Планирование эксперимента

из экспериментальных данных. Для отброса ошибочных данных существуют определённые правила.

Например, используют критерий Стьюдента t (Р; f): Опыт считается бракованным, если экспериментальное значение критерия t по модулю больше табличного значения t (Р; f).

Если в распоряжении исследователя имеется экспериментальная оценка дисперсии S2(yk) с небольшим конечным числом степеней свободы, то доверительные ошибки рассчитываются с помощью критерий Стьюдента t (Р; f):


ε() = t (Р; f)* S(yk)/= t (Р; f)* S()

ε(yk) = t (Р; f)* S(yk)


6. Результат прямого измерения – случайная величина, подчиняющаяся нормальному закону распределения


Результаты, которые получаются при экспериментальном исследовании какого-либо технологического процесса, зависят от целого ряда факторов. Поэтому результат исследования является случайной величиной, распределённой по нормальному закону распределения. Оно названо нормальным, т. к. именно это распределение для случайной величины является обычным и называется гаусовским или лапласским. Под распределением случайной величины понимают совокупность всех возможных значений случайной величины и соответствующих им вероятностей.

Законом распределения случайной величины называется всякое соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующим им вероятностям.

При экспериментальном исследовании какого-либо технологического процесса измеряемый результат последнего является случайной величиной, на которую оказывает влияние огромное число факторов (изменение погодных условий, самочувствие оператора, неоднородность сырья, влияние износа измерительной и стабилизирующей аппаратуры и т.д. и т.п.). Именно поэтому результат исследования является случайной величиной, распределенной по нормальному закону. Однако если исследователь какой-либо активный фактор не заметил или отнес его к неактивным, а неконтролируемое изменение этого фактора может вызвать несоразмерно большое изменение эффективности процесса и параметра, характеризующего эту эффективность, то распределение вероятности последнего может нормальному закону не подчиниться.

Точно так же приведет к нарушению нормальности закона распределения наличие в массиве экспериментальных данных грубых ошибок. Именно поэтому в первую очередь проводят анализ на наличие в экспериментальных данных грубых ошибок с принятой доверительной вероятностью.

Случайная величина будет распределена по нормальному закону, если она представляет собой сумму очень большого числа взаимно зависимых случайных величин, влияния каждой из которых ничтожно мало. Если измерения искомой величины y проведены много раз, то результат можно наглядно представить, построив диаграмму, которая показывала бы, как часто получались те или иные значения. Такая диаграмма называется гистограммой. Что бы построить гистограмму нужно разбить весь диапазон измеренных значений на равные интервалы. И посчитать сколько раз каждая величина попадает в каждый интервал.



Если измерения продолжать до тех пор, пока число измеренных значений n не станет очень большим, то ширину интервала можно сделать очень малой. Гистограмма перейдёт в непрерывную прямую, которая называется кривой распределения.

В основе теории случайных ошибок лежат два предположения:

1. при большом числе измерений случайные погрешности одинаково велики, но с разными знаками встречаются одинаково часто;

2. большие (по абсолютной величине) погрешности встречаются реже, чем малые. Т. е. вероятность появления погрешности уменьшается с ростом её величины.

Согласно закону больших чисел при бесконечно большом числе измерений n, истинное значение измеряемой величины y равно среднеарифметическому значению всех результатов измерений ỹ

Для всех m-повторностей можно записать:



Разделив это уравнение на число повторностей m, получим после подстановки:



За экспериментальную оценку истинного значения (математического ожидания) критерия оптимальности у принимается среднеарифметическая оценка результатов всех т повторностей:



Если число m велико (m→∞), то будет справедливо равенство:



Таким образом, при бесконечно большом числе измерений истинное значение измеряемой величины y равно среднеарифметическому значению ỹ всех результатов произведённых измерений: y═ỹ, при m→∞.

При ограниченном числе измерений (m≠∞) среднеарифметическое значение y будет отличаться от истинного значения, т.е. равенство y═ỹ будет неточным, а приближённым: y≈ỹ и величину этого расхождения необходимо оценить.

Если в распоряжении исследователя имеется только единичный результат измерения yk, то оценка истинного значения измеряемой величины будет менее точной. чем среднеарифметическая оценка при любом числе повторностей: |y─ỹ|<|y-yk|.

Появление того или иного значения yk в процессе измерения является случайным событием. Функция плотности нормального распределения случайной величины характеризуется двумя параметрами:

  • истинным значением y;

  • среднеквадратичным отклонением σ.


а) б)

Рисунок – 1а – кривая плотности нормального распределения; 1б – кривая плотности вероятности нормально распределенной случайной величины при различных дисперсиях


Плотность нормального распределения (рис. 1а) симметрична относительно y и достигает максимального значения при yk= y, стремится к 0 при увеличении.

Квадрат среднеквадратичного отклонения называется дисперсией случайной величины и является количественной характеристикой разброса результатов вокруг истинного значения y. Мера рассеяния результатов отдельных измерений yk от среднего значения ỹ должна выражаться в тех же единицах, то и значения измеряемой величины. В связи с этим в качестве показателя разброса гораздо чаще используют величину σ:



Значения этой величины определяют форму кривой распределения py. Площади под тремя кривыми одинаковы, но при малых значения σ кривые идут более круто и имеют большее значение py. С увеличением σ значение py уменьшается и кривая распределения растягивается вдоль оси y. Т.о. кривая 1 характеризует плотность распределения случайной величины, воспроизводимость которой в повторных измерениях лучше, чем воспроизводимость случайных величин имеющих плотность распределения 2, 4. На практике не возможно произвести слишком много замеров. Поэтому нельзя построить нормальное распределение, чтобы точно определить истинное значение y. В этом случае хорошим приближением к истинному значению можно считать ỹ, а достаточно точной оценкой ошибки выборочную дисперсию ρІn, вытекающую из закона распределения, но относящуюся к конечному числу измерения. Такое название величины ρІn объясняется тем, что из всего множества возможных значений yk, т.е. из генеральной совокупности выбирают лишь конечное число значений равное m, называемых выборкой, которая характеризуется выборочным средним значением и выборочной дисперсией.


7. Экспериментальные оценки истинных значений измеряемой случайной величины и её среднеквадратичного отклонения


Если в распоряжении исследователя находится конечное число независимых результатов повторности одного и того же опыта, то он может получить лишь экспериментальные оценки истинного значения и дисперсии результата опыта.

Оценки должны обладать следующими свойствами:

1. Несмещённости, проявляющейся в том, что теоретическое среднее совпадает с истинным значением измеряемого параметра.

2. Состоятельности, когда оценки при неограниченном увеличении числа измерений могут иметь сколь угодно малый доверительный интервал при доверительной вероятности.

3. Эффективности, проявляющейся в том, что из всех несмешанных оценок данная оценка будет иметь наименьшее рассеяние (дисперсию).

Экспериментальная оценка среднеквадратичного отклонения обозначается S с указанием в скобках символа анализируемой величины, т.е.

S (yk) – среднеквадратичного отклонение единичного результата.

S (y) – среднеквадратичное отклонение среднего результата.

Квадрат экспериментальной оценки среднеквадратичного отклонения SІ является экспериментальной оценкой дисперсии:



Для обработки результатов наблюдения можно использовать следующую схему:

 Определение среднего значения полученных результатов:


 Определение отклонения от среднего значения для каждого результата:



Эти отклонения характеризуют абсолютную ошибку определения. Случайные ошибки имеют разные знаки, когда значение результата опыта превышает среднее значение, ошибка опыта считается положительной, когда значение результата опыта меньше среднего значения, ошибка считается отрицательной.

Чем точнее произведены измерения, тем ближе значение отдельных результатов и среднее значение.

Если по m результатам рассчитывают оценку истинного значения , а затем, используя те же результаты, рассчитывают оценки абсолютных отклонений:



то оценку дисперсии единичного результата находят по зависимости:



Разность между числом т независимых результатов ук и числом уравнений, в которых эти результаты уже были использованы для расчета неизвестных оценок, называют числом степеней свободы f:

f=m –1.

Для оценки дисперсии эталонного процесса f=m.

Поскольку средняя оценка  является более точной, чем единичная ук, дисперсия средних будет меньше дисперсии единичных результатов в m раз, если  рассчитано по всем m единичным результатам ук:



Если в распоряжении исследователя имеется экспериментальная оценка дисперсии S2 (yк) с небольшим конечным числом степеней свободы, то доверительные ошибки рассчитывают с помощью критерия Стьюдента t (P; f):


,


где Р – доверительная вероятность (Р=1-q, q – уровень значимости).


Проверка надёжности полученных результатов по критерию Стьюдента для проведенного числа опытов m при избранной доверительной вероятности (надёжности) Р=0,95; 0,99. Это значит, что 95% или 99% абсолютных отклонений результатов лежит в указанных пределах. Критерий t (P; f) с доверительной вероятностью Р показывает во сколько раз модуль разности между истинным значением определённой величины y и средним значением ỹ больше стандартного отклонения среднего результата.


8. Определение грубых ошибок среди результатов повторностей опыта


При статистическом анализе экспериментальных данных для процессов, негативный результат которых не создает ситуаций, опасных для жизни людей или утраты больших материальных ценностей, доверительная вероятность обычно принимают равной Р=0,95

Среди результатов yk повторностей опыта могут быть результаты, значительно отличающиеся от других. Это может быть связано либо с какой-то грубой ошибкой, либо с неизбежным случайным влиянием неучтенных факторов на результат данной повторности опыта.

Признаком наличия «выделяющегося» результата среди других является большая величина отклонения │▲yk│= yk – yˉ.

Если ▲yk>yпред, то такие результаты относятся к грубым ошибкам. Предельное абсолютное отклонение определяют в зависимости от сложившейся ситуации различными методами. Если, например, проводиться статистический анализ экспериментальных данных опыта с эталонным процессом (известно истинное значение результата опыта и ▲yk=yk-y) и если исследователь имеет в своем распоряжении оценку дисперсии S2(yk) с таким большим числом степеней свободы, то может принять f→∞ и S2(yk)=σ2, то для определения грубых ошибок можно применить правило «2-х сигм»: все результаты, абсолютные отклонения которых по модулю превышают величину двух среднеквадратичных отклонений с надежностью 0,95 считаются грубыми ошибками и исключаются из массива экспериментальных данных (вероятность исключения достоверных результатов равна уровню значимости q=0,05).

Если доверительная вероятность отличается от 0,95 то пользуются правилом «одной сигмы» (Р=0,68) или правилом «трех сигм» (Р=0,997), или по заданной вероятности Р=2Ф(t) – 1 находят Ф(t) по справочным данным и параметр t, по которому и рассчитывают абсолютное отклонение:


Если в распоряжении исследователя имеется лишь приближенная оценка дисперсии с небольшим (конечным) числом степеней свободы, то применение правила «сигм» может привести либо к необоснованному исключению достоверных результатов либо к необоснованному оставлению ошибочных результатов.

В этой ситуации для определения грубых ошибок можно применить критерий максимального отклонения rmax(P, m), взятый из соответствующих таблиц. Для этого rmax сравнивают с величиной r, равной


(22)


Если r > rmax, то данный результат должен исключаться из дальнейшего анализа, оценка yˉ должна быть пересчитана, изменяются абсолютные отклонения ▲yk и соответственно оценка дисперсии S2(yk) и S2(yˉ). Анализ на грубые ошибки повторяют при новых значениях оценок yˉ и S2(yk), прекращают его при r <= rmax.

При пользовании формулой (22) следует применять оценку дисперсии, полученную по результатам повторностей опыта, среди которых находится сомнительный результат.

Для определения грубых ошибок существуют и другие методы, среди которых наиболее быстрым является метод «по размаху», основанный на оценке максимальных различий полученных результатов. Анализ по этому методу проводят в такой последовательности:

1) располагают результаты yk в упорядоченный ряд, в котором максимальному результату присваивается номер первый (y1), а максимальному – наибольший (ym).

2) Если результатом, вызывающим сомнение, будет ym, рассчитывают отношение


(23)


если сомнительным результатом будет y1 – отношение


(24)


3) при заданном уровни значимости q и известном числе повторностей m по приложению 6 находят табличное значение критерия αТ.

4) если α > αТ, то подозреваемый результат является ошибочным и его следует исключить.

После исключения грубой ошибки находят по таблице новую величину αТ и решают судьбу следующего «подозреваемого» результата, сравнивая αТ и рассчитанный для него α.

Если есть основание предполагать, что 2 наибольших (2 наименьших) результата являются «промахами», то их можно выявить в один прием, используя соответствующий столбец таблицы приложения 6 для определения αТ и рассчитывая α по формуле:


(25)

или


(26)


Средневзвешенные оценки дисперсии. Анализ однородности исходных оценок дисперсии

Если в распоряжении экспериментатора имеются результаты многократных измерений величин критерия оптимальности в опытах при различных условиях ведения процесса, то появляется возможность расчета средневзвешенной оценки дисперсии единичного результата, единой для всех опытов эксперимента.

В каждом из N опытов (номер опыта и = 1+N) оценка дисперсии единичного результата равна



где ти – число повторностей и-го опыта.

Средневзвешенная оценка дисперсии единичного результата рассчитывается по всем оценкам дисперсии единичного результата опытов:

а) при различных ти


где - число степеней свободы средневзвешенной оценки дисперсии; ти – 1 = fu – «вес» соответствующей и-ой оценки дисперсии, равный числу степеней свободы fu;

б) при ти = т = const



где N (m-1)=f – число степеней свободы средневзвешенной оценки дисперсии.

Прежде чем пользоваться соотношениями (28) и (29) для расчета средневзвешенных уточненных оценок дисперсии (чем больше число степеней свободы, тем более точной будет оценка дисперсии), надо доказать однородность исходных оценок дисперсии.

Определение «однородные» в статистике означает «являющиеся оценкой одного и того же параметра» (в данном случае – дисперсии σ 2).

Если измеряемая случайная величина уик распределена по нормальному закону во всем исследуемом диапазоне, то независимо от значений и дисперсия σ не будет изменять своей величины и оценки этой дисперсии должны быть однородными. Однородность этих оценок проявляется в том, что они могут отличаться друг от друга лишь незначительно, в пределах, зависящих от принятой вероятности и объема экспериментальных данных.

Если ти = т и f = const, то однородность оценок дисперсий можно проанализировать при помощи критерия Кохрена Gkp. Вычисляют отношение максимальной дисперсии S2(yuk)max к сумме всех дисперсий


и сравнивают это отношение с величиной критерия Кохрена Gkp (P; f; N). Если G < Gkp, то оценки однородны.

Таблица значений критерия Кохрена в зависимости от числа степеней свободы числителя fu, числа сравниваемых дисперсий N и принятого уровня значимости q = 1 – Р дана в приложении.

Если число повторностей в опытах различно (fltconst), однородность оценок дисперсии можно проанализировать с помощью критерия Фишера FТ. Для этого из N оценок дисперсии выбирают 2: максимальную S2(yuk)max и минимальную S2(yuk)min. Если вычисленное значение F их отношения меньше Ft,



то все N оценок дисперсии будут однородны.

Значения критерия Фишера FT даны в приложении в зависимости от принятого уровня значимости q и числа степеней свободы f1 и f2 оценок S2(yuk)max и S2(yuk)min соответственно.

Если оценки дисперсии непосредственно измеряемого параметра у оказались неоднородными, т.е. оценками различных дисперсий, то средневзвешенная оценка не может быть рассчитана. И кроме того, величины ук уже нельзя считать подчиняющимися нормальному закону, при котором дисперсия может быть лишь одной и неизменной при любом у.

Причиной нарушения нормального закона распределения может быть наличие оставшихся грубых ошибок (анализ на грубые ошибки либо не проводился, либо проведен недостаточно тщательно).

Другой причиной может быть наличие активного фактора, ошибочно отнесенного исследователем к неактивным и не снабженного системой стабилизации. Поскольку условия изменились, этот фактор стал значимо влиять на процесс.


9. Планирование и обработка результатов однофакторных экспериментов


9.1 Формализация экспериментальных данных методом наименьших квадратов


Влияние какого-либо фактора на выход процесса может быть выражено зависимостью у = f(C). Если конкретному значению Си соответствует единственное значение уи, то такая зависимость называется функциональной. Эту зависимость получают путем строгих логических доказательств, не нуждающихся в опытной проверке. Например, площадь квадрата ω может быть представлена функциональной зависимостью от размера стороны квадрата а: ω = а2.

Если уи остается неизменным в то время как Си изменяется, то у не зависит от С. Например, угол при вершине квадрата равный π/2, не зависит от размера стороны аи.

Если для оценки величин уи и Си используются данные наблюдений, величины случайные, то функциональная зависимость между ними существовать не может.

Измерив отдельно сторону а и площадь ω квадрата, можно убедиться, что полученные результаты не могут быть представлены с абсолютной точностью зависимостью ω = а 2.

К формализации экспериментальных данных, т.е. построению по ним описывающей процесс зависимости, исследователь прибегает, когда не может составить эвристическую (детерминированную) математическую модель из-за недостаточного понимания механизма процесса или его чрезмерной сложности.

Полученная в результате формализации экспериментальных данных эмпирическая математическая модель имеет меньшую ценность, чем отражающая механизм процесса эвристическая математическая модель, которая может предсказать поведение объекта за пределами изученного диапазона изменения переменных.

Приступая к эксперименту с целью получения эмпирической математической модели, исследователь должен определить необходимый объем опытных данных с учетом количества принятых к исследованию факторов, воспроизводимости процесса, предполагаемой структуры модели и обеспечения возможности проверки адекватности уравнения.

Если по результатам эксперимента, состоящего из двух опытов, получено линейное однофакторное уравнение у = b0 + b1С, то построенная по этому уравнению прямая обязательно пройдет через эти экспериментальные точки. Следовательно, для того чтобы проверить, насколько хорошо эта зависимость описывает данный процесс, надо поставить опыт хотя бы еще в одной точке. Этот дополнительный опыт дает возможность осуществить корректную процедуру проверки пригодности уравнения. Однако проверку обычно проводят не по одной дополнительной точке, которая не участвовала в определении коэффициентов уравнения, а по всем экспериментальным точкам, число которых (N) должно превышать число коэффициентов уравнения (N')

Так как N > N', решение такой системы требует специального подхода.


9.2 Симметричный и равномерный план однофакторного эксперимента


Задача в значительной степени упростится, если при планировании эксперимента, можно будет обеспечить условие:

ΣCu=0 (1)

При натуральной размерности факторов выполнить условие ΣCu=0 невозможно, т. к. в этом случае величина фактора должна иметь как положительные значения, так и отрицательные.

Если же точку отсчета величины фактора перенести в середину диапазона изменения фактора (центр эксперимента)



то появляется возможность удовлетворить условию в виде , где С'uu – С0.

Для равномерного плана Сu – С(u-1) = λ = const,

где λ – интервал варьирования фактора.

Условие  может быть выполнено, если для обозначения величины фактора использовать безразмерные выражения:


xu = ,


отсюда легко увидеть, что условие  эквивалентно условию  и такие планы называют симметричными.

При составлении плана диапазон фактора ориентировочно ограничивают величинами Сmin и Сmax, назначенными после изучения литературы по теме исследования. От опыта к опыту предусматривают такое изменение величины фактора, которое позволило бы достоверно уловить имеющимися в распоряжении исследователя приборами изменение выхода процесса .

С учетом величины λ и диапазона (Сmax – Cmin) определяют число опытов, округляя его до нечетного N:

.


Затем определяют величины факторов в каждом из N опытов и уточняют исследуемый диапазон фактора СN – С1:


=,


где хu – безразмерное выражение фактора, аналогичное полученному по соотношению

Для расчета коэффициентов уравнения используем формулу:


,


множители аju и знаменатель lj берем из приложения.

Число опытов эксперимента может быть четным или нечетным, и, как правило, должно быть больше числа коэффициентов N' уравнения.

Чем больше разность (N – N'), тем с большей точностью можно получить оценки коэффициентов данного уравнения и тем в большей степени эти оценки будут освобождены от влияния случайных неуточненных факторов.

Если Вам нужна помощь с академической работой (курсовая, контрольная, диплом, реферат и т.д.), обратитесь к нашим специалистам. Более 90000 специалистов готовы Вам помочь.
Бесплатные корректировки и доработки. Бесплатная оценка стоимости работы.

Поможем написать работу на аналогичную тему

Получить выполненную работу или консультацию специалиста по вашему учебному проекту
Нужна помощь в написании работы?
Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Пишем статьи РИНЦ, ВАК, Scopus. Помогаем в публикации. Правки вносим бесплатно.

Похожие рефераты: