JollyKate
Сообщение
#28274 7.2.2009, 8:23
Попалась вот такая вот задачка. Второй день сижу, ломаю голову
Для нормально распределенной случайной величины оценить объем выборки, чтобы точность среднеквадратического отклонения равнялась 10%. Дано: Sx=0,5, P=95% (доверительная вероятность)
Искала решение в Кремере и Гмурмане. Там приведены решения только для случая с генеральной средней и с генеральной долей, а вот с СКО - нет!
Попыталась вывести сама из формул для нахождения интервалов для СКО (по Кремеру) с учетом того, что точность (предельная ошибка) равна половине длины интервала, но получается слишком громоздкая зависимость. Возможно, есть более простое решение? Кто знает, подскажите
malkolm
Сообщение
#28279 7.2.2009, 10:29
Могу попробовать, но без уверенности, что попадаю "не пальцем в небо" - т.е. что требовалось именно это:
Нужно найти такое минимальное n, чтобы P(|1 - Sx/σ| < 0,1) >= 0,95.
Раскроем скобки, возведём в квадрат и домножим на n, т.е. приведём к виду, когда по центру окажется величина n*Sx²/σ² с хи-квадрат распределением с n-1 степенью свободы:
P(0,9 < Sx/σ < 1,1) = P(0,81n < n*Sx²/σ² < 1,21n) >= 0,95.
Теперь есть два выхода:
1) тупой, но я бы им и воспользовалась: берём Excel, в левую колонку загоняем n от 2 до "пока не хватит". Умеете? Надо написать 2, ниже 3, обе ячейки выделить и навести мышь на нижний уголок - там появится толстый крестик (маркер автозаполнения), его схватить и тащить вниз. В первой ячейке соседней колонки пишем
=ХИ2РАСП(0,81*A1;A1-1)-ХИ2РАСП(1,21*A1;A1-1)
и копируем ниже. Ждём, пока 0,95 не наберётся. У меня n=193 получилось.
2) чиста теоретический: надо использовать аппроксимацию Фишера - в Кремере это замечание в самом конце той главы, где доверительные интервалы для нормальны распределений.
Она говорит, что распределение величины sqrt(2X)-sqrt(2k-1) близко к стандартному нормальному, если X имеет хи-квадрат распределение с k степенями свободы. У нас X=n*Sx²/σ² имеет k=n-1 степень свободы.
Снова преобразуем неравенство, чтобы в середине получить sqrt(2X)-sqrt(2*(n-1)-1):
P(0,81n < n*Sx²/σ² < 1,21n) = P(sqrt(2*0,81n) - sqrt(2n-3) < sqrt(2X)-sqrt(2n-3) < sqrt(2*1,21n) - sqrt(2n-3) ) = 0,95.
Так как по центру - стандартная нормальная величина, границы можно брать симметричными, левая -1,96, правая 1,96. Ну или -2 и 2 "для верности", мы же приближением пользуемся.
Чтобы решить уравнение sqrt(2*0,81n) - sqrt(2n-3) = -2, стоит 2n-3 заменить на 2n: сойдёт и так. Тогда sqrt(2n) = 20, n=200. Если брать 1,96, то получается n=192.
Juliya
Сообщение
#28280 7.2.2009, 10:36
Вообще-то, в отличие от мат. ожидания и вероятности, интервал для дисперсии и среднего квадратического отклонения строится несимметричный. Поэтому по идее правая и левая граница, построенные с заданной доверительной вероятностью скорее всего не будут симметричны относительно Sх.
В общем случае такие задачи решаются так: когда известна доверительная вер-ть, находят P(Xи^2) для нижней и верхней границы как (1-р)/2 и (1+р)/2, потом по таблице Xи^2 распределения смотрят Xи^2 значения и находят верхнюю и нижнюю границу для дисперсии (СКО).
У Вас тут получается, что и доверительная вер-ть известна, и границы... Сомневаюсь, что это даст одинаковый объем выборки для нижней и верхней границ. Посчитайте - посмотрите.
вот ссылки из Википедии на всякий случай(хотя Вы вроде знаете формулы)
Доверительный интервал для дисперсии: (только там перепутаны вероятности - нижняя граница находится через вер-ть (1-р)/2)
http://ru.wikipedia.org/wiki/%D0%94%D0%BE%...%80%D0%BA%D0%B8и какое у Вас СКО - смещенное-несмещенное?
Выборочная дисперсия:
http://ru.wikipedia.org/wiki/%D0%92%D1%8B%...%81%D0%B8%D1%8Fps ну вот -пока писала - опоздала.. Ну не буду стирать... тем более писали о разном...