Помощь - Поиск - Пользователи - Календарь
Полная версия: Идентификация законов распределения > Теория вероятностей
Образовательный студенческий форум > Высшая математика > Теория вероятностей
Ната22
Как посчитать репрезентативную выборку???
tig81
Цитата(Ната22 @ 17.2.2009, 9:18) *

Как посчитать репрезентативную выборку???

А что такое "репрезентативная выборка"?
Juliya
Мне более интересно, что значит "как её посчитать"
Ната22
Цитата(Juliya @ 17.2.2009, 19:11) *

Мне более интересно, что значит "как её посчитать"


Это значит как нашли S(X) в таблице???? смотрите вложенный файл
Juliya
ну элементарно! smile.gif

Вы (или не Вы судя по всему, а кто-то) нашли шаг, разбили всю область возможных значений случайной величины на интервалы и считаем, сколько значений исходных данных попало в каждый интервал.
Например, первый интервал - [1;6,89] - в него попадает, видимо (я не пересчитывала smile.gif) 87 значений, поэтому S(x)=87. Далее смотрите, сколько значений попало во 2-й интервал и т.д. Это и будут эмпирические частоты - т.е. сколько значений, полученных эмпирически, опытным путем, попало в каждый из интервалов.
Для удобства подсчета лучше всего исходные данные ранжировать - т.е. выстроить в порядке возрастания - тогда легко будет подсчитать, сколько значений попало в каждый интервал... Ну, или для продвинутых пользователей Excel есть специальная функция ЧАСТОТА, которая позволяет эти частоты быстро рассчитать.

Потом согласно проверяемому теоретическому закону распределения (здесь - экспоненциальный, но проверить можно на принадлежность любому закону распределения) рассчитываете теоретические частоты - т.е. сколько значений бы попало, если бы изучаемый показатель имел интересующий нас закон распределения с параметром, рассчитанным для Вашей выборки.
И затем эмпирические и теоретические частоты сравниваются - насколько они близки с помощью критерия согласия Пирсона.

ЗЫ и для сведения, репрезентативная выборка - это выборка, правильно отражающая пропорции генеральной совокупности. Это достигается случайностью отбора объектов из генеральной совокупности. У вас выборка уже дана - а даже неизвестно, да Вас никто это и не спрашивает, насколько она репрезентативна.
Ната22
Спасибо за ответ!

Но это для вас элементарно....а я так и не могу понять откуда получилось 87 и как..и что разбивают на интервалы...........(понятно что таблицу значений, пересчитала уже и так и так не могу получить 87)
что нужно складывать с чем???
Juliya
Берем Вашу исходную таблицу:
Изображение

и ранжируем, как я уже писала (выстраиваем по возрастанию). Далее просто считаем, сколько значений попало в каждый из интервалов:

Изображение

Теперь я уже проверила, все частоты посчитаны верно - но Вы и сами теперь можете в этом убедиться. Интервалы и соответствующие им значения я выделила одним цветом.

Т.е. смысл построения интервального ряда в том, чтобы сгруппировать все значения случайной величины и посмотреть, насколько плотно они распределены по числовой оси, чтобы можно было подобрать подходящий закон распределения. Согласитесь, по 200 исходным наблюдениям это сделать проблематично...

Кстати, замеченные при беглом просмотре ошибки:
Цитата
В результате получим 9 интервалов, длина интервала i = 21,44.

почему? шаг ведь у Вас получился 5,89, судя по границам интервалов.
А у меня при расчетах по той же формуле Стерджеса получилось 6,131405285

И ещё. Обычно при построении интервального ряда за нижнюю границу принимают не минимальное значение (как у Вас), а немного сдвигают влево - обычно на полшага (т.е. в данном случае по этой задаче нужно было начать первый интервал от нуля... но вряд ли время отклика будет меньше 1 сек, видимо, точность измерений не позволяет это сделать). Но это уже нюансы, делайте, как Вам давали... Может, у всех разные подходы...
Ната22
спасибо за подробное описание решения smile.gif

И вот еще один вопрос из этого же задания

Критическая точка правосторонней критической области 2кр (0,05;7) = 14,07. Таким образом получаем, что 2набл < 2кр, следовательно гипотезу о распределении данной случайной величины по экспоненциальному закону можно принять с достаточно большой степенью вероятности.

наблюдаемое понятно от куда а критическое как нашли????
malkolm
Excel:
=ХИ2ОБР(0,05;7)
Ната22
ну было бы еще хорошо если бы точное решение описали...
а не этот интервал. откуда он взялся этот интервал??
malkolm
О каком интервале речь? Здесь ни одного интервала нет вроде бы.

Вы вообще про критерий хи-квадрат что-нибудь знаете? Граница критической области - это квантиль хи-квадрат распределения с числом степеней свободы, связанным с числом интервалов группировки (в данном случае 7 степеней свободы), а уровень этой квантили равен 1-0,05, потому что у Вас 0,05 берётся в качестве размера критерия.
Juliya
Цитата(Ната22 @ 11.3.2009, 10:32) *

а критическое как нашли????

если не дружите с Excel, используйте таблицы хи-квадрат распределения (наверняка у вас есть в конце учебника)
и почитайте, что такое и как работает критерий согласия Пирсона для проверки гипотез о законе распределения! Все встанет сразу на свои места...
Это текстовая версия — только основной контент. Для просмотра полной версии этой страницы, пожалуйста, нажмите сюда.
Русская версия Invision Power Board © 2001-2025 Invision Power Services, Inc.