Главная > Математика > Прикладная статистика: Основы моделирования и первичная обработка данных
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

5.4.3. Основные способы организации выборки.

При оценке репрезентативности выборки учитывается и то, как выборка получена, и то, насколько распределение в выборке существенных для изучаемого вопроса показателей характерно для анализируемой генеральной совокупности в целом. Первый путь повышения степени репрезентативности — достижение полностью случайного отбора объектов из генеральной совокупности — часто бывает труден в организационном плане. Кроме того, сочетание регулярного и случайного выбора иногда оказывается более эффективным. В любом случае способ сбора исходных данных должен тщательно планироваться и его необходимо полностью описывать в отчетах о выполненной работе.

Использование для оценки репрезентативности распределений основных показателей в выборке и в генеральной совокупности также имеет свои трудности, одни из которых носят чисто статистический характер — недостаточный объем (число отобранных для использования объектов) выборки, неразработанность методов сравнения многомерных распределений и т.п., а другие — содержательный, ведь заранее неизвестно, распределение каких показателей следует сравнивать при доказательстве репрезентативности.

Опишем кратко основные способы организации выборки.

Простой случайный отбор — способ извлечения объектов из конечной генеральной совокупности N объектов, при котором каждая из С возможных выборок имеет равную вероятность быть отобранной. На практике часто нумеруют объекты в генеральной совокупности числами от 1 до N и затем, используя таблицы случайных чисел или какой-либо другой метод, обеспечивающий равную вероятность выбора объекта (например, урну с N шарами, занумерованными цифрами от 1 до N), отбирают один за другим объектов. Полученная таким способом выборка называется случайной.

Простой отбор с помощью регулярной, но несущественной для изучаемого вопроса процедуры часто применяется вместо случайного отбора. В медицинской практике отбор может проводиться по дню недели, что удобно с организационной точки зрения; в социологических обследованиях — по букве, с которой начинается фамилия индивидуума, проживающего в домах данной жилищно-эксплуатационной конторы, и т. п. Получаемые таким образом выборки часто называют механическими.

Стратифицированный (расслоенный) отбор заключается в том, что исходная генеральная совокупность объема N подразделяется на подсовокупности объема При этом подсовокупности не содержат общих объектов и вместе исчерпывают всю генеральную совокупность, так что . Подсовокупности называют стратами или слоями. Когда слои определены, из каждого слоя извлекается простая случайная выборка объема соответственно . Для того чтобы можно было полностью воспользоваться выгодами от расслоения, значения должны быть известны. Стратифицированный отбор применяется, когда слои однородны в том смысле, что входящие в них объекты имеют близкие характеристики (средние значения которых могут быть оценены по малым выборкам);

либо когда нецелесообразно изучать генеральную совокупность с равной тщательностью во всех слоях; либо по организационным причинам, когда методы проведения отбора в слоях должны быть разными. Выборки, полученные таким способом, называются стратифицированными или расслоенными (иногда — районированными).

Частным случаем стратифицированного отбора является способ организации выборки, прикотором страты (слои) генеральной совокупности выделены по косвенному признаку, как-то связанному с изучаемым. Так, изучая средний душевой доход семей, для получения стратифицированных выборок можно предварительйо разбить исследуемую совокупность семей на группы, однородные по какой-либо из социально-экономических характеристик главы семьи (например, по заработку). В подобных случаях говорят о типическом способе отбора и соответственно о типических выборках.

Методы серийного отбора (и соответственно серийные выборки) используются тогда, когда удобнее назначать к обследованию не отдельные элементы генеральной совокупности, а целые «блоки» или серии таких элементов. Так, при проведении выборочных обследований населения способ территориально-административного деления страны и характер ведения соответствующей документации обусловливают большее удобство сплошного способа обследования целых территориальных единиц (домов, кварталов), а не отдельных семей. Подобный способ отбора часто называют также гнездовым.

Комбинированный (ступенчатый) отбор сочетает в себе сразу несколько из вышеописанных способов отбора, образующих различные ступени (или фазы) выборочного обследования. Так, при выборочном обследовании условий жизни и структуры семей какого-либо города на первой ступени можно с помощью случайного отбора назначить городские районы, в которых будет производиться это обследование, затем способом механического отбора определить подлежащие обследованию жилищно-эксплуатационные конторы (ЖЭКи), а внутри ЖЭКов сделать серийную (гнездовую) выборку домов.

Подробное описание теории и методов выборочных обследований дано, например, в [43].

Последовательный (активный) выбор.

При анализе физико-химических и технологических процессов часто исследуется зависимость некоторого результирующего показателя («отклика») у от набора управляющих показателей , которая описывается формулой вида

где — известная функция своих аргументов, — неизвестная точка в пространстве параметров («состояние природы»), — случайная ошибка со средним, равным нулю. Требуется по возможно меньшему числу опытов в точках принадлежащих «разрешенной» области значений оценить «состояние природы». Опыты можно ставить в любой из точек X, принадлежащих «разрешенной» области значений управляющих показателей. В этих условиях после каждой серии опытов в результате обработки полученных данных рассчитывается следующая «наиболее информативная» относительно 0 серия точек X, в них проводятся новые опыты и отыскиваются новая оценка 0 и новая серия точек X, в которых целесообразно проводить опыты, и т. д. Чтобы подчеркнуть, что точки X отбираются не наудачу, такие эксперименты часто называют активными. О задачах такого типа см. подробнее, например, в [81].

<< Предыдущий параграф Следующий параграф >>
Оглавление