Генеральная совокупность и выборочный метод. Генеральная совокупность и выборка

Генеральная совокупность – совокупность элементов, удовлетворяющих неким заданным условиям; именуется также изучаемой совокупностью. Генеральная совокупность (Universe) - все множество объектов (субъектов) исследования, из которого выбираются (могут выбираться) объекты (субъекты) для обследования (опроса).

ВЫБОРКА или выборочная совокупность (Sample) - это множество объектов (субъектов), отобранных специальным образом для обследования (опроса). Любые данные, полученные на основании выборочного обследования (опроса), имеют вероятностный характер. На практике это означает, что в ходе исследования определяется не конкретное значение, а интервал, в котором определяемое значение находится.

Характеристики выборки:

Качественная характеристика выборки – что именно мы выбираем и какие способы построения выборки мы для этого используем.

Количественная характеристика выборки – сколько случаев выбираем, другими словами объём выборки.

Необходимость выборки:

Объект исследования очень обширный. Например, потребители продукции глобальной компании – огромное количество территориально разбросанных рынков.

Существует необходимость в сборе первичной информации.

Объём выборки - число случаев, включённых в выборочную совокупность.

Зависимые и независимые выборки.

При сравнении двух (и более) выборок важным параметром является их зависимость. Если можно установить гомоморфную пару (то есть, когда одному случаю из выборки X соответствует один и только один случай из выборки Y и наоборот) для каждого случая в двух выборках (и это основание взаимосвязи является важным для измеряемого на выборках признака), такие выборки называются зависимыми .

В случае, если такая взаимосвязь между выборками отсутствует, то эти выборки считаются независимыми.

Типы выборки.

Выборки делятся на два типа:

Вероятностные;

Не вероятностные;

Репрезентативная выборка - выборочная совокупность, в которой основные характеристики совпадают с характеристиками генеральной совокупности. Только для этого типа выборки результаты обследования части единиц (объектов) можно распространять на всю генеральную совокупность. Необходимое условие для построения репрезентативной выборки - наличие информации о генеральной совокупности, т.е. либо полный список единиц (субъектов) генеральной совокупности, либо информация о структуре по характеристикам, существенно влияющим на отношение к предмету исследования.

17. Дискретный вариационный ряд, ранжирование, частота, частность.

Вариационным рядом (статистическим рядом) – называется последовательность вариант, записанных в порядке возрастания и соответствующих им весов.

Вариационный ряд может быть дискретным (выборка значений дискретной случайной величины) и непрерывным (интервальным) (выборка значений непрерывной случайной величины).

Дискретный вариационный ряд имеет вид:

Наблюдаемые значения случайной величины х1, х2, …, хk называются вариантами, а изменение этих значений называются варьированием.

Выборка (выборочная совокупность) – совокупность наблюдений, отобранных случайным образом из генеральной совокупности.

Число наблюдений в совокупности называется ее объемом.

N – объем генеральной совокупности.

n – объем выборки(сумма всех частот ряда).

Частотой варианты хi называется число ni (i=1,…,k), показывающее, сколько раз эта варианта встречается в выборке.

Частостью (относительной частотой, долей) варианты хi (i=1,…,k) называется отношение ее частоты ni к объему выборки n.
wi =ni /n

Ранжирование опытных данных - операция, заключающаяся в том, что результаты наблюдений над случайной величиной, т. е. наблюдаемые значения случайной величины, располагают в порядке неубывания.

Дискретным вариационным рядом распределения называется ранжированная совокупность вариантов хi с соответствующими им частотами или частностями.

Это наука, которая, основываясь на методах теории вероятностей, занимается систематизацией и обработкой статистических данных для получения научных и практических выводов.

Статистическими данными называются сведения о числе объектов, обладающих теми или иными признаками.

Группа объектов, объединенных по некоторому качественному или количественному признаку, называется статистической совокупностью . Объекты, входящие в совокупность, называются её элементами, а их общее число - ее объемом.

Генеральной совокупностью называется множество всех мыслимо возможных наблюдений, которые могли бы быть сделаны при данном реальном комплексе условий или более строго: генеральной совокупностью называется случайная величина x и связанное с ней вероятностное пространство {W,Á,Р}.

Распределение случайной величины x называют распределением генеральной совокупности (говорят, например, о нормально распределенной или просто нормальной генеральной совокупности).

Например, если производится ряд независимых измерений случайной величины x, то генеральная совокупность теоретически бесконечна (т.е. генеральная совокупность - абстрактное, условно - математическое понятие); если же проверяется число дефектных изделий в партии из N изделий, то эту партию рассматривают как конечную генеральную совокупность объема N.

В случае социально-экономических исследований генеральной совокупностью объема N может быть население какого-то города, региона или страны, а измеряемыми признаками - доходы, расходы или объем сбережений отдельно взятого человека. Если какой-то признак имеет качественный характер (например, пол, национальность, социальное положение, род деятельности и т.п.), но принадлежит к конечному множеству вариантов, то он может быть также закодирован числом (как это часто делают в анкетах).

Если число объектов N достаточно велико, то провести сплошное обследование затруднительно, а иногда физически невозможно (например, проверить качество всех патронов). Тогда случайным образом отбирают из всей генеральной совокупности ограниченное число объектов и подвергают их изучению.

Выборочной совокупностью или просто выборкой объема n называется последовательность х 1 , х 2 , …, х n независимых одинаково распределенных случайных величин, распределение каждой из которых совпадает с распределением случайной величины x.

Например, результаты n первых измерений случайной величины x принято рассматривать как выборку объема n из бесконечной генеральной совокупности. Полученные данные называют наблюдениями случайной величины x, а также говорят, что случайная величина x "принимает значения" х 1 , х 2 , …, х n .


Основная задача математической статистики - сделать научно обоснованные выводы о распределении одной или более неизвестных случайных величин или их взаимосвязи между собой. Метод, состоящий в том, что на основании свойств и характеристик выборки делаются заключения о числовых характеристиках и законе распределения случайной величины (генеральной совокупности) называется выборочным методом.

Для того, чтобы характеристики случайной величины, полученные выборочным методом, были объективны, необходимо, чтобы выборка была репрезентативной, т.е. достаточно хорошо представляла исследуемую величину. В силу закона больших чисел можно утверждать, что выборка будет репрезентативной, если ее осуществить случайно, т.е. все объекты генеральной совокупности имеют одинаковую вероятность попасть в выборку. Для этого существуют различные виды отбора выборки.

1. Простым случайным отбором называется отбор, при котором объекты извлекаются по одному из всей генеральной совокупности.

2. Стратифицированный (расслоенный ) отбор заключается в том, что исходная генеральная совокупность объема N подразделяется на подмножества (страты) N 1 , N 2 ,…,N k , так что N 1 + N 2 +…+ N k = N. Когда страты определены, из каждого из них извлекается простая случайная выборка объема n 1 , n 2 , …, n k . Частным случаем стратифицированного отбора является типический отбор, при котором объекты отбирают не из всей генеральной совокупности, а из каждой типической ее части.

Комбинированный отбор сочетает в себе сразу несколько видов отбора, образующих различные фазы выборочного обследования. Существуют и другие методы организации выборки.

Выборка называется повторной , если отобранный объект перед выбором следующего возвращается в генеральную совокупность. Выборка называется бесповторной , если отобранный объект в генеральную совокупность не возвращается. Для конечной генеральной совокупности случайный отбор без возвращения приводит на каждом шаге к зависимости отдельных наблюдений, случайный равновозможный выбор с возвращением - к независимости наблюдений. На практике обычно имеют дело с бесповторными выборками. Тем не менее, когда объем генеральной совокупности N во много раз больше, чем объем выборки n (например, в сотни или тысячи раз), зависимостью наблюдений можно пренебречь.

Таким образом, случайная выборка х 1 , х 2 , …, х n - это результат последовательных и независимых наблюдений над случайной величиной ξ, представляющую генеральную совокупность, и все элементы выборки имеют тоже распределении, что исходная случайная величина x.

Функцию распределения F x (х) и другие числовые характеристики случайной величины x будем называть теоретическими, в отличие от выборочных характеристик , которые определяются по результатам наблюдений.

Пусть выборка х 1 , х 2 , …, х к есть результат независимых наблюдений случайной величины x, причем х 1 наблюдалось n 1 раз, х 2 - n 2 раза, …, х к - n к раз, так что n i = n - объем выборки. Число n i , показывающее, сколько раз появилось значение х i в n наблюдениях, называется частотой данного значения, а отношение n i /n = w i - относительной частотой . Очевидно, что числа w i рациональны и .

Статистическая совокупность, расположенная в порядке возрастания признака, называется вариационным рядом . Его члены обозначают x (1) , x (2), … x (n) и называют вариантами . Вариационный ряд называется дискретным , если его члены принимают конкретные изолированные значения. Статистическим распределением выборки дискретной случайной величины x называется перечень вариант и соответствующих им относительных частот w i . Полученная таблица называется статистическим рядом.

X (1) x (2) ... x k(k)
ω 1 ω 2 ... ω k

Наибольшее и наименьшее значения вариационного ряда обозначают x min и x max и называют крайними членами вариационного ряда.

Если изучается непрерывная случайная величина, то группировка заключается в разбиении интервала наблюдаемых значений на k частичных интервалов равной длины h, и подсчете числа попаданий наблюдений в эти интервалы. Полученные числа принимают за частоты n i (для некоторой новой, уже дискретной случайной величины). В качестве новых значений вариант x i обычно берутся середины интервалов (либо в таблице указываются сами интервалы). Согласно формуле Стерждеса рекомендуемое число интервалов разбиения k » 1 + log 2 n , а длины частичных интервалов равны h = (x max - x min)/k. Предполагается, что весь интервал имеет вид .

Графически статистические ряды могут быть представлены в виде полигона, гистограммы или графика накопленных частот.

Полигоном частот называют ломаную линию, отрезки которой соединяют точки (x 1 , n 1), (x 2 , n 2), …, (x k , n k). Полигоном относительных частот называют ломаную, отрезки которой соединяют точки (x 1 , w 1), (x 2 , w 2), …, (x k , w k). Полигоны обычно служат для изображения выборки в случае дискретных случайных величин (рис. 7.1.1).

Рис. 7.1

.1.

Гистограммой относительных частот называется ступенчатая фигура, состоящая из прямоугольников, основанием которых служат частичные интервалы длиною h , а высоты

равны w i /h.

Гистограмма обычно служит для изображения выборки в случае непрерывных случайных величин. Площадь гистограммы равна единице (рис. 7.1.2). Если на гистограмме относительных частот соединить середины верхних сторон прямоугольников, то полученная ломанная образует полигон относительных частот. Поэтому гистограмму можно рассматривать как график эмпирической (выборочной) плотности распределения f n (x). Если у теоретического распределения существует конечная плотность, то эмпирическая плотность является некоторым приближением теоретической.

Графиком накопленных частот называется фигура, строящаяся аналогично гистограмме с той разницей, что для расчета высот прямоугольников берутся не простые, а накопленные относительные частоты , т.е. величины . Эти величины не убывают, и график накопленных частот имеет вид ступенчатой "лестницы" (от 0 до 1).

График накопленных частот на практике используются для приближения теоретической функции распределения.

Задача. Анализируется выборка из 100 малых предприятий региона. Цель обследования - измерение коэффициента соотношения заемных и собственных средств (х i) на каждом i-ом предприятии. Результаты представлены в таблице 7.1.1.

Таблица Коэффициенты соотношений заемных и собственных средств предприятий.

5,56 5,45 5,48 5,45 5,39 5,37 5,46 5,59 5,61 5,31
5,46 5,61 5,11 5,41 5.31 5,57 5,33 5,11 5,54 5,43
5,34 5,53 5,46 5,41 5,48 5,39 5,11 5,42 5,48 5,49
5,36 5,40 5,45 5,49 5,68 5,51 5,50 5,68 5,21 5,38
5,58 5,47 5,46 5,19 5,60 5,63 5,48 5,27 5,22 5,37
5,33 5,49 5,50 5,54 5,40 5.58 5,42 5,29 5,05 5,79
5,79 5,65 5,70 5,71 5,85 5,44 5,47 5,48 5,47 5,55
5,67 5,71 5,73 5,05 5,35 5,72 5,49 5,61 5,57 5,69
5,54 5,39 5,32 5,21 5,73 5,59 5,38 5,25 5,26 5,81
5,27 5,64 5,20 5,23 5,33 5,37 5,24 5,55 5,60 5,51

Построить гистограмму и график накопленных частот.

Решение . Построим группированный ряд наблюдений:

1. Определим в выборке х min = 5,05 и x max = 5,85;

2. Разобьем весь диапазон на k равных интервалов: k » 1 + log 2 100 = 7,62; k = 8, отсюда длина интервала

Таблица 7.1.2. Сгруппированный ряд наблюдений

Номер Интервала Интервалы Середины интервалов х i w i f n (x)
5,05-5,15 5,1 0,05 0,05 0,5
5,15-5,25 5,2 0,08 0,13 0,8
5,25-5,35 5,3 0,12 0,25 1,2
5,35-5,45 5,4 0,20 0,45 2,0
5,45-5,55 5,5 0,26 0,71 2,6
5,55-5,65 5,6 0,15 0,86 1,5
5,65-5,75 5,7 0,10 0,96 1,0
5,75-5,85 5,8 0,04 1,00 0,4

На рис. 7.1.3 и 7.1.4, построенных по данным таблицы 7.1.2, представлены гистограмма и график накопленных частот. Кривые соответствуют плотности и функции нормального распределения, "подобранного" к данным.

Таким образом, распределение выборки является некоторым приближением распределения генеральной совокупности.

Весь массив особей определенной категории называется генеральной совокупностью. Объем генеральной совокупности определяется задачами исследования.

Если изучается какой-нибудь вид диких животных или растений, то генеральной совокупностью будут все особи этого вида. В данном случае объем генеральной совокупности будет очень большой и при расчетах он принимается за бесконечно большую величину.

Если изучается действие какого-нибудь агента на растения и животных определенной категории, то генеральной совокупностью будут все растения и животные той категории (вида, пола, возраста, хозяйственного назначения), к которой относились подопытные объекты. Это уже не очень большое количество особей, но еще недоступное для сплошного изучения.

Не всегда объем генеральной совокупности недоступен для сплошного исследования. Иногда изучаются небольшие совокупности, например, определяется средний удой или средний настриг шерсти у группы животных, закрепленных за определенным работником. В таких случаях генеральной совокупностью будет совсем небольшое количество особей, которые все исследуются. Небольшая генеральная совокупность встречается также при исследовании растений или животных, имеющихся в какой-нибудь коллекции, с целью характеристики определенной группы в данной коллекции.

Характеристики групповых свойств ( и т. д.), относящиеся ко всей генеральной совокупности, называются генеральными параметрами.

Выборка – группа объектов, отличающихся тремя особенностями:

1 это часть генеральной совокупности;

2 отобранная в случайном порядке, определенным образом;

3 исследуемая для характеристики всей генеральной совокупности.

Для того чтобы по выборке можно было получить достаточно точную характеристику всей генеральной совокупности, необходимо организовать правильный отбор объектов из генеральной совокупности.

Теорией и практикой разработано несколько систем отбора особей в выборку. В основу всех этих систем положено стремление обеспечить максимальную возможность выбора любого объекта из генеральной совокупности. Тенденциозность, предвзятость при отборе объектов для выборочного исследования препятствуют получению правильных общих выводов, делают результаты выборочного исследования непоказательными для всей генеральной совокупности, т. е. нерепрезентативными.

Для получения правильной, неискаженной характеристики всей генеральной совокупности необходимо стремиться обеспечить возможность отбора в выборку любого объекта из любой части генеральной совокупности. Это основное требование должно выполняться тем строже, чем более изменчив изучаемый признак. Вполне понятно, что при разнообразии, приближающемся к нулю, например в случае изучения цвета волос или перьев некоторых видов, любой способ отбора выборки даст репрезентативные результаты.

В различных исследованиях применяются следующие способы отбора объектов в выборку.

4 Случайный повторный отбор, при котором объекты изучения отбираются из генеральной совокупности без предварительного учета развития у них изучаемого признака, т. е. в случайном (для данного признака) порядке; после отбора каждый объект изучается и затем возвращается в свою генеральную совокупность, так что любой объект может попасть повторно в выборку. Такой способ отбора равносилен отбору из бесконечно большой генеральной совокупности, для которого разработаны основные показатели взаимоотношений между выборочными и генеральными величинами.

5 Случайный бесповторный отбор, при котором объекты, отобранные, как и при предыдущем способе, случайно, не возвращаются в генеральную совокупность и не могут повторно попасть в выборку. Это наиболее распространенный способ организации выборки; он равносилен отбору из большой, но ограниченной генеральной совокупности, что учитывается при определении генеральных показателей по выборочным.

6 Механический отбор, при котором производится отбор объектов из отдельных частей генеральной совокупности, причем эти части предварительно намечаются механически по квадратам опытного поля, по случайным группам животных, взятых из разных ареалов популяции и т. д. Обычно намечается столько таких частей, сколько предполагается взять объектов для изучения, поэтому число частей бывает равно численности выборки. Механический отбор иногда осуществляется выбором для изучения особей через определенное число, например при пропускании животных через раскол и отборе каждого десятого, сотого и т. д., или при взятии укоса через каждые 100 или 200 м, или отборе одного объекта через каждые встретившиеся 10, 100 и т. д. экземпляров при исследовании всей популяции.

8 Серийный (гнездовой) отбор, при котором генеральная совокупность разбивается на части – серии, некоторые из них исследуются целиком. Применяется этот способ с успехом в тех случаях, когда исследуемые объекты достаточно равномерно распределены в определенном объеме или на определенной территории. Например, при исследовании зараженности воздуха или воды микроорганизмами берут пробы, которые подвергаются сплошному исследованию. В некоторых случаях гнездовым способом могут быть обследованы также сельскохозяйственные объекты. При изучении выходов мяса и других продуктов переработки мясной породы скота в выборку можно взять всех животных этой породы, поступивших на два-три мясокомбината. При изучении величины яйца в колхозном птицеводстве можно в нескольких колхозах провести изучение этого признака у всего поголовья кур.

Характеристики групповых свойств (μ, s и т. д.), полученные для выборки, называются выборочными показателями.

Репрезентативность

Непосредственное изучение группы отобранных объектов дает, прежде всего, первичный материал и характеристику самой выборки.

Все выборочные данные и сводные показатели имеют значение в качестве первичных фактов, вскрытых исследованием и подлежащих тщательному рассмотрению, анализу и сопоставлению с результатами других работ. Но этим не ограничивается процесс извлечения информации, заложенный в первичных материалах исследования.

То обстоятельство, что объекты отбирались в выборку специальными приемами и в достаточном количестве, делает результаты изучения выборки показательными не только для самой выборки, но также и для всей генеральной совокупности, из которой взята эта выборка.

Выборка при определенных условиях становится более или менее точным отражением всей генеральной совокупности. Это свойство выборки называется репрезентативностью, что означает представительность с определенной точностью и надежностью.

Как и всякое свойство, репрезентативность выборочных данных может быть выражена в достаточной или в недостаточной степени. В первом случае в выборке получаются достоверные оценки генеральных параметров, во втором – недостоверные. Важно помнить, что получение недостоверных оценок не умаляет значения выборочных показателей для характеристики самой выборки. Получение же достоверных оценок расширяет область применения достижений, полученных при выборочном исследовании.

Необходимость проводить выборочные исследования, может быть вызвана различными причинами:

    часто полное исследование изучаемого явления слишком дорого стоящее и длительное;

    иногда возможность использовать полученную информацию при полном исследовании может исчерпаться раньше, чем завершится процесс его подготовки;

    в некоторых случаях в результате проверки качества изделия происходит уничтожение исследуемого объекта.

Пример:

    предположим, совокупность — это все учащиеся школы (600 человек из 20 классов, по 30 человек в каждом классе). Предмет изучения — отношение к курению.

Генеральная совокупность — это набор объектов, о которых необходимо получить информацию.

Генеральная совокупность состоит из всех объектов, которые имеют качества, свойства, интересующие исследователя. Иногда генеральная совокупность — это все взрослое население определённого региона (например, когда изучается отношение потенциальных избирателей к кандидату), чаще всего задаётся несколько критериев, определяющих объекты исследования. Например, женщины 10-89 лет, использующие крем для рук определённой марки не реже одного раза в неделю, и имеющие доход не ниже 5 тысяч рублей на одного члена семьи.

Выборка — это небольшой набор объектов, извлеченных из генеральной совокупности.

Выборочная совокупность — это необходимый для исследования минимум результатов (случаев, испытуемых, объектов, событий, образцов) отобранных с помощью определённой процедуры из генеральной совокупности.

Примеры:

    выявление реакции клиентов фирмы на нововведения, все клиенты фирмы представляют собой генеральную совокупность. Те клиенты, которых обзвонили, образуют выборку.

    При аудиторской проверке фирм с большим числом сделок приходится довольствоваться изучением отобранного числа сделок. Все сделки фирмы образуют генеральную совокупность, отобранные — выборку.

    генеральную совокупность образуют все призывники определенного года.

    все лампы, изготовленные за определенное время на некотором предприятии, образуют генеральную совокупность. Те лампы, которые отобраны для контроля, — выбору.

Выборка может рассматриваться в качестве репрезентативной или нерепрезентативной. Выборка будет репрезентативной при обследовании большой группы людей, если внутри этой группы есть представители разных подгрупп, только так можно сделать верные выводы. .

Репрезентати́вность — соответствие характеристик выборки характеристикам популяции или генеральной совокупности в целом. Репрезентативность определяет, насколько возможно обобщать результаты исследования с привлечением определённой выборки на всю генеральную совокупность, из которой она была собрана.

Также репрезентативность можно определить, как свойство выборочной совокупности представлять параметры генеральной совокупности, значимые с точки зрения задач исследования.

Пример: выборка, состоящая из 60 учеников старших классов, гораздо хуже представляет совокупность, чем выборка из тех же 60 человек, в которую войдут по 3 ученика из каждого класса. Главной причиной тому — неравное возрастное распределение в классах. Следовательно, в первом случае репрезентативность выборки низкая, а во втором случае репрезентативность высокая (при прочих равных условиях).

Задача 1. В городе, насчитывающем 253 000 жителей, имеющих право голосовать, исследуйте политические симпатии будущих избирателей.

Решение

    Выборку можно построить, опрашивая каждого 15-о покупателя, выходящего из крупного торгового центра. Такая выборка будет отражать мнение посетителей торгового центра, но вряд ли будет представлять точку зрения всех жителей города.

    Другой метод построения выборки — провести опрос по телефону каждого 100-го жителя города, взяв номера из телефонного справочника. Такая систематическая выборка даст информацию о точке зрения группы людей, имеющих телефон, находящихся дома и отвечающих на телефонные звони. Но она не отражает мнения всех жителей города.

    Еще один метод построить выборку может заключаться в том, чтобы опросить участников митинга, организованного несколькими политическими партиями. Такая выборкка даст информацию о жителях, активно участвующих в политической жизни города.

Итак, нужны такие способы образования выборки, которые представляли бы всю генеральную совокупность, т. е. выборка должна быть репрезентативной (представительной).

Задача 2. Определить, является ли репрезентативной выборка:

1) число автомобильных аварий в июне, если необходимо составить статистический отчет по авариям в городе за год;

2) городские жители при подсчете числа автомобилей на душу населения в стране;

3) люди в возрасте от 40 до 50 лет при выяснении рейтинга молодежной телепрограммы.

Решение

1) Выборка не является репрезентативной. Летом нет снега и наледи на дорогах, а это одна из основных причин аварий.

2) Выборка не является репрезентативной. Понятно, что в городе машин намного больше, чем в сельских районах. Это необходимо учитывать.

3) Выборка не является репрезентативной. Люди в возрасте от 40 до 50 лет едва ли проявят интерес к программе, ориентированной на молодежную аудиторию. При использовании такой выборки рейтинг может сильно упасть, но это не отразит реального положения вещей. Для формирования выборочной совокупности применяются различные способы отбора. Статистические данные должны быть представлены так, чтобы ими можно было пользоваться.

Параметры генеральной совокупности и выборки

N - генеральная совокупность, которая подразделяется на страты N 1 , N 2 и так далее.

Страты представляют собой однородные объекты с точки зрения статистических характеристик (например, население делится на страты по возрастным группам или социальной принадлежности; предприятия — по отраслям). В этом случае выборки называются стратифицированными.

N - объем выборки.

В основе статистических выводов проведенного исследования лежит распределение случайной величины Х, наблюдаемые же значения х 1 , х 2 , х 3 называются реализациями случайной величины x.

Распределение случайной величины X в генеральной совокупности носит теоретический, идеальный характер, а ее выборочный аналог является эмпирическим распределением

Для выборки же функцию распределения определить трудно, а иногда невозможно, поэтому параметры оценивают по эмпирическим данным, а затем их подставляют в аналитическое выражение, описывающее теоретическое распределение. При этом предположение о виде распределения может быть как статистически верным, так и ошибочным.

Но в любом случае восстановленное по выборке эмпирическое распределение лишь грубо характеризует истинное.

Важнейшими параметрами распределений являются математическое ожидание а и дисперсия σ 2 - мера разброса данных.

Стандартное отклонение σ - степень отклонения данных наблюдений или множеств от среднего значения.

Задача 3. Михаил вместе со своими друзьями решил измерить рост своих собак (по холке). Найдите: среднее значение; отклонение роста.

Решение

    Математическое ожидание или среднее значение можно найти по формуле:


    Теперь посчитаем отклонение роста каждой собаки от среднего или математического ожидания, то есть посчитаем дисперсию.


Стандартное отклонение это всего лишь квадратный корень из дисперсии.

σ \ = 147,32

Таким образом, зная стандартное отклонение мы знаем, что значит «нормальный рост», и что является очень высокой и очень маленькой собакой.

Ответ: 394, 21,704; 147,32.

Задача 4. Наблюдение в контрольной лаборатории за сроком годности 50 электроламп одинаковой мощности, взятых наудачу из большой партии выпущенных заводом ламп этой же мощности, привело к следующим данным о нарушении установленного гарантийного срока горения:

Отклонение в Ч

10 мального распределения, которое отражает отклонение фактического срока горения лампочек от гарантийного.

Решение.

Среднее отклонение

Таким образом, искомое нормальное распределение характеризуется следующими значениями параметров: а = 0,4; σ 2 = 318; σ = 17,8.

Отсюда плотность вероятности:

Соответствующая этой плотности функция распределения будет выглядеть:

Генеральная совокупность (в англ. - population ) - совокупность всех объектов (единиц), относительно которых учёный намерен делать выводы при изучении конкретной проблемы.

Генеральная совокупность состоит из всех объектов, которые подлежат изучению. Состав генеральной совокупности зависит от целей исследования. Иногда генеральная совокупность - это все население определённого региона (например, когда изучается отношение потенциальных избирателей к кандидату), чаще всего задаётся несколько критериев, определяющих объект исследования. Например, мужчины 30-50 лет, использующие бритву определённой марки не реже раза в неделю, и имеющие доход не ниже $100 на одного члена семьи.

Выборка или выборочная совокупность - множество случаев (испытуемых, объектов, событий, образцов), с помощью определённой процедуры выбранных из генеральной совокупности для участия в исследовании.

Характеристики выборки:

 Качественная характеристика выборки – кого именно мы выбираем и какие способы построения выборки мы для этого используем.

 Количественная характеристика выборки – сколько случаев выбираем, другими словами объём выборки.

Необходимость выборки

 Объект исследования очень обширный. Например, потребители продукции глобальной компании – огромное количество территориально разбросанных рынков.

 Существует необходимость в сборе первичной информации.

Объём выборки

Объём выборки - число случаев, включённых в выборочную совокупность. Из статистических соображений рекомендуется, чтобы число случаев составляло не менее 30 – 35.

17. Основные способы формирования выборки

Формирование выборки прежде всего основывается на знании контура выборки, под которым понимается список всех единиц совокупности, из которого выбираются единицы выборки. Например, если в качестве совокупности рассматривать все автосервисные мастерские города Москвы, то надо иметь список таких мастерских, рассматриваемый как контур, в пределах которого формируется выборка.

Контур выборки неизбежно содержит ошибку, называемую ошибкой контура выборки и характеризующую степень отклонения от истинных размеров совокупности. Очевидно, что не существует полно официального списка всех автосервисных мастерских г. Москвы. Исследователь должен информировать заказчика работы о размерах ошибки контура выборки.

При формировании выборки используются вероятностные (случайные) и невероятностные (неслучайные) методы.

Если все единицы выборки имеют известный шанс (вероятность) быть включенными в выборку, то выборка называется вероятностной. Если эта вероятность неизвестна, то выборка называется невероятностной. К сожалению, в большинстве маркетинговых исследований из-за невозможности точного определения размера совокупности не представляется возможным точно рассчитать вероятности. Поэтому термин «известная вероятность» скорее основан на использовании определенных методов формирования выборки, чем на знании точных размеров совокупности.

Вероятностные методы включают в себя:

Простой случайный отбор;

Систематический отбор;

Кластерный отбор;

Стратифицированный отбор.

Невероятностные методы:

Отбор на основе принципа удобства;

Отбор на основе суждений;

Формирование выборки в процессе опроса;

Формирование выборки на основе квот.

Смысл метода отбора на основе принципа удобства заключается в том, что формирование выборки осуществляется самым удобным с позиций исследователя образом, например с позиций минимальных затрат времени и усилий, с позиций доступности респондентов. Выбор места исследования и состава выборки производится субъективным образом, например, опрос покупателей осуществляется в магазине, ближайшем к месту жительства исследователя. Очевидно, что многие представители совокупности не принимают участия в опросе.

Формирование выборки на основе суждения основано на использовании мнения квалифицированных специалистов, экспертов относительно состава выборки. На основе такого подхода часто формируется состав фокус-группы.

Формирование выборки в процессе опроса основано на расширении числа опрашиваемых исходя из предложений респондентов, которые уже приняли участие в обследовании. Первоначально исследователь формирует выборку намного меньшую, чем требуется для исследования, затем она по мере проведения расширяется.

Формирование выборки на основе квот (квотный отбор) предполагает предварительное, исходя из целей исследования, определение численности групп респондентов, отвечающих определенным требованиям (признакам). Например, в целях исследования было принято решение, что в универмаге должно быть опрошено пятьдесят мужчин и пятьдесят женщин. Интервьюер проводит опрос, пока не выберет установленную квоту.