Определение численности населения в статистике
В статистике часто используются популяции и выборки — но что это за вещи? Понимание разницы между генеральной совокупностью и выборкой в статистике очень важно для понимания статистических методов. Статистика в значительной степени опирается на изучение как популяций, так и выборок, но целью статистиков является описание популяций.
Как найти
Ответ на вопрос «что такое население в статистике?» это совсем не сложно. Популяция просто описывает всю конкретную группу особей, которые изучаются. Он изучает каждого члена этой конкретной группы. Например, рассмотрим тест. Каждый год можно вычислять средний или медианный балл по для каждого раздела, и при изучении среднего балла теста по математике совокупность состоит из всех сдавших тест. При непосредственном изучении популяции ни один индивид не может быть не учтен.
Термин, обозначающий обсервационное исследование, в котором используется каждый член популяции, — это перепись населения. В Соединенных Штатах национальная перепись населения проводится каждые десять лет. В ходе этого исследования был охвачен каждый представитель населения. Итак, когда статистики говорят о населении, они говорят обо всех людях, участвовавших в исследовании. Популяцией можно назвать практически все, что угодно, при условии, что индивиды внутри нее могут быть классифицированы в соответствии с одним или несколькими общими признаками. Например, в нашем примере с тестом, все учащиеся, сдавшие тест, образуют совокупность. В данном случае это тоже перепись населения. Однако статистическое исследование не всегда позволяет получить данные от всей совокупности. Например, в исследовании, целью которого является описание среднего веса всех женщин-спортсменок учащихся в институтах в США, население будет состоять исключительно из женщин-спортсменок институтов. Возможно, будет трудно собрать все эти данные, поэтому будет измерена только часть спортсменок колледжа. Однако, поскольку мы хотим описать всех студенток-спортсменок колледжа, они остаются основной массой населения.
Группы населения в статистике могут быть настолько конкретными или неконкретными, насколько мы пожелаем. В конечном счете, все сводится к цели проводимого конкретного исследования. Население США — это люди, которые живут здесь, но в исследовании о тех, кто голосует впервые, интересующей группой будут все те, кто голосует впервые, а не все население США.
Пример населения в статистике
Вот несколько примеров исследований вместе с их популяциями.
- Местная некоммерческая организация хочет знать, какой процент водителей в их городе пишут SMS во время вождения. Чтобы проверить это, они набирают группу из 200 жителей города, имеющих действительные водительские права, и проводят с ними опрос. В этом исследовании все население — водители в городе.
- Магазин мороженого хочет знать, какой процент покупателей предпочитает есть мороженое в столовой, а не заказывает его на вынос. Чтобы проверить это, они ведут учет каждого клиента, который приходит в течение одного дня, и обобщают результаты. Люди, представляющее интерес для данного исследования, — это все посетители этого магазина мороженого, а не только те, кто пришел в тот день.
- Математический факультет университета решает разработать один стандартный тест для всех своих студентов-статистиков, чтобы убедиться, что все преподаватели статистики соответствуют определенным стандартам качества. В конце семестра каждый студент в классе статистики сдает один и тот же экзамен. Здесь интересующая нас совокупность — это все студенты-статистики в этом университете, и поскольку все они изучаются, это квалифицируется как перепись населения.
Что такое выборка в статистике?
В некоторых из предыдущих примеров было невозможно изучить всю популяцию. Это часто имеет место в статистике, и по этой причине используются выборки, а не совокупности. В ситуациях, когда трудно измерить всю совокупность, необходимо провести выборку. Чтобы понять, что такое выборка в статистике, рассмотрим предыдущий первый пример. Местная некоммерческая организация хочет описать всех водителей в своем городе, но насчитывает только 200 человек. Эти 200 водителей составляют выборку для данного исследования. В общем, выборка в статистике описывает тех людей, от которых мы получаем данные.
Хотя существует много способов взять пробу, некоторые методы отбора проб лучше других. В статистике, даже при работе с выборками, статистики хотят описать всю совокупность. Это означает, что важно убедиться в том, что взятая выборка является хорошей репрезентативной для населения. Это делается двумя основными способами: во-первых, путем взятия вероятностных выборок или рандомизированной выборки, и, во-вторых, путем повторения исследования с большим количеством повторяющихся выборок. Эти два метода помогают снизить вероятность смещения выборки.
Совокупность по сравнению с выборкой
Диаграмма, показывающая большую группу с надписью «популяция» и меньшую группу с надписью «выборка»
Как найти образец?
Существуют различные методы отбора образцов. Вот несколько примеров методов отбора проб:
- Простая случайная выборка — аналогично вытягиванию имен из шляпы, индивиды в популяции выбираются случайным образом и изучаются.
- Стратифицированная случайная выборка — совокупность разбивается на две или более групп, и из каждой группы берется случайная выборка.
- Кластерная выборка — совокупность разбивается на множество групп. Некоторые из этих групп выбираются случайным образом, и каждый член каждой выбранной группы формирует выборку.
- Удобная выборка — самый простой метод выборки, удобная выборка описывает использование только тех людей, которые находятся под рукой, например, попросить первых десять человек, которых вы встретите, принять участие в опросе.
Из них простая случайная выборка является наиболее предпочтительным вариантом для получения репрезентативной выборки, а удобная выборка — это метод, который с наибольшей вероятностью содержит предвзятость.
Итак, подводя итог, можно сказать, что эта концепция используется в выборках, когда трудно изучить каждого индивида в популяции. Это происходит путем выделения части из этой популяции. Всегда есть надежда на то, что выборка будет хорошо репрезентативна для населения и что измерения, полученные из выборки, будут соответствовать измерениям для всего населения.
Пример выборки в статистике
Вот несколько примеров выборок в статистике.
- Работодатель желает пройти тест на наркотики, но не располагает ресурсами или рабочей силой для тестирования на наркотики каждого сотрудника. Таким образом, работодатель рассматривает три группы работников: администрацию, канцелярских работников и работников на этажах. Из каждой из этих групп берется простая случайная выборка. Это стратифицированная случайная выборка, которая обеспечивает хорошее представление о структуре компании в целом.
- Исследователь хочет знать среднее количество часов просмотра телевизора в день студентами колледжа. Она выбирает десять аудиторий в кампусе колледжа и наугад выбирает день и время: понедельник в 10:40 утра. В понедельник в 10:40 она опрашивает каждого ученика в этих десяти классах. Это кластерная выборка, и, рандомизируя свой выбор аудиторий, она надеется устранить предвзятость и получить хорошую репрезентативную выборку для совокупности всех студентов колледжа.
- Игровая компания хочет получить немедленный отклик на новую игру. Они поручили своему комьюнити-менеджеру провести опрос в социальных сетях на следующий день после запуска новой игры. Это удобная выборка, потому что подписчики в социальных сетях — это простой способ получить выборку людей, которые находятся под рукой. Однако эта выборка может быть не репрезентативной для населения, которым являются все геймеры, потому что не все, возможно, приобрели игру в первый день, и пользователи, с большей вероятностью откликнувшиеся на опрос компании в социальных сетях, могут оказаться на периферии — те, кому игра сильно не нравится, и те, кто сильно нравится это. Чтобы улучшить эту выборку, компании следует подождать, пока у них не будет хорошего списка пользователей, а затем напрямую опросить случайную выборку из этого списка.
Толпа людей
Часто задаваемые вопросы
Что вы подразумеваете под населением в статистике?
Популяция относится ко всем индивидам, которых исследование хочет описать. В исследовании, в котором выборка студентов колледжа описывает свои привычки в еде, представляющей интерес популяцией могут быть все студенты колледжа. Обычно выборка представляет собой несколько индивидов, удовлетворяющих определенным критериям, в то время как совокупность — это все такие индивиды.
Почему используется выборка вместо генеральной совокупности?
Не всегда возможно наблюдать или изучать каждого представителя популяции. Рассмотрим проблему опроса каждого зарегистрированного избирателя или, что еще сложнее, измерения количества каждого тунца в океанах. По этой причине возьмите выборки из тех групп населения, которые хорошо отражают то, на что похожа популяция в целом, и измерьте их.
Что подразумевается под выборкой в статистике?
В статистике выборкой являются только те лица, которые предоставляют данные. Итак, это люди, которые на самом деле ответили на опрос, люди, которые участвовали в исследовании, или объекты, которые мы на самом деле измеряли. Если от физического лица не получено никаких данных, то этого физического лица нет в выборке.
Как вы находите выборку в статистике?
Чтобы найти выборку в статистике, спросите: «От каких лиц были получены данные?» В опросе выборка — это те, кто откликнулся (а не только те, кому позвонили). В наблюдательном исследовании выборкой являются люди или объекты, за которыми ведется наблюдение.
В чем разница между генеральной совокупностью и выборкой?
Популяция — это все индивиды, которых касается данное исследование. Выборка — это только те индивиды в популяции, у которых были взяты данные. Если выборкой является все население, то исследование называется переписью населения.