Смешение и предвзятость в статистике: определение и примеры

Проблемы со статистическим анализом

Статистика — весьма полезный инструмент, если она находится в правильных руках. Она может помочь политикам выяснить, как лучше всего планировать свои кампании, предупредить преподавателей о студентах с особыми потребностями, помочь исследователям в создании новых лекарств или дать предприятиям некоторое представление о том, как ведут себя их клиенты. Однако в неквалифицированных руках статистика может принести больше проблем, чем пользы. Даже если ваши намерения чисты, статистический анализ часто может выявить вещи, которые далеки от истины. В этом уроке мы рассмотрим две конкретные проблемы, влияющие на статистику, а также рассмотрим примеры их возникновения.

Что сбивает с толку?

При планировании статистического анализа, будь то простой опрос или двойное слепое исследование, исследователи должны опасаться внесения каких-либо проблем в выборку. В конце концов, выяснить, что предсказывает набор данных, зачастую достаточно сложно, даже не разбирая дополнительные ошибки! Любая проблема, которая снижает вероятность того, что статистические данные смогут дать однозначный и реалистичный набор ответов, называется искажающей. Смешение может произойти, когда набор данных поврежден из-за плохих методов сбора, а также когда весь эксперимент проводится без достаточного контроля. Контроль – это метод, используемый статистиками для обеспечения того, чтобы исследовался только рассматриваемый вопрос. Например, если вы собираетесь спросить группу богатых людей, куда они ходили в продуктовый магазин, некоторые элементы управления будут включать в себя опрос только богатых людей или только людей, которые живут в районе, где много продуктовых магазинов. Аналогично, если бы вы готовили двойное слепое исследование, чтобы выяснить, популярен ли один безалкогольный напиток больше другого, вы бы учли расу, пол и экономическое происхождение.

Что такое предвзятость?

В то время как путаница относится к проблемам со структурой сбора данных, предвзятость относится к проблеме со способом сбора данных. Конечным результатом этого является набор данных, который радикально отличается от реальности. Существует много способов создать предвзятость в данных. Систематическая ошибка отбора возникает, когда для ответа на вопрос выбираются только определенные люди. В одном из приведенных выше примеров нам было интересно узнать, как богатые люди покупают продукты. Помните, что если не использовать элементы управления, например спрашивать людей о выборе продуктовых магазинов, это может привести к путанице. Предвзятость отбора будет заключаться только в опросе людей, которые делают покупки в одном месте, и экстраполяции их ответов на более обобщенные данные. Возможно, сайт на самом деле весьма непопулярен, но ваши данные предсказывают обратное. Фактически, если бы исследование оплачивалось соответствующим продуктовым магазином, у вас могли бы возникнуть обвинения в предвзятости финансирования, в результате чего можно было бы задать вопросы об объективности исследования из-за источника финансирования исследования. Кроме того, ошибка воспоминаний, при которой человек не может точно вспомнить точные события, может возникнуть, когда человека спрашивают, сколько раз он посещал несколько магазинов за последний год. Наконец, может возникнуть предвзятость наблюдателя, если на человека влияет человек, задающий вопросы. Если кто-то хотя бы намекает на правильный ответ, этого может быть достаточно, чтобы убедить кого-то позволить ему услышать то, что он хочет услышать.

Итоги урока

Даже самые лучшие опросы страдают от путаницы и предвзятости. Путаница возникает, когда сбор данных не структурирован должным образом и не имеет достаточного контроля. Помните, что контроль помогает гарантировать, что проверяется только рассматриваемая переменная, ограничивая ввод других факторов. С другой стороны, предвзятость — это проблема самого исследования, а не его структуры.

Предвзятость может существовать во многих формах, в том числе:

  • Предвзятость наблюдателя, которая возникает, если на человека влияет человек, задающий вопросы.
  • Предвзятость воспоминаний, при которой человек не может точно вспомнить точные события.
  • Предвзятость финансирования, при которой могут быть заданы вопросы об объективности исследования из-за источника финансирования исследования, и
  • Предвзятость отбора, или когда для ответа на вопрос выбираются только определенные люди.
Поделитесь материалом
Автор статьи: Наталья Венедиктова
Наталья Венедиктова
Историк-исскусствовед, специалист в области истории, географии и искусства. Много путешествовала, изучала эволюцию художественных стилей, культурные контексты произведений и влияние искусства на общественные и исторические процессы.
Наталья Венедиктова опубликовал статей: 315

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *