Джек работает над созданием некоммерческой организации по спасению ненужных пасхальных кроликов. Он собирает информацию и исследования, чтобы представить их потенциальным членам совета директоров. Джек хочет убедиться, что он предоставляет самую лучшую информацию, не вводя членов совета директоров в заблуждение. Хотя статистика может быть мощным инструментом, ее часто игнорируют из-за людей, которые хотят злоупотреблять данными и использовать их не по назначению. Чтобы избежать этой проблемы, Джеку нужно будет понять вводящие в заблуждение способы использования статистики.
На этом уроке вы узнаете о проблемах, возникающих при выборке и опросах, а также о проблемах с интерпретацией данных. Во-первых, давайте обсудим проблемы, которые могут возникнуть при выборке и опросах, когда статистика может вводить в заблуждение.
Проблемы с выборкой и опросами
Джек решает провести опрос, чтобы собрать информацию о необходимости спасения пасхального кролика. Он решает опросить нескольких близких друзей, задав им 10 вопросов с ответом «да» или «нет» о спасении кроликов. Давайте посмотрим на некоторые проблемы, которые могут возникнуть при анализе данных Джека.
Во-первых, у Джека плохой образец. Он не может предполагать, что группа его друзей представляет собой беспристрастную и полностью репрезентативную смесь. Это известно как, нерепрезентативная выборка, которая представляет собой выборку, отобранную методом, который специально исключает определенные группы из исследования, намеренно или непреднамеренно. Иногда сложно провести опросы, которые были бы полностью репрезентативными для населения. Однако важно знать об этих факторах и группах, которые могут быть упущены при сборе данных.
Далее у Джека плохой опрос, в котором есть несколько проблем:
- Ограничивающие вопросы
- Наводящие вопросы
- Социальная желательность
Вопросы типа «да» или «нет» не всегда дают хорошее представление о данных, собираемых из выборки. Эти вопросы ограничивают ответ участника. Например, предположим, что один из вопросов опроса Джека гласит: «Каждый год тысячи пасхальных кроликов выбрасываются, потому что они больше не нужны в качестве подарка». Если бы каждый спасатель был готов содержать хотя бы двух кроликов, мы могли бы многое изменить. Готовы ли вы содержать двух кроликов? Да или нет?’
Это ограничивающий вопрос. Участники опроса, возможно, захотят разместить одного кролика-спасателя, но не смогут разместить двух. Ответ «да» или «нет» не дает Джеку полной картины этих данных и ограничивает объем информации, которую он может собрать. Кроме того, могут быть участники, которые захотят взять на воспитание кролика или посвятить время волонтерству. Если Джек ищет информацию о том, сколько опрошенных участников заинтересованы в участии в спасении кроликов, то этот вопрос ограничивает информацию, которую он может собрать.
Наводящие вопросы — еще одна проблема, которая может привести к вводящей в заблуждение статистике. Наводящие вопросы – это вопросы, которые побуждают исследователя получить желаемые ответы. Например, приведенный выше вопрос Джека побуждает участника добровольно заняться домашним кроликом. Лучшим, но менее наводящим вопросом может быть: «Как вы думаете, какие способы могут помочь решить проблему брошенного кролика?» Это открытое приглашение участников ответить по-своему и не принуждает их отвечать определенным образом.
Другой проблемой является социальная желательность, которая означает склонность участников отвечать неточно, исходя из того, как, по их мнению, они должны отвечать, а не давать правдивый ответ. Например, участники могут положительно ответить на такие вопросы, как: «Считаете ли вы, что проблема отказа от кроликов важна?» потому что они не хотят выглядеть придурками, которым плевать на кроликов! Однако иногда участники могут не быть искренне заинтересованы в конкретном вопросе, и это может дать вводящие в заблуждение данные об уровне участия некоммерческого бизнеса в будущем.
Далее давайте поговорим о проблемах, которые могут возникнуть с данными после их сбора.
Проблемы с интерпретацией данных
Джек может ввести свою аудиторию в заблуждение, заставив ее неточно интерпретировать данные несколькими способами:
- Вводящие в заблуждение графики
- Проблемы с рейтингом
- Квалификационные проблемы
Графики — отличный способ отобразить информацию, собранную исследователем. Однако очень легко отобразить информацию неправильно или запутанно. Чтобы этого избежать, Джеку нужно будет ответить на несколько вопросов о своих данных:
- Как измеряется независимая переменная?
- Как измеряется зависимая переменная?
- Какие типы данных являются независимыми и зависимыми переменными?
Как только Джек поймет, какие данные используются в опросе, он сможет лучше понять, как организовать свои данные. Более подробную информацию о графиках и данных можно найти в наших уроках по таблицам и графикам.
Правильное построение графика — первый шаг во избежание вводящей в заблуждение статистики. Посмотрите этот график
Можете ли вы найти что-нибудь вводящее в заблуждение в этом графике? Обратите внимание на левую часть графика. Видите, насколько нерегулярны интервалы? График идет от нуля до трех, от семи до десяти и так далее. Из-за этого разница между количеством брошенных кроликов и количеством других брошенных животных выглядит совершенно по-разному. Однако взгляните на те же данные на другом графике, на этот раз с регулярными интервалами:
Хотя данные показывают нам, что количество брошенных животных со временем увеличилось, разница между количеством кроликов и количеством других животных на самом деле весьма мала.
Рейтинг в статистике также часто может вводить в заблуждение. Например, если Джек сказал, что среди проблем пасхальных праздников люди считают спасение кроликов самым важным, то можно предположить, что многих людей беспокоит проблема брошенных кроликов. Однако, если бы Джек ставил спасение кролика среди других вопросов, таких как поиск последнего пасхального яйца до того, как оно сгнило, и кто съел уши моему кролику, то, конечно, живое существо, вероятно, заняло бы довольно высокий рейтинг.
Кроме того, ранжированная статистика не всегда указывает выборочную группу. Если бы люди, которые поставили спасение кроликов на первое место, были волонтерами из организации Джека, то это была бы очень необъективная статистика.
Часто вы услышите статистику, представленную с вводящими в заблуждение уточнениями, например: «В пасхальный понедельник кролики — самые брошенные домашние животные в пригороде». Это сравнение кроликов с другими домашними животными из пригорода в пасхальный понедельник, чтобы количество брошенных кроликов выглядело впечатляюще. Однако это дает нам слишком мало информации для правильной интерпретации данных.
Например, вы можете подумать, что повсюду есть бедные брошенные кролики! Однако, поскольку в этом утверждении используются уточнения «в пасхальный понедельник» и «домашние животные в пригороде», это действительно ограничивает круг брошенных животных, с которыми сравниваются кролики. В пасхальный понедельник может быть много брошенных кроликов, но в общей схеме брошенных животных их может быть меньше. Когда в статистике используются уточнения, чтобы сузить категорию, сохраняя при этом ее расплывчатость, это может ввести в заблуждение.
Итог урока
Существует множество способов сбора и интерпретации информации с помощью статистики. Однако этой информацией легко ввести в заблуждение. На этом уроке мы обсудили вводящую в заблуждение статистику из-за проблем с выборками и опросами, а также проблемы с интерпретацией данных.
Иногда исследователь может оказаться с нерепрезентативной выборкой, то есть выборкой, отобранной методом, который специально исключает определенные группы из исследования, намеренно или непреднамеренно.
При проведении опроса исследователь может иметь:
- Ограничивающие вопросы
- Наводящие вопросы
- Социальная желательность
Ограничивающий вопрос может быть вопросом «да» или «нет». Эти вопросы не всегда дают хорошее представление о данных, собираемых из выборки. Эти вопросы ограничивают ответ участника. Наводящие вопросы — это вопросы, которые поощряют ответы, желаемые исследователем, а также социальная желательность, которая относится к склонности участников отвечать неточно, исходя из того, как, по их мнению, они должны отвечать, а не давать правдивый ответ.
Вы также можете столкнуться с проблемами при интерпретации данных:
- Вводящие в заблуждение графики
- Проблемы с рейтингом
- Квалификационные проблемы
Графики могут вводить в заблуждение, если они не подходят для организации части данных или когда они визуально искажают данные, например, отображая нерегулярные интервалы.
Проблемы с ранжированием возникают, когда исследователь не указывает количество того, что оценивается, и с чем сравниваются данные в исследовании. Кроме того, проблемы с квалификацией возникают, когда категория данных слишком узка, а другие элементы в категории неясны.
В конечном счете, чем конкретнее вы будете использовать свои данные, тем лучше и меньше вы будете вводить в заблуждение при представлении и анализе информации.