Что такое категориальные данные? — Определение и примеры

Определяющие данные

Энди работает над классным проектом по генетике. Ему нужно собрать данные о генах каждого из своих одноклассников и проанализировать эти данные для своего классного проекта. С чего Энди следует начать сбор своих данных?

Во-первых, ему нужно будет разобраться в данных, которые представляют собой информацию, собираемую для анализа. Данные обычно используются либо для доказательства, либо для опровержения гипотезы. Данные могут быть сгруппированы в два различных типа информации: категориальную и количественную.

На этом уроке вы узнаете о категориальных данных и о том, как они используются в статистике.

Понимание категориальных данных

Категориальные данные — это данные, которые собираются в группах или темах; количество событий в каждой группе подсчитывается численно. Например, если бы я хотел понять различные типы читательских интересов в моем офисе, то я мог бы собрать категориальные данные, чтобы определить жанр книг, которые нравятся каждому из моих коллег. Я могу организовать эти данные в таблицу, подобную этой:

Таблица для примера

В этом примере 4 человека сказали, что им нравится мистика, 3 человека любят романтику, 6 любят фантастику и 8 любят фэнтези.

Жанр Мистика Романтика Фантастика Фэнтези
4 3 6 8

Энди может использовать этот же метод сбора категориальных данных для своего проекта.

Во-первых, Энди нужно будет определить различные категории информации, которую он хочет собрать для своего класса. Он хочет знать о цвете волос, глаз, расщелинах подбородков и оторванных мочках ушей. Он раздает опрос 22 людям в своем классе.

Энди может создать таблицу на основе собранных им данных. Посмотрите:

Таблица для примера проекта класса

Каждая часть этой таблицы показывает категориальные данные, которые были собраны и могут быть использованы Энди в его исследовании. Прежде чем мы поговорим об анализе этих данных, давайте обсудим разницу между категориальными и количественными данными.

Категориальные и количественные данные

Бывает трудно понять различия между категориальными и количественными данными. Помните, что категориальные данные, как следует из названия, сгруппированы в какую-то категорию или несколько категорий. Количественные данные связаны с количествами. Такие данные, как рост, вес, средний балл, количество часов, потраченных на учебу, и другие типы информации, которые являются количественными и собираются просто в виде цифр.

Хороший способ запомнить разницу между категориальными и количественными данными — это изучить ответ на вопрос. Если ответом является число, то данные являются количественными. Если ответом является предпочтение, характеристика или что-либо еще, кроме числа, то данные являются категорическими.

Например, если вы спросите кого-нибудь, какой у вас рост? они ответили бы цифрой: 5 футов 6 дюймов. Если бы кто-нибудь спросил, какой ваш любимый вид спорта? затем они отвечали, отдавая предпочтение баскетболу. Таким образом, первый вопрос дает нам количественные данные, а второй — категориальные.

Теперь, когда вы понимаете разницу между категориальными и количественными данными, давайте посмотрим, как вы можете использовать категориальные данные в статистике.

Использование категориальных данных

Категориальные данные лучше всего анализировать путем преобразования информации в таблице в проценты. Например, данные Энди лучше всего можно проанализировать, преобразовав итоговые данные по каждой категории в процентное соотношение. Таким образом, он знает процентное соотношение каждой генетической характеристики.

, данные показаны в процентах

Таблица с процентами, например

В этой таблице мы можем видеть в углу, что сумма всех таблиц достигает 99%. Это связано с тем, что мы рассчитали каждый процент только с точностью до десятой доли десятичного знака. Вы можете использовать каждую строку и столбец для интерпретации информации о генетическом распределении в каждом классе. Например, в нижней части первой колонки мы видим, что у 13,5% учащихся в классе черные волосы. Если вы посмотрите на вторую колонку, вторую строку, то увидите, что у 22,5% одноклассников Энди каштановые волосы и карие глаза.

Вы также можете использовать категориальные данные для группировки большой числовой информации в управляемые категории. Например, допустим, Энди хотел включить рост в свой отчет о генетическом распределении в своей школе, а не только в своем классе. Поскольку в школу Энди ходит много людей, он хочет сгруппировать эту информацию по более мелким фрагментам. Он делает это, проводя следующий опрос:

Опрос для примера
пример опроса
Обратите внимание, что Энди взял количественные данные и превратил их в категориальные, сгруппировав несколько вариантов ответа по разным категориям. Это позволит ему анализировать свои данные по группам, а не по каждому отдельному росту. Теперь он может занести эту информацию в свою таблицу вместе с информацией, которую он собрал о цвете волос. И вот к чему он пришел:

дополнительная таблица, например

Дополнительная таблица, например

Из этой таблицы видно, что у вас есть 38% шанс встретить в школе Энди кого-нибудь с каштановыми волосами и ростом от 5 футов 3 до 5 футов 7 дюймов.

Чтобы получить доступ к этому уроку, вы должны быть Study.com Участник. Создайте свою учетную запись

Краткое содержание урока

Категориальные данные — это хороший способ сбора информации, которая не представлена в виде цифр или если цифры необходимо сгруппировать для анализа. Категориальные данные — это данные, которые собираются в группах или темах; количество событий в каждой группе подсчитывается численно. Это отличается от количественных данных, которые связаны с количествами и включают любые данные, собранные в числовой форме. Не забывайте: хороший способ запомнить разницу между категориальными и количественными данными — это изучить ответ на вопрос. Если ответом является число, то данные являются количественными. Если ответом является предпочтение, характеристика или что-либо еще, кроме числа, то данные являются категорическими. Вы также можете сгруппировать числовые данные, чтобы облегчить их анализ, точно так же, как Энди поступил с показателями роста своих одноклассников.

 

Поделитесь материалом
Автор статьи: Наталья Венедиктова
Наталья Венедиктова
Историк-исскусствовед, специалист в области истории, географии и искусства. Много путешествовала, изучала эволюцию художественных стилей, культурные контексты произведений и влияние искусства на общественные и исторические процессы.
Наталья Венедиктова опубликовал статей: 315

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *