Какова цель статистики?
Статистика — это математический предмет, который собирает, систематизирует, анализирует и интерпретирует данные. Цель статистики – сделать обоснованные выводы на основе выборки данных, представляющей совокупность популяции.
Интерпретация собранных данных предоставит возможность понять население.
Статистическое моделирование
Статистическое моделирование использует математические модели и статистические выводы для создания данных, которые можно использовать для понимания реальных ситуаций. Статистические модели показывают математическую связь между случайными величинами.
Типы статистических моделей
Статистические модели можно объединять в группы по параметрам. Параметр — это числовое или иное измеримое значение, используемое для объяснения или определения набора данных и взаимосвязей между ними. Параметры можно рассматривать как ограничения или рекомендации, которым следуют данные. Ниже приведены пояснения статистических моделей.
- Параметрические модели имеют распределения вероятностей с известными заданными параметрами.
- Непараметрические модели имеют значения, в которых параметры могут изменяться и не установлены изначально.
- Полупараметрические модели представляют собой смесь параметрических и непараметрических моделей, фиксированных и гибких.
Типы переменных
Модели имеют переменные и данные. Переменная — это характеристика исследуемого объекта, которая может представлять любое значение в наборе, которое можно измерить или классифицировать. Данные — это то, как измеряются переменные; собранная информация.
Переменные ответа
Переменные отклика более известны как зависимые переменные. Зависимые переменные являются результатом исследования. Зависимые переменные измеряются, чтобы увидеть, как на них влияет изменение независимых переменных.
Независимые переменные
Независимые переменные — это переменные, которые изменяются, чтобы увидеть, будут ли результаты исследования отличаться. Независимые переменные — это часть исследования, которая считается причиной изменения данных. На независимые переменные никогда не влияют другие переменные.
Пояснительные переменные
Независимые переменные — это особые типы независимых переменных, на которые не могут полностью влиять другие переменные. Хотя можно считать, что переменная влияет только на других, это не означает, что переменная сама по себе не имеет побочного эффекта.
Категориальные данные
Категориальные данные — это мера переменной, помещенная в группы. Группы или категории иногда обозначаются числами, но цифры не обозначают количество. Числа соответствуют группе. Категориальные данные можно разбить на две группы.
Порядковые и номинальные данные
- Порядковые данные объединяются в группы на основе ранговой системы. Система рейтинга может представлять собой позицию в гонке или рейтинг, полученный в результате опроса.
- Номинальные данные размещаются в группах без ранговой системы. Группы могут представлять собой названия автомобилей, видов спорта или даже жанров фильмов.
Количественные данные
Количественные данные — это мера переменной, представленная числовыми величинами. Собранными данными можно манипулировать с помощью математических операций, таких как сложение, вычитание, умножение или деление. Цифры в количественных данных представляют фактическое количество товаров. Существуют две подгруппы количественных данных.
Дискретные и непрерывные данные
- Дискретные данные — это конечные данные, которые можно посчитать. Количество животных в зоопарке или количество яблок, висящих на деревьях, являются примерами дискретных данных.
- Непрерывные данные — это измерение данных, не имеющее границ и ограничений. Числа могут обозначать возраст, вес и даже размер обуви. Все это можно измерить и не имеет предела.
Примеры статистических данных
Статистические данные можно найти во всех аспектах жизни. Сбор, организация, анализ и интерпретация данных (статистики) можно увидеть в самых простых и самых сложных сферах жизни. Ниже приведены несколько примеров статистических данных.
- Самый популярный урок среди четвероклассников – урок рисования. Статистические данные являются категорически порядковыми данными, поскольку собранную информацию можно разделить на группы, а результаты можно ранжировать. Независимой переменной будут все участники, которые являются четвероклассниками. Переменными ответа будут все доступные классы, в которых обучаются четвероклассники.
- Число пассажиров городских автобусов, носящих кроссовки, в среднем составляет пять из шести пассажиров. Статистические данные являются количественно дискретными, поскольку пассажиров можно посчитать, а количество возможных пассажиров в городском автобусе максимально. Независимой переменной будут пассажиры городских автобусов. Переменными ответа будут различные типы обуви. Эти статистические данные также имеют объясняющую переменную. Объясняющей переменной будет расстояние, которое пассажирам придется пройти после выхода из автобуса. Причина, по которой многие носят кроссовки, может заключаться в комфорте ходьбы после поездки, а не только в том, что они ездят на городском автобусе.
- Был проведен опрос всех посетителей, пришедших в библиотеку. Посетителей спросили, книгу какого жанра они прочитали последней. При опросе посетителей библиотеки статистические данные являются категорически номинальными, поскольку по жанру книги относятся к группам и группы не расположены в каком-либо порядке.
Итог урока
Статистика — это математический предмет, который собирает, систематизирует, анализирует и интерпретирует данные. Статистическое моделирование использует математические модели и статистические выводы для создания данных, которые можно использовать для понимания реальных ситуаций. Статистические модели показывают математическую связь между случайными величинами. Статистические модели можно объединять в группы по параметрам. Параметр — это числовое или иное измеримое значение, используемое для объяснения или определения набора данных и взаимосвязей между ними. Типы статистических моделей: параметрические, непараметрические и полупараметрические. Параметры либо установлены и известны, либо являются гибкими, либо представляют собой комбинацию этих двух параметров.
Переменная — это характеристика исследуемого объекта, которая может представлять любое значение в наборе, которое можно измерить или классифицировать. Данные — это то, как измеряются переменные, собранная информация. Переменные и данные можно разбить на подгруппы. Переменные могут быть зависимыми (откликом), независимыми или объяснительными. Зависимые переменные являются результатом исследования. Независимые переменные — это переменные, которые изменяются, чтобы увидеть, будут ли результаты исследования отличаться. Независимые переменные представляют собой особый тип независимых переменных, на которые не могут полностью влиять другие переменные. Данные могут быть категориальными или количественными. Оба типа данных также можно разбить на определенные группы.
Категориальный: группы | Количественный: подсчитанный |
Порядковый: сгруппирован по рангу | Дискретный: конечное число. |
Номинальный: сгруппирован без ранжирования | Непрерывный: бесконечное число. |
Часто задаваемые вопросы
Что подразумевается под статистическим моделированием?
Статистическое моделирование — это метод, используемый для объяснения ситуаций. Статистические модели используют математические инструменты и статистические выводы для создания данных, которые можно использовать для понимания реальных ситуаций.
Каковы две основные цели статистики?
Статистика имеет множество целей. Двумя основными целями статистики являются интерпретация данных и прогнозирование будущих событий на основе данных.
Как построить статистическую модель?
Статистическая модель создается на основе реальной ситуации. Модель производит данные, которые обобщаются для будущего использования. Модель должна включать две случайные величины, имеющие взаимосвязь.
Для чего используются статистические модели?
Статистические модели используются для прогнозирования или вывода выводов. Эти предсказания и выводы основаны на том, как связаны две случайные величины. Модели покажут взаимосвязь между переменными.