Показатели центральной тенденции | Определение, формула и примеры

Что такое показатели центральной тенденции?

«Показатели центральной тенденции» — одна из наиболее важных концепций при изучении описательной статистики, типа статистики, используемой для описания и суммирования значений в наборе данных. Меры центральной тенденции не предоставляют информацию об отдельных значениях набора данных. Скорее, это набор числовых значений, которые лучше всего представляют или суммируют середину набора данных. Для определения центральной тенденции можно использовать следующие меры:

  • Среднее: среднее значение отдельных значений набора данных.
  • Медиана: число в середине набора данных с равным количеством значений выше и ниже него.
  • Мода: число или значение, которое чаще всего встречается в наборе данных.

Диапазон часто учитывается при определении показателей центральной тенденции. Однако на самом деле диапазон является мерой вариаций. Мера вариации описывает изменчивость данных или степень распределения данных в наборе данных.

Для чего используются среднее значение, медиана, мода и диапазон?

Среднее значение не всегда является лучшим показателем центральной тенденции набора данных. Когда данные имеют симметричное распределение или колоколообразную кривую, среднее значение, медиана и мода находятся в центре распределения. Если набор данных содержит выбросы или значения, которые значительно выше или ниже остальных, он может выглядеть искаженным при представлении на графике. Искаженное распределение — это когда хвост распределения на графике длиннее другого. Если хвост длиннее к отрицательной стороне числовой прямой, он скошен влево. Если хвост длиннее на положительной стороне числовой прямой, он перекошен вправо. Чем больше распределение искажено вправо или влево, тем менее точным является среднее значение.

медиана всегда будет находиться посередине среднего значения и моды.

Для любого асимметричного распределения медиана всегда будет находиться посередине среднего значения и моды.

В отличие от среднего значения, медиана не рассчитывается с использованием всех чисел в наборе данных, поэтому на нее не влияют экстремальные выбросы или сильно искаженные распределения.

Мода предоставляет значение, которое чаще всего встречается в наборе данных. Этот режим часто используется с наборами данных, которые включают категориальные данные или данные, которые могут быть организованы в группы, но не имеют математического значения. Почтовые индексы и номера телефонов — это типы числовых данных, которые не имеют математического значения, поскольку не указывают на тенденции в наборе данных. Мода полезен для поиска самого популярного варианта в категориальном наборе данных, например, самого любимого цвета.

Диапазон — это числовое значение, которое представляет разброс набора данных. Диапазон может вводить в заблуждение, если в наборе данных есть крайние выбросы.

Как найти среднее значение

В математике нахождение среднего значения является синонимом нахождения среднего значения набора чисел.

Чтобы вычислить среднее значение:

  • Определите общее количество значений.
  • Определите сумму значений.
  • Разделите сумму всех значений на общее количество.

Как найти медиану

Есть два способа найти медиану. Правильный метод зависит от количества значений в наборе.

Если набор данных имеет нечетное количество чисел в наборе:

  • Организуйте значения «по величине» (от меньшего к большему).
  • Найдите значение, которое находится прямо в середине множества.

Если набор данных имеет четное количество чисел в наборе:

  • Упорядочите значения по величине.
  • Найдите два значения, которые расположены прямо в середине набора.
  • Сложите два значения вместе, затем разделите сумму на два.

Как найти моду

Мода — это число, которое чаще всего встречается. Мода не может быть уникальным значением, если ни одно число не повторяется чаще других.

  • Организуйте данные по группам или величине.
  • Определите значение, которое чаще всего встречается в наборе.

Как найти диапазон

Диапазон представляет собой числовую разницу между максимумом и минимумом.

  • Определите максимальное (самое большое) и минимальное (наименьшее) значения.
  • Вычтите минимум из максимума.

Пример использования среднего значения, медианы, мода и диапазона

Ниже приведен пример того, как среднее значение, медиана, мода и диапазон могут быть получены из одного и того же набора данных.

Американский университет включил в свой список на 2021-2022 учебный год следующих абитуриентов:

  • Минди — 19 лет
  • Кэмерон — 22
  • Тони — 19
  • Кит — 23
  • Лорен — 19
  • Томми — 21
  • Пилар — 25
  • Майк — 19
  • Карла — 27
  • Кира — 25
  • Маркус — 21

Нахождение среднего значения

Чтобы найти среднее значение списка Американского университета или «набора данных», выполните следующие действия:

  1. Найдите сумму значений множества.
  2. Разделите сумму на количество значений в наборе.
19+22+19+23+19+21+25+19+27+25+2111=24011=21.81¯

Средний возраст члена команды по плаванию составляет примерно 21, 81 год.

Нахождение медианы

Чтобы найти медиану:

Распределите возрасты от меньшего к большему.
В настоящее время этот набор имеет нечетные значения (возрастов), медиана будет одна.

Пример
В нечетном наборе данных медиана будет представлять собой одно число прямо в центре.

21 — единственное число прямо в центре, поэтому медиана команды по плаванию равна 21.

Джордану восемнадцать лет, он новичок, который только что присоединился к команде по плаванию Американского университета, и ее состав изменился. Теперь необходим второй метод нахождения медианы:

  • После добавления нового значения (возраста) в набор данных теперь имеется четное количество значений.
  • Найдите среднее двух средних значений.

2 значения
В четном наборе данных в центре есть два значения.

  • Чтобы найти одно значение медианы, вычислите среднее из этих двух значений. Средний возраст члена команды по плаванию — 21 год.

 

21+212=21 

Поиск моды

Мода

Мода — это число, которое встречается чаще всего. 19 это режим.

Значение (возраст) 19 встречается чаще всего, то есть четыре раза. Самый распространенный возраст участников команды – 19 лет. Таким образом, режим 19.

Лучший показатель центральной тенденции

График ниже демонстрирует распределение набора данных. Распределение слегка смещено вправо («положительная асимметрия»).

  • Это распределение включает возраст Джордана.
  • Новое среднее значение, включая возраст Джордана, составляет 21,5 года.
  • Средний возраст — 21 год.

Это распределение слегка смещено вправо

Это распределение слегка смещено вправо. Это означает, что большинству членов команды 21 год или меньше.

Распределение смещено вправо и указывает на то, что среднее значение лишь немного превышает медиану. На среднее значение не сильно влияет возможный выброс.

Для этого набора данных мода (19 лет) является самым низким показателем центральной тенденции, а среднее значение (21,5 года) — самым высоким. Медиана (21 год) — это значение посередине. Поскольку среднее значение и медиана различаются всего на 0,5 года, оба можно считать лучшим представлением этого набора данных.

Поиск диапазона

Чтобы найти диапазон:

  • Определите минимальное и максимальное значение.
  • Вычтите минимальное значение из максимального значения

27 − 18 = 9

Возрастной диапазон членов команды по плаванию – 9 лет.

Краткие итоги урока

В этом уроке рассматриваются следующие вопросы:

  • Меры центральной тенденции представляют собой набор числовых значений, которые лучше всего представляют или суммируют середину набора данных.
  • Среднее значение, можно найти, найдя сумму значений и разделив эту сумму на количество значени.
  • Медиана — это число в середине с равным количеством значений выше и ниже него.
  • Мода— это значение, которое встречается чаще всего. Режимов может быть несколько, или режим может отсутствовать.
  • Диапазон — это мера вариации, которая указывает на разброс данных. Диапазон можно найти, вычитая минимальное значение из максимального значения.
    При симметричном распределении среднее значение, медиана и мода находятся в центре распределения.
  • При сильно искаженном распределении медиана (а в некоторых случаях и мода) может обеспечить более точное представление данных.

В этом уроке были рассмотрены следующие словарные термины:

  • Описательная статистика: тип статистики, используемый для описания и суммирования значений.
  • Категориальные данные: тип данных, которые могут быть организованы в группы, но не имеют математического значения.
  • Мера изменчивости: описание изменчивости или того, насколько распределены данные в наборе данных.
  • Симметричное распределение: когда данные образуют на графике симметричную колоколообразную кривую.
    Выбросы: значение, которое значительно выше или ниже остальных значений.
  • Неравномерное распределение: когда хвост распределения длиннее другого. Если хвост длиннее к отрицательной стороне числовой прямой, он скошен влево. Если хвост длиннее на положительной стороне числовой прямой, он перекошен вправо.

Часто задаваемые вопросы

Среднее соответствует среднему?

Рассчитывается путем нахождения суммы общих значений и последующего деления этого числа на количество значений в наборе.

Что такое режим диапазона и что он означает?

Диапазон является мерой изменчивости и представляет собой разброс значений. Режим — это число или значение, которое чаще всего, или самое популярное значение. Среднее значение — это среднее значение или центр нормального распределения. Оно может быть не таким точным в наборах данных с выбросами или асимметричными распределениями.

Как найти среднее значение, медиану и моду?

Среднее значение можно найти, сложив значения и разделив эту сумму на общее количество значений. Медиану можно найти, расположив значения от наименьшего к наибольшему и разместив значение, находящееся непосредственно в центре набора. Если есть два значения, среднее значение можно найти, сложив эти два значения и разделив сумму на два.

Мода — это значение, которое чаще всего встречается.

Поделитесь материалом
Автор статьи: Наталья Венедиктова
Наталья Венедиктова
Историк-исскусствовед, специалист в области истории, географии и искусства. Много путешествовала, изучала эволюцию художественных стилей, культурные контексты произведений и влияние искусства на общественные и исторические процессы.
Наталья Венедиктова опубликовал статей: 315

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *