Уравнение стандартного отклонения, формула и примеры

Что такое стандартное отклонение (СО)?

Стандартное отклонение позволяет выразить, насколько «разбросан» любой набор данных, используя одно число. Начав со среднего значения и измерив расстояние до каждой точки, можно вычислить меру того, насколько «близко друг к другу» находится набор в целом.

Одно стандартное отклонение от среднего отмечено красным.

Одно стандартное отклонение от среднего отмечено красным.

Пример стандартного отклонения

Если мы рассмотрим два набора с одинаковым средним значением, скажем, 10, стандартное отклонение может дать нам непосредственную картину распределения значений в наборе.

Сначала рассмотрим набор данных, состоящий из значений 6, 7, 8, 10, 12, 13 и 14. Его значения распределены равномерно от минимума до максимума, а его СО равно:

5872.88

Второй набор, который мы рассмотрим, имеет значения 9, 9, 10, 10, 10, 11 и 11. Эти значения сгруппированы гораздо ближе к среднему значению, поэтому стандартное отклонение должно быть намного меньше. И мы видим, что это действительно так:

470.76

Эти два набора имеют идентичные средние значения, но СО кратко показывает резкую разницу между ними.

Как найти стандартное отклонение

Оно состоит из двух основных строительных блоков: среднего значения и дисперсии. Среднее значение похоже на среднее и должно быть знакомо вам по исследованиям, тогда как дисперсия — это новая концепция, тесно связанная со стандартным отклонением.

Дисперсия

Вариация — это то, где в игру вступает свойство «распространения» набора данных. Начните с вычисления расстояния каждой точки данных от среднего значения в квадрате. Затем возьмите среднее значение, суммируя их и разделив на общее количество точек данных. ПРИМЕЧАНИЕ. Возведение в квадрат каждой разности является необходимым шагом. Как мы увидим позже, без этого дисперсия становится совершенно бессмысленной.

σ2=1ni=1n(xiμ)2

Символ σ2 ,(читайте «сигма в квадрате») — это обозначение дисперсии.

Формула стандартного отклонения

Наконец, чтобы найти СО, просто извлеките квадратный корень из дисперсии.

σ=σ2=1ni=1n(xiμ)2

Поскольку при этом удаляется показатель степени, обозначение стандартного отклонения просто
(«сигма»).

Решение уравнения стандартного отклонения

Теперь у нас есть все инструменты, необходимые для нахождения стандартного отклонения. Для начала нам сначала понадобится µ среднее значение.

  • Вычислите среднее значение.
  • Для каждой точки данных умножьте разницу на среднее значение, затем возведите ее в квадрат.
  • Усредните результаты.
  • Извлеките квадратный корень.

Как упоминалось выше, возведение в квадрат имеет важное значение. Чтобы понять почему, рассмотрим, что произойдет, если квадрат не берется: тогда формула просто основывается на расстоянии каждой исходной величины от среднего значения. Подумайте о том, что такое среднее значение в наборе статистических данных: одним словом, среднее значение. Что произойдет, если мы просто возьмем расстояния каждого значения от среднего, а затем сложим их вместе?

Мы можем попробовать формулу без квадрата, чтобы проверить, что именно происходит. Давайте упростим, начав с формулы для дисперсии, поскольку мы можем легко извлечь квадратный корень после того, как закончим.

σ2=1ni=1n(xiμ)

Далее напомним определение µ

σ2=1ni=1n(xij=1nxjn)

Сумма может быть разбита на суммы или на разности внутри них…

σ2=1n(i=1nxii=1nj=1nxjn)

…но вторая сумма не содержит индекса n, так что это просто повторяется n раз

σ2=1n(i=1nxinj=1nxjn)σ2=1n(i=1nxij=1nxj)σ2=1n(0)=0σ=0

Всегда не забывайте возводить в квадрат разницу между каждой величиной и средним значением перед их суммированием, иначе уравнение станет несерьезным.

Как найти стандартное отклонение набора данных

Пример 1

Рассмотрим набор данных о температурах, измеряемых каждый день в течение одной недели, показанный в таблице ниже. Что такое СО?

  • воскресенье — 68
  • понедельник — 64
  • вторник — 62
  • среда — 63
  • четверг — 60
  • пятница — 65
  • суббота — 66

Помните: прежде чем мы сможем начать со СО, мы должны знать среднее значение.

μ=i=1nxinμ=68+64+62+63+60+65+667μ=4487μ=64

Теперь мы можем приступить к расчету, начиная с дисперсии.

σ2=17i=1n(xiμ)2σ2=17i=1n(xi64)2σ2=17((6864)2+(6464)2+(6264)2+(6364)2+(6064)2+(6564)2+(6664)2)σ2=17((4)2+(0)2+(2)2+(1)2+(4)2+(1)2+(2)2)σ2=17(16+0+4+1+16+1+4)σ2=1n(42)=6

Наконец, извлеките квадратный корень.

σ=62.45

Пример 2

Двенадцать студентов недавно сдали экзамен. Их баллы составили 90, 63, 96, 97, 80, 71, 84, 74, 92, 97, 87 и 81. Найдите СО этого набора. Опять же, начните со среднего значения. Сумма всех этих чисел равна 1012; разделите это на 12, чтобы получить среднее значение,

101212=253384.3

Теперь, когда у нас есть среднее значение, мы можем вычислить дисперсию, как и раньше. Возьмите разницу каждого элемента данных со средним значением и возведите эту разницу в квадрат, чтобы найти эти двенадцать значений:

2899,40969,12259,14449,1699,16009,19,9619,5299,14449,649,1009

Взяв среднее из них, получим дисперсию:

σ2=119229÷12=198718=110.38

Наконец, извлеките квадратный корень: запоминание символа квадрата над сигмой напоминает нам о необходимости сделать этот важный шаг и преобразовать дисперсию в стандартное отклонение.

σ10.51

Как найти стандартное отклонение от среднего значения

Стандартные отклонения измеряются от среднего значения набора данных. Например, в нашем первом примере среднее значение было 64, а СО — 2,45. СО номер один в отрицательном направлении составляет 61,55, а одно СО в отрицательном направлении — 66,45.

Во втором примере среднее значение равно 84,33, а СО — 10,51. Следовательно, 73,82 — это СО меньше среднего, а 94,84 — на одно СО больше среднего.

В первом примере значения между 57,52 и 70,48 лежат в пределах одного отклонения от среднего значения. Во втором эти значения находятся между 73,82 и 94,82.

Стандартное отклонение и результаты данных

В наборе данных с нормальным распределением примерно 34% точек данных находятся в пределах одного СО выше среднего и, аналогично, около 34% находятся в пределах одного СО ниже среднего. То есть примерно 68% данных лежат в пределах одного СО от среднего значения. Полные 95% лежат в пределах двух стандартных отклонений в обоих направлениях, а интервал в шесть СО, три выше среднего и три ниже него, составляет 99,7% всего набора данных. (Это широко известно как эмпирическое правило.) Таким образом, знание позволяет нам мгновенно узнать несколько вероятностей многих распространенных распределений.

Не только это, но и зная СО, мы можем изучить набор данных, чтобы определить, НЕ является ли он нормально распределенным. Поскольку нормальное распределение должно подчиняться приведенному выше правилу, если данное распределение не подчиняется этому правилу, то оно не может быть нормальным!

Нормально распределенная переменная с проиллюстрированным эмпирическим правилом.

До сих пор мы рассматривали случай стандартного отклонения популяции — когда известны все данные. Если доступные данные представляют собой только выборку населения в целом, то СО выборки может отличаться от «истинного» и, как таковое, рассчитывается по-другому. Формула для стандартного отклонения выборки такова:

s=1n1i=1n(xiμ)2

Краткие итоги урока

Оно количественно определяет, насколько тесно сгруппированы или насколько разбросаны значения в наборе статистических данных. Первым шагом к вычислению является определение расстояния каждой точки от среднего значения. Взяв эти разности, обязательно приведите их в квадрат; затем усредните все квадраты значений, чтобы найти дисперсию. Последний шаг — извлечь квадратный корень, поскольку стандартное отклонение — это квадратный корень из дисперсии.

Часто задаваемые вопросы:

Почему мы рассчитываем стандартное отклонение?

Оно дает хорошее представление о «форме» набора данных. Он также обладает несколькими важными свойствами нормального распределения и может использоваться для определения того, не является ли данный набор данных нормально распределенным.

Как рассчитывается СО?

  • Найдите среднее значение
  • Рассчитайте разницу каждой точки данных от среднего значения
  • Возведите каждую разницу в квадрат
  • Усредните эти квадраты (это дисперсия)
  • Возьмите квадратный корень из дисперсии

По какой формуле рассчитывается стандартное отклонение?

Формула стандартного отклонения выглядит следующим образом:

σ=σ2=1ni=1n(xiμ)2
Поделитесь материалом
Автор статьи: Наталья Венедиктова
Наталья Венедиктова
Историк-исскусствовед, специалист в области истории, географии и искусства. Много путешествовала, изучала эволюцию художественных стилей, культурные контексты произведений и влияние искусства на общественные и исторические процессы.
Наталья Венедиктова опубликовал статей: 315

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *