Нахождение процентиля набора данных | Формула и пример

Объяснение процентилей

Такие фразы, как «Я набрал 80-й процентиль по весу» или «Этот ребенок находится в 15-м процентиле по весу», используют термин «перцентиль». Разговоры о нем распространены на протяжении всей жизни, но что это на самом деле означает? Процентиль описывает диапазон, в который попадает статистика (например, результат теста или вес ребенка). 90-й процентиль означает, что в наборе данных 90% точек данных ниже выбранной точки. Таким образом, если кто-то набрал на тесте 60-й процентиль, то 60% баллов были ниже, а 40% баллов выше.

Это может сбить с толку, поскольку процентиль звучит, как процент. Особенно, когда речь идет об оценках тестов, это может привести к путанице. Кто-то может оказаться в 50-м процентиле по тесту, но это не значит, что он набрал по тесту 50%. У них может быть 95% баллов по тесту, или они могут набрать 10% баллов по тесту, или любой другой балл. Процентиль на самом деле не показывает, какой процент вопросов теста был сделан правильным. Он говорит только о том, сколько других оценок было выше или ниже. Если многие люди набрали действительно высокие баллы, то 50-й процентиль также может быть действительно высоким баллом по тесту. С другой стороны, если бы большинство людей набрали очень низкие баллы по тесту, то 50-й процентиль также был бы низким баллом по тесту.

Процентили лучше всего объясняются при просмотре графика. Если все оценки, высоты или любые точки данных в наборе данных были изображены на графике, это может выглядеть примерно так:

нормальное распределение точек данных

Если бы все оценки были отображены в виде графика, график мог бы выглядеть следующим образом: этот график показывает нормальное распределение точек данных, что является самым простым типом набора данных для работы.

На этом графике 5-й процентиль заштрихован:

5-й процентиль

5-й процентиль — это самые низкие 5 процентов оценок на графике, которые на этом графике заштрихованы.

На этом графике 50-й процентиль заштрихован:

50-й процентиль

50-й процентиль — это нижние 50 процентов оценок, которые показаны заштрихованными.

На этом графике 95-й процентиль заштрихован:

Для 90-го процентиля 90 процентов оценок ниже

Для 90-го процентиля 90 процентов оценок ниже, что заштриховано на графике.

Процентиль объясняет, какой процент точек данных ниже выбранной точки данных.

Формула процентиля с примером

Для расчета процентиля можно использовать следующую формулу:

P=nN×100

Где:

  • P — рассчитываемый процентиль.
  • n (строчный регистр) — количество точек данных ниже интересующей точки данных.
  • N (заглавные буквы — количество точек данных в наборе данных)

Для того, чтобы найти необходимую информацию, выполните следующие действия:

  • Упорядочите точки данных от низшего к высшему
  • Подсчитайте общее количество точек данных, это N
  • Подсчитайте количество точек данных ниже интересующей точки данных, это n

После того как необходимая информация найдена, можно рассчитать процентиль.

Примеры

Давайте рассмотрим несколько примеров, где рассчитывается процентиль.

Пример 1: Как найти процентиль

Следующий набор представляет собой высоту всех деревьев в местном парке:

  Высота
1 5 футов
2 6 футов
3 15 футов
4 16 футов
5 19 футов
6 20 футов
7 22 футов
8 25 футов
9 76 футов
10 150 футов

Этот набор уже отсортирован от наименьшего к наибольшему.

Найдите N: общее количество точек данных равно 10.
Теперь найдите процентиль для 20-футового дерева.

Найдите n: есть 5 деревьев высотой меньше, чем 20-футовое дерево, поэтому n = 5.
Рассчитайте его:

P=510×100

Дерево высотой 20 футов находится в 50-м процентиле.

Пример 2

Теперь давайте посмотрим на пример результатов тестов. Допустим, следующие данные представляют собой результаты тестов всех учеников класса: 75%, 67%, 98%, 45%, 87%, 72%, 84%, 94%, 86%, 63%, 83%. , 55%, 76%, 81%, 91%, 94%, 82%, 17%, 99% и 85%.

Давайте сначала перегруппируем этот набор данных от самого низкого к высшему. Существуют программы, такие как Excel, которые могут делать это автоматически. Если вы делаете это вручную, обязательно дважды проверьте, чтобы все точки данных были учтены. Перегруппированный набор данных выглядит следующим образом:

17%
45%
55%
63%
67%
72%
75%
76%
81%
82%
83%
84%
85%
86%
87%
91%
94%
94%
98%
99%

Теперь, когда данные отсортированы и пронумерованы, легко увидеть, что N равно 20. Теперь предположим, что кто-то захотел найти место, где находится 44-й процентиль. Чтобы найти 44-й процентиль, используйте то же уравнение, но переставьте его, чтобы найти n:

n=P×N100

Искомый P — это 44-й процентиль, или 45%, а N — 20:

n=44×20100=8.8

Это означает, что оценка 44-го процентиля имеет 8,8 баллов ниже, что на самом деле не может быть частичным баллом. Всегда округляйте до следующего целого числа, равного 9. Это означает, что в 44-м процентиле на 9 баллов меньше, что означает, что это 10-й балл. Глядя на список, 10-й балл составляет 82%. Это означает, что 82% находятся в 44-м процентиле.

Пример 3

Теперь предположим, что кто-то набрал 85-й процентиль по ACT, зная, что примерно 1,3 миллиона студентов сдали ACT. Сколько студентов набрали больше баллов?

Учитывая эту информацию, давайте заполним известные и неизвестные сведения:

  • N: 1,3 миллиона
  • P: 85-й процентиль (85%)
  • n: неизвестно (нужно найти)

Решение для n:

n=85×1300000100=1105000

Это означает, что было 1 105 000 студентов, которые набрали меньше баллов, но вопрос в том, сколько из них набрало больше баллов. Чтобы найти это, сначала прибавьте 1 к n, чтобы найти фактическое место этого студента, которое равно 1,105001, затем вычтите из N:

Это означает, что 194 999 студентов набрали больше баллов.

Краткие итоги урока

Процентиль — это статистика, которая показывает, какой процент точек данных ниже выбранной точки данных. Его можно найти с помощью следующего уравнения:

Где:

  • P — рассчитываемый процентиль.
  • n (строчный регистр) — количество точек данных ниже интересующей точки данных.
  • N (заглавные буквы — количество точек данных в наборе данных)

Для расчета процентиля набор данных всегда необходимо отсортировать от наименьшего к наибольшему. Если он указан и необходимо найти n, не забудьте всегда округлять результат до следующего по величине числа.

Часто задаваемые вопросы

Как рассчитать процентиль?

Процентиль находится по уравнению: P = n/N * 100%. Где P — процентиль, строчные буквы n — это количество точек данных ниже интересующей точки данных, а N — общее количество точек данных в наборе данных.

Что такое процентиль в статистике на примере?

Это количество точек данных ниже определенной точки данных. На графике это будет представлять собой заштрихованный процент графика.

Какой процентиль составляет 90%?

90% — это 90-й процентиль, что означает, что 90% точек данных ниже интересующей точки данных.

Поделитесь материалом
Автор статьи: Наталья Венедиктова
Наталья Венедиктова
Историк-исскусствовед, специалист в области истории, географии и искусства. Много путешествовала, изучала эволюцию художественных стилей, культурные контексты произведений и влияние искусства на общественные и исторические процессы.
Наталья Венедиктова опубликовал статей: 315

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *