Неравномерное и симметричное распределение | Определение и графики

Определение симметричного распределения

Данные — это совокупность фактов, чисел, будь то измерения или статистика. Набор данных — это информация, собранная и часто отображаемая в каком-либо визуальном представлении, например в таблице или на графике. Что подразумевается под распределением? Распределение данных относится к форме набора данных при отображении на графике, часто в виде гистограммы. Оно может принимать разные формы, в том числе симметричное и асимметричное.

Что такое симметричное распределение данных? Это графическое распределение, которое выглядит почти одинаково с обеих сторон. Важно отметить, что данные не обязательно должны быть абсолютно одинаковыми, чтобы считаться симметричными, а только почти одинаковыми. Представьте себе зеркало в центре распределения данных. Обе стороны должны быть зеркальными отражениями друг друга.

Ниже приведен пример симметричного распределения, показанный в виде симметричной гистограммы. На графике показано количество вопросов, на которые правильно ответил вымышленный класс учащихся в популярной викторине. Баллы в порядке убывания: 0, 1, 1, 2, 2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5. , 5, 6, 6, 6, 6, 6, 7, 7, 7, 7, 8, 8, 8, 9, 9, 10.

График симметричного распределения

График симметричного (нормального) распределения

Две стороны графика зеркально или почти зеркально отражают друг друга. Пик графика находится прямо посередине. Равное количество студентов набрало баллы выше и ниже пика.

О симметричном наборе данных важно знать, что среднее значение, медиана и мода будут возникать в одной и той же точке. Среднее или среднее число, медиана или точное среднее число, а также мода или наиболее распространенное число будут одинаковыми в симметричном наборе данных.

Рассмотрим еще раз гистограмму результатов популярной викторины, показанную выше. Среднее значение, медиана и мода имеют номер 5, что делает это распределение симметричным.

Определение асимметричного распределения

Что это такое? Искаженное распределение не является симметричным, а имеет пики с одной или другой стороны. Распределение может быть очень искаженным или лишь слегка искаженным. Рассмотрим примеры ниже.

На графике ниже, выделенном красным, показан пример неравномерного распределения данных. Две стороны графика не зеркально отражают друг друга, а пик не находится посередине. В правой части графика находится еще много точек данных. На картинке показано количество вопросов, на которые правильно ответил вымышленный класс учащихся в объявленной викторине. Студентов с высокими оценками гораздо больше, чем студентов с низкими баллами. Среднее значение, медиана и мода этого набора данных не будут встречаться в одном и том же номере. График такого распределения, у которого есть пик справа и хвост слева, называется перекошенным влево. Если пик находится слева, а хвост справа, распределение искажено вправо.

Гистограмма асимметричного распределения

График асимметричного распределения

На графике ниже показаны результаты тестов вымышленного класса, в котором тесты были оценены с неправильным ключом ответа. Это распределение не симметрично, а смещено вправо. Обратите также внимание на пустые места для правильных ответов, набравших 7 или 8 баллов. Такая область, где нет точек данных или наблюдений, называется разрывом.

Распределение с разрывом

Распределение с разрывом

На графике ниже показаны результаты теста вымышленного класса. Это распределение данных не является ни симметричным, ни асимметричным, а распределяется случайным образом. Обратите внимание, что на этом графике есть два пика: один с оценкой 3, а другой с оценкой 8. Это означает, что набор данных имеет два режима. Такое расположение называется бимодальным, что означает, что оно имеет два режима.

Бимодальное распределение

Бимодальное распределение

Примеры асимметричного и симметричного распределения

Каковы примеры распределений, которые могут быть симметричными или асимметричными? Любое распределение может принимать любую форму, но некоторые из них чаще, чем другие симметричны или перекошены. Распределения, которые имеют тенденцию быть симметричными, включают результаты стандартизированных тестов, рост взрослых мужчин или женщин, данные о погоде за длительный период времени и заработную плату. В этих случаях пик, скорее всего, будет посередине, а две стороны графика, вероятно, будут почти симметричными. Некоторые распределения имеют тенденцию к искаженнию. Примером этого является количество взрослых, проживающих в домохозяйствах. В большинстве домохозяйств будет 1, 2 или, возможно, 3 взрослых, и лишь в немногих семьях будет 6, 7 или 8 взрослых. Такое распределение данных, скорее всего, будет иметь пик слева и хвост справа, и оно будет считаться перекошенным вправо.

Графические наборы данных

В визуальном представлении набора данных легко увидеть распределение. Обычными визуальными представлениями, используемыми для отображения данных, являются гистограммы, точечные и линейные графики, а также прямоугольные диаграммы.

Гистограммы и линейные графики очень похожи. Графики, показанные в начале урока, представляют собой гистограммы. На ней показано распределение лепестков ириса разной длины. Каждый интервал отмечен как 1 сантиметр, в каждом интервале имеется 2 столбца. Первая полоса в первом интервале показывает количество лепестков от 0 до 0,49 см, а вторая полоса показывает количество лепестков от 0,5 до 0,99 см. Вот как гистограмма может отображать диапазон значений.

Гистограмма

Гистограмма

Точечный график использует точки, а не столбцы, чтобы показать распределение данных. Случайный точечный график показан ниже. На линейном графике используются x, а не точки.

точечный график

Точечный график

Диаграмма «ящик с усами» (коробчатая диаграмма) использует прямоугольник и ус, чтобы показать каждую сторону распределения.

Диаграмма «ящик с усами»

Диаграмма «ящик с усами»

Построение графиков симметричных наборов данных

Как человек отображает симметричный набор данных в виде графика? Вот пример: этот набор показывает высокие температуры (в градусах по Фаренгейту) в вымышленном городе Парк-Сити каждый день в течение одного месяца. Данные расположены в числовом порядке: 50, 53, 53, 53, 56, 56, 57, 58, 58, 58, 59, 59, 60, 60, 60, 60, 60, 60, 61, 62, 62. , 63, 63, 63, 63, 65, 65, 65, 68, 70. Значения данных слишком разбросаны, чтобы составить график; гистограмма — лучший выбор. Чтобы построить гистограмму, значения данных необходимо сгруппировать. Эти значения данных можно сгруппировать по 3 (50-51-52 / 53-54-55 / 56-57-58 / 59-61 / 62-63-64 / 65-66-67 / 68-69-70).

Симметричная гистограмма

Симметричная гистограмма

Глядя на распределение данных, кажется, что оно симметричное. Пик находится посередине, и обе стороны являются почти зеркальным отражением друг друга. Чтобы проверить это, рассчитайте среднее значение, медиану и моду набора данных, используя разгруппированные значения. Среднее значение, медиана и мода этого набора данных равны 60, что подтверждает, что это симметричное распределение.

Симметричная гистограмма

Вот еще один пример: этот набор данных показывает высокие температуры (в градусах по Фаренгейту) в вымышленном городе Хилл-Сити каждый день в течение одного месяца. Данные расположены в числовом порядке: 57, 58, 58, 58, 58, 59, 59, 59, 59, 59, 59, 60, 60, 60, 60, 60, 60, 60, 60, 61, 61. , 61, 61, 61, 61, 62, 62, 62, 62, 63. Диапазон значений данных достаточно узок, чтобы можно было отобразить это распределение в виде гистограммы.

Симметричная гистограмма

Симметричная гистограмма

Если посмотреть на распределение данных, окажется, что этот набор данных также представляет собой симметричное распределение. Пик находится посередине, и обе стороны кажутся зеркальными отражениями друг друга. Чтобы проверить это, вычислите среднее значение, медиану и моду. Среднее значение, медиана и мода этого примера равны 60, что подтверждает, что это еще одно симметричное распределение.

Графическое представление асимметричных наборов данных

Как человек отображает искаженный набор данных? Вот пример: этот набор данных показывает высокие температуры (в градусах по Фаренгейту) в вымышленном городе Силвер-Сити каждый день в течение одного месяца. Данные расположены в числовом порядке: 57, 58, 60, 60, 61, 61, 62, 62, 62, 63, 63, 63, 63, 64, 64, 64, 64, 64, 65, 65, 65. , 65, 65, 65, 65, 66, 66, 66, 66, 66. Диапазон значений данных достаточно узок, чтобы можно было отобразить это распределение в виде гистограммы.

Перекошенный график

Перекошенный график

Если посмотреть на пример, то окажется, что этот набор данных представляет собой асимметричное распределение. Пик находится справа, а влево идет хвост. Распределение графика смещено влево. Обратите также внимание на разрыв, который появляется при температуре 59°С, где данные отсутствуют.

Вот еще один пример: этот набор данных показывает высокие температуры (в градусах по Фаренгейту) в вымышленном городе Хрустальный город каждый день в течение одного месяца. Данные расположены в числовом порядке: 57, 57, 57, 58, 58, 58, 58, 58, 58, 59, 59, 59, 59, 59, 60, 60, 60, 60, 60, 60, 61. , 61, 61, 62, 62, 62, 63, 63, 64, 65, 66. Диапазон значений данных достаточно узок, чтобы можно было отобразить это распределение в виде гистограммы.

Перекошенный бимодальный график

Перекошенный бимодальный график

Если посмотреть на изображение, то окажется, что этот набор данных также представляет собой асимметричное распределение. Однако вершина находится слева, а хвост длится вправо. Распределение этого смещено вправо. Обратите также внимание, что это оно также является бимодальным. Есть два режима: один на 58, другой на 60.

Краткие итоги урока

Распределение данных — это графическая форма набора данных. Вот несколько важных терминов, которые следует знать:

  • симметричное: набор данных, в котором среднее значение, медиана и мода встречаются в одной и той же точке. На графике две стороны этого распределения будут выглядеть почти зеркальными отражениями другого.
  • асимметричное: набор данных, который при отображении на графике имеет пик с одной стороны и хвост, простирающийся на другую сторону. Если хвост простирается влево, график перекошен влево. Если хвост простирается вправо, график перекошен вправо.
  • разрыв: Пространство, где нет наблюдений или данных.
  • бимодальный: набор данных с двумя режимами.

Наборы данных могут отображаться различными способами, включая гистограммы и гистограммы. Некоторые наборы данных, такие как высота, с большей вероятностью будут иметь симметричный характер. Другие, такие как количество взрослых, проживающих в домохозяйстве, с большей вероятностью будут иметь искаженный вид.

Часто задаваемые вопросы

Как узнать, симметричны ли данные?

Набор данных является симметричным, если среднее значение, медиана и мода встречаются в одном и том же номере. При построении графика две стороны графика будут почти зеркальными отражениями друг друга.

Как определить, перекошена ли гистограмма вправо или влево?

График с вершиной справа и хвостом, простирающимся влево, называется перекошенным влево.

График с вершиной слева и хвостом, простирающимся вправо, называется перекошенным вправо.

Что является примером симметричного распределения?

Результаты стандартизированных тестов являются примером симметричного распределения. Среднее значение, медиана и мода набора данных будут иметь одно и то же значение.

Поделитесь материалом
Автор статьи: Наталья Венедиктова
Наталья Венедиктова
Историк-исскусствовед, специалист в области истории, географии и искусства. Много путешествовала, изучала эволюцию художественных стилей, культурные контексты произведений и влияние искусства на общественные и исторические процессы.
Наталья Венедиктова опубликовал статей: 315

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *