Влияние линейных преобразований на показатели центра и разброса

Эффекты линейных преобразований

Профессор Печонкин — профессор естественных наук в местном университете. Недавно профессор провел тест на одном из своих занятий по естественным наукам. Это оценки (в процентах), которые каждый из учеников получил за свои тесты: 31, 17, 27, 35, 22, 35, 15, 17, 21, 27, 17.

Ой-ой. Похоже, студенты не очень хорошо справились с этим тестом. Среднее значение этого набора данных равно 24, что означает, что учащиеся набрали в среднем 24% баллов на своих тестах. Это пример показателя центра в наборе данных. Стандартное отклонение этого набора составляет примерно 7,4. Это пример показателя разброса в наборе данных. Поскольку 7,4 — довольно небольшое число для стандартного отклонения, это означает, что числа в наборе данных довольно близки друг к другу. Поскольку они близки и не расходятся от среднего значения, мы знаем, что все учащиеся не прошли этот тест и имеют примерно одинаковое понимание концепции.

Если вы не знакомы с этими понятиями, приостановите чтение и посмотрите другие наши уроки по этим темам.

Профессор Печонкин решает помочь студентам, оценивая этот тест по кривой. Кривая — это один из примеров линейного преобразования, когда переменная умножается на константу, а затем добавляется к ней. При использовании линейных преобразований набора данных преобразуются все переменные в наборе. Поэтому профессор Печонкин хочет изменить оценки всех студентов на более высокие значения в наборе данных.

Преобразование данных

Мы можем преобразовать данные в этом наборе, используя следующую формулу линейных преобразований: a + bx. В этом случае x = число в наборе данных, a = константа, добавляемая к переменной, и b = константа, умножаемая на переменную.

Лучший способ выяснить, как преобразовать эти данные, — это посмотреть на среднее значение, равное 24. Профессор считает, что было бы справедливо, если бы средний студент набрал 75% по этому тесту. Если средний балл равен 24, то мы можем использовать формулу линейных преобразований, чтобы изменить средний балл 24 на средний балл 75 следующим образом: 27 + 2(24) = 75.

Теперь, когда у нас есть формула, мы можем преобразовать все значения в этом наборе данных. Взгляните на диаграмму ниже, чтобы увидеть новые значения для набора данных.

данные после преобразования

Новые данные после преобразования

Вы можете заметить, что самый высокий балл изменился с 35 на 97, а самый низкий балл изменился с 15 на 57. Таким образом, с учетом новых баллов только один ученик не сдал тест по естественным наукам. Наше новое среднее значение для этого набора данных составляет 75, и это среднее значение, которое мы использовали для определения нашего среднего балла. Стандартное отклонение для этого нового набора данных составляет 14,14 — почти вдвое больше нашего исходного стандартного отклонения. Взгляните на этот график, чтобы увидеть различия между первым набором данных и вторым набором данных:

Диаграмма сравнения первого и второго наборов

Диаграмма сравнения первого и второго наборов данных

Это означает, что наш набор данных теперь распространяется дальше. Обратите внимание, что общая форма двух линий схожа, но верхняя линия круче, чем нижняя. Это можно лучше объяснить, если мы посмотрим на диапазон нашего набора данных. Диапазон для нашего исходного набора данных составлял 35–15 = 20. Это означает, что между самым высоким и самым низким числами в наборе данных была разница в 20 значений. В новом наборе данных диапазон составлял 97–57 = 40. Это означает, что между самым высоким и самым низким числами в наборе данных была разница в 40 значений. Поскольку наш диапазон увеличился вдвое, это также объясняет, почему стандартное отклонение почти удваивается.

Пример 2 линейных преобразований

Профессор Печонкин сейчас учит своих студентов конвертировать температуру по шкале Цельсия в градусы Фаренгейта. Преобразования — еще один пример линейных преобразований набора данных. Следующие числа представляют собой температуру в градусах Цельсия: 32, 36, 38, 31, 32, 35, 38, 32.

Средняя температура в этом наборе данных составляет 34,25, а стандартное отклонение составляет примерно 2,86. Чтобы преобразовать эти температуры, используйте следующую формулу: F = 1,8C + 32. Обратите внимание, что эта формула соответствует нашей формуле для линейных преобразований. У нас есть переменная C, умноженная на константу 1,8, добавленную к константе 32. Посмотрите на эту диаграмму, чтобы увидеть новые значения для набора данных:

новые значения для набора данных о температуре

Диаграмма, показывающая новые значения для набора данных о температуре

Для этого нового набора данных среднее значение составляет 93,65, а стандартное отклонение составляет примерно 5,16. Обратите внимание, что среднее значение снова увеличилось, а также увеличилось стандартное отклонение. Эти значения всегда будут увеличиваться, потому что вы умножаете и добавляете исходные значения. Видите, как данные смещаются вправо? Это показывает нам, как возросла ценность всего набора данных.

Краткие итоги урока

Линейное преобразование — это когда переменная умножается на константу, а затем добавляется к константе. При их использовании преобразуются все переменные в наборе данных. Когда вы используете линейное преобразование набора данных, ваше среднее и любые другие меры центра будут увеличиваться, а также ваше стандартное отклонение и любые другие меры разброса. Это потому, что вы увеличиваете исходные значения в соответствии с этой формулой: a + bx, где x = число в наборе данных, a = константа, добавляемая к переменной, и b = константа, умножаемая на переменную.

Поскольку диапазон вашего набора данных значительно изменится, вы увидите значительное изменение стандартного отклонения набора данных в зависимости от того, какую константу вы используете для b, числа, которое вы умножаете на свою переменную.

Поделитесь материалом
Автор статьи: Наталья Венедиктова
Наталья Венедиктова
Историк-исскусствовед, специалист в области истории, географии и искусства. Много путешествовала, изучала эволюцию художественных стилей, культурные контексты произведений и влияние искусства на общественные и исторические процессы.
Наталья Венедиктова опубликовал статей: 315

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *