1. ОбразованиеМатематикаСтатистикаСтатистика и гистограммы
Сборник статистических данных для чайников с онлайн-практикой, 2-е издание

Дебора Дж. Рамси

Гистограмма - это гистограмма для количественных данных. Поскольку данные являются числовыми, вы делите их на группы, не оставляя промежутков между ними (чтобы столбцы были связаны). На оси Y показаны частоты (числа) или относительные частоты (проценты) данных, попадающих в каждую группу.

Как создать гистограмму

Чтобы создать гистограмму, сначала нужно разделить данные на разумное количество групп одинаковой длины. Подсчитайте количество значений в наборе данных, попадающих в каждую группу (другими словами, составьте таблицу частот). Если точка данных попадает на границу, примите решение, в какую группу ее помещать, убедившись, что вы остаетесь последовательными (всегда ставьте ее в верхнюю из двух или всегда в нижнюю из двух). Составьте гистограмму, используя группы и их частоты - частотную гистограмму.

Если вы разделите частоты на общий размер выборки, вы получите процент, который попадает в каждую группу. Таблица, которая показывает группы и их проценты, является таблицей относительной частоты. Соответствующая гистограмма является гистограммой относительной частоты.

Вы можете использовать Minitab или другой программный пакет для создания гистограмм, или вы можете создавать свои гистограммы вручную. В любом случае, выбранный вами интервал ширины (называемый бинами для компьютерных пакетов) может отличаться от того, который вы видите на рисунках, и это хорошо, если вы похожи. И они будут, если вы не используете необычно низкое или большое количество баров и ваши бары имеют одинаковую ширину.

Вы также можете выбрать разные начальные / конечные точки для каждого интервала, и это тоже хорошо. Просто убедитесь, что все четко обозначено, чтобы ваш инструктор мог видеть, что вы пытаетесь сделать. И будьте последовательны в отношении ценностей, которые оказываются прямо на границе; всегда помещайте их в нижнюю группу или всегда помещайте в верхнюю группу. Однако если у вас есть выбор, сделайте свои гистограммы с помощью компьютерного пакета, такого как Minitab Это делает вашу задачу намного проще.

Ниже приведен пример создания двух типов гистограмм.

Результаты тестов для класса из 30 студентов показаны в следующей таблице.

Частотные гистограммы и относительные частотные гистограммы выглядят одинаково; они просто сделаны с использованием разных масштабов по оси Y.

Частотная гистограмма для данных оценок показана на следующем рисунке.

частотная гистограмма

Вы можете найти относительные частоты, взяв каждую частоту и разделив на 30 (общий размер выборки). Относительные частоты для этих трех групп составляют 8/30 = 0,27 или 27%; 16/30 = 0,53 или 53%; и 6/30 = 0,20 или 20% соответственно.

Гистограмма, основанная на относительных частотах, выглядит так же, как гистограмма (из тех же данных). Единственным отличием является метка на оси Y.

Осмысление гистограмм

Гистограмма дает вам общую информацию о трех основных характеристиках ваших количественных (числовых) данных: форма, центр и разброс.

Форма гистограммы показана ее общим рисунком. Возможны многие шаблоны, и некоторые распространены, включая следующие:

  • Колоколообразный: выглядит как колокол - большой ком по середине и хвосты, которые опускаются с каждой стороны примерно с одинаковой скоростью. (Рисунок а) Перекошено вправо: большая часть данных откладывается влево, а несколько больших наблюдений - справа. (Рисунок б) Перекошенный влево: большая часть данных отправляется вправо, а несколько меньших наблюдений - влево. (Рисунок с) Униформа: Все бруски имеют одинаковую высоту. (Рисунок г) Бимодальный: два пика или (рисунок е) U-образный: бимодальный с двумя пиками на нижнем и верхнем концах, с меньшим количеством данных в середине. (См. Рисунок 4-1 (рисунок f) Симметричный: выглядит одинаково на каждой стороне, когда вы разделяете его по центру; колоколообразные, однородные и U-образные гистограммы являются примерами симметричных данных. (Рисунки а, г и е)
общие паттерны гистограммы

Вы можете просмотреть центр гистограммы двумя способами. Одна - это точка на оси х, где график балансирует, принимая во внимание фактические значения данных. Эта точка называется средней, и вы можете найти ее, найдя точку уравновешивания (представьте, что данные находятся на качелях). Другой способ просмотра центра - найти линию на гистограмме, где 50 процентов данных находятся по обе стороны. Линия называется медианой и представляет физическую середину набора данных. Представьте, что вы разрезаете гистограмму пополам, чтобы половина области находилась по обе стороны линии.

Распространение относится к расстоянию между данными, либо относительно друг друга, либо относительно некоторой центральной точки. Один грубый способ измерить спред - это найти диапазон или расстояние между наибольшим значением и наименьшим значением. Другой способ - найти среднее расстояние от середины, иначе называемое стандартным отклонением. Трудно придумать стандартное отклонение, просто взглянув на гистограмму, но вы можете получить грубое представление, если вы возьмете диапазон, деленный на 6. Если высоты столбцов рядом с серединой кажутся очень высокими, это означает, что большинство значения близки к среднему, что указывает на небольшое стандартное отклонение. Если столбцы выглядят короткими, у вас может быть большее стандартное отклонение.

Вы можете сделать фактическую сводную статистику для вычисления количественных данных, но гистограмма может дать вам общее направление для нахождения этих этапов. Как и круговые диаграммы и гистограммы, не все гистограммы являются достоверными, полными и точными. Вы должны знать, что искать, чтобы оценить их.

Как выровнять перекос данных с помощью гистограмм

Вы должны сделать особые соображения для искаженных наборов данных, с точки зрения которых статистика является наиболее подходящей для использования и когда. Вы также должны знать, как неправильная статистика может дать ложные ответы.

Вы можете связать среднее значение и медиану, чтобы узнать о форме ваших данных. Имея среднее значение и медиану, близкую к тому, чтобы быть равными, создаст форму, которая примерно симметрична

Среднее значение зависит от выбросов в данных, а медиана - нет. Если среднее значение и медиана близки друг к другу, данные не искажены и, скорее всего, не содержат выбросов с одной или другой стороны. Это означает, что данные выглядят примерно одинаково на каждой стороне середины, что является определением симметричных данных (см. A, d или f на предыдущем рисунке).

Тот факт, что среднее значение и медиана являются близкими, говорит о том, что данные примерно симметричны, можно использовать в тестовом вопросе другого типа. Предположим, что кто-то спрашивает вас, являются ли данные симметричными, и у вас нет гистограммы, но у вас есть среднее значение и медиана. Сравните два значения среднего и медианы, и если они близки, данные симметричны. Если это не так, данные не являются симметричными.

Как определить ложную гистограмму

Читатели могут быть введены в заблуждение гистограммой способами, которые не возможны с гистограммой. Помните, что гистограмма имеет дело с числовыми данными, а не категориальными данными, что означает, что вы должны определить, как вы хотите, чтобы числовые данные, разбитые на группы, отображались на горизонтальной оси. И то, как вы определяете эти группировки, может сделать график совсем другим. Следите за гистограммами, которые используют масштаб, чтобы ввести читателей в заблуждение. Как и в случае гистограмм, вы можете преувеличивать различия, используя меньший масштаб на вертикальной оси гистограммы, и вы можете преуменьшать различия, используя больший масштаб.

Смотрите также

Выбор лучшего поставщика облачных услуг, функций и инструментов для DevOps. Почему DevOps имеет значение: 11 способов DevOps приносит пользу вашей организации: используйте больше облачных инструментов: автоматизация DevOps в CloudTips для повышения производительности проектирования с помощью DevOpsКак формировать команды DevOps в вашей организацииПеремещение к процессам DevOps: От линии к CircuitInterview Методы для создания команды DevOps: получение правильных технических навыков Непрерывная интеграция и непрерывная поставка: реализация и получение преимуществ от CI / CDTop 10 Подводные камни DevOps: почему ваши программные проекты терпят неудачу Что такое DevOps? DevOps For Dummies Полная стоимостьКак найти свои контакты в InstagramВыбор лучшего поставщика облачных услуг, функций и инструментов для DevOpsКак выбрать лучшую соковыжималку для вас: руководство по покупкеВоспользовавшись хэштегами InstagramЧто такое CISO?Откройте для себя особенности iPhone 11 и iOS 13 Как подписаться на подкасты на вашем iPhone Рекомендуемые приложения для вашего iPhoneiPhone Для пожилых людей Для чайников Шпаргалка Как создать трейлер фильма на вашем iPhone Как работает Amazon Fire TV Stick? Как получить доступ к VPN на вашем iPhoneКак подключить интернет-соединение с телефоном AndroidКак сделать конференц-звонок на телефоне AndroidКак включить белое на черном на iPhoneКак заблокировать и разблокировать iPhone