Що таке розподіл даних
Навіщо робити розподіл даних
По-перше: щоб краще аналізувати дані. Розуміння розподілу часто допомагає виявити закономірності та патерни у великих обсягах даних.
По-друге: щоб якісно візуалізувати дані. Людям часто складно аналізувати великі масиви, а різноманітні графіки допомагають зрозуміти дані правильно та прийняти на їх основі якісні рішення.
По-третє: щоб робити якісні моделі юніт-економіки та фінансові прогнози на їх основі.
З чим пов'язаний розподіл даних
Розподіл даних можна описати за допомогою декількох характеристик:
- Середнє — середнє арифметичне значення всіх записів в наборі даних.
- Середньозважене — значення, що враховує при розрахунку середнього не тільки кількість записів, а й їх значення також.
- Медіана — значення розбиває набір даних на дві половини.
- Мода — значення зустрічається в наборі даних найчастіше.
- Стандартне відхилення — міра того, наскільки значення в наборі даних відрізняються від середнього.
Як візуалізувати розподіл даних
Гистограма показує, скільки разів кожне значення зустрічається в наборі даних.
Коробча діаграма показує медіану, квартилі та викиди в наборі даних.
QQ-ділянка: Це графік, який використовується для порівняння розподілу даних з нормальним розподілом.
Переконайтеся, що зрозуміли все як слід
Пройдіть безкоштовний тестВідкриється наш телеграм-бот, де відбудеться вся магія
Хочете розібратися глибше?
Проходьте наш курс
«Юніт-економіка»
для підприємців та менеджерів 💪
Помітили помилку?
Маякніть Яру, будь-ласка 🙏🏻