Медіана — це тип середнього значення, яке представляє середнє значення в наборі даних, упорядкованому за зростанням або спаданням. На відміну від середнього, для якого потрібна сума всіх значень, медіана ділить набір даних на дві рівні половини. У контексті математики та статистики розуміння медіани має вирішальне значення для аналізу даних, допомагаючи узагальнити набір даних за його центральною тенденцією.
У математиці поняття медіани є простим. Якщо кількість спостережень у наборі даних непарна, медіана є середнім числом. Однак, якщо кількість спостережень парна, медіана є середнім з двох середніх чисел. Математичне представлення знаходження медіани залежить від того, парну чи непарну кількість спостережень містить набір даних.
Для непарної кількості спостережень: якщо набір даних має \(n\) значень, відсортованих у порядку зростання, і \(n\) є непарним, тоді медіана \(M\) є значенням у позиції \(\frac{n+1}{2}\) .
Для парної кількості спостережень: якщо \(n\) парне, тоді медіана \(M\) є середнім значень у положеннях \(\frac{n}{2}\) і \(\frac{n}{2} + 1\) .
У статистиці медіана широко використовується як міра центральної тенденції, особливо коли дані спотворені або містять викиди, які можуть спотворювати середнє значення. Медіана забезпечує більш точне представлення центру набору даних, що робить його безцінним у задачах аналізу реальних даних.
Однією з ключових особливостей медіани є її стійкість до викидів, які є екстремальними значеннями, які суттєво відрізняються від інших спостережень. Оскільки медіана стосується лише середнього значення, на неї не впливають викиди. Ця характеристика робить медіану особливо корисною в таких галузях, як нерухомість, фінанси та економіка, де кілька екстремальних значень можуть спотворювати середнє, надаючи таким чином оманливу інформацію.
Приклад 1. Розглянемо набір чисел: 2, 3, 4, 5, 6. Оскільки є п’ять чисел, непарна кількість, медіана є просто середнім числом, яке в даному випадку дорівнює 4.
Приклад 2. Для набору даних: 1, 2, 3, 4, 5, 6, з парною кількістю спостережень, медіана буде середнім третього та четвертого чисел: \(\frac{3 + 4}{2} = 3.5\) .
Маніпулювання набором даних: щоб зрозуміти вплив викидів на медіану, розглянемо набір даних: 100, 200, 300, 400, 500. Медіана дорівнює 300. Якщо ми додамо до набору даних два крайніх значення, наприклад 10 000 і 20 000, роблячи його: 100, 200, 300, 400, 500, 10 000, 20 000, медіана лише зміщується до середнього значення 300 і 400, що дорівнює 350, демонструючи надійність медіани в порівнянні з викидами.
Медіана проти середнього значення: щоб зрозуміти різницю між медіаною та середнім значенням, розглянемо набір даних про доходи домогосподарств у невеликій громаді: 30 000, 35 000, 40 000, 45 000 та один викид із 1 000 000. Середній дохід буде значно вищим через викид, що свідчить про вищий рівень життя, ніж є точним для більшості громади. Однак медіанний дохід точно представлятиме центральну тенденцію доходу громади, на яку не впливає викид.
Медіана пропонує простий, але надійний метод розуміння розподілу та центральної тенденції набору даних. Зосереджуючись на середньому значенні, а не на сумі всіх значень, медіана забезпечує справжнє відображення центральної точки як у парних, так і в непарних наборах даних. Його стійкість до впливу викидів робить його кращим показником у різних галузях математики та статистики, що підсилює важливість медіани в аналізі та інтерпретації даних.