Medijan je vrsta prosjeka koji predstavlja srednju vrijednost u skupu podataka kada je poredan uzlaznim ili silaznim redoslijedom. Za razliku od srednje vrijednosti, koja zahtijeva zbroj svih vrijednosti, medijan dijeli skup podataka na dvije jednake polovice. U kontekstu matematike i statistike, razumijevanje medijana ključno je za analizu podataka, pomažući u sažimanju skupa podataka prema središnjoj tendenciji.
U matematici je koncept medijana jednostavan. Ako je broj opažanja u skupu podataka neparan, medijan je srednji broj. Međutim, ako je broj opažanja paran, medijan je prosjek dva srednja broja. Matematički prikaz pronalaženja medijana varira ovisno o tome ima li skup podataka neparan ili paran broj opažanja.
Za neparan broj opažanja: Ako skup podataka ima \(n\) vrijednosti poredane uzlaznim redoslijedom i \(n\) je neparan, tada je medijan, \(M\) , vrijednost na poziciji \(\frac{n+1}{2}\) .
Za paran broj opažanja: Ako je \(n\) paran, tada je medijan, \(M\) , prosjek vrijednosti na pozicijama \(\frac{n}{2}\) i \(\frac{n}{2} + 1\) .
U statistici se medijan naširoko koristi kao mjera središnje tendencije, osobito kada su podaci iskrivljeni ili sadrže odstupanja, što može iskriviti srednju vrijednost. Medijan daje točniji prikaz središta skupa podataka, što ga čini neprocjenjivim u zadacima analize podataka u stvarnom svijetu.
Jedna od ključnih značajki medijana je njegova otpornost na ekstremne vrijednosti, koje su ekstremne vrijednosti koje se značajno razlikuju od drugih opažanja. Budući da se medijan odnosi samo na srednju vrijednost, na njega ne utječu ekstremi. Ova karakteristika čini medijan posebno korisnim u područjima kao što su nekretnine, financije i ekonomija, gdje bi nekoliko ekstremnih vrijednosti moglo iskriviti prosjek, pružajući tako pogrešne informacije.
Primjer 1: Razmotrite skup brojeva: 2, 3, 4, 5, 6. Budući da postoji pet brojeva, neparna količina, medijan je jednostavno srednji broj, koji je u ovom slučaju 4.
Primjer 2: Za skup podataka: 1, 2, 3, 4, 5, 6, s parnim brojem opažanja, medijan bi bio prosjek trećeg i četvrtog broja: \(\frac{3 + 4}{2} = 3.5\) .
Manipuliranje skupom podataka: Da biste razumjeli učinak outliera na medijan, razmotrite skup podataka: 100, 200, 300, 400, 500. Medijan je 300. Ako skupu podataka dodamo dvije ekstremne vrijednosti, kao što su 10 000 i 20 000, čineći ga: 100, 200, 300, 400, 500, 10 000, 20 000, medijan se pomiče samo na prosjek od 300 i 400, što je 350, pokazujući robusnost medijana u odnosu na izvanredne vrijednosti.
Medijan u odnosu na srednju vrijednost: da biste shvatili razliku između medijana i srednje vrijednosti, razmotrite skup podataka o prihodima kućanstva u maloj zajednici: 30 000, 35 000, 40 000, 45 000 i jedan outlier od 1 000 000. Prosječni dohodak bio bi znatno veći zbog ekstremne vrijednosti, što sugerira viši životni standard nego što je točno za većinu zajednice. Međutim, medijan prihoda točno bi predstavljao središnju tendenciju prihoda zajednice, na koju ne bi utjecao outlier.
Medijan nudi jednostavnu, ali robusnu metodu za razumijevanje distribucije i središnje tendencije skupa podataka. Usredotočujući se na srednju vrijednost, a ne na zbroj svih vrijednosti, medijan daje pravi odraz središnje točke u parnim i neparnim skupovima podataka. Njegova otpornost na utjecaj izvanrednih vrijednosti čini ga preferiranom mjerom u raznim područjima matematike i statistike, pojačavajući važnost medijana u analizi i interpretaciji podataka.