Статистиката е гранка од математиката која се занимава со собирање, анализа, интерпретација и презентација на податоци. Тоа е моќна алатка за разбирање на светот околу нас, помагајќи да се донесуваат одлуки врз основа на податоци, а не на претпоставки.
Постојат две главни гранки на статистиката: описна статистика и инференцијална статистика .
Мерките на централна тенденција се користат за сумирање на збир на податоци преку идентификување на централната позиција во тој збир на податоци. Најчестите мерки се средна вредност, медијана и режим.
Мерките на варијација опишуваат како податоците се дисперзираат или шират. Најчестите мерки се опсегот, варијансата и стандардната девијација.
Инференцијалните статистики извлекуваат заклучоци од податоците кои се предмет на случајна варијација. Ова вклучува грешки во набљудувањето, варијации на земање примероци итн. Се работи за правење заклучоци за популацијата врз основа на примерок.
Тестирањето на хипотезата е метод на статистички заклучоци. Се користи за да се одлучи дали податоците поддржуваат одредена хипотеза или не. Ова вклучува споредба на p-вредноста , или набљудуваната значајност, со однапред одредено ниво на значајност, често 0,05.
Интервали на доверба се опсег на вредности, добиени од податоците од примероците, за кои се верува дека ја содржат вредноста на непознат параметар популација на одредено ниво на доверба. На пример, 95% интервал на доверливост за средната вредност би значело дека доколку истата популација се зема примерок повеќе пати и се пресметуваат интервали, приближно 95% од тие интервали би ја содржат вистинската средна популација.
Регресивна анализа е статистичка метода која ја испитува врската помеѓу две или повеќе променливи. На пример, линеарната регресија може да се користи за да се предвиди вредноста на една променлива врз основа на вредноста на друга. Равенката за едноставна линеарна регресивна линија е \(y = \beta_0 + \beta_1x\) , каде што \(y\) е зависната променлива, \(x\) е независна променлива и \(\beta_0\) и \(\beta_1\) се коефициентите кои го претставуваат y-пресекот и наклонот на правата, соодветно.
Собирањето податоци е клучен чекор во процесот на статистичка анализа. Податоците мора да бидат соодветно собрани за да се осигура дека резултатите се валидни и веродостојни. Вообичаените методи вклучуваат анкети, експерименти и набљудувачки студии.
Веројатноста игра основна улога во статистиката, бидејќи овозможува квантификација на неизвесноста. Веројатноста може да се смета како веројатност да се случи некој настан и таа се движи од 0 (невозможно) до 1 (одредено).
Основната формула за веројатност е: P(A) =Број на поволни исходи ∕ Вкупен број на можни исходи
Каде:
Едно важно правило е Правилото за собирање , кое вели дека веројатноста да се случи некој од двата или повеќе меѓусебно исклучувачки настани е еднаква на збирот на нивните поединечни веројатности. Формулата е \(P(A \textrm{ или } B) = P(A) + P(B)\) , под претпоставка дека \(A\) и \(B\) се исклучуваат меѓусебно.
Друг суштински концепт е Правилото за множење , кое се користи при пресметување на веројатноста два или повеќе независни настани да се случат заедно. Формулата е \(P(A \textrm{ и } B) = P(A) \times P(B)\) .
Разбирањето на овие концепти и алатки за статистика може да ги поттикне поединците да донесуваат информирани одлуки врз основа на податоци, а не на претпоставки. Таа ја поставува основата за анализа на сложени збирки на податоци, придонесувајќи значително за напредокот во различни области како што се економијата, науката и јавното здравство.