Ti do të mësosh:
Analiza e regresionit është një mënyrë e lidhjes së variablave me njëri-tjetrin. Variablat janë thjesht pjesë të informacionit që kemi mbledhur. Duke përdorur analizën e regresionit, ne mund të gjejmë modele në të dhënat tona. Na lejon të bëjmë parashikime bazuar në të dhënat tona. Regresioni statistikor është një teknikë e përdorur për të përcaktuar se si një ndryshore e varur ndikohet nga një ose më shumë variabla të pavarur. Në aspektin matematikor Regresioni Statistikor i përgjigjet pyetjes: Cili do të jetë ndikimi në vlerën e Y (ndryshores së varur) nëse ndryshohet vlera e X (ndryshores së pavarur)?
Për shembull - ne duam të zbulojmë lidhjen midis moshës dhe çmimit të makinave të përdorura të shitura vitin e kaluar nga një tregtar makinash. Do të shohim një marrëdhënie negative midis këtyre dy variablave. Me rritjen e moshës së makinave çmimet ulen. Në këtë shembull, mosha e makinës dhe çmimi i makinës janë dy variabla. Çmimi i makinës varet nga mosha e makinës. Ajo që duam të gjejmë është një ekuacion që i përshtatet më së miri të dhënave që kemi. Një model shumë i thjeshtë i analizës së regresionit që mund të përdorim për shembullin tonë quhet modeli linear , i cili përdor një ekuacion të thjeshtë linear për të përshtatur të dhënat. Ekuacionet lineare kur vizatohen në grafik ju japin një vijë të drejtë.
Ekuacioni i regresionit linear ose i njohur gjithashtu si formula e pjerrësisë ka formën Y= a + bX, ku Y është ndryshorja e varur (kjo është ndryshorja që shkon në boshtin Y), X është ndryshorja e pavarur (d.m.th. është paraqitur në Boshti X), b është pjerrësia e vijës dhe a është y-prerja (vlera e y kur x = 0).
Pjerrësia e një linje është një vlerë që përshkruan shkallën e ndryshimit midis variablave të pavarur dhe të varur. Pjerrësia na tregon se si ndryshon mesatarisht ndryshorja e varur ( y ) për çdo rritje prej një njësie në variablin e pavarur ( x ). Ndërprerja y përdoret për të përshkruar variablin e varur kur ndryshorja e pavarur është e barabartë me zero.
b>0 tregon një lidhje pozitive midis dy variablave.
Ju gjithashtu mund të përdorni çdo softuer statistikor si excel për të marrë ekuacionin për regresionin linear, për të vizatuar grafikun e shpërndarjes dhe për të vizatuar vijën e regresionit.
Si funksionon analiza e regresionit?
Regresioni linear konsiston në gjetjen e vijës së drejtë më të përshtatshme përmes pikave. Përcaktoni një variabël të varur që supozoni se ndikohet nga një ose disa variabla të pavarur. Mblidhni grupin e të dhënave për këto variabla.
Shembulli 1: Le të shqyrtojmë të dhënat e mëposhtme për shitjen e makinave të përdorura.
Mosha e makinës (në vite) | Çmimi (në dollarë) |
4 | 6500 |
4 | 6000 |
5 | 5500 |
5 | 5300 |
7 | 4700 |
7 | 4300 |
8 | 4000 |
9 | 3100 |
10 | 3000 |
11 | 2000 |
12 | 1800 |
Duke parë të dhënat mund të themi se çmimi i makinës ulet me rritjen e vjetërsisë së makinave.
Formula për një vijë regresioni është Y= a + bX, nxirrni a dhe b duke përdorur formulat e mëposhtme
Ekuacioni i regresionit linear për këtë marrëdhënie është Y = -557.62125 X + 8356.81293
Paraqitni pikat e të dhënave dhe vijën e regresionit në një grafik.
Boshti X : Mosha, Boshti Y : Çmimi
Shembulli 2: Gjoni është hidraulik. Ai kërkon 25 dollarë si tarifë vizite dhe 35 dollarë si tarifa të punës për orë. Një ekuacion linear që shpreh shumën totale të parave që fiton Gjoni për çdo vizitë është y = 25 + 35x.
Pse analiza e regresionit?