Naučit ćeš:
Regresijska analiza je način međusobnog povezivanja varijabli. Varijable su jednostavno dijelovi informacija koje smo prikupili. Korištenjem regresijske analize možemo pronaći obrasce u našim podacima. Omogućuje nam predviđanje na temelju naših podataka. Statistička regresija je tehnika koja se koristi za određivanje kako na zavisnu varijablu utječe jedna ili više neovisnih varijabli. U matematičkom smislu, Statistička regresija odgovara na pitanje: Kakav će biti utjecaj na vrijednost Y (zavisne varijable) ako se promijeni vrijednost X (nezavisne varijable)?
Na primjer - želimo saznati odnos starosti i cijene rabljenih automobila koje je prodao prošle godine prodavač automobila. Vidjet ćemo negativnu vezu između ove dvije varijable. Kako automobil stari, cijene padaju. U ovom primjeru, starost automobila i cijena automobila su dvije varijable. Cijena automobila ovisi o starosti automobila. Ono što želimo pronaći je jednadžba koja najbolje odgovara podacima koje imamo. Vrlo jednostavan model regresijske analize koji možemo koristiti za naš primjer naziva se linearni model , koji koristi jednostavnu linearnu jednadžbu za uklapanje podataka. Linearne jednadžbe kada su prikazane na grafikonu daju vam ravnu liniju.
Jednadžba linearne regresije ili također prepoznata kao formula nagiba ima oblik Y= a + bX, gdje je Y zavisna varijabla (to je varijabla koja ide na Y-osi), X je nezavisna varijabla (tj. ucrtana je na X-os), b je nagib pravca, a a je y-presjek (vrijednost y kada je x = 0).
Nagib linije je vrijednost koja opisuje stopu promjene između nezavisnih i zavisnih varijabli. Nagib nam govori kako se zavisna varijabla ( y ) u prosjeku mijenja za svako povećanje od jedne jedinice u neovisnoj ( x ) varijable. Presjek y koristi se za opisivanje zavisne varijable kada je nezavisna varijabla jednaka nuli.
b>0 pokazuje pozitivan odnos između dvije varijable.
Također možete koristiti bilo koji statistički softver kao što je excel da dobijete jednadžbu za linearnu regresiju, da nacrtate dijagram raspršenja i nacrtate liniju regresije.
Kako radi regresijska analiza?
Linearna regresija se sastoji od pronalaženja najprikladnije ravne linije kroz točke. Definirajte zavisnu varijablu za koju pretpostavljate da je pod utjecajem jedne ili više nezavisnih varijabli. Prikupite skup podataka za ove varijable.
Primjer 1: Razmotrimo sljedeće podatke za prodaju rabljenih automobila.
Starost automobila (u godinama) | Cijena (u dolarima) |
4 | 6500 |
4 | 6000 |
5 | 5500 |
5 | 5300 |
7 | 4700 |
7 | 4300 |
8 | 4000 |
9 | 3100 |
10 | 3000 |
11 | 2000 |
12 | 1800 |
Gledajući podatke možemo reći da se cijena automobila smanjuje s povećanjem starosti automobila.
Formula za regresijsku liniju je Y= a + bX, izvedite a i b koristeći formule ispod
Jednadžba linearne regresije za ovaj odnos je Y = -557,62125 X + 8356,81293
Iscrtajte podatkovne točke i regresijsku liniju u graf.
X-os : Starost, Y-os : Cijena
Primjer 2: Ivan je vodoinstalater. On naplaćuje 25 dolara kao naknadu za posjetu i 35 dolara kao troškove rada po satu. Linearna jednadžba koja izražava ukupan iznos novca koji John zaradi za svaki posjet je y = 25 + 35x.
Zašto regresijska analiza?