Matututo ka:
Ang pagsusuri ng regression ay isang paraan ng pag-uugnay ng mga variable sa bawat isa. Ang mga variable ay simpleng mga piraso ng impormasyon na aming nakolekta. Sa pamamagitan ng paggamit ng regression analysis, mahahanap natin ang mga pattern sa ating data. Nagbibigay-daan ito sa amin na gumawa ng mga hula batay sa aming data. Ang Statistical Regression ay isang pamamaraan na ginagamit upang matukoy kung paano naaapektuhan ang isang dependent variable ng isa o higit pang independent variable. Sa mathematical terms sinasagot ng Statistical Regression ang tanong na: Ano ang magiging epekto sa halaga ng Y (ang dependent variable) kung ang halaga ng X (ang independent variable) ay binago?
Halimbawa - gusto naming malaman ang kaugnayan sa pagitan ng edad at presyo ng mga ginamit na sasakyan na ibinebenta noong nakaraang taon ng isang dealer ng kotse. Makakakita tayo ng negatibong relasyon sa pagitan ng dalawang variable na ito. Habang tumataas ang edad ng sasakyan, bumababa ang mga presyo. Sa halimbawang ito, ang edad ng kotse at presyo ng kotse ay dalawang variable. Ang presyo ng kotse ay nakasalalay sa edad ng kotse. Ang gusto naming mahanap ay isang equation na pinakaangkop sa data na mayroon kami. Ang isang napakasimpleng modelo ng pagsusuri ng regression na magagamit natin para sa ating halimbawa ay tinatawag na linear model , na gumagamit ng simpleng linear equation upang magkasya sa data. Ang mga linear equation kapag na-graph ay nagbibigay sa iyo ng isang tuwid na linya.
Ang linear regression equation o kinikilala rin bilang formula ng slope ay may anyo na Y= a + bX, kung saan ang Y ang dependent variable (iyan ang variable na napupunta sa Y-axis), ang X ay ang independent variable (ibig sabihin, naka-plot ito sa X-axis), ang b ay ang slope ng linya at ang a ay ang y-intercept(ang halaga ng y kapag x = 0).
Ang slope ng isang linya ay isang value na naglalarawan sa rate ng pagbabago sa pagitan ng independent at dependent variables. Sinasabi sa atin ng slope kung paano nagbabago ang dependent variable ( y ) para sa bawat pagtaas ng isang unit sa independent ( x ) variable, sa average. Ang y -intercept ay ginagamit upang ilarawan ang dependent variable kapag ang independent variable ay katumbas ng zero.
b>0 ay nagpapakita ng positibong relasyon sa pagitan ng dalawang variable.
Maaari mo ring gamitin ang anumang statistical software tulad ng excel upang makuha ang equation para sa linear regression, upang i-plot ang scatter chart, at iguhit ang regression line.
Paano gumagana ang pagsusuri ng regression?
Ang linear regression ay binubuo ng paghahanap ng pinaka-angkop na tuwid na linya sa pamamagitan ng mga puntos. Tukuyin ang isang dependent variable na iyong hypothesize na naiimpluwensyahan ng isa o ilang independent variable. Kolektahin ang dataset para sa mga variable na ito.
Halimbawa 1: Isaalang-alang natin ang data sa ibaba para sa pagbebenta ng ginamit na sasakyan.
Edad ng Kotse (sa mga taon) | Presyo (sa dolyar) |
4 | 6500 |
4 | 6000 |
5 | 5500 |
5 | 5300 |
7 | 4700 |
7 | 4300 |
8 | 4000 |
9 | 3100 |
10 | 3000 |
11 | 2000 |
12 | 1800 |
Kung titingnan ang data, masasabi nating bumababa ang presyo ng sasakyan sa pagtaas ng edad ng sasakyan.
Ang formula para sa isang linya ng regression ay Y= a + bX, nakukuha ang a at b gamit ang mga formula sa ibaba
Ang linear regression equation para sa relasyong ito ay Y = -557.62125 X + 8356.81293
I-plot ang mga punto ng data at ang linya ng regression sa isang graph.
X-axis : Edad, Y-axis : Presyo
Halimbawa2: Si John ay isang tubero. Siya ay naniningil ng $25 dolyar bilang singil sa pagbisita at $35 bilang kanyang oras-oras na singil sa pagtatrabaho. Ang isang linear equation na nagpapahayag ng kabuuang halaga ng perang kinikita ni John para sa bawat pagbisita ay y = 25 + 35x.
Bakit ang pagsusuri ng regression?