Google Play badge

การถดถอยเชิงสถิติ


คุณจะได้เรียนรู้:

การวิเคราะห์การถดถอย เป็นวิธีการเชื่อมโยงตัวแปรเข้าด้วยกัน ตัวแปรเป็นเพียงส่วนเล็กๆ ของข้อมูลที่เรารวบรวมไว้ โดยใช้การวิเคราะห์การถดถอย เราสามารถหารูปแบบในข้อมูลของเราได้ ช่วยให้เราสามารถคาดการณ์ได้จากข้อมูลของเรา การถดถอยทางสถิติเป็นเทคนิคที่ใช้ในการพิจารณาว่าตัวแปรตามได้รับผลกระทบจากตัวแปรอิสระตั้งแต่หนึ่งตัวขึ้นไปอย่างไร ในแง่คณิตศาสตร์ การถดถอยทางสถิติตอบคำถาม: อะไรจะเกิดขึ้นกับค่าของ Y (ตัวแปรตาม) ถ้าค่าของ X (ตัวแปรอิสระ) เปลี่ยนไป?

ตัวอย่างเช่น เราต้องการค้นหาความสัมพันธ์ระหว่างอายุและราคาของรถยนต์มือสองที่ขายเมื่อปีที่แล้วโดยตัวแทนจำหน่ายรถยนต์ เราจะเห็นความสัมพันธ์เชิงลบระหว่างสองตัวแปรนี้ พออายุรถมากขึ้นราคาก็ลง ในตัวอย่างนี้ อายุรถและราคารถเป็นสองตัวแปร ราคารถขึ้นอยู่กับอายุรถ สิ่งที่เราต้องการค้นหาคือสมการที่เหมาะกับข้อมูลที่เรามีมากที่สุด แบบจำลองการวิเคราะห์การถดถอยอย่างง่ายที่เราสามารถใช้สำหรับตัวอย่างของเราเรียกว่า แบบจำลองเชิงเส้น ซึ่งใช้สมการเชิงเส้นอย่างง่ายเพื่อให้พอดีกับข้อมูล สมการเชิงเส้นเมื่อวาดกราฟจะให้เส้นตรง

สมการถดถอยเชิงเส้นหรือที่เรียกว่า สูตรความชัน มีรูปแบบ Y= a + bX โดยที่ Y คือตัวแปรตาม (นั่นคือตัวแปรที่อยู่บนแกน Y) X คือตัวแปรอิสระ (กล่าวคือ มันถูกลงจุดบน แกน X), b คือความชันของเส้นตรง และ a คือจุดตัดแกน y(ค่าของ y เมื่อ x = 0)

ความชันของเส้น เป็นค่าที่อธิบายอัตราการเปลี่ยนแปลงระหว่างตัวแปรอิสระและตัวแปรตาม ความชัน บอกเราว่าตัวแปรตาม ( y ) เปลี่ยนแปลงอย่างไรสำหรับทุก ๆ หนึ่งหน่วยที่เพิ่มขึ้นในตัวแปรอิสระ ( x ) โดยเฉลี่ย y -intercept ใช้เพื่ออธิบายตัวแปรตามเมื่อตัวแปรอิสระมีค่าเท่ากับศูนย์

\(a = \frac{(\Sigma y)(\Sigma x^2) - (\Sigma x) (\Sigma xy)} {n(\Sigma x^2) - (\Sigma x)^2 }\)
\(b = \frac{n(\Sigma xy) - (\Sigma x) (\Sigma y)} {n(\Sigma x^2) - (\Sigma x)^2 }\)

b>0 แสดงความสัมพันธ์เชิงบวกระหว่างตัวแปรทั้งสอง

คุณยังสามารถใช้ซอฟต์แวร์ทางสถิติใดๆ เช่น excel เพื่อรับสมการสำหรับการถดถอยเชิงเส้น วางแผนแผนภูมิกระจาย และวาดเส้นการถดถอย

การวิเคราะห์การถดถอยทำงานอย่างไร
การถดถอยเชิงเส้นประกอบด้วยการหาเส้นตรงที่เหมาะสมที่สุดผ่านจุดต่างๆ กำหนดตัวแปรตามที่คุณตั้งสมมติฐานว่าได้รับอิทธิพลจากตัวแปรอิสระหนึ่งตัวหรือหลายตัว รวบรวมชุดข้อมูลสำหรับตัวแปรเหล่านี้
ตัวอย่างที่ 1: ลองพิจารณาข้อมูลด้านล่างสำหรับการขายรถมือสอง

อายุรถ (ปี) ราคา (เป็นดอลลาร์)
4 6500
4 6000
5 5500
5 5300
7 4700
7 4300
8 4000
9 3100
10 3000
11 2543
12 1800

เมื่อดูข้อมูลเราสามารถพูดได้ว่าราคารถยนต์ลดลงตามอายุรถยนต์ที่เพิ่มขึ้น

สูตรสำหรับเส้นถดถอยคือ Y= a + bX หาค่า a และ b โดยใช้สูตรด้านล่าง

\(a = \frac{(\Sigma y)(\Sigma x^2) - (\Sigma x) (\Sigma xy)} {n(\Sigma x^2) - (\Sigma x)^2 }\)
\(b = \frac{n(\Sigma xy) - (\Sigma x) (\Sigma y)} {n(\Sigma x^2) - (\Sigma x)^2 }\)


สมการถดถอยเชิงเส้นสำหรับความสัมพันธ์นี้คือ Y = -557.62125 X + 8356.81293

เขียนจุดข้อมูลและเส้นการถดถอยในกราฟ

แกน X : อายุ แกน Y : ราคา

ตัวอย่างที่ 2: จอห์นเป็นช่างประปา เขาเรียกเก็บเงิน 25 ดอลลาร์เป็นค่าเยี่ยมและ 35 ดอลลาร์เป็นค่าทำงานรายชั่วโมง สมการเชิงเส้นที่แสดงจำนวนเงินทั้งหมดที่จอห์นได้รับสำหรับการเข้าชมแต่ละครั้งคือ y = 25 + 35x

ทำไมต้องวิเคราะห์การถดถอย?

Download Primer to continue