สถิติเป็นสาขาหนึ่งของคณิตศาสตร์ที่เกี่ยวข้องกับการรวบรวม การวิเคราะห์ การตีความ และการนำเสนอข้อมูล สถิติเป็นเครื่องมือที่มีประสิทธิภาพในการทำความเข้าใจโลกที่อยู่รอบตัวเรา ช่วยให้ตัดสินใจโดยอาศัยข้อมูลมากกว่าการสันนิษฐาน
สถิติมีอยู่ 2 สาขาหลัก คือ สถิติเชิงพรรณนา และ สถิติเชิงอนุมาน
การวัดแนวโน้มกลาง ใช้เพื่อสรุปชุดข้อมูลโดยระบุตำแหน่งกลางภายในชุดข้อมูลนั้น การวัดที่ใช้กันทั่วไป ได้แก่ ค่าเฉลี่ย ค่ามัธยฐาน และค่าฐานนิยม
การวัดความแปรปรวน อธิบายถึงการกระจายหรือกระจายข้อมูล การวัดที่ใช้กันทั่วไป ได้แก่ ช่วง ความแปรปรวน และค่าเบี่ยงเบนมาตรฐาน
สถิติเชิงอนุมานจะดึงข้อสรุปจากข้อมูลที่มีการเปลี่ยนแปลงแบบสุ่ม ซึ่งรวมถึงข้อผิดพลาดในการสังเกต การเปลี่ยนแปลงจากการสุ่มตัวอย่าง เป็นต้น สถิติเชิงอนุมานนี้เกี่ยวข้องกับการอนุมานเกี่ยวกับประชากรโดยอิงจากตัวอย่าง
การทดสอบสมมติฐาน เป็นวิธีการอนุมานทางสถิติ ใช้ในการตัดสินใจว่าข้อมูลสนับสนุนสมมติฐานเฉพาะหรือไม่ ซึ่งเกี่ยวข้องกับการเปรียบเทียบ ค่า p หรือความสำคัญที่สังเกตได้กับระดับความสำคัญที่กำหนดไว้ล่วงหน้า ซึ่งมักจะเป็น 0.05
ช่วงความเชื่อมั่น คือช่วงค่าที่ได้จากข้อมูลตัวอย่าง ซึ่งเชื่อว่ามีค่าพารามิเตอร์ประชากรที่ไม่ทราบค่าที่ระดับความเชื่อมั่นบางระดับ ตัวอย่างเช่น ช่วงความเชื่อมั่น 95% สำหรับค่าเฉลี่ยจะหมายความว่าหากมีการสุ่มตัวอย่างประชากรกลุ่มเดียวกันหลายครั้งและมีการคำนวณช่วงแล้ว ช่วงประมาณ 95% ของช่วงเหล่านั้นจะมีค่าเฉลี่ยประชากรที่แท้จริง
การวิเคราะห์การถดถอย เป็นวิธีทางสถิติที่ตรวจสอบความสัมพันธ์ระหว่างตัวแปรสองตัวหรือมากกว่า ตัวอย่างเช่น การถดถอยเชิงเส้นสามารถใช้เพื่อทำนายค่าของตัวแปรหนึ่งโดยอ้างอิงจากค่าของตัวแปรอื่น สมการสำหรับเส้นการถดถอยเชิงเส้นแบบง่ายคือ \(y = \beta_0 + \beta_1x\) โดยที่ \(y\) คือตัวแปรตาม \(x\) คือตัวแปรอิสระ และ \(\beta_0\) และ \(\beta_1\) คือค่าสัมประสิทธิ์ที่แสดงถึงค่าตัดแกน y และความชันของเส้นตามลำดับ
การรวบรวมข้อมูลเป็นขั้นตอนสำคัญในกระบวนการวิเคราะห์ทางสถิติ จำเป็นต้องรวบรวมข้อมูลอย่างเหมาะสมเพื่อให้แน่ใจว่าผลลัพธ์มีความถูกต้องและเชื่อถือได้ วิธีการทั่วไป ได้แก่ การสำรวจ การทดลอง และการศึกษาเชิงสังเกต
ความน่าจะเป็นมีบทบาทสำคัญในสถิติ เนื่องจากช่วยให้สามารถวัดความไม่แน่นอนได้ ความน่าจะเป็นสามารถพิจารณาได้ว่าเป็นความน่าจะเป็นที่เหตุการณ์จะเกิดขึ้น และมีตั้งแต่ 0 (เป็นไปไม่ได้) ถึง 1 (แน่นอน)
สูตรพื้นฐานสำหรับ ความน่าจะเป็น คือ: P(A) = จำนวนผลลัพธ์ที่เอื้ออำนวย ∕ จำนวนผลลัพธ์ที่เป็นไปได้ทั้งหมด
ที่ไหน:
กฎที่สำคัญข้อหนึ่งคือ กฎการบวก ซึ่งระบุว่าความน่าจะเป็นของเหตุการณ์ใดเหตุการณ์หนึ่งจากสองเหตุการณ์ขึ้นไปที่แยกกันจะเกิดขึ้นนั้นเท่ากับผลรวมของความน่าจะเป็นของเหตุการณ์แต่ละเหตุการณ์ สูตรคือ \(P(A \textrm{ หรือ } B) = P(A) + P(B)\) โดยถือว่า \(A\) และ \(B\) แยกกัน
แนวคิดสำคัญอีกประการหนึ่งคือ กฎการคูณ ซึ่งใช้ในการคำนวณความน่าจะเป็นของเหตุการณ์อิสระสองเหตุการณ์ขึ้นไปที่เกิดขึ้นพร้อมกัน สูตรคือ \(P(A \textrm{ และ } B) = P(A) \times P(B)\)
การทำความเข้าใจแนวคิดและเครื่องมือทางสถิติเหล่านี้จะช่วยให้บุคคลต่างๆ สามารถตัดสินใจอย่างรอบรู้โดยอาศัยข้อมูลมากกว่าการคาดเดา นอกจากนี้ยังช่วยวางรากฐานสำหรับการวิเคราะห์ชุดข้อมูลที่ซับซ้อน ซึ่งมีส่วนช่วยอย่างมากต่อความก้าวหน้าในสาขาต่างๆ เช่น เศรษฐศาสตร์ วิทยาศาสตร์ และสาธารณสุข