পরিসংখ্যান হল গণিতের একটি শাখা যা তথ্য সংগ্রহ, বিশ্লেষণ, ব্যাখ্যা এবং উপস্থাপনা নিয়ে কাজ করে। এটি আমাদের চারপাশের বিশ্বকে বোঝার জন্য একটি শক্তিশালী হাতিয়ার, অনুমানের পরিবর্তে ডেটার উপর ভিত্তি করে সিদ্ধান্ত নিতে সহায়তা করে।
পরিসংখ্যানের দুটি প্রধান শাখা রয়েছে: বর্ণনামূলক পরিসংখ্যান এবং অনুমানমূলক পরিসংখ্যান ।
কেন্দ্রীয় প্রবণতার পরিমাপগুলি ডেটার সেটের মধ্যে কেন্দ্রীয় অবস্থান চিহ্নিত করে ডেটার একটি সেটকে সংক্ষিপ্ত করতে ব্যবহৃত হয়। সবচেয়ে সাধারণ পরিমাপ হল গড়, মধ্যমা এবং মোড।
পরিবর্তনের পরিমাপ বর্ণনা করে যে কীভাবে ডেটা ছড়িয়ে দেওয়া বা ছড়িয়ে দেওয়া হয়। সর্বাধিক সাধারণ পরিমাপ হল পরিসীমা, প্রকরণ এবং মানক বিচ্যুতি।
অনুমানীয় পরিসংখ্যানগুলি র্যান্ডম প্রকরণের সাপেক্ষে ডেটা থেকে উপসংহার টানে। এর মধ্যে রয়েছে পর্যবেক্ষণগত ত্রুটি, নমুনার ভিন্নতা ইত্যাদি। এটি একটি নমুনার উপর ভিত্তি করে জনসংখ্যা সম্পর্কে অনুমান করা।
হাইপোথিসিস টেস্টিং হল পরিসংখ্যানগত অনুমানের একটি পদ্ধতি। ডেটা একটি নির্দিষ্ট অনুমান সমর্থন করে কিনা তা নির্ধারণ করতে এটি ব্যবহার করা হয়। এর মধ্যে p-মান , বা পর্যবেক্ষণ করা তাত্পর্যকে একটি পূর্বনির্ধারিত তাৎপর্য স্তরের সাথে তুলনা করা জড়িত, প্রায়শই 0.05।
আত্মবিশ্বাসের ব্যবধান হল মানগুলির একটি পরিসর, নমুনা ডেটা থেকে প্রাপ্ত, যা বিশ্বাস করা হয় যে একটি নির্দিষ্ট আত্মবিশ্বাসের স্তরে একটি অজানা জনসংখ্যার প্যারামিটারের মান রয়েছে৷ উদাহরণ স্বরূপ, গড় জন্য একটি 95% আত্মবিশ্বাসের ব্যবধানের অর্থ হল যদি একই জনসংখ্যাকে একাধিকবার নমুনা করা হয় এবং ব্যবধান গণনা করা হয়, তাহলে এই ব্যবধানের প্রায় 95% প্রকৃত জনসংখ্যার গড় ধারণ করবে।
রিগ্রেশন বিশ্লেষণ হল একটি পরিসংখ্যানগত পদ্ধতি যা দুই বা ততোধিক ভেরিয়েবলের মধ্যে সম্পর্ক পরীক্ষা করে। উদাহরণস্বরূপ, রৈখিক রিগ্রেশন একটি ভেরিয়েবলের মান অন্যটির মানের উপর ভিত্তি করে ভবিষ্যদ্বাণী করতে ব্যবহার করা যেতে পারে। একটি সরল রৈখিক রিগ্রেশন লাইনের সমীকরণ হল \(y = \beta_0 + \beta_1x\) , যেখানে \(y\) নির্ভরশীল চলক, \(x\) হল স্বাধীন চলক, এবং \(\beta_0\) এবং \(\beta_1\) হল সহগ যা যথাক্রমে y-ইন্টারসেপ্ট এবং রেখার ঢালকে প্রতিনিধিত্ব করে।
তথ্য সংগ্রহ পরিসংখ্যান বিশ্লেষণ প্রক্রিয়ার একটি গুরুত্বপূর্ণ পদক্ষেপ। ফলাফলগুলি বৈধ এবং নির্ভরযোগ্য তা নিশ্চিত করার জন্য ডেটা যথাযথভাবে সংগ্রহ করতে হবে। সাধারণ পদ্ধতির মধ্যে রয়েছে সমীক্ষা, পরীক্ষা-নিরীক্ষা এবং পর্যবেক্ষণমূলক গবেষণা।
সম্ভাব্যতা পরিসংখ্যানে একটি মৌলিক ভূমিকা পালন করে, কারণ এটি অনিশ্চয়তার পরিমাণ নির্ধারণের অনুমতি দেয়। সম্ভাব্যতাকে একটি ঘটনা ঘটার সম্ভাবনা হিসাবে বিবেচনা করা যেতে পারে এবং এটি 0 (অসম্ভব) থেকে 1 (নির্দিষ্ট) পর্যন্ত।
সম্ভাব্যতার প্রাথমিক সূত্র হল: P(A) = অনুকূল ফলাফলের সংখ্যা ∕ সম্ভাব্য ফলাফলের মোট সংখ্যা
কোথায়:
একটি গুরুত্বপূর্ণ নিয়ম হল সংযোজন বিধি , যা বলে যে দুটি বা ততোধিক পারস্পরিক একচেটিয়া ঘটনার যে কোনো একটির সম্ভাব্যতা তাদের পৃথক সম্ভাব্যতার সমষ্টির সমান। সূত্রটি হল \(P(A \textrm{ বা } B) = P(A) + P(B)\) , ধরে নেওয়া হচ্ছে \(A\) এবং \(B\) পারস্পরিকভাবে একচেটিয়া।
আরেকটি অপরিহার্য ধারণা হল গুণন বিধি , দুই বা ততোধিক স্বাধীন ঘটনা একসাথে ঘটানোর সম্ভাবনা গণনা করার সময় ব্যবহৃত হয়। সূত্রটি হল \(P(A \textrm{ এবং } B) = P(A) \times P(B)\) ।
এই ধারণাগুলি এবং পরিসংখ্যানের সরঞ্জামগুলি বোঝা ব্যক্তিকে অনুমানের পরিবর্তে ডেটার উপর ভিত্তি করে জ্ঞাত সিদ্ধান্ত নেওয়ার ক্ষমতা দিতে পারে। এটি জটিল ডেটা সেট বিশ্লেষণের ভিত্তি তৈরি করে, অর্থনীতি, বিজ্ঞান এবং জনস্বাস্থ্যের মতো বিভিন্ন ক্ষেত্রে অগ্রগতিতে উল্লেখযোগ্যভাবে অবদান রাখে।