শতকরা হল এমন পরিমাপ যা একটি ডেটাসেটকে 100টি সমান অংশে বিভক্ত করে, একটি নির্দিষ্ট স্তরের নিচে থাকা মানগুলির শতাংশের পরিপ্রেক্ষিতে ডেটা বিতরণ বোঝার একটি উপায় প্রদান করে। এগুলি সাধারণত স্কোর তুলনা করতে এবং ডেটাসেটের মধ্যে একটি নির্দিষ্ট মানের অবস্থান বোঝার জন্য পরিসংখ্যানে ব্যবহৃত হয়। উদাহরণস্বরূপ, যদি আপনি একটি পরীক্ষায় 90 তম পার্সেন্টাইলে স্কোর করেন, তাহলে এর অর্থ হল যে আপনি পরীক্ষা দিয়েছেন তাদের 90% থেকে ভাল স্কোর করেছেন।
শতাংশ গণনা করা হচ্ছে
একটি ডেটাসেটের একটি মানের শতকরা সূত্রটি ব্যবহার করে গণনা করা যেতে পারে: \( P = \left(\frac{N - 1}{100}\right) \times k + 1 \) যেখানে \(P\) হল শতাংশের অবস্থান, \(N\) হল ডেটাসেটে পর্যবেক্ষণের সংখ্যা, এবং \(k\) হল 0 এবং 100-এর মধ্যে একটি সংখ্যা হিসাবে গণনা করা শতকরা। এই সূত্রটি \(k^{th}\) এর অবস্থান দেয়। বাছাই করা ডেটাসেটে \(k^{th}\) শতাংশ। এই অবস্থানের মান, অথবা এই অবস্থান এবং পরের মধ্যে গড় যদি \(P\) একটি পূর্ণসংখ্যা না হয়, তাহলে \(k^{th}\) শতাংশকে উপস্থাপন করে।
শতকরা হিসাব করার উদাহরণ
পরীক্ষার স্কোরগুলির একটি ডেটাসেট বিবেচনা করুন: 45, 50, 55, 60, 65, 70, 75, 80। আসুন 50 তম পার্সেন্টাইল গণনা করি, প্রায়শই মধ্যম হিসাবে উল্লেখ করা হয়। প্রথমে, ডেটাসেট বাছাই করুন (এই ক্ষেত্রে, এটি ইতিমধ্যেই সাজানো হয়েছে), এবং তারপরে \(N = 8\) (8টি স্কোর আছে) এবং \(k = 50\) দিয়ে সূত্র প্রয়োগ করুন (আমরা 50 তম শতাংশ খুঁজে পাচ্ছি ): \( P = \left(\frac{8 - 1}{100}\right) \times 50 + 1 = 4.5 \) অবস্থান \(P = 4.5\) মানে 50 তম পার্সেন্টাইল 4র্থ এবং এর মধ্যে অর্ধেক। ডেটাসেটের ৫ম মান (৬০ এবং ৬৫)। অতএব, 50 তম পার্সেন্টাইল (মিডিয়ান) হল: \( \frac{60 + 65}{2} = 62.5 \) সুতরাং, 62.5 হল সেই মান যার নিচে 50% স্কোর পড়ে।
শতকরার অ্যাপ্লিকেশন
শিক্ষা, স্বাস্থ্য এবং অর্থ সহ বিভিন্ন ক্ষেত্রে শতকরা ব্যাপকভাবে ব্যবহৃত হয়। উদাহরণস্বরূপ, বৃহত্তর জনসংখ্যার সাথে একজন ব্যক্তির পারফরম্যান্সের তুলনা করতে সাহায্য করার জন্য প্রমিত পরীক্ষার ফলাফলগুলি প্রায়শই শতাংশে রিপোর্ট করা হয়। স্বাস্থ্যের ক্ষেত্রে, গ্রোথ চার্টগুলি সহকর্মীদের তুলনায় শিশুদের বৃদ্ধির মূল্যায়ন করতে শতাংশ ব্যবহার করে। ফাইন্যান্সে, পার্সেন্টাইল বিনিয়োগের উপর রিটার্নের বন্টন বিশ্লেষণ করতে সাহায্য করতে পারে।
পারসেন্টাইল বনাম অন্যান্য পরিমাপ
যদিও পার্সেন্টাইলগুলি ডেটা বিতরণের অন্তর্দৃষ্টি প্রদান করে, তারা অন্যান্য পরিসংখ্যানগত ব্যবস্থা যেমন গড়, মধ্য এবং মোড থেকে আলাদা। গড় (গড়) হল মানের সংখ্যা দ্বারা ভাগ করা সমস্ত মানের মোট। মধ্যমা (50তম শতাংশ) হল একটি ডেটাসেটের মধ্যম মান। মোড হল সবচেয়ে ঘন ঘন ঘটমান মান। এই ব্যবস্থাগুলির প্রতিটি ডেটাসেটের বৈশিষ্ট্য সম্পর্কে বিভিন্ন তথ্য প্রদান করে।
কোয়ার্টাইল এবং পারসেন্টাইল
কোয়ার্টাইল হল একটি নির্দিষ্ট ধরনের পারসেন্টাইল যা ডেটাকে কোয়ার্টারে ভাগ করে। প্রথম কোয়ার্টাইল (Q1) হল 25 তম পার্সেন্টাইল, দ্বিতীয় চতুর্থাংশ (Q2) হল 50 তম পার্সেন্টাইল (বা মাঝারি), এবং তৃতীয় চতুর্থাংশ (Q3) হল 75 তম পার্সেন্টাইল৷ কোয়ার্টাইলগুলি ডেটাসেটের স্প্রেড এবং কেন্দ্র বোঝার পাশাপাশি বহিরাগতদের সনাক্ত করার জন্য বিশেষভাবে কার্যকর।
পারসেন্টাইল র্যাঙ্ক বোঝা
একটি পার্সেন্টাইল র্যাঙ্ক হল এর ফ্রিকোয়েন্সি ডিস্ট্রিবিউশনের স্কোরের শতাংশ যা এটির সমান বা কম। উদাহরণস্বরূপ, যদি একজন শিক্ষার্থীর স্কোর 80 তম পার্সেন্টাইলে থাকে, তাহলে এর মানে হল যে 80% শিক্ষার্থী এই শিক্ষার্থীর সমান বা তার চেয়ে কম স্কোর করেছে। শতকরা র্যাঙ্কগুলি একটি গোষ্ঠীর তুলনায় একজন ব্যক্তির কর্মক্ষমতা মূল্যায়নের জন্য কার্যকর।
শতাংশের সীমাবদ্ধতা
যদিও শতকরা মূল্যবান অন্তর্দৃষ্টি প্রদান করে, তাদের সীমাবদ্ধতা রয়েছে। পারসেন্টাইল একটি ডেটাসেটের মানের মধ্যে পার্থক্যের মাত্রা প্রতিফলিত করে না। দুই ব্যক্তির স্কোর একে অপরের কাছাকাছি হতে পারে কিন্তু ভিন্ন শতাংশে, বা অনেক দূরে কিন্তু একই শতাংশে। অধিকন্তু, খুব বড় বা খুব ছোট ডেটাসেটে, শতাংশের গণনার ফলে ভুল হতে পারে।
উপসংহার
শতকরা হল পরিসংখ্যানের একটি মৌলিক ধারণা যা একটি ডেটাসেটের মধ্যে পৃথক মানগুলি কীভাবে তুলনা করে তা বোঝার একটি উপায় অফার করে। ডেটাকে 100টি সমান অংশে ভাগ করে, শতকরা তাদের আপেক্ষিক অবস্থানের পরিপ্রেক্ষিতে ডেটা পয়েন্টগুলির তুলনা করার অনুমতি দেয়। শিক্ষাগত মূল্যায়ন, স্বাস্থ্য মূল্যায়ন বা আর্থিক বিশ্লেষণে ব্যবহার করা হোক না কেন, শতকরা ডেটা ব্যাখ্যার জন্য একটি শক্তিশালী হাতিয়ার প্রদান করে। যাইহোক, তাদের সীমাবদ্ধতাগুলি বিবেচনা করা এবং একটি বিস্তৃত বিশ্লেষণের জন্য অন্যান্য পরিসংখ্যানগত ব্যবস্থাগুলির পাশাপাশি সেগুলি ব্যবহার করা হয়েছে তা নিশ্চিত করা অপরিহার্য।