গাণিতিক পরিসংখ্যান হল এমন একটি পদ্ধতি যা আপনাকে অনিশ্চিত অবস্থার মধ্যে সচেতন সিদ্ধান্ত নিতে দেয়। তথ্য সংগ্রহ ও পদ্ধতিগত করার পদ্ধতির অধ্যয়ন, পরীক্ষা-নিরীক্ষার চূড়ান্ত ফলাফল প্রক্রিয়াকরণ এবং ভর র্যান্ডমনেস সহ যেকোন প্যাটার্ন আবিষ্কার করাই গণিতের এই শাখাটি করে। গাণিতিক পরিসংখ্যানের মৌলিক ধারণাগুলো বিবেচনা করুন।
সম্ভাব্যতা তত্ত্বের সাথে পার্থক্য
গাণিতিক পরিসংখ্যানের পদ্ধতিগুলি সম্ভাব্যতা তত্ত্বের সাথে ঘনিষ্ঠভাবে ছেদ করে। গণিতের উভয় শাখাই অসংখ্য এলোমেলো ঘটনার অধ্যয়ন নিয়ে কাজ করে। দুটি শৃঙ্খলা সীমা উপপাদ্য দ্বারা সংযুক্ত। যাইহোক, এই বিজ্ঞান মধ্যে একটি বড় পার্থক্য আছে. যদি সম্ভাব্যতা তত্ত্ব একটি গাণিতিক মডেলের ভিত্তিতে বাস্তব জগতে একটি প্রক্রিয়ার বৈশিষ্ট্য নির্ধারণ করে, তাহলে গাণিতিক পরিসংখ্যান বিপরীতটি করে - এটি মডেলের বৈশিষ্ট্যগুলিকে সেট করেপর্যবেক্ষণ করা তথ্যের উপর ভিত্তি করে।
পদক্ষেপ
গাণিতিক পরিসংখ্যানের প্রয়োগ শুধুমাত্র এলোমেলো ঘটনা বা প্রক্রিয়াগুলির সাথে বা বরং, তাদের পর্যবেক্ষণ থেকে প্রাপ্ত ডেটার সাথে সম্পৃক্ত হতে পারে। এবং এটি বিভিন্ন পর্যায়ে ঘটে। প্রথমত, পরীক্ষা-নিরীক্ষার ডেটা নির্দিষ্ট প্রক্রিয়াকরণের মধ্য দিয়ে যায়। তাদের স্বচ্ছতা এবং বিশ্লেষণের সহজতার জন্য আদেশ দেওয়া হয়। তারপর পর্যবেক্ষণ করা এলোমেলো প্রক্রিয়ার প্রয়োজনীয় পরামিতিগুলির একটি সঠিক বা আনুমানিক অনুমান করা হয়। তারা হতে পারে:
- একটি ইভেন্টের সম্ভাব্যতার মূল্যায়ন (এর সম্ভাবনা প্রাথমিকভাবে অজানা);
- একটি অনির্দিষ্ট বিতরণ ফাংশনের আচরণ অধ্যয়ন করা;
- প্রত্যাশিত অনুমান;
- ভেরিয়েন্স অনুমান
- ইত্যাদি
তৃতীয় পর্যায় হল বিশ্লেষণের আগে সেট করা যেকোন অনুমানের যাচাইকরণ, অর্থাৎ, পরীক্ষার ফলাফলগুলি তাত্ত্বিক গণনার সাথে কীভাবে সামঞ্জস্যপূর্ণ সেই প্রশ্নের উত্তর পাওয়া। প্রকৃতপক্ষে, এটি গাণিতিক পরিসংখ্যানের মূল পর্যায়। একটি উদাহরন বিবেচনা করা হবে যে একটি পর্যবেক্ষিত এলোমেলো প্রক্রিয়ার আচরণ স্বাভাবিক বন্টনের মধ্যে আছে কিনা৷
জনসংখ্যা
গাণিতিক পরিসংখ্যানের মৌলিক ধারণার মধ্যে রয়েছে সাধারণ এবং নমুনা জনসংখ্যা। এই শৃঙ্খলা কিছু সম্পত্তির সাপেক্ষে নির্দিষ্ট বস্তুর সেটের অধ্যয়নের সাথে সম্পর্কিত। একটি উদাহরণ একটি ট্যাক্সি ড্রাইভার কাজ.এই র্যান্ডম ভেরিয়েবলগুলি বিবেচনা করুন:
- লোড বা গ্রাহকের সংখ্যা: প্রতিদিন, দুপুরের খাবারের আগে, দুপুরের খাবারের পরে, …;
- গড় ভ্রমণ সময়;
- আগত অ্যাপ্লিকেশনের সংখ্যা বা শহরের জেলাগুলিতে তাদের সংযুক্তি এবং আরও অনেক কিছু৷
এটাও লক্ষণীয় যে অনুরূপ এলোমেলো প্রক্রিয়াগুলির একটি সেট অধ্যয়ন করা সম্ভব, যা একটি এলোমেলো পরিবর্তনশীলও হবে যা পর্যবেক্ষণ করা যেতে পারে।
সুতরাং, গাণিতিক পরিসংখ্যানের পদ্ধতিতে, অধ্যয়নাধীন বস্তুর সম্পূর্ণ সেট বা প্রদত্ত বস্তুর উপর একই অবস্থার অধীনে পরিচালিত বিভিন্ন পর্যবেক্ষণের ফলাফলকে সাধারণ জনসংখ্যা বলা হয়। অন্য কথায়, গাণিতিকভাবে আরও কঠোরভাবে, এটি একটি এলোমেলো পরিবর্তনশীল যা প্রাথমিক ইভেন্টের স্পেসে সংজ্ঞায়িত করা হয়, এতে উপসেটের একটি শ্রেণী নির্ধারিত হয়, যার উপাদানগুলির একটি পরিচিত সম্ভাবনা রয়েছে।
নমুনা জনসংখ্যা
এমন কিছু ক্ষেত্রে আছে যখন প্রতিটি বস্তু অধ্যয়নের জন্য একটি অবিচ্ছিন্ন অধ্যয়ন পরিচালনা করা কোন কারণে (খরচ, সময়) অসম্ভব বা অবাস্তব। উদাহরণস্বরূপ, সিল করা জ্যামের প্রতিটি জার খোলার জন্য এর গুণমান পরীক্ষা করা একটি সন্দেহজনক সিদ্ধান্ত এবং একটি কিউবিক মিটারে প্রতিটি বায়ুর অণুর গতিপথ অনুমান করার চেষ্টা করা অসম্ভব। এই ধরনের ক্ষেত্রে, নির্বাচনী পর্যবেক্ষণের পদ্ধতি ব্যবহার করা হয়: সাধারণ জনসংখ্যা থেকে একটি নির্দিষ্ট সংখ্যক বস্তু নির্বাচন করা হয় (সাধারণত এলোমেলোভাবে) এবং তাদের বিশ্লেষণ করা হয়।
এই ধারণাগুলো প্রথমে জটিল মনে হতে পারে। অতএব, বিষয়টি সম্পূর্ণরূপে বোঝার জন্য, আপনাকে V. E. Gmurman-এর পাঠ্যপুস্তক অধ্যয়ন করতে হবে "সম্ভাব্যতা তত্ত্ব এবং গাণিতিক পরিসংখ্যান"। সুতরাং, একটি নমুনা সেট বা নমুনা হল সাধারণ সেট থেকে এলোমেলোভাবে নির্বাচিত বস্তুর একটি সিরিজ। কঠোর গাণিতিক পরিভাষায়, এটি স্বাধীন, সমানভাবে বিতরণ করা র্যান্ডম ভেরিয়েবলের একটি ক্রম, যার প্রতিটির জন্য বন্টন সাধারণ র্যান্ডম ভেরিয়েবলের জন্য নির্দেশিত এর সাথে মিলে যায়।
মৌলিক ধারণা
আসুন সংক্ষেপে গাণিতিক পরিসংখ্যানের আরও কয়েকটি মৌলিক ধারণা বিবেচনা করা যাক। সাধারণ জনসংখ্যা বা নমুনায় বস্তুর সংখ্যাকে আয়তন বলে। পরীক্ষার সময় যে নমুনা মানগুলি পাওয়া যায় তাকে নমুনা উপলব্ধি বলা হয়। একটি নমুনার উপর ভিত্তি করে সাধারণ জনসংখ্যার একটি অনুমান নির্ভরযোগ্য হওয়ার জন্য, একটি তথাকথিত প্রতিনিধি বা প্রতিনিধি নমুনা থাকা গুরুত্বপূর্ণ৷ এর মানে হল যে নমুনাটি অবশ্যই জনসংখ্যার সম্পূর্ণ প্রতিনিধিত্ব করবে। জনসংখ্যার সমস্ত উপাদানের নমুনায় থাকার সমান সম্ভাবনা থাকলেই এটি অর্জন করা যেতে পারে৷
নমুনাগুলি ফেরত এবং ফেরত না দেওয়ার মধ্যে পার্থক্য করে৷ প্রথম ক্ষেত্রে, নমুনার বিষয়বস্তুতে, পুনরাবৃত্ত উপাদানটি সাধারণ সেটে ফিরে আসে, দ্বিতীয় ক্ষেত্রে, তা নয়। সাধারণত, অনুশীলনে, প্রতিস্থাপন ছাড়া নমুনা ব্যবহার করা হয়। এটিও লক্ষ করা উচিত যে সাধারণ জনসংখ্যার আকার সর্বদা উল্লেখযোগ্যভাবে নমুনার আকারকে ছাড়িয়ে যায়। বিদ্যমাননমুনা প্রক্রিয়ার জন্য অনেক বিকল্প:
- সরল - আইটেমগুলি এলোমেলোভাবে এক সময়ে নির্বাচিত হয়;
- টাইপ করা হয়েছে - সাধারণ জনসংখ্যাকে প্রকারভেদে বিভক্ত করা হয়েছে এবং প্রতিটি থেকে একটি পছন্দ করা হয়েছে; একটি উদাহরণ হল বাসিন্দাদের সমীক্ষা: পুরুষ এবং মহিলা আলাদাভাবে;
- যান্ত্রিক - উদাহরণস্বরূপ, প্রতি ১০ম উপাদান নির্বাচন করুন;
- ক্রমিক - উপাদানগুলির সিরিজে নির্বাচন করা হয়৷
পরিসংখ্যানগত বন্টন
Gmurman এর মতে, সম্ভাব্যতা তত্ত্ব এবং গাণিতিক পরিসংখ্যান বৈজ্ঞানিক জগতে অত্যন্ত গুরুত্বপূর্ণ শাখা, বিশেষ করে এর ব্যবহারিক অংশে। নমুনার পরিসংখ্যানগত বন্টন বিবেচনা করুন।
ধরুন আমাদের একদল ছাত্র আছে যারা গণিতে পরীক্ষা দিয়েছে। ফলস্বরূপ, আমাদের কাছে অনুমানের একটি সেট রয়েছে: 5, 3, 1, 4, 3, 4, 2, 5, 4, 4, 5 - এটি আমাদের প্রাথমিক পরিসংখ্যানগত উপাদান৷
প্রথমত, আমাদের এটিকে সাজাতে হবে, বা একটি র্যাঙ্কিং অপারেশন করতে হবে: 1, 2, 3, 3, 4, 4, 4, 4, 5, 5, 5 - এবং এইভাবে একটি ভিন্নতামূলক সিরিজ পেতে হবে। প্রতিটি মূল্যায়নের পুনরাবৃত্তির সংখ্যাকে মূল্যায়ন ফ্রিকোয়েন্সি বলা হয় এবং নমুনার আকারের সাথে তাদের অনুপাতকে আপেক্ষিক ফ্রিকোয়েন্সি বলা হয়। আসুন নমুনার পরিসংখ্যানগত বন্টনের একটি টেবিল বা শুধু একটি পরিসংখ্যান সিরিজ তৈরি করি:
ai | 1 | 2 | 3 | 4 | 5 |
pi | 1 | 1 | 2 | 4 | 3 |
বা
ai | 1 | 2 | 3 | 4 | 5 |
pi | 1/11 | 1/11 | 2/11 | 4/11 | 3/11 |
আসুন একটি র্যান্ডম ভেরিয়েবল আছে যার উপর আমরা পরীক্ষণের একটি সিরিজ পরিচালনা করব এবং দেখব এই ভেরিয়েবলটির মান কী। ধরুন সে মান নিয়েছে একটি1 - m1 বার; a2 - m2 বার, ইত্যাদি এই নমুনার আকার হবে m1 + … + mk=মি। সেট ai, যেখানে আমি 1 থেকে k থেকে পরিবর্তিত হয়, এটি একটি পরিসংখ্যানগত সিরিজ।
ব্যবধান বিতরণ
VE Gmurman-এর বইতে "সম্ভাব্যতা তত্ত্ব এবং গাণিতিক পরিসংখ্যান" একটি অন্তর্বর্তী পরিসংখ্যান সিরিজও উপস্থাপন করা হয়েছে। এটির সংকলন সম্ভব যখন অধ্যয়নের অধীনে বৈশিষ্ট্যটির মান একটি নির্দিষ্ট ব্যবধানে অবিচ্ছিন্ন থাকে এবং মানের সংখ্যা বড় হয়। ছাত্রদের একটি গ্রুপ বিবেচনা করুন, বা বরং, তাদের উচ্চতা: 163, 180, 185, 172, 161, 171, 189, 157, 165, 174, 180, 181, 175, 182, 167, 159, 716,417 179, 160, 180, 166, 178, 156, 180, 189, 173, 174, 175 - মোট 30 জন ছাত্র। স্পষ্টতই, একজন ব্যক্তির উচ্চতা একটি ক্রমাগত মান। আমরা ব্যবধান ধাপ সংজ্ঞায়িত করতে হবে. এর জন্য Sturges সূত্র ব্যবহার করা হয়।
h= | সর্বোচ্চ - সর্বনিম্ন | = | 190 - 156 | = | 33 | = | 5, 59 |
1+লগ2মি | 1+লগ230 | 5, 9 |
এইভাবে, 6-এর মানটিকে ব্যবধানের আকার হিসাবে নেওয়া যেতে পারে। এটাও বলা উচিত যে মান 1+log2m এর সূত্রব্যবধানের সংখ্যা নির্ধারণ করা (অবশ্যই, রাউন্ডিং সহ)। এইভাবে, সূত্র অনুসারে, 6টি ব্যবধান পাওয়া যায়, যার প্রতিটির আকার 6। এবং প্রাথমিক ব্যবধানের প্রথম মানটি হবে সূত্র দ্বারা নির্ধারিত সংখ্যা: min - h/2=156 - 6/2=153. চলুন একটি সারণী তৈরি করি যাতে ব্যবধান এবং একটি নির্দিষ্ট ব্যবধানের মধ্যে ছাত্রদের সংখ্যা বৃদ্ধি পায়।
H | [153; 159) | [159; 165) | [165; 171) | [১৭১; 177) | [১৭৭; 183) | [183; 189) |
P | 2 | 5 | 3 | 9 | 8 | 3 |
P | 0, 06 | 0, 17 | 0, 1 | 0, 3 | 0, 27 | 0, 1 |
অবশ্যই, এই সব নয়, কারণ গাণিতিক পরিসংখ্যানে আরও অনেক সূত্র রয়েছে। আমরা শুধুমাত্র কিছু মৌলিক ধারণা বিবেচনা করেছি।
বন্টন সময়সূচী
গাণিতিক পরিসংখ্যানের মৌলিক ধারণাগুলির মধ্যে বিতরণের একটি গ্রাফিকাল উপস্থাপনাও অন্তর্ভুক্ত থাকে, যা স্বচ্ছতার দ্বারা আলাদা করা হয়। দুটি ধরণের গ্রাফ রয়েছে: বহুভুজ এবং হিস্টোগ্রাম। প্রথমটি একটি পৃথক পরিসংখ্যান সিরিজের জন্য ব্যবহৃত হয়। এবং ক্রমাগত বিতরণের জন্য, যথাক্রমে, দ্বিতীয়টি।