পরিসংখ্যানগত মডেলিং: পদ্ধতি, বর্ণনা, প্রয়োগ

সুচিপত্র:

পরিসংখ্যানগত মডেলিং: পদ্ধতি, বর্ণনা, প্রয়োগ
পরিসংখ্যানগত মডেলিং: পদ্ধতি, বর্ণনা, প্রয়োগ
Anonim

পরিসংখ্যানগত মডেলিং-এ মূর্ত অনুমানগুলি সম্ভাব্যতা বন্টনের একটি সেট বর্ণনা করে, যার মধ্যে কিছুকে পর্যাপ্তভাবে আনুমানিক বন্টন বলে ধরে নেওয়া হয়। সংজ্ঞা থেকে ডেটার একটি নির্দিষ্ট সেট নির্বাচন করা হয়। পরিসংখ্যানগত মডেলিংয়ের অন্তর্নিহিত সম্ভাব্যতা বন্টনগুলিই যা পরিসংখ্যানগত মডেলগুলিকে অন্যান্য, অ-পরিসংখ্যানগত, গাণিতিক মডেলগুলি থেকে আলাদা করে৷

Image
Image

গণিতের সাথে সংযোগ

এই বৈজ্ঞানিক পদ্ধতিটি প্রাথমিকভাবে গণিতে নিহিত। সিস্টেমের পরিসংখ্যানগত মডেলিং সাধারণত গাণিতিক সমীকরণ দ্বারা দেওয়া হয় যা এক বা একাধিক র্যান্ডম ভেরিয়েবল এবং সম্ভবত অন্যান্য নন-র্যান্ডম ভেরিয়েবলের সাথে সম্পর্কযুক্ত। সুতরাং, একটি পরিসংখ্যান মডেল হল একটি "একটি তত্ত্বের আনুষ্ঠানিক উপস্থাপনা" (হারম্যান অ্যাডার, কেনেথ বোলেনের উদ্ধৃতি দিয়ে)।

সমস্ত পরিসংখ্যানগত হাইপোথিসিস পরীক্ষা এবং সমস্ত পরিসংখ্যানগত অনুমান পরিসংখ্যান মডেল থেকে নেওয়া হয়। আরও সাধারণভাবে, পরিসংখ্যানগত মডেলগুলি পরিসংখ্যানগত অনুমানের ভিত্তির অংশ।

পরিসংখ্যানের পদ্ধতিমডেলিং

অনুষ্ঠানিকভাবে, একটি পরিসংখ্যান মডেলকে একটি নির্দিষ্ট সম্পত্তি সহ একটি পরিসংখ্যানগত অনুমান (বা পরিসংখ্যানগত অনুমানের সেট) হিসাবে ভাবা যেতে পারে: এই অনুমানটি আমাদের যে কোনও ঘটনার সম্ভাব্যতা গণনা করতে দেয়। একটি উদাহরণ হিসাবে, সাধারণ ছয়-পার্শ্বযুক্ত পাশা একটি জোড়া বিবেচনা করুন. আমরা হাড় সম্পর্কে দুটি ভিন্ন পরিসংখ্যানগত অনুমান অধ্যয়ন করব।

প্রথম পরিসংখ্যানগত অনুমানটি পরিসংখ্যানগত মডেল গঠন করে, কারণ শুধুমাত্র একটি অনুমান দিয়ে আমরা যেকোনো ঘটনার সম্ভাব্যতা গণনা করতে পারি। বিকল্প পরিসংখ্যানগত অনুমান একটি পরিসংখ্যানগত মডেল গঠন করে না, কারণ শুধুমাত্র একটি অনুমান দিয়ে আমরা প্রতিটি ঘটনার সম্ভাব্যতা গণনা করতে পারি না।

সাধারণ পরিসংখ্যান মডেল।
সাধারণ পরিসংখ্যান মডেল।

প্রথম অনুমান সহ উপরের উদাহরণে, একটি ঘটনার সম্ভাব্যতা গণনা করা সহজ। যাইহোক, অন্য কিছু উদাহরণে, গণনা জটিল বা এমনকি অব্যবহারিক হতে পারে (উদাহরণস্বরূপ, এটির জন্য কয়েক মিলিয়ন বছরের গণনার প্রয়োজন হতে পারে)। একটি পরিসংখ্যানগত মডেল গঠন করে এমন ধারণার জন্য, এই অসুবিধাটি গ্রহণযোগ্য: গণনা সম্পাদন করা কার্যত সম্ভব নয়, তাত্ত্বিকভাবে সম্ভব।

মডেলের উদাহরণ

ধরুন আমাদের স্কুলছাত্রের একটি জনসংখ্যা রয়েছে যেখানে সমানভাবে বিতরণ করা হয়েছে। একটি শিশুর উচ্চতা স্টোকাস্টিকভাবে বয়সের সাথে সম্পর্কিত হবে: উদাহরণস্বরূপ, যখন আমরা জানি যে একটি শিশুর বয়স 7 বছর, এটি শিশুটির 5 ফুট লম্বা (প্রায় 152 সেমি) হওয়ার সম্ভাবনাকে প্রভাবিত করে। আমরা একটি রৈখিক রিগ্রেশন মডেলে এই সম্পর্কটিকে আনুষ্ঠানিক করতে পারি, উদাহরণস্বরূপ: বৃদ্ধি=b0 + b1agei+ εi, যেখানে b0 হল ছেদ, b1 হল সেই প্যারামিটার যার দ্বারা বৃদ্ধির পূর্বাভাস পাওয়ার সময় বয়সকে গুণ করা হয়, εi হল ত্রুটি শব্দ৷ এটি বোঝায় যে উচ্চতা কিছু ত্রুটি সহ বয়স দ্বারা পূর্বাভাস করা হয়৷

একটি বৈধ মডেল অবশ্যই সমস্ত ডেটা পয়েন্টের সাথে মেলে। সুতরাং একটি সরল রেখা (উচ্চতা=b0 + b1agei) একটি ডেটা মডেলের জন্য একটি সমীকরণ হতে পারে না - যদি না এটি সমস্ত ডেটা পয়েন্টকে ঠিকভাবে ফিট না করে, অর্থাৎ সমস্ত ডেটা পয়েন্ট লাইনের উপর পুরোপুরি থাকে৷ সমস্ত ডেটা পয়েন্টের সাথে মানানসই মডেলের সমীকরণে ত্রুটি শব্দটি εi অন্তর্ভুক্ত করতে হবে।

লিঙ্গ পরিসংখ্যান
লিঙ্গ পরিসংখ্যান

একটি পরিসংখ্যানগত অনুমান করতে, আমাদের প্রথমে εi এর জন্য কিছু সম্ভাব্যতা বন্টন অনুমান করতে হবে। উদাহরণস্বরূপ, আমরা অনুমান করতে পারি যে εi এর বন্টনগুলি গাউসিয়ান, শূন্য গড় সহ। এই ক্ষেত্রে, মডেলটিতে 3টি প্যারামিটার থাকবে: b0, b1 এবং গাউসিয়ান ডিস্ট্রিবিউশনের প্রকরণ।

সাধারণ বর্ণনা

একটি পরিসংখ্যান মডেল গাণিতিক মডেলের একটি বিশেষ শ্রেণি। একটি পরিসংখ্যানগত মডেলকে অন্যান্য গাণিতিক মডেল থেকে যা আলাদা করে তা হল এটি অ-নির্ধারক। এটি পরিসংখ্যানগত ডেটা মডেল করতে ব্যবহৃত হয়। এইভাবে, গাণিতিক সমীকরণের সাথে সংজ্ঞায়িত একটি পরিসংখ্যান মডেলে, কিছু ভেরিয়েবলের নির্দিষ্ট মান থাকে না, তবে এর পরিবর্তে সম্ভাব্যতা বন্টন থাকে; অর্থাৎ, কিছু ভেরিয়েবল স্টোকাস্টিক। উপরের উদাহরণে, ε একটি স্টোকাস্টিক পরিবর্তনশীল; এই পরিবর্তনশীল ছাড়া, মডেল ছিলনির্ধারক হবে।

পরিসংখ্যানগত মডেলগুলি প্রায়শই পরিসংখ্যান বিশ্লেষণ এবং মডেলিংয়ে ব্যবহৃত হয়, এমনকি যদি শারীরিক প্রক্রিয়াটি নির্ধারক হয়। উদাহরণস্বরূপ, মুদ্রা নিক্ষেপ করা নীতিগতভাবে একটি নির্ধারক প্রক্রিয়া; তবুও এটি সাধারণত স্টোকাস্টিক হিসাবে মডেল করা হয় (একটি বার্নোলি প্রক্রিয়ার মাধ্যমে)।

উষ্ণায়ন পরিসংখ্যান।
উষ্ণায়ন পরিসংখ্যান।

প্যারামেট্রিক মডেল

প্যারামেট্রিক মডেল হল সবচেয়ে বেশি ব্যবহৃত পরিসংখ্যানগত মডেল। আধা-প্যারামেট্রিক এবং নন-প্যারামেট্রিক মডেল সম্পর্কে, স্যার ডেভিড কক্স বলেছেন: "এগুলি সাধারণত বন্টনের গঠন এবং আকৃতি সম্পর্কে কম অনুমান অন্তর্ভুক্ত করে, তবে সাধারণত শক্তিশালী স্বাধীনতা অনুমান থাকে।" অন্যান্য উল্লিখিত মডেলগুলির মতো, এগুলিও প্রায়শই গাণিতিক মডেলিংয়ের পরিসংখ্যান পদ্ধতিতে ব্যবহৃত হয়৷

মাল্টিলেভেল মডেল

মাল্টিলেভেল মডেল (এছাড়াও হায়ারার্কিক্যাল লিনিয়ার মডেল, নেস্টেড ডেটা মডেল, মিশ্র মডেল, এলোমেলো সহগ, র্যান্ডম ইফেক্ট মডেল, র্যান্ডম প্যারামিটার মডেল, বা পার্টিশন মডেল হিসাবে পরিচিত) হল পরিসংখ্যানগত প্যারামিটার মডেল যা একাধিক স্তরে পরিবর্তিত হয়। একটি উদাহরণ হল একটি ছাত্র কৃতিত্বের মডেল যা পৃথক ছাত্রদের জন্য মেট্রিক্স এবং সেইসাথে শ্রেণীকক্ষের মেট্রিক্স ধারণ করে যেখানে ছাত্রদের দলবদ্ধ করা হয়। এই মডেলগুলিকে রৈখিক মডেলগুলির সাধারণীকরণ হিসাবে ভাবা যেতে পারে (বিশেষত, রৈখিক রিগ্রেশন), যদিও সেগুলি অ-রৈখিক মডেলগুলিতেও প্রসারিত হতে পারে। এসব মডেল হয়ে গেছেপর্যাপ্ত কম্পিউটিং শক্তি এবং সফ্টওয়্যার উপলব্ধ হওয়ার পরে অনেক বেশি জনপ্রিয়৷

সেগমেন্ট পরিসংখ্যান
সেগমেন্ট পরিসংখ্যান

মাল্টিলেভেল মডেলগুলি বিশেষভাবে গবেষণা প্রকল্পগুলির জন্য উপযুক্ত যেখানে অংশগ্রহণকারীদের জন্য ডেটা একাধিক স্তরে সংগঠিত হয় (যেমন, নেস্টেড ডেটা)। বিশ্লেষণের ইউনিটগুলি সাধারণত ব্যক্তি (নিম্ন স্তরে) যেগুলি প্রসঙ্গ/সমষ্টি ইউনিটের মধ্যে (উচ্চ স্তরে) থাকে। যদিও মাল্টিলেভেল মডেলগুলিতে সর্বনিম্ন স্তরের ডেটা সাধারণত স্বতন্ত্র, ব্যক্তিদের বারবার পরিমাপও বিবেচনা করা যেতে পারে। এইভাবে, মাল্টিলেভেল মডেলগুলি ইউনিভেরিয়েট বা মাল্টিভেরিয়েট বারবার পরিমাপ বিশ্লেষণের জন্য একটি বিকল্প ধরনের বিশ্লেষণ প্রদান করে। বৃদ্ধি বক্ররেখা পৃথক পার্থক্য বিবেচনা করা যেতে পারে. উপরন্তু, বহুস্তরীয় মডেলগুলি ANCOVA-এর বিকল্প হিসাবে ব্যবহার করা যেতে পারে, যেখানে চিকিত্সার পার্থক্যের জন্য পরীক্ষার আগে কোভেরিয়েটগুলির জন্য নির্ভরশীল পরিবর্তনশীল স্কোরগুলি সামঞ্জস্য করা হয় (যেমন, পৃথক পার্থক্য)। মাল্টিলেভেল মডেলগুলি ANCOVA দ্বারা প্রয়োজনীয় অভিন্ন রিগ্রেশন ঢালের অনুমান ছাড়াই এই পরীক্ষাগুলি বিশ্লেষণ করতে সক্ষম৷

মাল্টিলেভেল মডেলগুলি অনেক স্তরের ডেটার জন্য ব্যবহার করা যেতে পারে, যদিও দুই-স্তরের মডেলগুলি সবচেয়ে সাধারণ এবং এই নিবন্ধের বাকি অংশগুলি এইগুলির উপর ফোকাস করে৷ নির্ভরশীল পরিবর্তনশীলটি বিশ্লেষণের সর্বনিম্ন স্তরে পরীক্ষা করা উচিত।

বায়ুমণ্ডলীয় চাপ গ্রাফ।
বায়ুমণ্ডলীয় চাপ গ্রাফ।

মডেল নির্বাচন

মডেল নির্বাচনপরিসংখ্যানগত মডেলিংয়ের কাঠামোর মধ্যে পরিচালিত ডেটা প্রদত্ত প্রার্থী মডেলের একটি সেট থেকে নির্বাচন করার কাজ। সহজ ক্ষেত্রে, একটি ইতিমধ্যে বিদ্যমান ডেটা সেট বিবেচনা করা হয়। যাইহোক, টাস্কটি ডিজাইনিং পরীক্ষাগুলিকেও জড়িত করতে পারে যাতে সংগৃহীত ডেটা মডেল নির্বাচনের কাজের জন্য উপযুক্ত হয়। অনুরূপ ভবিষ্যদ্বাণীমূলক বা ব্যাখ্যামূলক ক্ষমতা সহ প্রার্থী মডেলগুলি দেওয়া হলে, সবচেয়ে সহজ মডেলটি সর্বোত্তম পছন্দ হতে পারে (ওকামের রেজার)।

কোনিশি এবং কিতাগাওয়া বলেছেন, "বেশিরভাগ পরিসংখ্যানগত অনুমান সমস্যাকে পরিসংখ্যানগত মডেলিং সম্পর্কিত সমস্যা হিসাবে বিবেচনা করা যেতে পারে।" একইভাবে, কক্স বলেছেন, "পরিসংখ্যানগত মডেলে বিষয়বস্তুর অনুবাদ কীভাবে করা হয় তা প্রায়শই বিশ্লেষণের সবচেয়ে গুরুত্বপূর্ণ অংশ।"

মডেল নির্বাচন অনিশ্চয়তার অধীনে সিদ্ধান্ত বা অপ্টিমাইজেশনের উদ্দেশ্যে গণনামূলক মডেলের একটি বড় সেট থেকে কয়েকটি প্রতিনিধি মডেল নির্বাচন করার সমস্যাকেও উল্লেখ করতে পারে।

গ্রাফিক প্যাটার্ন

গ্রাফিক মডেল, বা সম্ভাব্য গ্রাফিক মডেল, (PGM) বা কাঠামোগত সম্ভাব্য মডেল, একটি সম্ভাব্য মডেল যার জন্য গ্রাফটি এলোমেলো ভেরিয়েবলের মধ্যে একটি শর্তাধীন সম্পর্কের গঠন প্রকাশ করে। এগুলি সাধারণত সম্ভাব্যতা তত্ত্ব, পরিসংখ্যান (বিশেষ করে বায়েসিয়ান পরিসংখ্যান) এবং মেশিন লার্নিং-এ ব্যবহৃত হয়৷

একটি গ্রাফ সহ পরিসংখ্যান মডেল।
একটি গ্রাফ সহ পরিসংখ্যান মডেল।

অর্থনৈতিক মডেল

ইকোনোমেট্রিক মডেল হল পরিসংখ্যানগত মডেল যা ব্যবহৃত হয়অর্থনীতি একটি ইকোনোমেট্রিক মডেল পরিসংখ্যানগত সম্পর্ককে সংজ্ঞায়িত করে যা একটি নির্দিষ্ট অর্থনৈতিক ঘটনার সাথে সম্পর্কিত বিভিন্ন অর্থনৈতিক পরিমাণের মধ্যে বিদ্যমান বলে বিশ্বাস করা হয়। একটি ইকোনোমেট্রিক মডেল একটি নির্ধারক অর্থনৈতিক মডেল থেকে উদ্ভূত হতে পারে যা অনিশ্চয়তাকে বিবেচনা করে, অথবা একটি অর্থনৈতিক মডেল থেকে যা নিজেই স্টোকাস্টিক। যাইহোক, ইকোনোমেট্রিক মডেলগুলি ব্যবহার করাও সম্ভব যেগুলি কোনও নির্দিষ্ট অর্থনৈতিক তত্ত্বের সাথে আবদ্ধ নয়৷

প্রস্তাবিত: