পরিসংখ্যানগত তথ্য: সংগ্রহ, প্রক্রিয়াকরণ, বিশ্লেষণ

সুচিপত্র:

পরিসংখ্যানগত তথ্য: সংগ্রহ, প্রক্রিয়াকরণ, বিশ্লেষণ
পরিসংখ্যানগত তথ্য: সংগ্রহ, প্রক্রিয়াকরণ, বিশ্লেষণ
Anonim

পরিসংখ্যানের ইতিহাস জুড়ে, পরিমাপের স্তরগুলির একটি শ্রেণিবিন্যাস তৈরি করার জন্য বিভিন্ন প্রচেষ্টা করা হয়েছে। সাইকোফিজিসিস্ট স্ট্যানলি স্মিথ স্টিভেনস নামমাত্র, অর্ডিনাল, ইন্টারভাল এবং আনুপাতিক স্কেল সংজ্ঞায়িত করেছেন।

নামমাত্র পরিমাপের মানগুলির মধ্যে র‌্যাঙ্কের কোনও উল্লেখযোগ্য ক্রম নেই এবং যে কোনও এক থেকে এক রূপান্তরের অনুমতি দেয়৷

নিয়মিত মাত্রাগুলির ধারাবাহিক মানের মধ্যে সঠিক পার্থক্য রয়েছে, তবে সেই মানগুলির একটি নির্দিষ্ট ক্রম রয়েছে এবং যে কোনও অর্ডার-সংরক্ষণকারী রূপান্তরের অনুমতি দেয়৷

ব্যবধান পরিমাপের বিন্দুর মধ্যে অর্থপূর্ণ দূরত্ব রয়েছে, তবে শূন্যের মান নির্বিচারে (যেমন সেলসিয়াস বা ফারেনহাইটে দ্রাঘিমাংশ এবং তাপমাত্রা পরিমাপের ক্ষেত্রে) এবং যেকোন রৈখিক রূপান্তরের জন্য অনুমতি দেয়৷

অনুপাতের মাত্রাগুলির একটি অর্থপূর্ণ শূন্য মান এবং বিভিন্ন মাত্রার মধ্যে দূরত্ব উভয়ই থাকে এবং যে কোনও স্কেলিং রূপান্তরের অনুমতি দেয়৷

Image
Image

ভেরিয়েবল এবং তথ্যের শ্রেণীবিভাগ

কারণ ভেরিয়েবলশুধুমাত্র নামমাত্র বা অর্ডিনাল পরিমাপের সাথে সামঞ্জস্যপূর্ণ যুক্তিসঙ্গতভাবে সংখ্যাগতভাবে পরিমাপ করা যায় না এবং কখনও কখনও শ্রেণীগত পরিবর্তনশীল হিসাবে গোষ্ঠীভুক্ত করা হয়। অনুপাত এবং ব্যবধান পরিমাপ পরিমাণগত পরিবর্তনশীল হিসাবে গোষ্ঠীভুক্ত করা হয়, যা তাদের সংখ্যাগত প্রকৃতির কারণে বিচ্ছিন্ন বা অবিচ্ছিন্ন হতে পারে। এই ধরনের পার্থক্যগুলি প্রায়শই কম্পিউটার বিজ্ঞানে ডেটা টাইপের সাথে শিথিলভাবে সম্পর্কিত, যেহেতু দ্বিমুখী শ্রেণীগত ভেরিয়েবলগুলিকে বুলিয়ান মান দ্বারা প্রতিনিধিত্ব করা যেতে পারে, একটি অখণ্ড ডেটা টাইপে নির্বিচারে পূর্ণসংখ্যা সহ বহু-বিশিষ্ট শ্রেণীগত ভেরিয়েবল এবং ফ্লোটিং পয়েন্ট গণনা জড়িত বাস্তব উপাদানগুলির সাথে অবিচ্ছিন্ন ভেরিয়েবলগুলি। কিন্তু পরিসংখ্যানগত তথ্য উপাত্ত প্রকারের প্রদর্শন নির্ভর করে কোন শ্রেণিবিন্যাস প্রয়োগ করা হয়েছে তার উপর।

শ্রমিকদের পরিসংখ্যানগত তথ্য।
শ্রমিকদের পরিসংখ্যানগত তথ্য।

অন্যান্য শ্রেণীবিভাগ

পরিসংখ্যানগত তথ্য (তথ্য) এর অন্যান্য শ্রেণীবিভাগও তৈরি করা হয়েছে। উদাহরণস্বরূপ, মোস্টেলার এবং টুকি গ্রেড, র‌্যাঙ্ক, গণনাকৃত শেয়ার, গণনা, পরিমাণ এবং ব্যালেন্সের মধ্যে পার্থক্য করেছেন। নেল্ডার এক সময়ে অবিচ্ছিন্ন গণনা, অবিচ্ছিন্ন অনুপাত, গণনার পারস্পরিক সম্পর্ক এবং ডেটা যোগাযোগের সুনির্দিষ্ট উপায় বর্ণনা করেছিলেন। এই সমস্ত শ্রেণীবিভাগ পদ্ধতি পরিসংখ্যানগত তথ্য সংগ্রহে ব্যবহৃত হয়।

সমস্যা

বিভিন্ন পরিমাপ (সংগ্রহ) পদ্ধতির মাধ্যমে প্রাপ্ত ডেটাতে বিভিন্ন ধরণের পরিসংখ্যান পদ্ধতি প্রয়োগ করা উপযুক্ত কিনা সেই প্রশ্নটি ভেরিয়েবলের রূপান্তর এবং প্রশ্নের সুনির্দিষ্ট ব্যাখ্যা সম্পর্কিত সমস্যাগুলির দ্বারা জটিল।গবেষণা তথ্য এবং এটি যা বর্ণনা করে তার মধ্যে সম্পর্কটি কেবল এই সত্যটিকে প্রতিফলিত করে যে নির্দিষ্ট ধরণের পরিসংখ্যানগত বিবৃতিতে সত্য মান থাকতে পারে যা নির্দিষ্ট রূপান্তরের অধীনে অপরিবর্তনীয় নয়। রূপান্তরটি বিবেচনার যোগ্য কিনা তা নির্ভর করে আপনি যে প্রশ্নের উত্তর দেওয়ার চেষ্টা করছেন তার উপর।

পরিসংখ্যানগত তথ্যের উদাহরণ।
পরিসংখ্যানগত তথ্যের উদাহরণ।

ডেটা টাইপ কি

ডেটা টাইপ হল একটি ভেরিয়েবলের শব্দার্থিক বিষয়বস্তুর একটি মৌলিক উপাদান এবং নিয়ন্ত্রণ করে যে ভেরিয়েবলকে বর্ণনা করার জন্য কোন ধরনের সম্ভাব্যতা বন্টন যৌক্তিকভাবে ব্যবহার করা যেতে পারে, এটির উপর অনুমোদিত ক্রিয়াকলাপ, এটির পূর্বাভাস দিতে ব্যবহৃত রিগ্রেশন বিশ্লেষণের ধরন, ইত্যাদি। একটি ডেটা টাইপের ধারণা পরিমাপ স্তরের ধারণার অনুরূপ, তবে আরও নির্দিষ্ট - উদাহরণস্বরূপ, ডেটা গণনার জন্য অ-নেতিবাচক বাস্তব মানের তুলনায় একটি ভিন্ন বন্টন (পয়সন বা দ্বিপদী) প্রয়োজন, তবে উভয়ই একই অধীনে পড়ে পরিমাপের স্তর (সহগ স্কেল)।

বিচারকদের পরিসংখ্যানগত তথ্য।
বিচারকদের পরিসংখ্যানগত তথ্য।

স্কেল

পরিসংখ্যানগত তথ্য প্রক্রিয়াকরণের জন্য পরিমাপের স্তরগুলির একটি শ্রেণীবিন্যাস তৈরি করার জন্য বিভিন্ন প্রচেষ্টা করা হয়েছে। সাইকোফিজিসিস্ট স্ট্যানলি স্মিথ স্টিভেনস নামমাত্র, অর্ডিনাল, ইন্টারভাল এবং আনুপাতিক স্কেল সংজ্ঞায়িত করেছেন। নামমাত্র পরিমাপের মানগুলির মধ্যে র‌্যাঙ্কের একটি উল্লেখযোগ্য ক্রম থাকে না এবং যে কোনও এক থেকে এক রূপান্তরের অনুমতি দেয়। সাধারণ পরিমাপের ধারাবাহিক মানের মধ্যে অস্পষ্ট পার্থক্য রয়েছে, কিন্তু সেই মানগুলির উল্লেখযোগ্য ক্রমানুসারে পার্থক্য রয়েছে এবং অনুমতি দেয়কোনো অর্ডার-সংরক্ষণকারী রূপান্তর। ব্যবধান পরিমাপের মধ্যে পরিমাপের মধ্যে অর্থপূর্ণ দূরত্ব থাকে, কিন্তু শূন্যের মান নির্বিচারে হয় (যেমন সেলসিয়াস বা ফারেনহাইটে দ্রাঘিমাংশ এবং তাপমাত্রা পরিমাপের ক্ষেত্রে) এবং যেকোনো রৈখিক রূপান্তরের জন্য অনুমতি দেয়। অনুপাতের মাত্রাগুলির একটি অর্থপূর্ণ শূন্য মান এবং বিভিন্ন সংজ্ঞায়িত মাত্রার মধ্যে দূরত্ব উভয়ই রয়েছে এবং যে কোনও স্কেলিং রূপান্তরের অনুমতি দেয়৷

ডায়াগ্রাম মডেল।
ডায়াগ্রাম মডেল।

একক সংখ্যা ব্যবহার করে বর্ণনা করা যায় না এমন ডেটা প্রায়ই বাস্তব র্যান্ডম ভেরিয়েবলের এলোমেলো ভেক্টরে অন্তর্ভুক্ত করা হয়, যদিও সেগুলিকে নিজে প্রক্রিয়া করার একটি ক্রমবর্ধমান প্রবণতা রয়েছে। এই ধরনের উদাহরণ নীচে আলোচনা করা হবে.

এলোমেলো ভেক্টর

ব্যক্তিগত উপাদানগুলি পারস্পরিক সম্পর্কযুক্ত হতে পারে বা নাও হতে পারে। পারস্পরিক র্যান্ডম ভেক্টর বর্ণনা করতে ব্যবহৃত ডিস্ট্রিবিউশনের উদাহরণ হল মাল্টিভেরিয়েট সাধারন ডিস্ট্রিবিউশন এবং মাল্টিভেরিয়েট টি-ডিস্ট্রিবিউশন। সাধারণভাবে, যেকোনো উপাদানের মধ্যে নির্বিচারে পারস্পরিক সম্পর্ক থাকতে পারে, তবে এটি প্রায়শই একটি নির্দিষ্ট আকারের উপরে নিয়ন্ত্রণের অযোগ্য হয়ে যায়, যার জন্য সম্পর্কযুক্ত উপাদানগুলিতে অতিরিক্ত সীমাবদ্ধতার প্রয়োজন হয়।

পরিসংখ্যান বৈশিষ্ট্য
পরিসংখ্যান বৈশিষ্ট্য

এলোমেলো ম্যাট্রিক্স

এলোমেলো ম্যাট্রিক্সগুলিকে রৈখিকভাবে সাজানো যেতে পারে এবং এলোমেলো ভেক্টর হিসাবে বিবেচনা করা যেতে পারে, তবে এটি বিভিন্ন উপাদানের মধ্যে পারস্পরিক সম্পর্ক উপস্থাপন করার একটি কার্যকর উপায় নাও হতে পারে। কিছু সম্ভাব্যতা বন্টন বিশেষভাবে এলোমেলো ম্যাট্রিক্সের জন্য ডিজাইন করা হয়েছে, যেমন সাধারণ ম্যাট্রিক্সবিতরণ এবং উইশার্ট বিতরণ।

এলোমেলো সিকোয়েন্স

কখনও কখনও এগুলিকে এলোমেলো ভেক্টর হিসাবে বিবেচনা করা হয়, তবে অন্যান্য ক্ষেত্রে শব্দটি বিশেষভাবে এমন ক্ষেত্রে প্রয়োগ করা হয় যেখানে প্রতিটি র্যান্ডম ভেরিয়েবল শুধুমাত্র কাছাকাছি চলকের সাথে সম্পর্কযুক্ত (মার্কভ মডেলের মতো)। এটি Bayesian নেটওয়ার্কের একটি বিশেষ কেস এবং এটি খুব দীর্ঘ সিকোয়েন্সের জন্য ব্যবহৃত হয়, যেমন জিন চেইন বা দীর্ঘ পাঠ্য নথি। বেশ কয়েকটি মডেল বিশেষভাবে এই ধরনের সিকোয়েন্সের জন্য ডিজাইন করা হয়েছে, যেমন লুকানো মার্কভ সিকোয়েন্স।

সাধারণ চার্ট।
সাধারণ চার্ট।

এলোমেলো প্রক্রিয়া

এগুলি র্যান্ডম সিকোয়েন্সের মতো, কিন্তু শুধুমাত্র তখনই যখন ক্রমটির দৈর্ঘ্য অনির্দিষ্ট বা অসীম হয় এবং অনুক্রমের উপাদানগুলি একে একে প্রক্রিয়া করা হয়। এটি প্রায়শই ডেটার জন্য ব্যবহৃত হয় যা টাইম সিরিজ হিসাবে বর্ণনা করা যেতে পারে। এটি সত্য যখন এটি আসে, উদাহরণস্বরূপ, পরের দিন স্টক মূল্য৷

উপসংহার

পরিসংখ্যানগত তথ্যের বিশ্লেষণ সম্পূর্ণরূপে এর সংগ্রহের মানের উপর নির্ভর করে। পরেরটি, ঘুরে, দৃঢ়ভাবে এর শ্রেণীবিভাগের সম্ভাবনার সাথে সম্পর্কিত। অবশ্যই, পরিসংখ্যানগত তথ্যের শ্রেণীবিভাগের অনেক ধরণের আছে, যা পাঠক এই নিবন্ধটি পড়ার সময় নিজের জন্য দেখতে পারে। তবুও, কার্যকর সরঞ্জামের উপস্থিতি এবং গণিতের একটি ভাল কমান্ড, সেইসাথে সমাজবিজ্ঞানের ক্ষেত্রে জ্ঞান, তাদের কাজ করবে, আপনাকে ত্রুটির জন্য উল্লেখযোগ্য সংশোধন ছাড়াই কোনও জরিপ বা অধ্যয়ন পরিচালনা করার অনুমতি দেবে। ফর্মে পরিসংখ্যানগত তথ্যের উৎসমানুষ, সংস্থা এবং সমাজবিজ্ঞানের অন্যান্য বিষয়, ভাগ্যক্রমে, প্রচুর পরিমাণে প্রতিনিধিত্ব করা হয়। এবং সত্যিকারের অভিযাত্রীর পথে কোন অসুবিধাই দাঁড়াতে পারে না।

প্রস্তাবিত: