মাল্টিভেরিয়েট স্কেলিং (এমডিএস) একটি ডেটা সেটে পৃথক ক্ষেত্রের মিলের স্তরটি কল্পনা করার জন্য একটি সরঞ্জাম। এটি তথ্যের ভিজ্যুয়ালাইজেশনে ব্যবহৃত সম্পর্কিত অর্ডিনেশন পদ্ধতির একটি সেট বোঝায়, বিশেষ করে দূরত্ব ম্যাট্রিক্সে থাকা তথ্য প্রদর্শন করতে। এটি অ-রৈখিক মাত্রিকতা হ্রাসের একটি রূপ। MDS অ্যালগরিদমের লক্ষ্য প্রতিটি বস্তুকে একটি N-মাত্রিক স্থানে এমনভাবে স্থাপন করা যাতে বস্তুর মধ্যে দূরত্ব যতটা সম্ভব সংরক্ষিত হয়। প্রতিটি বস্তুকে তারপর প্রতিটি N মাত্রায় স্থানাঙ্ক বরাদ্দ করা হয়।
MDS গ্রাফের মাত্রার সংখ্যা 2 ছাড়িয়ে যেতে পারে এবং একটি অগ্রাধিকার নির্দিষ্ট করা হয়েছে। N=2 নির্বাচন করা 2D স্ক্যাটারপ্লটের জন্য অবজেক্ট প্লেসমেন্ট অপ্টিমাইজ করে। আপনি নিবন্ধের ছবিতে বহুমাত্রিক স্কেলিং এর উদাহরণ দেখতে পারেন। রাশিয়ান ভাষায় চিহ্ন সহ উদাহরণগুলি বিশেষভাবে দৃষ্টান্তমূলক৷
সারাংশ
বহুমাত্রিক স্কেলিং পদ্ধতি (MMS,MDS) হল শাস্ত্রীয় সরঞ্জামগুলির একটি বর্ধিত সেট যা লস ফাংশনগুলির একটি সেট এবং ওজন সহ পরিচিত দূরত্বের ইনপুট ম্যাট্রিক্সের জন্য অপ্টিমাইজেশন পদ্ধতিকে সাধারণীকরণ করে। এই প্রসঙ্গে, একটি দরকারী ক্ষতি ফাংশনকে স্ট্রেস বলা হয়, যা প্রায়শই স্ট্রেস মেজরাইজেশন নামক একটি পদ্ধতি দ্বারা হ্রাস করা হয়।
ম্যানুয়াল
বহুমাত্রিক স্কেলিং এর জন্য বেশ কিছু বিকল্প রয়েছে। MDS প্রোগ্রামগুলি সমাধান পেতে স্বয়ংক্রিয়ভাবে লোড কমিয়ে দেয়। ননমেট্রিক এমডিএস অ্যালগরিদমের মূল একটি দ্বিগুণ অপ্টিমাইজেশন প্রক্রিয়া। প্রথমত, সর্বোত্তম একঘেয়ে প্রক্সিমিটি ট্রান্সফরমেশন খুঁজে বের করতে হবে। দ্বিতীয়ত, কনফিগারেশন পয়েন্টগুলি অবশ্যই সর্বোত্তমভাবে অবস্থান করতে হবে যাতে তাদের দূরত্বগুলি যতটা সম্ভব ঘনিষ্ঠভাবে স্কেল করা প্রক্সিমিটি মানগুলির সাথে মেলে৷
সম্প্রসারণ
পরিসংখ্যানে মেট্রিক মাল্টিডাইমেনশনাল স্কেলিং এর একটি এক্সটেনশন যেখানে টার্গেট স্পেস হল একটি নির্বিচারে মসৃণ অ-ইউক্লিডীয় স্থান। যেখানে পার্থক্যগুলি একটি পৃষ্ঠের দূরত্ব এবং লক্ষ্য স্থানটি একটি ভিন্ন পৃষ্ঠ। থিম্যাটিক প্রোগ্রামগুলি আপনাকে একটি সংযুক্তি খুঁজে পেতে দেয় যাতে একটি পৃষ্ঠের অন্য পৃষ্ঠের মধ্যে ন্যূনতম বিকৃতি রয়েছে৷
পদক্ষেপ
মাল্টিভেরিয়েট স্কেলিং ব্যবহার করে একটি অধ্যয়ন পরিচালনা করার জন্য বেশ কয়েকটি ধাপ রয়েছে:
- সমস্যার প্রণয়ন। আপনি কি ভেরিয়েবল তুলনা করতে চান? আপনি কতগুলি ভেরিয়েবল তুলনা করতে চান? অধ্যয়নটি কোন উদ্দেশ্যে ব্যবহার করা হবে?
- ইনপুট ডেটা নেওয়া হচ্ছে।উত্তরদাতাদের একাধিক প্রশ্ন করা হয়। প্রতিটি জোড়া পণ্যের জন্য, তাদের সাদৃশ্য রেট করতে বলা হয় (সাধারণত 7-পয়েন্ট লিকার্ট স্কেলে খুব মিল থেকে খুব ভিন্ন)। প্রথম প্রশ্নটি হতে পারে কোকা-কোলা/পেপসির জন্য, উদাহরণস্বরূপ, পরবর্তীটি বিয়ারের জন্য, পরেরটি ড. মরিচ ইত্যাদির জন্য৷ প্রশ্নের সংখ্যা ব্র্যান্ডের সংখ্যার উপর নির্ভর করে৷
বিকল্প পদ্ধতি
আরো দুটি পন্থা আছে। "পার্সেপচুয়াল ডেটা: ডেরাইভড অ্যাপ্রোচ" নামে একটি কৌশল রয়েছে যেখানে পণ্যগুলি গুণাবলীতে পচে যায় এবং মূল্যায়ন একটি শব্দার্থিক ডিফারেনশিয়াল স্কেলে করা হয়। আরেকটি পদ্ধতি হল "পছন্দ ডেটা পদ্ধতি", যেখানে উত্তরদাতাদের মিলের পরিবর্তে পছন্দ সম্পর্কে জিজ্ঞাসা করা হয়৷
এটি নিম্নলিখিত পদক্ষেপগুলি নিয়ে গঠিত:
- MDS পরিসংখ্যান প্রোগ্রাম চালু করা হচ্ছে। পদ্ধতিটি সম্পাদনের জন্য সফ্টওয়্যার অনেক পরিসংখ্যানগত সফ্টওয়্যার প্যাকেজে উপলব্ধ। মেট্রিক এমডিএস (যা ব্যবধান বা অনুপাত স্তরের ডেটা নিয়ে কাজ করে) এবং নন-মেট্রিক এমডিএস (যা অর্ডিনাল ডেটা নিয়ে কাজ করে) এর মধ্যে প্রায়ই একটি পছন্দ থাকে।
- পরিমাপের সংখ্যা নির্ণয় করা। গবেষককে অবশ্যই কম্পিউটারে যে পরিমাপ তৈরি করতে চান তার সংখ্যা নির্ধারণ করতে হবে। পরিমাপ যত বেশি, পরিসংখ্যানের মান তত ভাল, কিন্তু ফলাফল ব্যাখ্যা করা তত কঠিন৷
- ফলাফল প্রদর্শন করুন এবং পরিমাপ সংজ্ঞায়িত করুন - পরিসংখ্যান প্রোগ্রাম (বা সম্পর্কিত মডিউল) ফলাফল প্রদর্শন করবে। মানচিত্র প্রতিটি পণ্য প্রদর্শন করবে (সাধারণত 2D)।স্থান)। পণ্যগুলির একে অপরের নৈকট্য তাদের সাদৃশ্য বা পছন্দ নির্দেশ করে, কোন পদ্ধতি ব্যবহার করা হয়েছিল তার উপর নির্ভর করে। যাইহোক, কিভাবে পরিমাপ আসলে সিস্টেম আচরণের পরিমাপের সাথে মিলে যায় তা সবসময় পরিষ্কার নয়। সামঞ্জস্যের একটি বিষয়গত রায় এখানে করা যেতে পারে৷
- নির্ভরযোগ্যতা এবং বৈধতার জন্য ফলাফল পরীক্ষা করুন - MDS পদ্ধতির দ্বারা হিসাব করা যেতে পারে এমন স্কেল করা ডেটা বৈচিত্রের অনুপাত নির্ধারণ করতে R-squared গণনা করুন। স্কয়ার R 0.6 সর্বনিম্ন গ্রহণযোগ্য স্তর হিসাবে বিবেচিত হয়। R বর্গ 0.8 মেট্রিক স্কেলিং এর জন্য ভাল বলে বিবেচিত হয়, যখন 0.9 নন-মেট্রিক স্কেলিং এর জন্য ভাল বলে বিবেচিত হয়।
বিভিন্ন পরীক্ষা
অন্যান্য সম্ভাব্য পরীক্ষাগুলি হল ক্রুস্কাল-টাইপ স্ট্রেস টেস্ট, স্প্লিট ডেটা টেস্ট, ডেটা স্ট্যাবিলিটি টেস্ট এবং রিটেস্ট নির্ভরযোগ্যতা পরীক্ষা। পরীক্ষার ফলাফল সম্পর্কে বিস্তারিত লিখুন। ম্যাপিংয়ের সাথে, অন্তত একটি পরিমাপ দূরত্ব (যেমন সোরেনসন সূচক, জ্যাকার্ড সূচক) এবং নির্ভরযোগ্যতা (যেমন স্ট্রেস মান) নির্দিষ্ট করা উচিত।
এটি একটি অ্যালগরিদম দেওয়াও অত্যন্ত বাঞ্ছনীয় (যেমন, ক্রুস্কাল, ম্যাথার) যা প্রায়শই ব্যবহৃত প্রোগ্রাম দ্বারা নির্ধারিত হয় (কখনও কখনও অ্যালগরিদম রিপোর্ট প্রতিস্থাপন করা হয়), যদি আপনি একটি স্টার্টিং কনফিগারেশন দিয়ে থাকেন বা একটি এলোমেলো পছন্দ করেন, নম্বর মাত্রার রান, মন্টে কার্লো ফলাফল, পুনরাবৃত্তির সংখ্যা, স্থিতিশীলতার স্কোর, এবং প্রতিটি অক্ষের আনুপাতিক প্রকরণ (r-বর্গ)।
ভিজ্যুয়াল তথ্য এবং ডেটা বিশ্লেষণ পদ্ধতিবহুমাত্রিক স্কেলিং
ইনফরমেশন ভিজ্যুয়ালাইজেশন হল মানুষের চেতনা বাড়ানোর জন্য বিমূর্ত তথ্যের ইন্টারেক্টিভ (ভিজ্যুয়াল) উপস্থাপনার অধ্যয়ন। বিমূর্ত ডেটাতে সাংখ্যিক এবং অ-সংখ্যাসূচক উভয় ডেটা যেমন পাঠ্য এবং ভৌগলিক তথ্য অন্তর্ভুক্ত থাকে। যাইহোক, তথ্য ভিজ্যুয়ালাইজেশন বৈজ্ঞানিক ভিজ্যুয়ালাইজেশন থেকে পৃথক: "এটি তথ্যমূলক (তথ্য ভিজ্যুয়ালাইজেশন) যখন একটি স্থানিক উপস্থাপনা বেছে নেওয়া হয়, এবং scivis (বৈজ্ঞানিক দৃশ্যায়ন) যখন একটি স্থানিক উপস্থাপনা দেওয়া হয়।"
মানব-কম্পিউটার ইন্টারঅ্যাকশন, কম্পিউটার সায়েন্স অ্যাপ্লিকেশন, গ্রাফিক্স, ভিজ্যুয়াল ডিজাইন, মনোবিজ্ঞান এবং ব্যবসায়িক পদ্ধতিতে গবেষণা থেকে তথ্য ভিজ্যুয়ালাইজেশনের ক্ষেত্রটি উদ্ভূত হয়েছে। এটি বৈজ্ঞানিক গবেষণা, ডিজিটাল লাইব্রেরি, ডেটা মাইনিং, আর্থিক তথ্য, বাজার গবেষণা, উৎপাদন নিয়ন্ত্রণ ইত্যাদিতে একটি অপরিহার্য উপাদান হিসাবে ক্রমবর্ধমানভাবে ব্যবহৃত হচ্ছে৷
পদ্ধতি এবং নীতি
তথ্য ভিজ্যুয়ালাইজেশন পরামর্শ দেয় যে ভিজ্যুয়ালাইজেশন এবং মিথস্ক্রিয়া পদ্ধতিগুলি মানুষের উপলব্ধির সমৃদ্ধির সদ্ব্যবহার করে, যা ব্যবহারকারীদের একই সাথে প্রচুর পরিমাণে তথ্য দেখতে, অন্বেষণ করতে এবং বুঝতে দেয়। তথ্য ভিজ্যুয়ালাইজেশনের লক্ষ্য হল বিমূর্ত তথ্য, তথ্য একটি স্বজ্ঞাত উপায়ে যোগাযোগের পদ্ধতি তৈরি করা।
ডেটা বিশ্লেষণ শিল্পে সমস্ত প্রয়োগ গবেষণা এবং সমস্যা সমাধানের একটি অবিচ্ছেদ্য অংশ। অধিকাংশডেটা বিশ্লেষণের মৌলিক পন্থাগুলি হল ভিজ্যুয়ালাইজেশন (হিস্টোগ্রাম, স্ক্যাটার প্লট, সারফেস প্লট, ট্রি ম্যাপ, সমান্তরাল স্থানাঙ্ক প্লট, ইত্যাদি), পরিসংখ্যান (অনুমান পরীক্ষা, রিগ্রেশন, পিসিএ, ইত্যাদি), ডেটা বিশ্লেষণ (ম্যাচিং, ইত্যাদি)।.d.) এবং মেশিন লার্নিং পদ্ধতি (ক্লাস্টারিং, শ্রেণীবিভাগ, সিদ্ধান্ত গাছ, ইত্যাদি)।
এই পন্থাগুলির মধ্যে, তথ্য ভিজ্যুয়ালাইজেশন বা ভিজ্যুয়াল ডেটা বিশ্লেষণ হল বিশ্লেষণাত্মক কর্মীদের জ্ঞানীয় দক্ষতার উপর সবচেয়ে বেশি নির্ভরশীল এবং অসংগঠিত কর্মযোগ্য অন্তর্দৃষ্টি আবিষ্কারের অনুমতি দেয় যা শুধুমাত্র মানুষের কল্পনা এবং সৃজনশীলতার দ্বারা সীমাবদ্ধ। ডেটা ভিজ্যুয়ালাইজেশন ব্যাখ্যা করতে সক্ষম হওয়ার জন্য একজন বিশ্লেষকের কোন জটিল কৌশল শেখার দরকার নেই। তথ্য ভিজ্যুয়ালাইজেশন হল একটি হাইপোথিসিস জেনারেশন স্কিম যা সাধারণত আরও বিশ্লেষণাত্মক বা আনুষ্ঠানিক বিশ্লেষণ যেমন পরিসংখ্যানগত হাইপোথিসিস টেস্টিং এর সাথে হতে পারে।
অধ্যয়ন
ভিজ্যুয়ালাইজেশনের আধুনিক অধ্যয়ন কম্পিউটার গ্রাফিক্সের মাধ্যমে শুরু হয়েছিল, যা "প্রথম থেকেই বৈজ্ঞানিক সমস্যাগুলি অধ্যয়ন করতে ব্যবহৃত হয়েছিল। তবে, প্রাথমিক বছরগুলিতে, গ্রাফিক্স শক্তির অভাব প্রায়শই এর উপযোগিতাকে সীমিত করেছিল। ভিজ্যুয়ালাইজেশনের অগ্রাধিকার শুরু হয়েছিল সায়েন্টিফিক কম্পিউটিং-এ কম্পিউটার গ্রাফিক্স এবং ভিজ্যুয়ালাইজেশনের জন্য বিশেষ সফ্টওয়্যার প্রকাশের সাথে 1987 সালে বিকাশের জন্য, তখন থেকে, IEEE কম্পিউটার সোসাইটি এবং ACM SIGGRAPH দ্বারা যৌথভাবে বেশ কয়েকটি সম্মেলন এবং কর্মশালা আয়োজন করা হয়েছে"
তারা ডেটা ভিজ্যুয়ালাইজেশন, তথ্য ভিজ্যুয়ালাইজেশন এবং বৈজ্ঞানিক ভিজ্যুয়ালাইজেশনের সাধারণ বিষয়গুলি কভার করেছে,সেইসাথে আরও নির্দিষ্ট ক্ষেত্র যেমন ভলিউম রেন্ডারিং।
সারাংশ
জেনারালাইজড মাল্টিডাইমেনশনাল স্কেলিং (GMDS) হল মেট্রিক মাল্টিডাইমেনশনাল স্কেলিং এর একটি এক্সটেনশন যেখানে টার্গেট স্পেস অ-ইউক্লিডীয়। যখন পার্থক্যগুলি একটি পৃষ্ঠের দূরত্ব হয়, এবং লক্ষ্য স্থানটি অন্য পৃষ্ঠ হয়, তখন GMDS আপনাকে ন্যূনতম বিকৃতি সহ একটি পৃষ্ঠের অন্য পৃষ্ঠের মধ্যে বাসা খুঁজে পেতে দেয়৷
GMDS গবেষণার একটি নতুন লাইন। বর্তমানে, প্রধান অ্যাপ্লিকেশনগুলি হল বিকৃত বস্তুর স্বীকৃতি (উদাহরণস্বরূপ, 3D ফেস রিকগনিশনের জন্য) এবং টেক্সচার ম্যাপিং৷
মাল্টিডাইমেনশনাল স্কেলিং এর উদ্দেশ্য হল বহুমাত্রিক ডেটা উপস্থাপন করা। বহুমাত্রিক ডেটা, অর্থাৎ, যে ডেটার প্রতিনিধিত্ব করতে দুই বা তিনটি মাত্রার বেশি প্রয়োজন, তা ব্যাখ্যা করা কঠিন হতে পারে। সরলীকরণের একটি পদ্ধতি হল অনুমান করা যে আগ্রহের ডেটা একটি উচ্চ-মাত্রিক স্থানের একটি এমবেডেড নন-লিনিয়ার ম্যানিফোল্ডের উপর রয়েছে। যদি সংগ্রাহকের যথেষ্ট মাত্রা কম থাকে, তবে তথ্যটি নিম্ন-মাত্রিক স্থানে কল্পনা করা যেতে পারে।
অরৈখিক মাত্রা হ্রাস করার অনেক পদ্ধতিই রৈখিক পদ্ধতির সাথে সম্পর্কিত। অরৈখিক পদ্ধতিগুলিকে বিস্তৃতভাবে দুটি গ্রুপে শ্রেণীবদ্ধ করা যেতে পারে: যেগুলি ম্যাপিং প্রদান করে (হয় উচ্চ-মাত্রিক স্থান থেকে নিম্ন-মাত্রিক এম্বেডিং পর্যন্ত, বা বিপরীতভাবে), এবং যেগুলি কেবল ভিজ্যুয়ালাইজেশন প্রদান করে। মেশিন লার্নিং এর প্রেক্ষাপটে ম্যাপিং পদ্ধতি হিসেবে দেখা যেতে পারেবৈশিষ্ট্য নিষ্কাশনের একটি প্রাথমিক পর্যায়, যার পরে প্যাটার্ন স্বীকৃতি অ্যালগরিদম প্রয়োগ করা হয়। সাধারণত যেগুলি কেবল ভিজ্যুয়ালাইজেশন দেয় তা প্রক্সিমিটি ডেটার উপর ভিত্তি করে - যেমন দূরত্ব পরিমাপ। বহুমাত্রিক স্কেলিং মনোবিজ্ঞান এবং অন্যান্য মানবিকেও বেশ সাধারণ।
যদি অ্যাট্রিবিউটের সংখ্যা বড় হয়, তাহলে অনন্য সম্ভাব্য স্ট্রিং-এর স্থানও দ্রুতগতিতে বড়। এইভাবে, মাত্রা যত বড় হবে, স্থানটি চিত্রিত করা তত কঠিন হবে। এতে অনেক সমস্যা হয়। উচ্চ-মাত্রিক ডেটাতে কাজ করা অ্যালগরিদমগুলির সময় খুব বেশি জটিলতা থাকে। কম মাত্রায় ডেটা হ্রাস করা প্রায়শই বিশ্লেষণ অ্যালগরিদমগুলিকে আরও দক্ষ করে তোলে এবং মেশিন লার্নিং অ্যালগরিদমগুলিকে আরও সঠিক ভবিষ্যদ্বাণী করতে সহায়তা করতে পারে। এই কারণেই বহুমাত্রিক ডেটা স্কেলিং এত জনপ্রিয়৷