ডেটা মাইনিং হল ধারণা, অ্যালগরিদম বিশ্লেষণ, উদ্দেশ্য এবং প্রয়োগ

সুচিপত্র:

ডেটা মাইনিং হল ধারণা, অ্যালগরিদম বিশ্লেষণ, উদ্দেশ্য এবং প্রয়োগ
ডেটা মাইনিং হল ধারণা, অ্যালগরিদম বিশ্লেষণ, উদ্দেশ্য এবং প্রয়োগ
Anonim

তথ্য প্রযুক্তির বিকাশ বাস্তব ফলাফল নিয়ে আসে। কিন্তু তথ্য অনুসন্ধান, বিশ্লেষণ এবং ব্যবহার করার মতো কাজগুলি এখনও একটি কার্যকর উচ্চ-মানের সরঞ্জাম পায়নি। বিশ্লেষণ এবং পরিমাণগত সরঞ্জাম আছে, তারা সত্যিই কাজ. কিন্তু তথ্যের ব্যবহারে গুণগত বিপ্লব এখনও ঘটেনি।

কম্পিউটার প্রযুক্তির আবির্ভাবের অনেক আগে, একজন ব্যক্তির প্রচুর পরিমাণে তথ্য প্রক্রিয়াকরণের প্রয়োজন ছিল এবং তার সর্বোত্তম অভিজ্ঞতা এবং উপলব্ধ প্রযুক্তিগত সক্ষমতার সাথে এটি মোকাবেলা করতে হয়েছিল।

জ্ঞান এবং দক্ষতার বিকাশ সর্বদা বাস্তব চাহিদা পূরণ করেছে এবং বর্তমান কাজের সাথে সঙ্গতিপূর্ণ। ডেটা মাইনিং হল একটি সম্মিলিত নাম যা পূর্বে অজানা, অ-তুচ্ছ, ব্যবহারিকভাবে উপযোগী এবং তথ্যে অ্যাক্সেসযোগ্য জ্ঞান আবিষ্কার করার জন্য পদ্ধতির একটি সেট বোঝাতে ব্যবহৃত হয়, যা মানুষের কার্যকলাপের বিভিন্ন ক্ষেত্রে সিদ্ধান্ত নেওয়ার জন্য প্রয়োজনীয়।

মানুষ, বুদ্ধিমত্তা, প্রোগ্রামিং

একজন ব্যক্তি সর্বদা জানে যে কোন পরিস্থিতিতে কিভাবে কাজ করতে হয়।অজ্ঞতা বা অপরিচিত পরিস্থিতি তাকে সিদ্ধান্ত নিতে বাধা দেয় না। মানুষের যেকোনো সিদ্ধান্তের বস্তুনিষ্ঠতা এবং যুক্তিযুক্ততা প্রশ্নবিদ্ধ হতে পারে, তবে তা গ্রহণ করা হবে।

বুদ্ধিমত্তার উপর ভিত্তি করে: বংশগত "প্রক্রিয়া", অর্জিত, সক্রিয় জ্ঞান। জ্ঞান একজন ব্যক্তির সামনে উদ্ভূত সমস্যা সমাধানের জন্য প্রয়োগ করা হয়।

  1. বুদ্ধি হল জ্ঞান এবং দক্ষতার একটি অনন্য সেট: মানুষের জীবন এবং কাজের জন্য সুযোগ এবং ভিত্তি৷
  2. বুদ্ধিমত্তা ক্রমাগত বিকশিত হচ্ছে, এবং মানুষের ক্রিয়াকলাপ অন্য লোকেদের উপর প্রভাব ফেলে৷

প্রোগ্রামিং হল ডেটার উপস্থাপনা এবং অ্যালগরিদম তৈরির প্রক্রিয়াকে আনুষ্ঠানিক করার প্রথম প্রচেষ্টা৷

মানুষ, বুদ্ধিমত্তা, প্রোগ্রামিং
মানুষ, বুদ্ধিমত্তা, প্রোগ্রামিং

কৃত্রিম বুদ্ধিমত্তা (AI) সময় এবং সম্পদের অপচয়, কিন্তু AI এর ক্ষেত্রে গত শতাব্দীর ব্যর্থ প্রচেষ্টার ফলাফল স্মৃতিতে রয়ে গেছে, বিভিন্ন বিশেষজ্ঞ (বুদ্ধিমান) সিস্টেমে ব্যবহার করা হয়েছে এবং রূপান্তরিত হয়েছে, বিশেষ করে, অ্যালগরিদম (নিয়ম) এবং গাণিতিক (যৌক্তিক) ডেটা বিশ্লেষণ এবং ডেটা মাইনিং।

তথ্য এবং একটি সমাধানের জন্য সাধারণ অনুসন্ধান

একটি সাধারণ লাইব্রেরি জ্ঞানের ভান্ডার, এবং মুদ্রিত শব্দ এবং গ্রাফিক্স এখনও কম্পিউটার প্রযুক্তির হাতের তালু দেয়নি। পদার্থবিদ্যা, রসায়ন, তাত্ত্বিক বলবিদ্যা, নকশা, প্রাকৃতিক ইতিহাস, দর্শন, প্রাকৃতিক বিজ্ঞান, উদ্ভিদবিদ্যা, পাঠ্যপুস্তক, মনোগ্রাফ, বিজ্ঞানীদের কাজ, সম্মেলনের উপকরণ, উন্নয়নমূলক কাজের প্রতিবেদন ইত্যাদি সব সময়ই প্রাসঙ্গিক এবং নির্ভরযোগ্য।

লাইব্রেরি হল অনেকগুলি বিভিন্ন উত্স যা ভিন্নউপাদান, উত্স, গঠন, বিষয়বস্তু, উপস্থাপনা শৈলী, ইত্যাদি উপস্থাপনের ফর্ম।

লাইব্রেরি: বই, ম্যাগাজিন এবং অন্যান্য মুদ্রিত বিষয়
লাইব্রেরি: বই, ম্যাগাজিন এবং অন্যান্য মুদ্রিত বিষয়

বাহ্যিকভাবে সবকিছু বোঝার এবং ব্যবহারের জন্য দৃশ্যমান (পঠনযোগ্য, অ্যাক্সেসযোগ্য)। আপনি যেকোনো সমস্যার সমাধান করতে পারেন, সঠিকভাবে কাজটি সেট করতে পারেন, সমাধানের ন্যায্যতা প্রমাণ করতে পারেন, একটি প্রবন্ধ বা টার্ম পেপার লিখতে পারেন, একটি ডিপ্লোমার জন্য উপাদান নির্বাচন করতে পারেন, একটি গবেষণামূলক বা একটি বৈজ্ঞানিক ও বিশ্লেষণমূলক প্রতিবেদনের বিষয়ে উত্স বিশ্লেষণ করতে পারেন৷

যেকোন তথ্য সমস্যা সমাধান করা যেতে পারে। যথাযথ অধ্যবসায় এবং দক্ষতার সাথে, একটি সঠিক এবং নির্ভরযোগ্য ফলাফল পাওয়া যাবে। এই প্রসঙ্গে, ডেটা মাইনিং একটি সম্পূর্ণ ভিন্ন পদ্ধতি।

ফলাফল ছাড়াও, একজন ব্যক্তি লক্ষ্য অর্জনের প্রক্রিয়ায় দেখা সমস্ত কিছুর জন্য "সক্রিয় লিঙ্ক" পান। সমস্যা সমাধানে তিনি যে উত্সগুলি ব্যবহার করেছিলেন সেগুলি উল্লেখ করা যেতে পারে এবং কেউ উত্সের অস্তিত্বের সত্যতা নিয়ে বিতর্ক করবে না। এটি সত্যতার গ্যারান্টি নয়, তবে এটি একটি নিশ্চিত সাক্ষ্য যা সত্যতার জন্য দায়ী "আনসাবস্ক্রাইবড"। এই দৃষ্টিকোণ থেকে, ডেটা মাইনিং মানে নির্ভরযোগ্যতা সম্পর্কে বড় সন্দেহ এবং কোনও "সক্রিয়" লিঙ্ক নেই৷

বিভিন্ন সমস্যা সমাধানের মাধ্যমে, একজন ব্যক্তি ফলাফল পান এবং তার বুদ্ধিবৃত্তিক সম্ভাবনাকে অনেক "সক্রিয় লিঙ্কে" প্রসারিত করেন। যদি একটি নতুন টাস্ক একটি ইতিমধ্যে বিদ্যমান লিঙ্ক "সক্রিয়" করে, তবে ব্যক্তিটি কীভাবে এটি সমাধান করবেন তা জানতে পারবেন: আবার কিছু অনুসন্ধান করার দরকার নেই৷

"সক্রিয় লিঙ্ক" হল একটি স্থির অ্যাসোসিয়েশন: একটি নির্দিষ্ট ক্ষেত্রে কীভাবে এবং কী করতে হবে৷ মানুষের মস্তিষ্ক স্বয়ংক্রিয়ভাবে সব কিছু মনে রাখে যা এটিকে সম্ভাব্য আকর্ষণীয়, দরকারী বলে মনে হয়।অথবা ভবিষ্যতে প্রয়োজন হতে পারে। অনেক উপায়ে, এটি একটি অবচেতন স্তরে ঘটে, তবে একটি "সক্রিয় লিঙ্ক" এর সাথে যুক্ত করা যেতে পারে এমন একটি কাজ উত্থাপিত হওয়ার সাথে সাথে এটি তাত্ক্ষণিকভাবে মনের মধ্যে পপ আপ হয় এবং তথ্যের জন্য অতিরিক্ত অনুসন্ধান ছাড়াই একটি সমাধান পাওয়া যাবে। ডেটা মাইনিং সর্বদা অনুসন্ধান অ্যালগরিদমের পুনরাবৃত্তি এবং এই অ্যালগরিদম পরিবর্তন হয় না৷

নিয়মিত অনুসন্ধান: "শৈল্পিক" সমস্যা

গণিতের লাইব্রেরি এবং এতে তথ্য অনুসন্ধান করা তুলনামূলকভাবে দুর্বল কাজ। একটি পূর্ণাঙ্গ সমাধান, একটি ম্যাট্রিক্স তৈরি বা দুটি কাল্পনিক সংখ্যা যোগ করার অপারেশন সম্পাদন করার জন্য একটি বা অন্য উপায় খুঁজে পাওয়া শ্রমসাধ্য, কিন্তু সহজ। আপনাকে অনেকগুলি বইয়ের মাধ্যমে সাজাতে হবে, যার মধ্যে অনেকগুলি একটি নির্দিষ্ট ভাষায় লেখা, সঠিক পাঠ্যটি সন্ধান করুন, এটি অধ্যয়ন করুন এবং প্রয়োজনীয় সমাধান পান৷

সময়ের সাথে সাথে, গণনা পরিচিত হয়ে উঠবে, এবং সঞ্চিত অভিজ্ঞতা আপনাকে লাইব্রেরির তথ্য এবং অন্যান্য গাণিতিক সমস্যাগুলি নেভিগেট করার অনুমতি দেবে। এটি প্রশ্ন এবং উত্তরের একটি সীমিত তথ্য স্থান। একটি চরিত্রগত বৈশিষ্ট্য: তথ্যের জন্য এই ধরনের অনুসন্ধান অনুরূপ সমস্যা সমাধানের জন্য জ্ঞান সঞ্চয় করে। তথ্যের জন্য একজন ব্যক্তির অনুসন্ধান তার স্মৃতিতে অন্যান্য সমস্যার সম্ভাব্য সমাধানের চিহ্ন ("সক্রিয় লিঙ্ক") রেখে যায়।

কথাসাহিত্যে, প্রশ্নের উত্তর খুঁজুন: "মানুষ 1248 সালের জানুয়ারীতে কীভাবে বাস করত?" খুবই কঠিন. দোকানের তাকগুলিতে কী ছিল এবং কীভাবে খাদ্য ব্যবসা সংগঠিত হয়েছিল এই প্রশ্নের উত্তর দেওয়া আরও কঠিন। কোনো কোনো লেখক তার উপন্যাসে এ বিষয়ে স্পষ্ট ও প্রত্যক্ষভাবে লিখলেও যদি এই লেখকের নাম পাওয়া যেত, তাহলে সন্দেহ হয়।প্রাপ্ত তথ্যের নির্ভরযোগ্যতা থাকবে। নির্ভরযোগ্যতা হল যে কোন পরিমাণ তথ্যের একটি গুরুত্বপূর্ণ বৈশিষ্ট্য। সূত্র, লেখক এবং প্রমাণ যা ফলাফলের মিথ্যাকে বাদ দেয় তা গুরুত্বপূর্ণ।

একটি নির্দিষ্ট পরিস্থিতির উদ্দেশ্যমূলক পরিস্থিতি

মানুষ দেখে, শোনে, অনুভব করে। কিছু বিশেষজ্ঞ একটি অনন্য অনুভূতিতে সাবলীল - অন্তর্দৃষ্টি। সমস্যার বিবৃতিতে তথ্যের প্রয়োজন হয়, সমস্যা সমাধানের প্রক্রিয়াটি প্রায়শই সমস্যার বিবৃতির পরিমার্জনার সাথে থাকে। কম্পিউটার সিস্টেমের অন্ত্রে তথ্য সরানোর ক্ষেত্রে এটি কম সমস্যা।

ভার্চুয়াল স্পেসে তথ্য
ভার্চুয়াল স্পেসে তথ্য

লাইব্রেরি এবং কাজের সহকর্মীরা সিদ্ধান্ত প্রক্রিয়ায় পরোক্ষ অংশগ্রহণকারী। বইটির নকশা (উৎস), পাঠ্যের গ্রাফিক্স, তথ্যকে শিরোনামে বিভক্ত করার বৈশিষ্ট্য, বাক্যাংশ দ্বারা পাদটীকা, বিষয় সূচী, প্রাথমিক উত্সগুলির তালিকা - সবকিছুই একজন ব্যক্তির মধ্যে সম্পর্ক তৈরি করে যা পরোক্ষভাবে সমাধানের প্রক্রিয়াকে প্রভাবিত করে। সমস্যা।

সমস্যা সমাধানের সময় ও স্থান অপরিহার্য। একজন ব্যক্তি এতটাই সাজানো যে তিনি অনিচ্ছাকৃতভাবে সমস্যা সমাধানের প্রক্রিয়ায় তাকে ঘিরে থাকা সমস্ত কিছুর প্রতি মনোযোগ দেন। এটি বিভ্রান্তিকর হতে পারে, বা এটি উদ্দীপক হতে পারে। ডেটা মাইনিং কখনই "বুঝবে না"।

ভার্চুয়াল স্পেসে তথ্য

একজন ব্যক্তি সর্বদা একটি সমস্যা সমাধানের জন্য একটি ঘটনা, ঘটনা, বস্তু, অ্যালগরিদম সম্পর্কে নির্ভরযোগ্য তথ্যে আগ্রহী। মানুষ সর্বদা কল্পনা করে যে সে কীভাবে কাঙ্ক্ষিত লক্ষ্য অর্জন করতে পারে।

কম্পিউটার এবং তথ্য ব্যবস্থার উপস্থিতি একজন ব্যক্তির জীবনকে সহজ করে তোলা উচিত ছিল, কিন্তু সবকিছুই কেবল আরও জটিল হয়ে উঠেছে।তথ্য কম্পিউটার সিস্টেমের অন্ত্রে স্থানান্তরিত হয় এবং দৃষ্টি থেকে অদৃশ্য হয়ে যায়। প্রয়োজনীয় ডেটা নির্বাচন করতে, আপনাকে একটি সঠিক অ্যালগরিদম তৈরি করতে হবে বা ডাটাবেসের জন্য একটি প্রশ্ন তৈরি করতে হবে।

তথ্য সিস্টেমের ভিতরে ডেটা
তথ্য সিস্টেমের ভিতরে ডেটা

প্রশ্নটি অবশ্যই সঠিক হতে হবে। তাহলেই উত্তর পাওয়া যাবে। কিন্তু সত্যতা নিয়ে সন্দেহ থেকেই যায়। এই অর্থে, ডেটা মাইনিং সত্যিই "খনন", এটি "তথ্য নিষ্কাশন"। এইভাবে এই শব্দগুচ্ছ অনুবাদ করা ফ্যাশনেবল। রাশিয়ান সংস্করণ হল ডেটা মাইনিং বা ডেটা মাইনিং প্রযুক্তি৷

আধিকারিক বিশেষজ্ঞদের কাজে, ডেটা মাইনিং এর কাজগুলি নিম্নরূপ নির্দেশিত হয়:

  • শ্রেণীবিভাগ;
  • ক্লাস্টারিং;
  • সংযোগ;
  • ক্রম;
  • পূর্বাভাস।

অভ্যাসের দৃষ্টিকোণ থেকে যা একজন ব্যক্তিকে তথ্যের ম্যানুয়াল প্রক্রিয়াকরণে গাইড করে, এই সমস্ত অবস্থানগুলি বিতর্কিত। যাই হোক না কেন, একজন ব্যক্তি স্বয়ংক্রিয়ভাবে তথ্য প্রসেস করে এবং ডেটা শ্রেণীবদ্ধ করা, বস্তুর বিষয়ভিত্তিক গোষ্ঠী সংকলন (ক্লাস্টারিং), টেম্পোরাল প্যাটার্ন (ক্রম) অনুসন্ধান করা বা ফলাফলের পূর্বাভাস দেওয়ার কথা ভাবে না৷

মানুষের মনের এই সমস্ত অবস্থানগুলি সক্রিয় জ্ঞান দ্বারা উপস্থাপিত হয়, যা আরও অবস্থান কভার করে এবং গতিশীলভাবে প্রাথমিক ডেটা প্রক্রিয়াকরণের যুক্তি ব্যবহার করে। একজন ব্যক্তির অবচেতন একটি গুরুত্বপূর্ণ ভূমিকা পালন করে, বিশেষ করে যখন সে জ্ঞানের একটি নির্দিষ্ট ক্ষেত্রে বিশেষজ্ঞ হয়।

উদাহরণ: কম্পিউটার সরঞ্জামের পাইকারি

টাস্কটি সহজ। বেশ কিছু আছেকয়েক ডজন কম্পিউটার সরঞ্জাম এবং পেরিফেরাল সরবরাহকারী। প্রতিটির xls ফরম্যাটে একটি মূল্য তালিকা রয়েছে (এক্সেল ফাইল), যা সরবরাহকারীর অফিসিয়াল ওয়েবসাইট থেকে ডাউনলোড করা যেতে পারে। এটি একটি ওয়েব রিসোর্স তৈরি করতে হবে যা এক্সেল ফাইলগুলি পড়ে, সেগুলিকে ডাটাবেস টেবিলে রূপান্তর করে এবং গ্রাহকদের সর্বনিম্ন মূল্যে পছন্দসই পণ্যগুলি নির্বাচন করতে দেয়৷

সমস্যা সাথে সাথে দেখা দেয়। প্রতিটি সরবরাহকারী xls ফাইলের গঠন এবং বিষয়বস্তুর নিজস্ব সংস্করণ অফার করে। আপনি সরবরাহকারীর ওয়েবসাইট থেকে ফাইলটি ডাউনলোড করে, ই-মেইলের মাধ্যমে অর্ডার করে বা আপনার ব্যক্তিগত অ্যাকাউন্টের মাধ্যমে একটি ডাউনলোড লিঙ্ক পেয়ে, অর্থাৎ, সরবরাহকারীর সাথে আনুষ্ঠানিকভাবে নিবন্ধন করে ফাইলটি পেতে পারেন।

ভার্চুয়াল কম্পিউটার স্টোর
ভার্চুয়াল কম্পিউটার স্টোর

সমস্যার সমাধান (শুরুতে) প্রযুক্তিগতভাবে সহজ। ফাইল লোড হচ্ছে (প্রাথমিক ডেটা), প্রতিটি সরবরাহকারীর জন্য একটি ফাইল শনাক্তকরণ অ্যালগরিদম লেখা হয় এবং ডেটা প্রাথমিক ডেটার একটি বড় টেবিলে রাখা হয়। সমস্ত ডেটা প্রাপ্ত হওয়ার পরে, তাজা ডেটার ক্রমাগত অদলবদল করার (দৈনিক, সাপ্তাহিক বা পরিবর্তনের পরে) প্রক্রিয়া প্রতিষ্ঠিত হওয়ার পরে:

  • পরিবর্তন ভাণ্ডার;
  • দাম পরিবর্তন;
  • স্টক থাকা পরিমাণের স্পষ্টীকরণ;
  • ওয়ারেন্টির শর্তাবলী, স্পেসিফিকেশন, ইত্যাদির সমন্বয়

এখানেই আসল সমস্যা শুরু হয়। বিষয়টি হল সরবরাহকারী লিখতে পারেন:

  • নোটবুক Acer;
  • নোটবুক আসুস;
  • ডেল ল্যাপটপ।

আমরা একই পণ্য সম্পর্কে কথা বলছি, তবে বিভিন্ন নির্মাতার কাছ থেকে। কিভাবে নোটবুক=ল্যাপটপ মেলে বা কিভাবে পণ্য লাইন থেকে Acer, Asus এবং Dell সরাতে হয়?

এর জন্যমানুষ কোন সমস্যা নয়, কিন্তু অ্যালগরিদম কিভাবে "বুঝবে" যে Acer, Asus, Dell, Samsung, LG, HP, Sony ট্রেডমার্ক বা সরবরাহকারী? কিভাবে "প্রিন্টার" এবং প্রিন্টার, "স্ক্যানার" এবং "MFP", "কপিয়ার" এবং "MFP", "হেডফোন" এর সাথে "হেডসেট", "আনুষঙ্গিক" এর সাথে "আনুষাঙ্গিক" এর সাথে মিল করবেন?

যখন আপনাকে সবকিছু স্বয়ংক্রিয়ভাবে সেট করতে হবে তখন সোর্স ডেটা (সোর্স ফাইল) এর উপর ভিত্তি করে একটি ক্যাটাগরি ট্রি তৈরি করা ইতিমধ্যেই একটি সমস্যা।

ডেটা স্যাম্পলিং: "নতুনভাবে ঢেলে দেওয়া" এর খনন

কম্পিউটার সরঞ্জাম সরবরাহকারীদের একটি ডাটাবেস তৈরির কাজটি সমাধান করা হয়েছে। বিভাগের একটি গাছ তৈরি করা হয়েছে, সমস্ত সরবরাহকারীদের কাছ থেকে অফার সহ একটি সাধারণ টেবিল কাজ করছে৷

এই উদাহরণের পরিপ্রেক্ষিতে সাধারণ ডেটা মাইনিং কাজগুলি:

  • সর্বনিম্ন মূল্যে একটি পণ্য খুঁজুন;
  • নিম্নতম শিপিং খরচ এবং মূল্য সহ আইটেমটি নির্বাচন করুন;
  • পণ্য বিশ্লেষণ: মানদণ্ড অনুসারে বৈশিষ্ট্য এবং দাম।

কয়েক ডজন সরবরাহকারীর ডেটা ব্যবহার করে একজন ম্যানেজারের আসল কাজে, এই কাজের অনেক বৈচিত্র্য থাকবে, এমনকি আরও বাস্তব পরিস্থিতি।

উদাহরণস্বরূপ, একজন সরবরাহকারী "A" আছেন যিনি ASUS VivoBook S15 বিক্রি করেন: প্রিপেমেন্ট, অর্থের প্রকৃত প্রাপ্তির 5 দিন পরে বিতরণ। একই মডেলের একই পণ্যের একটি সরবরাহকারী "B" রয়েছে: প্রাপ্তির পরে অর্থ প্রদান, একদিনের মধ্যে চুক্তি শেষ হওয়ার পরে বিতরণ, মূল্য দেড় গুণ বেশি৷

ডেটা মাইনিং শুরু হয় - "খনন"। রূপক অভিব্যক্তি: "খনন" বা "ডেটা মাইনিং" সমার্থক শব্দ। সিদ্ধান্ত নেওয়ার কারণ কীভাবে পাওয়া যায় সে সম্পর্কে।

সরবরাহকারী "A" এবং "B" এর ডেলিভারির ইতিহাস রয়েছে। শ্রেণীদ্বিতীয় ক্ষেত্রে রসিদের পেমেন্টের বিপরীতে প্রথম ক্ষেত্রে প্রিপেমেন্ট, দ্বিতীয় ক্ষেত্রে ডেলিভারি ব্যর্থতা 65% বেশি। ক্লায়েন্টের কাছ থেকে জরিমানা হওয়ার ঝুঁকি বেশি/কম। কিভাবে এবং কি নির্ধারণ করতে হবে এবং কি সিদ্ধান্ত নিতে হবে?

অন্যদিকে: ডাটাবেসটি একজন প্রোগ্রামার এবং একজন ম্যানেজার দ্বারা তৈরি করা হয়েছিল। যদি প্রোগ্রামার এবং ম্যানেজার পরিবর্তিত হয়ে থাকে, তাহলে কিভাবে ডাটাবেসের বর্তমান অবস্থা নির্ণয় করবেন এবং কীভাবে এটি সঠিকভাবে ব্যবহার করবেন তা শিখবেন? আপনাকে ডেটা মাইনিংও করতে হবে। ডেটা মাইনিং বিভিন্ন ধরণের গাণিতিক এবং যৌক্তিক পদ্ধতি অফার করে যা কোন ধরণের ডেটা গবেষণা করা হচ্ছে তা বিবেচনা করে না। এটি কিছু ক্ষেত্রে সঠিক সমাধান দেয়, তবে সব ক্ষেত্রে নয়।

ভার্চুয়ালটিতে চলে যাওয়া এবং অর্থ খোঁজা

ডেটা মাইনিং পদ্ধতি অর্থবহ হয়ে ওঠে যত তাড়াতাড়ি তথ্য ডাটাবেসে লেখা হয় এবং "দর্শনের ক্ষেত্র" থেকে অদৃশ্য হয়ে যায়। কম্পিউটার সরঞ্জাম ট্রেডিং একটি আকর্ষণীয় কাজ, কিন্তু এটি শুধুমাত্র একটি ব্যবসা. তিনি কোম্পানিতে কতটা সুসংগঠিত তা নির্ভর করে এর সাফল্যের উপর৷

গ্রহের জলবায়ু পরিবর্তন এবং একটি নির্দিষ্ট শহরের আবহাওয়া সকলের আগ্রহের বিষয়, শুধু পেশাদার জলবায়ু বিশেষজ্ঞদের নয়। হাজার হাজার সেন্সর বায়ু, আর্দ্রতা, চাপ, কৃত্রিম আর্থ স্যাটেলাইট থেকে ডেটা রিডিং নেয় এবং বছরের পর শতাব্দী ধরে ডেটার ইতিহাস রয়েছে৷

আবহাওয়া সংক্রান্ত ডেটা শুধুমাত্র কাজ করার জন্য ছাতা আনতে হবে কি না তা নির্ধারণ করে না। ডেটা মাইনিং প্রযুক্তি হল একটি বিমানের নিরাপদ ফ্লাইট, একটি হাইওয়ের স্থিতিশীল অপারেশন এবং সমুদ্রপথে পেট্রোলিয়াম পণ্যের নির্ভরযোগ্য সরবরাহ৷

"কাঁচা" তথ্য তথ্য পাঠানো হয়পদ্ধতি. ডেটা মাইনিং-এর কাজগুলি হল সেগুলিকে টেবিলের একটি সুশৃঙ্খল সিস্টেমে পরিণত করা, লিঙ্ক স্থাপন করা, সমজাতীয় ডেটার গোষ্ঠীগুলিকে হাইলাইট করা এবং প্যাটার্ন সনাক্ত করা৷

জলবায়ু, আবহাওয়া এবং কাঁচা তথ্য
জলবায়ু, আবহাওয়া এবং কাঁচা তথ্য

পরিমাণগত বিশ্লেষণ ওএলএপি (অন-লাইন বিশ্লেষণাত্মক প্রক্রিয়াকরণ) এর দিন থেকে গাণিতিক এবং যৌক্তিক পদ্ধতিগুলি তাদের ব্যবহারিকতা দেখিয়েছে। এখানে, প্রযুক্তি আপনাকে কম্পিউটার সরঞ্জাম বিক্রির উদাহরণের মতো অর্থ খুঁজে পেতে এবং এটি হারাতে দেয় না৷

আরও, বিশ্বব্যাপী কাজগুলিতে:

  • আন্তর্জাতিক ব্যবসা;
  • এয়ার পরিবহন ব্যবস্থাপনা;
  • পৃথিবীর অন্ত্রের অধ্যয়ন বা সামাজিক সমস্যা (রাষ্ট্রীয় পর্যায়ে);
  • একটি জীবন্ত জীবের উপর ওষুধের প্রভাব নিয়ে গবেষণা;
  • একটি শিল্প প্রতিষ্ঠান নির্মাণের পরিণতির পূর্বাভাস, ইত্যাদি।

ডেটা মাইন প্রযুক্তি এবং "অর্থহীন" ডেটাকে বাস্তব ডেটাতে পরিণত করা যা আপনাকে উদ্দেশ্যমূলক সিদ্ধান্ত নিতে দেয়।

মানুষের সম্ভাবনা শেষ হয় যেখানে প্রচুর পরিমাণে কাঁচা তথ্য থাকে। ডেটা মাইনিং সিস্টেমগুলি তাদের উপযোগিতা হারিয়ে ফেলে যেখানে এটি তথ্য দেখতে, বুঝতে এবং অনুভব করতে হয়৷

ফাংশন এবং বস্তুনিষ্ঠতার যুক্তিসঙ্গত বন্টন

মানুষ এবং কম্পিউটার একে অপরের পরিপূরক হওয়া উচিত - এটি একটি স্বতঃসিদ্ধ। একটি গবেষণামূলক লেখা একটি ব্যক্তির জন্য একটি অগ্রাধিকার, এবং একটি তথ্য সিস্টেম একটি সাহায্য. এখানে, ডেটা মাইনিং প্রযুক্তিতে যে ডেটা রয়েছে তা হল হিউরিস্টিক, নিয়ম, অ্যালগরিদম৷

একটি সাপ্তাহিক আবহাওয়ার পূর্বাভাস প্রস্তুত করা তথ্য ব্যবস্থার অগ্রাধিকার।মানুষ ডেটা পরিচালনা করে, কিন্তু সিস্টেমের গণনার ফলাফলের উপর তার সিদ্ধান্তের ভিত্তি করে। এটি ডেটা মাইনিং পদ্ধতি, বিশেষজ্ঞ ডেটা শ্রেণীবিভাগ, অ্যালগরিদম প্রয়োগের ম্যানুয়াল নিয়ন্ত্রণ, অতীতের ডেটার স্বয়ংক্রিয় তুলনা, গাণিতিক পূর্বাভাস এবং তথ্য ব্যবস্থার প্রয়োগের সাথে জড়িত প্রকৃত ব্যক্তিদের প্রচুর জ্ঞান এবং দক্ষতা একত্রিত করে৷

মানুষ এবং কম্পিউটার
মানুষ এবং কম্পিউটার

সম্ভাব্যতা তত্ত্ব এবং গাণিতিক পরিসংখ্যান জ্ঞানের সবচেয়ে "প্রিয়" এবং বোধগম্য ক্ষেত্র নয়। অনেক বিশেষজ্ঞ তাদের থেকে অনেক দূরে, কিন্তু এই এলাকায় বিকশিত পদ্ধতি প্রায় 100% সঠিক ফলাফল দেয়। ডেটা মাইনিংয়ের ধারণা, পদ্ধতি এবং অ্যালগরিদমের উপর ভিত্তি করে সিস্টেম প্রয়োগ করে, সমাধানগুলি বস্তুনিষ্ঠ এবং নির্ভরযোগ্যভাবে প্রাপ্ত করা যেতে পারে। অন্যথায়, সমাধান পাওয়া অসম্ভব।

ফেরাউন এবং বিগত শতাব্দীর রহস্য

ইতিহাস পর্যায়ক্রমে পুনর্লিখন করা হয়েছিল:

  • রাষ্ট্র - তাদের কৌশলগত স্বার্থের জন্য;
  • অথরিটিভ বিজ্ঞানী - তাদের বিষয়গত বিশ্বাসের জন্য।

কোনটা সত্যি আর কোনটা মিথ্যে বলা মুশকিল। ডেটা মাইনিং ব্যবহার আমাদের এই সমস্যার সমাধান করতে দেয়। উদাহরণস্বরূপ, পিরামিড নির্মাণের প্রযুক্তিটি ইতিহাসবিদদের দ্বারা বর্ণনা করা হয়েছিল এবং বিভিন্ন শতাব্দীতে বিজ্ঞানীরা অধ্যয়ন করেছিলেন। সমস্ত উপকরণ ইন্টারনেটে পাওয়া যায় না, এখানে সবকিছু অনন্য নয় এবং অনেক ডেটা নাও থাকতে পারে:

  • সময়ে বর্ণিত পয়েন্ট;
  • বর্ণনা লেখার সময়;
  • তারিখ যার উপর ভিত্তি করে বর্ণনা করা হয়েছে;
  • লেখক(রা), মতামত (লিঙ্ক) বিবেচনায় নেওয়া হয়েছে;
  • বস্তুত্বের নিশ্চিতকরণ।

Bগ্রন্থাগার, মন্দির এবং "অপ্রত্যাশিত স্থান" আপনি বিভিন্ন শতাব্দীর পাণ্ডুলিপি এবং অতীতের বস্তুগত প্রমাণ খুঁজে পেতে পারেন৷

আকর্ষণীয় লক্ষ্য: সবকিছু একত্রিত করা এবং "সত্য" উদ্ঘাটন করা। সমস্যার বৈশিষ্ট্য: ফারাওদের জীবদ্দশায়, বর্তমান শতাব্দী পর্যন্ত একজন ক্রনিকারের প্রথম বর্ণনা থেকে তথ্য পাওয়া যেতে পারে, যেখানে অনেক বিজ্ঞানী আধুনিক পদ্ধতিতে এই সমস্যার সমাধান করেছেন।

ডেটা মাইনিং ব্যবহার করার যুক্তি: কায়িক শ্রম সম্ভব নয়। অনেক বেশি পরিমাণ:

  • তথ্যের উৎস;
  • প্রতিনিধিত্বের ভাষা;
  • গবেষকরা একই জিনিসকে বিভিন্ন উপায়ে বর্ণনা করছেন;
  • তারিখ, ঘটনা এবং শর্তাবলী;
  • মেয়াদী পারস্পরিক সম্পর্ক সমস্যা;
  • সময়ের সাথে সাথে ডেটা গ্রুপের পরিসংখ্যানের বিশ্লেষণ ভিন্ন হতে পারে, ইত্যাদি।

গত শতাব্দীর শেষের দিকে, যখন কৃত্রিম বুদ্ধিমত্তার ধারণার আরেকটি বিপর্যয় শুধুমাত্র সাধারণ মানুষের কাছেই নয়, একজন পরিশীলিত বিশেষজ্ঞের কাছেও সুস্পষ্ট হয়ে ওঠে, তখন ধারণাটি উপস্থিত হয়েছিল: "ব্যক্তিত্বকে পুনরায় তৈরি করতে।"

উদাহরণস্বরূপ, পুশকিন, গোগোল, চেখভের কাজ অনুসারে, একটি নির্দিষ্ট নিয়ম, আচরণের যুক্তি তৈরি করা হয় এবং একটি তথ্য ব্যবস্থা তৈরি করা হয় যা কিছু প্রশ্নের উত্তর দিতে পারে যেমন একজন ব্যক্তি: পুশকিন, গোগোল বা চেখভ। তাত্ত্বিকভাবে, এই ধরনের একটি কাজ আকর্ষণীয়, কিন্তু বাস্তবে এটি বাস্তবায়ন করা অত্যন্ত কঠিন।

তবে, এই জাতীয় কাজের ধারণাটি একটি খুব বাস্তব ধারণার পরামর্শ দেয়: "কিভাবে একটি বুদ্ধিমান তথ্য অনুসন্ধান তৈরি করা যায়।" ইন্টারনেট হল অনেক উন্নয়নশীল সংস্থান, একটি বিশাল ডাটাবেস এবং এটি মানুষের সাথে একত্রে ডেটা মাইনিং প্রয়োগ করার একটি দুর্দান্ত সুযোগযৌথ বিকাশের বিন্যাসে যুক্তি।

যন্ত্র আর মানুষ একসাথে
যন্ত্র আর মানুষ একসাথে

একটি মেশিন এবং একজন মানুষ জুটিবদ্ধ একটি চমৎকার কাজ এবং "তথ্য প্রত্নতত্ত্ব" ক্ষেত্রে একটি নিঃসন্দেহে সাফল্য, ডেটা এবং ফলাফলগুলিতে উচ্চ-মানের খনন যা কিছু সন্দেহের মধ্যে ফেলবে, কিন্তু সন্দেহ ছাড়াই আপনাকে অনুমতি দেবে নতুন জ্ঞান অর্জন করতে এবং সমাজে চাহিদা থাকবে।

প্রস্তাবিত: