সময় সিরিজের বিশ্লেষণ এবং পূর্বাভাস

সুচিপত্র:

সময় সিরিজের বিশ্লেষণ এবং পূর্বাভাস
সময় সিরিজের বিশ্লেষণ এবং পূর্বাভাস
Anonim

অনেক বছর ধরে, লোকেরা আবহাওয়ার পরিস্থিতি, অর্থনৈতিক ও রাজনৈতিক ঘটনা এবং খেলার ফলাফলের পূর্বাভাস দিয়েছে, সম্প্রতি এই বিস্তৃত তালিকাটি ক্রিপ্টোকারেন্সি দিয়ে পুনরায় পূরণ করা হয়েছে। বহুমুখী ইভেন্টের পূর্বাভাস দেওয়ার জন্য, পূর্বাভাস বিকাশের অনেক উপায় রয়েছে। উদাহরণস্বরূপ, অন্তর্দৃষ্টি, বিশেষজ্ঞের মতামত, ঐতিহ্যগত পরিসংখ্যানের সাথে তুলনা করার জন্য অতীতের ফলাফলগুলি ব্যবহার করে এবং সময় সিরিজের পূর্বাভাস তাদের মধ্যে একটি, যেখানে বিস্তৃত অ্যাপ্লিকেশন সহ সবচেয়ে আধুনিক এবং সঠিক ধরনের পূর্বাভাস।

টাইম সিরিজ পদ্ধতি

টাইম সিরিজ পদ্ধতি
টাইম সিরিজ পদ্ধতি

A টাইম সিরিজ (TS) পদ্ধতি হল একটি ডেটাসেট যা নির্দিষ্ট সময়ের মধ্যে তথ্য সংগ্রহ করে। এই ধরনের নিষ্কাশনের জন্য বিশেষ পদ্ধতি আছে:

  • রৈখিক এবং অরৈখিক;
  • প্যারামেট্রিক এবং নন-প্যারামেট্রিক;
  • একমাত্রিক এবং বহুমাত্রিক।

পূর্বাভাসের সময়আজকের চ্যালেঞ্জ মোকাবেলা করার জন্য সিরিজ এটির সাথে এক অনন্য ক্ষমতার সেট নিয়ে আসে। মডেলিং ডেটা পরিবর্তনের পিছনে চালিকা শক্তি প্রতিষ্ঠা করতে শেখার উপর নির্ভর করে। প্রক্রিয়াটি দীর্ঘমেয়াদী প্রবণতা, ঋতুগত প্রভাব, বা অনিয়মিত ওঠানামা থেকে আসে যা TS-এর বৈশিষ্ট্য এবং অন্যান্য ধরনের বিশ্লেষণে দেখা যায় না।

মেশিন লার্নিং হল কম্পিউটার বিজ্ঞানের একটি শাখা যেখানে অ্যালগরিদমগুলি ডেটা থেকে সংকলিত হয় এবং এতে কৃত্রিম নিউরাল নেটওয়ার্ক, ডিপ লার্নিং, অ্যাসোসিয়েশন নিয়ম, ডিসিশন ট্রি, রিইনফোর্সমেন্ট লার্নিং এবং বায়েসিয়ান নেটওয়ার্ক অন্তর্ভুক্ত থাকে। বিভিন্ন ধরনের অ্যালগরিদম সমস্যা সমাধানের বিকল্প প্রদান করে এবং প্রতিটির নিজস্ব প্রয়োজনীয়তা এবং ডেটা ইনপুট, গতি এবং ফলাফলের নির্ভুলতার ক্ষেত্রে ট্রেড-অফ রয়েছে। এইগুলি, চূড়ান্ত ভবিষ্যদ্বাণীগুলির যথার্থতার সাথে, যখন ব্যবহারকারী সিদ্ধান্ত নেবে যে কোন অ্যালগরিদম অধ্যয়নের অধীনে থাকা পরিস্থিতির জন্য সবচেয়ে ভাল কাজ করবে তখন ওজন করা হবে৷

টাইম সিরিজের পূর্বাভাস পরিসংখ্যানের ক্ষেত্র থেকে ধার করে, কিন্তু সমস্যা মডেলিংয়ের জন্য নতুন পন্থা দেয়। মেশিন লার্নিং এবং টাইম সিরিজের প্রধান সমস্যা একই - পূর্বে জানা তথ্যের উপর ভিত্তি করে নতুন ফলাফলের পূর্বাভাস দেওয়া।

ভবিষ্যদ্বাণীমূলক মডেলের লক্ষ্য

ভবিষ্যদ্বাণীমূলক মডেলের উদ্দেশ্য
ভবিষ্যদ্বাণীমূলক মডেলের উদ্দেশ্য

TS হল নিয়মিত বিরতিতে সংগ্রহ করা ডেটা পয়েন্টের একটি সেট। একটি দীর্ঘমেয়াদী প্রবণতা নির্ধারণ করতে, ভবিষ্যতের পূর্বাভাস দিতে বা অন্য কোনো ধরনের বিশ্লেষণ করতে এগুলি বিশ্লেষণ করা হয়। 2টি জিনিস আছে যা টিএসকে একটি সাধারণ রিগ্রেশন সমস্যা থেকে আলাদা করে:

  1. এরা সময়ের উপর নির্ভর করে। তাইএকটি রৈখিক রিগ্রেশন মডেলের মৌলিক অনুমান যে পর্যবেক্ষণগুলি স্বাধীন এই ক্ষেত্রে ধরে না।
  2. ক্রমবর্ধমান বা হ্রাসের প্রবণতার সাথে, বেশিরভাগ টিএস-এর কোনো না কোনো ধরনের ঋতু আছে, যেমন পরিবর্তন যা নির্দিষ্ট সময়ের জন্য নির্দিষ্ট।

একটি টাইম সিরিজ পূর্বাভাস মডেলের লক্ষ্য হল চাহিদা অনুযায়ী সঠিক পূর্বাভাস দেওয়া। টাইম সিরিজে স্বাধীন ভেরিয়েবল এবং টার্গেট ডিপেন্ডেন্ট ভেরিয়েবল হিসাবে সময় (t) আছে। বেশিরভাগ ক্ষেত্রে, পূর্বাভাস একটি নির্দিষ্ট ফলাফল, উদাহরণস্বরূপ, একটি বাড়ির বিক্রয় মূল্য, প্রতিযোগিতার ক্রীড়া ফলাফল, স্টক এক্সচেঞ্জে ট্রেডিংয়ের ফলাফল। ভবিষ্যদ্বাণীটি মধ্যমা এবং গড় প্রতিনিধিত্ব করে এবং 80-95% পরিসরে আত্মবিশ্বাসের মাত্রা প্রকাশ করে একটি আত্মবিশ্বাসের ব্যবধান অন্তর্ভুক্ত করে। যখন সেগুলি নিয়মিত বিরতিতে রেকর্ড করা হয়, তখন প্রক্রিয়াগুলিকে টাইম সিরিজ বলা হয় এবং দুটি উপায়ে প্রকাশ করা হয়:

  • একমাত্রিক সময় সূচক সহ যা একটি অন্তর্নিহিত ক্রম তৈরি করে;
  • একটি দুটি মাত্রা সহ সেট: একটি স্বাধীন চলকের সাথে সময় এবং আরেকটি নির্ভরশীল পরিবর্তনশীল।

ফলিত মেশিন লার্নিং-এ বৈশিষ্ট্য তৈরি করা সবচেয়ে গুরুত্বপূর্ণ এবং সময়সাপেক্ষ কাজগুলির মধ্যে একটি। যাইহোক, সময় সিরিজের পূর্বাভাস বৈশিষ্ট্যগুলি তৈরি করে না, অন্তত ঐতিহ্যগত অর্থে নয়। এটি বিশেষভাবে সত্য যখন আপনি ফলাফলের পূর্বাভাস দিতে চান কয়েক ধাপ এগিয়ে, এবং শুধুমাত্র পরবর্তী মান নয়।

এর অর্থ এই নয় যে বৈশিষ্ট্যগুলি সম্পূর্ণরূপে অক্ষম৷ সেগুলিকে শুধুমাত্র নিম্নলিখিত কারণগুলির জন্য সতর্কতার সাথে ব্যবহার করা উচিত:

  1. অস্পষ্ট ভবিষ্যত কি বাস্তবমান এই বৈশিষ্ট্যগুলির জন্য হবে৷
  2. যদি বস্তুগুলি অনুমানযোগ্য হয় এবং কিছু প্যাটার্ন থাকে, তাহলে আপনি তাদের প্রতিটির জন্য একটি ভবিষ্যদ্বাণীমূলক মডেল তৈরি করতে পারেন৷

তবে, সচেতন থাকুন যে ভবিষ্যদ্বাণীমূলক মানগুলি বৈশিষ্ট্য হিসাবে ব্যবহার করলে লক্ষ্য ভেরিয়েবলের মধ্যে ত্রুটি ছড়িয়ে পড়বে এবং ত্রুটি বা পক্ষপাতদুষ্ট ভবিষ্যদ্বাণীর দিকে পরিচালিত করবে৷

টাইম সিরিজের উপাদান

সময় সিরিজের উপাদান
সময় সিরিজের উপাদান

প্রবণতা বিদ্যমান থাকে যখন সিরিজটি সময়ের সাথে সাথে বৃদ্ধি পায়, হ্রাস পায় বা একটি ধ্রুবক স্তরে থাকে, তাই এটি একটি ফাংশন হিসাবে নেওয়া হয়। সিজন্যালিটি বলতে একটি টাইম সিরিজের একটি বৈশিষ্ট্যকে বোঝায় যা পর্যায়ক্রমিক প্যাটার্নগুলি প্রদর্শন করে যা একটি ধ্রুবক ফ্রিকোয়েন্সি (m) এ পুনরাবৃত্তি হয়, উদাহরণস্বরূপ, m=12 মানে প্রতি বারো মাসে প্যাটার্ন পুনরাবৃত্তি হয়৷

ঋতুর অনুরূপ ডামি ভেরিয়েবল একটি বাইনারি ফাংশন হিসাবে যোগ করা যেতে পারে। আপনি উদাহরণস্বরূপ, ছুটির দিন, বিশেষ ইভেন্ট, বিপণন প্রচারাভিযান বিবেচনা করতে পারেন, মূল্য বিদেশী হোক বা না হোক। যাইহোক, আপনাকে মনে রাখতে হবে যে এই ভেরিয়েবলের অবশ্যই নির্দিষ্ট প্যাটার্ন থাকতে হবে। যাইহোক, ভবিষ্যতের সময়কালের জন্য দিনের সংখ্যা সহজেই গণনা করা যেতে পারে এবং সময় সিরিজের পূর্বাভাসকে প্রভাবিত করে, বিশেষ করে আর্থিক ক্ষেত্রে।

চক্র হল এমন ঋতু যা একটি নির্দিষ্ট হারে ঘটে না। উদাহরণস্বরূপ, কানাডা লিংক্সের বার্ষিক প্রজনন বৈশিষ্ট্যগুলি ঋতু এবং চক্রীয় নিদর্শনগুলিকে প্রতিফলিত করে। তারা নিয়মিত বিরতিতে পুনরাবৃত্তি করে না এবং কম্পাঙ্ক 1 (m=1) হলেও ঘটতে পারে।

পিছিয়ে থাকা মান -একটি ভেরিয়েবলের ল্যাগিং মান ভবিষ্যদ্বাণী হিসাবে অন্তর্ভুক্ত করা যেতে পারে। কিছু মডেল, যেমন ARIMA, ভেক্টর অটোরিগ্রেশন (VAR), বা অটোরিগ্রেসিভ নিউরাল নেটওয়ার্ক (NNAR), এইভাবে কাজ করে৷

আগ্রহের ভেরিয়েবলের উপাদানগুলি সময় সিরিজ বিশ্লেষণ এবং পূর্বাভাস দেওয়ার জন্য, তাদের আচরণ, নিদর্শনগুলি বোঝার জন্য এবং উপযুক্ত মডেল নির্বাচন করতে সক্ষম হওয়ার জন্য খুবই গুরুত্বপূর্ণ৷

ডেটা সেট বৈশিষ্ট্য

ডেটাসেট বৈশিষ্ট্য
ডেটাসেট বৈশিষ্ট্য

আপনি মেশিন লার্নিং মডেলগুলিতে হাজার হাজার, লক্ষ লক্ষ এবং বিলিয়ন ডেটা পয়েন্ট প্রবেশ করতে অভ্যস্ত হতে পারেন, তবে এটি টাইম সিরিজের জন্য প্রয়োজনীয় নয়। প্রকৃতপক্ষে, ভেরিয়েবলের ফ্রিকোয়েন্সি এবং প্রকারের উপর নির্ভর করে ছোট এবং মাঝারি টিএসের সাথে কাজ করা সম্ভব এবং এটি পদ্ধতির একটি অসুবিধা নয়। তাছাড়া, এই পদ্ধতির আসলে বেশ কিছু সুবিধা রয়েছে:

  1. এই ধরনের তথ্যের সেটগুলি বাড়ির কম্পিউটারের ক্ষমতার সাথে মিলে যাবে।
  2. কিছু ক্ষেত্রে, শুধুমাত্র একটি নমুনা নয়, সমগ্র ডেটা সেট ব্যবহার করে সময় সিরিজ বিশ্লেষণ এবং পূর্বাভাস সম্পাদন করুন৷
  3. TS দৈর্ঘ্য বিশ্লেষণ করা যায় এমন গ্রাফ তৈরি করার জন্য উপযোগী। এটি একটি অত্যন্ত গুরুত্বপূর্ণ বিষয় কারণ প্রোগ্রামাররা বিশ্লেষণ পর্বে গ্রাফিক্সের উপর নির্ভর করে। এর মানে এই নয় যে তারা বিশাল সময় সিরিজের সাথে কাজ করে না, তবে প্রাথমিকভাবে তাদের ছোট টিএস পরিচালনা করতে সক্ষম হওয়া উচিত।
  4. যেকোন ডেটাসেট যেটিতে একটি সময়-সম্পর্কিত ক্ষেত্র রয়েছে তা সময় সিরিজ বিশ্লেষণ এবং পূর্বাভাস থেকে উপকৃত হতে পারে। যাইহোক, যদি প্রোগ্রামারের কাছে ডেটার একটি বড় সেট থাকে, তবে DB (TSDB)আরো উপযুক্ত হতে পারে।

এই সেটগুলির মধ্যে কিছু টাইমস্ট্যাম্প, সিস্টেম লগ এবং আর্থিক ডেটা সহ রেকর্ড করা ইভেন্ট থেকে আসে। যেহেতু টিএসডিবি নেটিভভাবে টাইম সিরিজের সাথে কাজ করে, তাই এই কৌশলটি বড় আকারের ডেটাসেটে প্রয়োগ করার একটি দুর্দান্ত সুযোগ৷

মেশিন লার্নিং

মেশিন লার্নিং (ML) ঐতিহ্যগত সময় সিরিজের পূর্বাভাস পদ্ধতিকে ছাড়িয়ে যেতে পারে। TS ডেটার আরও ক্লাসিক পরিসংখ্যানের সাথে মেশিন লার্নিং পদ্ধতির তুলনা করার জন্য প্রচুর গবেষণা রয়েছে। নিউরাল নেটওয়ার্কগুলি এমন একটি প্রযুক্তি যা ব্যাপকভাবে গবেষণা করা হয়েছে এবং টিএস পদ্ধতি প্রয়োগ করে। মেশিন লার্নিং পদ্ধতি সময় সিরিজের উপর ভিত্তি করে ডেটা সংগ্রহের জন্য র‌্যাঙ্কিংয়ে নেতৃত্ব দেয়। এই সেটগুলি কার্যকর প্রমাণিত হয়েছে, M3 বা কাগলের বিরুদ্ধে বিশুদ্ধ TS সেটগুলিকে ছাড়িয়ে যাচ্ছে৷

MO এর নিজস্ব নির্দিষ্ট সমস্যা রয়েছে। একটি ডেটাসেট থেকে বৈশিষ্ট্যগুলি তৈরি করা বা নতুন ভবিষ্যদ্বাণী তৈরি করা এটির জন্য একটি গুরুত্বপূর্ণ পদক্ষেপ এবং কর্মক্ষমতার উপর একটি বিশাল প্রভাব ফেলতে পারে এবং TS ডেটার প্রবণতা এবং ঋতু সংক্রান্ত সমস্যাগুলি মোকাবেলার একটি প্রয়োজনীয় উপায় হতে পারে। এছাড়াও, কিছু মডেলের সমস্যা আছে যে তারা ডেটার সাথে কতটা মানানসই, এবং যদি তারা না করে, তাহলে তারা মূল প্রবণতা মিস করতে পারে৷

টাইম সিরিজ এবং মেশিন লার্নিং পদ্ধতি একে অপরের থেকে বিচ্ছিন্নভাবে বিদ্যমান থাকা উচিত নয়। প্রতিটি পদ্ধতির সুবিধা দিতে তারা একসাথে মিলিত হতে পারে। পূর্বাভাস পদ্ধতি এবং সময় সিরিজ বিশ্লেষণ প্রবণতা এবং মৌসুমী ডেটাতে ডেটা পচানোর একটি ভাল কাজ করে।উপাদান এই বিশ্লেষণটি তখন একটি এমএল মডেলের ইনপুট হিসাবে ব্যবহার করা যেতে পারে যার অ্যালগরিদমে ট্রেন্ডিং এবং ঋতু সংক্রান্ত তথ্য রয়েছে, যা উভয় বিশ্বের সেরা দেয়৷

সমস্যা বিবৃতি বোঝা

উদাহরণস্বরূপ, একটি নতুন উচ্চ-গতির রেল পরিষেবায় যাত্রীর সংখ্যা পূর্বাভাসের সাথে সম্পর্কিত TS বিবেচনা করুন। উদাহরণস্বরূপ, আপনার কাছে 2 বছরের ডেটা রয়েছে (আগস্ট 2016 - সেপ্টেম্বর 2018) এবং এই ডেটার সাহায্যে আপনাকে পরবর্তী 7 মাসের জন্য যাত্রীর সংখ্যা ভবিষ্যদ্বাণী করতে হবে, 2 বছরের ডেটা (2016-2018) প্রতি ঘণ্টায় ভ্রমণকারী যাত্রীর সংখ্যা, এবং ভবিষ্যতে তাদের সংখ্যা অনুমান করা প্রয়োজন৷

সময় সিরিজের সাথে পূর্বাভাসের জন্য ডেটাসেটের উপসেট:

  1. সিমুলেশনের জন্য একটি ট্রেন এবং পরীক্ষার ফাইল তৈরি করা হচ্ছে।
  2. প্রথম 14 মাস (আগস্ট 2016 - অক্টোবর 2017) প্রশিক্ষণ ডেটা হিসাবে ব্যবহার করা হয় এবং পরবর্তী 2 মাস (নভেম্বর 2017 - ডিসেম্বর 2017) হল পরীক্ষার ডেটা৷
  3. দৈনিক ভিত্তিতে ডেটাসেট একত্রিত করুন।
ডেটা সেট একত্রীকরণ
ডেটা সেট একত্রীকরণ

সময়ের সাথে এটি কীভাবে পরিবর্তিত হয় তা দেখতে ডেটা ভিজ্যুয়ালাইজেশন সম্পাদন করুন।

ডেটা ভিজ্যুয়ালাইজেশন
ডেটা ভিজ্যুয়ালাইজেশন

অনেক পদ্ধতি নির্মাণ পদ্ধতি

TS পূর্বাভাসের জন্য এই ক্ষেত্রে ব্যবহৃত লাইব্রেরি হল স্ট্যাটস মডেল। এই পন্থাগুলির যে কোনও একটি প্রয়োগ করার আগে এটি অবশ্যই ইনস্টল করা উচিত। সম্ভবত statsmodels ইতিমধ্যে পাইথন পরিবেশে ইনস্টল করা আছে, কিন্তু এটি পদ্ধতি সমর্থন করে নাভবিষ্যদ্বাণী, তাই আপনাকে এটি সংগ্রহস্থল থেকে ক্লোন করতে হবে এবং উত্স থেকে এটি ইনস্টল করতে হবে৷

সিকোয়েন্সিং
সিকোয়েন্সিং

এই উদাহরণের জন্য, এর অর্থ হল কয়েন ভ্রমণের মূল্য প্রথম থেকে এবং পুরো সময়কাল জুড়ে স্থিতিশীল। এই পদ্ধতিটি অনুমান করে যে পরবর্তী প্রত্যাশিত বিন্দুটি শেষ পর্যবেক্ষিত বিন্দুর সমান এবং একে বলা হয় নিষ্পাপ দৃষ্টিভঙ্গি।

নিষ্পাপ পদ্ধতি
নিষ্পাপ পদ্ধতি

এখন পরীক্ষার ডেটাসেটে মডেলের নির্ভুলতা পরীক্ষা করতে আদর্শ বিচ্যুতি গণনা করুন। RMSE মান এবং উপরের গ্রাফ থেকে, আমরা উপসংহারে আসতে পারি যে Naive উচ্চ অস্থিরতার বিকল্পগুলির জন্য উপযুক্ত নয়, তবে স্থিতিশীলগুলির জন্য ব্যবহৃত হয়৷

সরল মাঝারি শৈলী

পদ্ধতিটি প্রদর্শনের জন্য, একটি চার্ট আঁকা হয়, ধরে নেওয়া হয় যে Y-অক্ষ মূল্যকে প্রতিনিধিত্ব করে এবং X-অক্ষটি সময় (দিন) প্রতিনিধিত্ব করে।

সহজ মাঝারি শৈলী
সহজ মাঝারি শৈলী

এটি থেকে আমরা উপসংহারে আসতে পারি যে দাম সামান্য মার্জিনের সাথে এলোমেলোভাবে বাড়ে এবং হ্রাস পায়, যাতে গড় মান স্থির থাকে। এই ক্ষেত্রে, আপনি পরবর্তী সময়ের মূল্য পূর্বাভাস দিতে পারেন, যা বিগত সমস্ত দিনের গড় মূল্যের মতো।

আগে পর্যবেক্ষণ করা পয়েন্টগুলির প্রত্যাশিত গড় সহ পূর্বাভাস দেওয়ার এই পদ্ধতিটিকে সাধারণ গড় পদ্ধতি বলা হয়৷

এই ক্ষেত্রে, পূর্বে পরিচিত মানগুলি নেওয়া হয়, গড় গণনা করা হয় এবং পরবর্তী মান হিসাবে নেওয়া হয়। অবশ্যই, এটি সঠিক হবে না, তবে এটি বেশ কাছাকাছি, এবং এমন পরিস্থিতিতে রয়েছে যেখানে এই পদ্ধতিটি সবচেয়ে ভাল কাজ করে৷

সরল মাধ্যমপদ্ধতি
সরল মাধ্যমপদ্ধতি

গ্রাফে প্রদর্শিত ফলাফলের উপর ভিত্তি করে, এই পদ্ধতিটি সর্বোত্তম কাজ করে যখন প্রতিটি সময়ের মধ্যে গড় মান স্থির থাকে। যদিও সাদাসিধা পদ্ধতিটি গড় থেকে ভাল, তবে সমস্ত ডেটাসেটের জন্য নয়। প্রতিটি মডেলকে ধাপে ধাপে চেষ্টা করার পরামর্শ দেওয়া হয় এবং দেখুন এটি ফলাফলের উন্নতি করে কি না।

মুভিং এভারেজ মডেল

চলন্ত গড় মডেল
চলন্ত গড় মডেল

এই চার্টের উপর ভিত্তি করে, আমরা উপসংহারে পৌঁছাতে পারি যে দামগুলি অতীতে বেশ কয়েকবার বিস্তৃত ব্যবধানে বেড়েছে, কিন্তু এখন স্থিতিশীল। আগের গড় পদ্ধতি ব্যবহার করার জন্য, আপনাকে আগের সমস্ত ডেটার গড় নিতে হবে। প্রাথমিক সময়ের দাম পরবর্তী সময়ের পূর্বাভাসকে দৃঢ়ভাবে প্রভাবিত করবে। তাই, সাধারণ গড় থেকে উন্নতি হিসাবে, শুধুমাত্র শেষ কয়েক সময়ের দামের গড় নিন।

এই পূর্বাভাস কৌশলটিকে মুভিং এভারেজ কৌশল বলা হয়, কখনও কখনও এটিকে "n" আকারের "চলন্ত উইন্ডো" হিসাবে উল্লেখ করা হয়। একটি সাধারণ মডেল ব্যবহার করে, পদ্ধতির যথার্থতা পরীক্ষা করার জন্য TS-এর পরবর্তী মান ভবিষ্যদ্বাণী করা হয়। স্পষ্টতই সাদাসিধে এই ডেটাসেটের জন্য গড় এবং চলমান গড় উভয়কেই ছাড়িয়ে যায়৷

সরল সূচকীয় মসৃণকরণের পদ্ধতি দ্বারা পূর্বাভাসের একটি রূপ রয়েছে৷ চলমান গড় পদ্ধতিতে, অতীতের "n" পর্যবেক্ষণগুলি সমানভাবে ওজনযুক্ত। এই ক্ষেত্রে, আপনি এমন পরিস্থিতির সম্মুখীন হতে পারেন যেখানে অতীতের প্রতিটি 'n' তার নিজস্ব উপায়ে পূর্বাভাসকে প্রভাবিত করে। এই প্রকরণ, যা অতীতের পর্যবেক্ষণকে ভিন্নভাবে ওজন করে, তাকে পদ্ধতি বলা হয়ওজনযুক্ত চলমান গড়।

প্যাটার্নের এক্সট্রাপোলেশন

টাইম সিরিজ পূর্বাভাস অ্যালগরিদম বিবেচনা করার জন্য সবচেয়ে গুরুত্বপূর্ণ বৈশিষ্ট্যগুলির মধ্যে একটি হল প্রশিক্ষণ ডেটা ডোমেনের বাইরে প্যাটার্নগুলি এক্সট্রাপোলেট করার ক্ষমতা৷ অনেক ML অ্যালগরিদমের এই ক্ষমতা নেই কারণ তারা প্রশিক্ষণের ডেটা দ্বারা সংজ্ঞায়িত অঞ্চলের মধ্যে সীমাবদ্ধ থাকে। অতএব, তারা TS-এর জন্য উপযুক্ত নয়, যার উদ্দেশ্য হল ফলাফলকে ভবিষ্যতে প্রজেক্ট করা।

TS অ্যালগরিদমের আরেকটি গুরুত্বপূর্ণ বৈশিষ্ট্য হল আত্মবিশ্বাসের ব্যবধান পাওয়ার সম্ভাবনা। যদিও এটি টিএস মডেলের জন্য ডিফল্ট বৈশিষ্ট্য, বেশিরভাগ এমএল মডেলের এই ক্ষমতা নেই কারণ তারা সব পরিসংখ্যানগত বন্টনের উপর ভিত্তি করে নয়।

মনে করবেন না যে TS-এর পূর্বাভাস দিতে শুধুমাত্র সাধারণ পরিসংখ্যান পদ্ধতি ব্যবহার করা হয়। এটা একেবারেই ওই রকম না. অনেক জটিল পন্থা রয়েছে যা বিশেষ ক্ষেত্রে খুব কার্যকর হতে পারে। জেনারেলাইজড অটোরিগ্রেসিভ কন্ডিশনাল হেটেরোসেডেস্টিসিটি (GARCH), Bayesian এবং VAR এর মধ্যে কয়েকটি।

এছাড়াও নিউরাল নেটওয়ার্ক মডেল রয়েছে যা টাইম সিরিজে প্রয়োগ করা যেতে পারে যা ল্যাগিং ভবিষ্যদ্বাণী ব্যবহার করে এবং নিউরাল নেটওয়ার্ক অটোরিগ্রেশন (NNAR) এর মতো বৈশিষ্ট্যগুলি পরিচালনা করতে পারে। এমনকি জটিল শিক্ষা থেকে ধার করা টাইম সিরিজ মডেল রয়েছে, বিশেষ করে পুনরাবৃত্ত নিউরাল নেটওয়ার্ক পরিবারে, যেমন এলএসটিএম এবং জিআরইউ নেটওয়ার্ক।

আনুমানিক মেট্রিক্স এবং অবশিষ্ট ডায়াগনস্টিকস

সবচেয়ে সাধারণ ভবিষ্যদ্বাণী মেট্রিকগুলি হল৷rms মানে, যা অনেক লোক রিগ্রেশন সমস্যা সমাধান করার সময় ব্যবহার করে:

  • MAPE কারণ এটি স্কেল স্বাধীন এবং শতাংশ হিসাবে প্রকৃত মানের সাথে ত্রুটির অনুপাত উপস্থাপন করে;
  • MASE, যা দেখায় যে নির্বোধ গড় পূর্বাভাসের তুলনায় ভবিষ্যদ্বাণী কতটা ভালো পারফর্ম করছে৷

একবার একটি পূর্বাভাস পদ্ধতি অভিযোজিত হয়ে গেলে, এটি কতটা ভালভাবে মডেলগুলি ক্যাপচার করতে সক্ষম তা মূল্যায়ন করা গুরুত্বপূর্ণ৷ যদিও মূল্যায়নের পরিমাপগুলি প্রকৃত মানের সাথে মানগুলি কতটা কাছাকাছি তা নির্ধারণ করতে সহায়তা করে, তারা মডেলটি টিএসের সাথে খাপ খায় কিনা তা মূল্যায়ন করে না। অবশিষ্টাংশ এটি মূল্যায়ন করার একটি ভাল উপায়। যেহেতু প্রোগ্রামার টিএস প্যাটার্নগুলি প্রয়োগ করার চেষ্টা করছেন, তাই তিনি ত্রুটিগুলি "সাদা গোলমাল" এর মতো আচরণ করার আশা করতে পারেন কারণ তারা এমন কিছু উপস্থাপন করে যা মডেল দ্বারা ক্যাপচার করা যায় না৷

"হোয়াইট নয়েজ"-এর অবশ্যই নিম্নলিখিত বৈশিষ্ট্য থাকতে হবে:

  1. অসংলগ্ন অবশিষ্টাংশ (Acf=0)
  2. অবশিষ্টগুলি শূন্য গড় (নিরপেক্ষ) এবং ধ্রুবক পার্থক্য সহ একটি স্বাভাবিক বন্টন অনুসরণ করে৷
  3. যদি দুটি বৈশিষ্ট্যের যে কোনো একটি অনুপস্থিত থাকে, তাহলে মডেলটিতে উন্নতির সুযোগ রয়েছে।
  4. জিরো গড় সম্পত্তি টি-টেস্ট ব্যবহার করে সহজেই পরীক্ষা করা যেতে পারে।
  5. স্বাভাবিকতা এবং ধ্রুবক বৈচিত্র্যের বৈশিষ্ট্যগুলি অবশিষ্টাংশের একটি হিস্টোগ্রাম বা একটি উপযুক্ত ইউনিভেরিয়েট স্বাভাবিকতা পরীক্ষা ব্যবহার করে দৃশ্যত নিয়ন্ত্রিত হয়৷

আরিমা মডেল

ARIMA - অটোরিগ্রেসিভ ইন্টিগ্রেটেড মুভিং-অ্যাভারেজ মডেল, টিএস পূর্বাভাসে ব্যবহৃত সবচেয়ে জনপ্রিয় পদ্ধতিগুলির মধ্যে একটি, প্রধানতউচ্চ-মানের মডেল তৈরি করতে ডেটা স্বয়ংক্রিয় সম্পর্কের মাধ্যমে।

ARIMA সহগ মূল্যায়ন করার সময়, প্রধান অনুমান হল যে ডেটা স্থির। এর মানে হল প্রবণতা এবং ঋতুতা বৈচিত্রকে প্রভাবিত করতে পারে না। ভবিষ্যদ্বাণীকৃত মানগুলির সাথে প্রকৃত মানগুলির সময় প্লট তুলনা করে মডেলের গুণমান মূল্যায়ন করা যেতে পারে। যদি উভয় বক্ররেখা কাছাকাছি হয়, তাহলে অনুমান করা যেতে পারে যে মডেলটি বিশ্লেষণ করা ক্ষেত্রে ফিট করে। এটি যেকোনো প্রবণতা এবং ঋতুতা প্রকাশ করা উচিত, যদি থাকে।

অবশিষ্টাংশের বিশ্লেষণের পরে দেখানো উচিত যে মডেলটি মানানসই কিনা: এলোমেলো অবশিষ্টাংশ মানে এটি সঠিক। প্যারামিটার (0, 1, 1) সহ ARIMA ফিটিং করা সূচকীয় স্মুথিংয়ের মতো একই ফলাফল দেবে এবং প্যারামিটার (0, 2, 2) ব্যবহার করে দ্বিগুণ সূচকীয় স্মুথিং ফলাফল দেবে।

SQL সার্ভারে টাইম সিরিজ অ্যালগরিদম
SQL সার্ভারে টাইম সিরিজ অ্যালগরিদম

আপনি এক্সেলে ARIMA সেটিংস অ্যাক্সেস করতে পারেন:

  1. Excel শুরু করুন।
  2. টুলবারে XL MINER খুঁজুন।
  3. রিবনে, ড্রপ-ডাউন মেনু থেকে ARIMA নির্বাচন করুন।

আরিমা মডেল ক্ষমতার সারাংশ:

  1. ARIMA - অটোরিগ্রেসিভ ইন্টিগ্রেটেড মুভিং এভারেজ।
  2. সময় সিরিজ বিশ্লেষণে ব্যবহৃত পূর্বাভাস মডেল।
  3. ARIMA প্যারামিটার সিনট্যাক্স: ARIMA (p, d, q) যেখানে p=অটোরিগ্রেসিভ পদের সংখ্যা, d=ঋতুগত পার্থক্যের সংখ্যা এবং q=চলমান গড় পদের সংখ্যা।

এসকিউএল সার্ভারে অ্যালগরিদম

ক্রস প্রেডিকশন পারফর্ম করা গুরুত্বপূর্ণ একআর্থিক কাজ পূর্বাভাস সময় সিরিজের বৈশিষ্ট্য. যদি দুটি সম্পর্কিত সিরিজ ব্যবহার করা হয়, ফলাফলের মডেলটি অন্যদের আচরণের উপর ভিত্তি করে একটি সিরিজের ফলাফলের পূর্বাভাস দিতে ব্যবহার করা যেতে পারে।

SQL সার্ভার 2008-এ শেখার এবং ব্যবহার করার জন্য শক্তিশালী নতুন টাইম সিরিজ বৈশিষ্ট্য রয়েছে। টুলটিতে সহজেই অ্যাক্সেসযোগ্য TS ডেটা, অ্যালগরিদম ফাংশন অনুকরণ এবং পুনরুত্পাদনের জন্য একটি সহজে ব্যবহারযোগ্য ইন্টারফেস এবং সার্ভার-সাইড ডিএমএক্স প্রশ্নের লিঙ্ক সহ একটি ব্যাখ্যা উইন্ডো রয়েছে যাতে আপনি বুঝতে পারেন ভিতরে কী চলছে৷

মার্কেট টাইম সিরিজ হল একটি বিস্তৃত ক্ষেত্র যেখানে গভীর শিক্ষার মডেল এবং অ্যালগরিদম প্রয়োগ করা যেতে পারে। ব্যাঙ্ক, ব্রোকার এবং তহবিলগুলি এখন সূচক, বিনিময় হার, ফিউচার, ক্রিপ্টোকারেন্সি মূল্য, সরকারী স্টক এবং আরও অনেক কিছুর জন্য তাদের বিশ্লেষণ এবং পূর্বাভাস স্থাপনের সাথে পরীক্ষা করছে৷

সময় সিরিজের পূর্বাভাসে, নিউরাল নেটওয়ার্ক বাজারের কাঠামো এবং প্রবণতা অধ্যয়ন করে অনুমানযোগ্য প্যাটার্ন খুঁজে পায় এবং ব্যবসায়ীদের পরামর্শ দেয়। এই নেটওয়ার্কগুলি অপ্রত্যাশিত উচ্চ, নিম্ন, প্রবণতা পরিবর্তন এবং স্তরের পরিবর্তনের মতো অসঙ্গতিগুলি সনাক্ত করতে সহায়তা করতে পারে। আর্থিক পূর্বাভাসের জন্য অনেক কৃত্রিম বুদ্ধিমত্তা মডেল ব্যবহার করা হয়।

প্রস্তাবিত: