ফলাফল

সারণি 8.3a. রিগ্রেশন পরিসংখ্যান
রিগ্রেশন পরিসংখ্যান
একাধিক আর 0,998364
আর-বর্গক্ষেত্র 0,99673
স্বাভাবিকীকৃত R-বর্গক্ষেত্র 0,996321
মান ত্রুটি 0,42405
পর্যবেক্ষণ 10

চলুন প্রথমে সারণি 8.3a-এ উপস্থাপিত গণনার উপরের অংশটি দেখা যাক, রিগ্রেশন পরিসংখ্যান।

মান R-স্কয়ার, যাকে নিশ্চিততার পরিমাপও বলা হয়, ফলে রিগ্রেশন লাইনের গুণমানকে চিহ্নিত করে। এই গুণটি মূল ডেটা এবং রিগ্রেশন মডেল (গণনা করা ডেটা) এর মধ্যে চিঠিপত্রের ডিগ্রি দ্বারা প্রকাশ করা হয়। নিশ্চিততার পরিমাপ সর্বদা ব্যবধানের মধ্যে থাকে।

বেশিরভাগ ক্ষেত্রে, R-বর্গীয় মান এই মানের মধ্যে থাকে, যাকে চরম বলা হয়, অর্থাৎ শূন্য এবং একের মধ্যে।

যদি R-বর্গের মান একের কাছাকাছি হয়, তাহলে এর মানে হল যে নির্মিত মডেলটি সংশ্লিষ্ট ভেরিয়েবলের প্রায় সমস্ত পরিবর্তনশীলতা ব্যাখ্যা করে। বিপরীতভাবে, শূন্যের কাছাকাছি একটি R-স্কোয়ার মান মানে নির্মিত মডেলের নিম্নমানের।

আমাদের উদাহরণে, নিশ্চিততার পরিমাপ হল 0.99673, যা মূল ডেটাতে রিগ্রেশন লাইনের খুব ভাল ফিট নির্দেশ করে।

একাধিক আর- একাধিক পারস্পরিক সম্পর্ক R-এর সহগ - স্বাধীন ভেরিয়েবল (X) এবং নির্ভরশীল চলকের (Y) নির্ভরতার মাত্রা প্রকাশ করে।

একাধিক R সমান বর্গমূলনির্ণয়ের সহগ থেকে, এই মানটি শূন্য থেকে এক পর্যন্ত পরিসরে মান নেয়।

সরল রৈখিক রিগ্রেশন বিশ্লেষণে, একাধিক আর সহগ সমানপিয়ারসন পারস্পরিক সম্পর্ক। প্রকৃতপক্ষে, আমাদের ক্ষেত্রে একাধিক R পূর্ববর্তী উদাহরণ (0.998364) থেকে পিয়ারসন পারস্পরিক সম্পর্ক সহগের সমান।

সারণি 8.3b. রিগ্রেশন সহগ
মতভেদ মান ত্রুটি t-পরিসংখ্যান
Y- ছেদ 2,694545455 0,33176878 8,121757129
পরিবর্তনশীল X 1 2,305454545 0,04668634 49,38177965
* গণনার একটি ছোট সংস্করণ দেওয়া হয়েছে

এখন সারণি 8.3b এ উপস্থাপিত গণনার মাঝের অংশটি বিবেচনা করুন। এখানে, রিগ্রেশন সহগ b (2.305454545) এবং y-অক্ষ বরাবর অফসেট দেওয়া হয়েছে, যেমন ধ্রুবক a (2.694545455)।

গণনার উপর ভিত্তি করে, আমরা নিম্নরূপ রিগ্রেশন সমীকরণ লিখতে পারি:

Y= x*2.305454545+2.694545455

ভেরিয়েবলের মধ্যে সম্পর্কের দিকটি চিহ্নের (নেতিবাচক বা ইতিবাচক) উপর ভিত্তি করে নির্ধারিত হয় রিগ্রেশন সহগ(গুণ খ)।

যদি সাইন এ রিগ্রেশন সহগ- ধনাত্মক, স্বাধীনের সাথে নির্ভরশীল চলকের সম্পর্ক ধনাত্মক হবে। আমাদের ক্ষেত্রে, রিগ্রেশন সহগের চিহ্নটি ইতিবাচক, তাই সম্পর্কটিও ইতিবাচক।

যদি সাইন এ রিগ্রেশন সহগ- ঋণাত্মক, নির্ভরশীল চলক এবং স্বাধীন চলকের মধ্যে সম্পর্ক ঋণাত্মক (বিপরীত)।

সারণিতে 8.3c. অবশিষ্টাংশের আউটপুট ফলাফল উপস্থাপন করা হয়. রিপোর্টে এই ফলাফলগুলি দেখানোর জন্য, "রিগ্রেশন" টুল চালু করার সময় "অবশিষ্ট" চেকবক্স সক্রিয় করা প্রয়োজন।

অবশিষ্ট প্রত্যাহার

সারণি 8.3c. থেকে যায়
পর্যবেক্ষণ ভবিষ্যদ্বাণী Y থেকে যায় স্ট্যান্ডার্ড ব্যালেন্স
1 9,610909091 -0,610909091 -1,528044662
2 7,305454545 -0,305454545 -0,764022331
3 11,91636364 0,083636364 0,209196591
4 14,22181818 0,778181818 1,946437843
5 16,52727273 0,472727273 1,182415512
6 18,83272727 0,167272727 0,418393181
7 21,13818182 -0,138181818 -0,34562915
8 23,44363636 -0,043636364 -0,109146047
9 25,74909091 -0,149090909 -0,372915662
10 28,05454545 -0,254545455 -0,636685276

প্রতিবেদনের এই অংশটি ব্যবহার করে, আমরা নির্মিত রিগ্রেশন লাইন থেকে প্রতিটি বিন্দুর বিচ্যুতি দেখতে পারি। সর্বশ্রেষ্ঠ পরম মান

রিগ্রেশন বিশ্লেষণপরিমাপ করা ডেটা মডেলিং এবং তাদের বৈশিষ্ট্য অধ্যয়ন করার জন্য একটি পদ্ধতি। ডেটা মানগুলির জোড়া নিয়ে গঠিত নির্ভরশীল পরিবর্তনশীল(প্রতিক্রিয়া পরিবর্তনশীল) এবং স্বাধীন চলক(ভেরিয়েবলের ব্যাখ্যা)। রিগ্রেশন মডেল হল স্বাধীন ভেরিয়েবলের একটি ফাংশন এবং একটি যুক্ত র্যান্ডম ভেরিয়েবল সহ প্যারামিটার। মডেল প্যারামিটারগুলি এমনভাবে সুর করা হয়েছে যাতে মডেলটি সম্ভাব্য সর্বোত্তম উপায়ে ডেটা আনুমানিক করে। আনুমানিক মানের মানদণ্ড (উদ্দেশ্য ফাংশন) সাধারণত গড় বর্গক্ষেত্র ত্রুটি: মডেলের মানগুলির মধ্যে পার্থক্যের বর্গক্ষেত্রের সমষ্টি এবং একটি যুক্তি হিসাবে স্বাধীন ভেরিয়েবলের সমস্ত মানের জন্য নির্ভরশীল পরিবর্তনশীল। গাণিতিক পরিসংখ্যান এবং মেশিন লার্নিং এর রিগ্রেশন বিশ্লেষণ বিভাগ। এটা ধরে নেওয়া হয় যে নির্ভরশীল পরিবর্তনশীল হল কিছু মডেলের মান এবং একটি এলোমেলো ভেরিয়েবলের সমষ্টি। এই মানের বিতরণের প্রকৃতি সম্পর্কে, অনুমান করা হয়, যাকে ডেটা জেনারেশন হাইপোথিসিস বলা হয়। এই অনুমানকে নিশ্চিত বা খণ্ডন করার জন্য, পরিসংখ্যানগত পরীক্ষা করা হয়, যাকে বলা হয় অবশিষ্ট বিশ্লেষণ। এটি অনুমান করে যে স্বাধীন পরিবর্তনশীলটিতে ত্রুটি নেই। রিগ্রেশন বিশ্লেষণ পূর্বাভাস, সময় সিরিজ বিশ্লেষণ, হাইপোথিসিস পরীক্ষা এবং ডেটাতে লুকানো সম্পর্ক আবিষ্কারের জন্য ব্যবহৃত হয়।

রিগ্রেশন বিশ্লেষণের সংজ্ঞা

নমুনা একটি ফাংশন নাও হতে পারে, কিন্তু একটি সম্পর্ক. উদাহরণস্বরূপ, একটি রিগ্রেশন তৈরির জন্য ডেটা হতে পারে: . এই ধরনের নমুনায়, ভেরিয়েবলের একটি মান ভেরিয়েবলের বেশ কয়েকটি মানের সাথে মিলে যায়।

লিনিয়ার রিগ্রেশন

লিনিয়ার রিগ্রেশনঅনুমান করে যে ফাংশনটি রৈখিকভাবে পরামিতিগুলির উপর নির্ভর করে। এই ক্ষেত্রে, মুক্ত ভেরিয়েবলের উপর একটি রৈখিক নির্ভরতা ঐচ্ছিক,

ক্ষেত্রে যেখানে লিনিয়ার রিগ্রেশন ফাংশন ফর্ম আছে

এখানে ভেক্টরের উপাদান রয়েছে।

লিনিয়ার রিগ্রেশনের ক্ষেত্রে প্যারামিটারের মানগুলি সর্বনিম্ন বর্গ পদ্ধতি ব্যবহার করে পাওয়া যায়। এই পদ্ধতির ব্যবহার একটি র্যান্ডম ভেরিয়েবলের একটি গাউসিয়ান ডিস্ট্রিবিউশন অনুমান দ্বারা ন্যায্য।

নির্ভরশীল ভেরিয়েবলের প্রকৃত মান এবং পুনর্গঠিত মানগুলির মধ্যে পার্থক্য বলা হয় রিগ্রেশন অবশিষ্টাংশ(অবশিষ্ট)। সাহিত্যে সমার্থক শব্দও ব্যবহৃত হয়: অবশিষ্টাংশএবং ভুল. প্রাপ্ত নির্ভরতার গুণমানের মাপকাঠির একটি গুরুত্বপূর্ণ অনুমান হল অবশিষ্টাংশের বর্গক্ষেত্রের সমষ্টি:

এখানে বর্গাকার ত্রুটির সমষ্টি।

অবশিষ্টাংশের বৈচিত্র্য সূত্র দ্বারা গণনা করা হয়

এখানে স্কয়ার ত্রুটি বোঝায়।

গ্রাফগুলি নীল বিন্দু দিয়ে চিহ্নিত নমুনাগুলি এবং কঠিন রেখা দিয়ে চিহ্নিত রিগ্রেশন নির্ভরতা দেখায়। মুক্ত ভেরিয়েবলটি অ্যাবসিসা বরাবর প্লট করা হয় এবং নির্ভরশীল ভেরিয়েবলটি অর্ডিনেট বরাবর প্লট করা হয়। তিনটি নির্ভরতাই পরামিতির ক্ষেত্রে রৈখিক।

অরৈখিক রিগ্রেশন

ননলাইনার রিগ্রেশন মডেল - মডেল দেখুন

যা হিসাবে উপস্থাপন করা যায় না বিন্দু পণ্য

যেখানে - রিগ্রেশন মডেলের প্যারামিটার, - স্থান থেকে মুক্ত পরিবর্তনশীল , - নির্ভরশীল পরিবর্তনশীল, - এলোমেলো মানএবং কিছু নির্দিষ্ট সেট থেকে একটি ফাংশন।

নন-লিনিয়ার রিগ্রেশনের ক্ষেত্রে প্যারামিটার মানগুলি গ্রেডিয়েন্ট ডিসেন্ট পদ্ধতিগুলির একটি ব্যবহার করে পাওয়া যায়, উদাহরণস্বরূপ, লেভেনবার্গ-মার্কোয়ার্ড অ্যালগরিদম।

শর্তাবলী সম্পর্কে

"রিগ্রেশন" শব্দটি 19 শতকের শেষের দিকে ফ্রান্সিস গাল্টন দ্বারা তৈরি করা হয়েছিল। গ্যাল্টন দেখতে পান যে লম্বা বা খাটো বাবা-মায়ের সন্তানরা সাধারণত অসামান্য উচ্চতার উত্তরাধিকারী হয় না এবং এই ঘটনাটিকে "মাঝারিতার দিকে রিগ্রেশন" বলে অভিহিত করে। প্রথমে, শব্দটি জৈবিক অর্থে একচেটিয়াভাবে ব্যবহৃত হত। কার্ল পিয়ারসনের কাজের পরে, এই শব্দটি পরিসংখ্যানে ব্যবহৃত হতে শুরু করে।

পরিসংখ্যান সাহিত্যে, একটি মুক্ত পরিবর্তনশীল এবং বেশ কয়েকটি মুক্ত চলক সহ রিগ্রেশনের মধ্যে একটি পার্থক্য তৈরি করা হয় একমাত্রিকএবং বহুমাত্রিকরিগ্রেশন এটা ধরে নেওয়া হয় যে আমরা বেশ কিছু ফ্রি ভেরিয়েবল ব্যবহার করি, অর্থাৎ একটি ফ্রি ভেরিয়েবল একটি ভেক্টর। বিশেষ ক্ষেত্রে, যখন মুক্ত চলকটি একটি স্কেলার হয়, তখন এটি দ্বারা চিহ্নিত করা হবে। পার্থক্য করা রৈখিকএবং অরৈখিকরিগ্রেশন যদি রিগ্রেশন মডেলটি প্যারামিটারের ফাংশনগুলির একটি রৈখিক সংমিশ্রণ না হয়, তবে কেউ একটি নন-লিনিয়ার রিগ্রেশনের কথা বলে। এই ক্ষেত্রে, মডেলটি একটি নির্দিষ্ট সেট থেকে ফাংশনগুলির একটি নির্বিচারে সুপারপজিশন হতে পারে। অ-রৈখিক মডেলগুলি সূচকীয়, ত্রিকোণমিতিক এবং অন্যান্য (উদাহরণস্বরূপ, রেডিয়াল বেস ফাংশন বা রোজেনব্ল্যাট পারসেপ্ট্রন), যা অনুমান করে যে প্যারামিটার এবং নির্ভরশীল পরিবর্তনশীলের মধ্যে সম্পর্ক অ-রৈখিক।

পার্থক্য করা প্যারামেট্রিকএবং ননপ্যারামেট্রিকরিগ্রেশন এই দুই ধরনের রিগ্রেশনের মধ্যে একটি তীক্ষ্ণ রেখা আঁকা কঠিন। বর্তমানে, এক ধরণের মডেলকে অন্য থেকে আলাদা করার জন্য কোন সাধারণভাবে গৃহীত মানদণ্ড নেই। উদাহরণস্বরূপ, রৈখিক মডেলগুলিকে প্যারামেট্রিক হিসাবে বিবেচনা করা হয়, যেখানে মুক্ত ভেরিয়েবলের স্থানের উপর নির্ভরশীল ভেরিয়েবলের গড় জড়িত মডেলগুলিকে অ-প্যারামেট্রিক হিসাবে বিবেচনা করা হয়। একটি প্যারামেট্রিক রিগ্রেশন মডেলের একটি উদাহরণ: রৈখিক ভবিষ্যদ্বাণীকারী, মাল্টিলেয়ার পারসেপ্টরন। মিশ্র রিগ্রেশন মডেলের উদাহরণ: রেডিয়াল বেসিস ফাংশন। কিছু প্রস্থের একটি উইন্ডোতে ননপ্যারামেট্রিক মডেল মুভিং এভারেজ। সাধারণভাবে, ননপ্যারামেট্রিক রিগ্রেশন প্যারামেট্রিক রিগ্রেশন থেকে আলাদা যে নির্ভরশীল ভেরিয়েবলটি মুক্ত ভেরিয়েবলের একটি মানের উপর নির্ভর করে না, তবে এই মানের কিছু প্রদত্ত প্রতিবেশের উপর নির্ভর করে।

পদগুলির মধ্যে একটি পার্থক্য রয়েছে: "ফাংশন অ্যাপ্রোক্সিমেশন", "অ্যাপ্রক্সিমেশন", "ইনটারপোলেশন" এবং "রিগ্রেশন"। এটা নিম্নলিখিত গঠিত.

ফাংশন আনুমানিক.একটি পৃথক বা অবিচ্ছিন্ন যুক্তির একটি ফাংশন দেওয়া হয়। কিছু প্যারামেট্রিক পরিবার থেকে একটি ফাংশন খুঁজে বের করতে হবে, উদাহরণস্বরূপ, বীজগণিতীয় বহুপদগুলির মধ্যে প্রদত্ত ডিগ্রী. ফাংশন প্যারামিটারগুলিকে অবশ্যই ন্যূনতম কিছু কার্যকারিতা প্রদান করতে হবে, উদাহরণস্বরূপ,

মেয়াদ অনুমান"ফাংশনের আনুমানিকতা" শব্দটির একটি প্রতিশব্দ। আরো প্রায়ই ব্যবহৃত যখন আমরা কথা বলছিএকটি পৃথক যুক্তি একটি ফাংশন হিসাবে একটি প্রদত্ত ফাংশন সম্পর্কে. এখানে এমন একটি ফাংশন খুঁজে বের করতে হবে যা প্রদত্ত ফাংশনের সমস্ত পয়েন্টের কাছাকাছি যায়। এটি ধারণাটি প্রবর্তন করে অবশিষ্টাংশএকটি অবিচ্ছিন্ন ফাংশনের বিন্দু এবং একটি পৃথক যুক্তির একটি ফাংশনের সংশ্লিষ্ট বিন্দুর মধ্যে দূরত্ব।

ইন্টারপোলেশনআনুমানিক সমস্যার একটি বিশেষ ক্ষেত্রে কাজ করে, যখন এটি প্রয়োজন হয় যে নির্দিষ্ট পয়েন্টে, বলা হয় ইন্টারপোলেশন নোডফাংশনের মান এবং এটির আনুমানিক ফাংশন মিলে গেছে। আরও সাধারণ ক্ষেত্রে, ডেরিভেটিভের কিছু ডেরিভেটিভের মানগুলির উপর বিধিনিষেধ আরোপ করা হয়। যে, একটি পৃথক যুক্তি একটি ফাংশন দেওয়া হয়. এটি এমন একটি ফাংশন খুঁজে বের করতে হবে যা সমস্ত পয়েন্টের মধ্য দিয়ে যায়। এই ক্ষেত্রে, মেট্রিক সাধারণত ব্যবহার করা হয় না, তবে পছন্দসই ফাংশনের "মসৃণতা" ধারণাটি প্রায়শই চালু করা হয়।

রিগ্রেশন বিশ্লেষণের লক্ষ্য হল একটি নির্ভরশীল ভেরিয়েবল এবং একটি (পেয়ারওয়াইজ রিগ্রেশন অ্যানালাইসিস) বা একাধিক (একাধিক) স্বাধীন ভেরিয়েবলের মধ্যে সম্পর্ক পরিমাপ করা। স্বাধীন ভেরিয়েবলকে ফ্যাক্টরিয়াল, ব্যাখ্যামূলক, নির্ধারক, রিগ্রেসার এবং ভবিষ্যদ্বাণীও বলা হয়।

নির্ভরশীল পরিবর্তনশীলকে কখনও কখনও সংজ্ঞায়িত, ব্যাখ্যা করা বা "প্রতিক্রিয়া" ভেরিয়েবল হিসাবে উল্লেখ করা হয়। অভিজ্ঞতামূলক গবেষণায় রিগ্রেশন বিশ্লেষণের অত্যন্ত ব্যাপক ব্যবহার শুধুমাত্র এই কারণেই নয় যে এটি হাইপোথিসিস পরীক্ষা করার জন্য একটি সুবিধাজনক হাতিয়ার। রিগ্রেশন, বিশেষ করে একাধিক রিগ্রেশন হল কার্যকর পদ্ধতিমডেলিং এবং পূর্বাভাস।

চলুন শুরু করা যাক রিগ্রেশন এনালাইসিসের সাথে কাজ করার নীতিগুলিকে একটি সহজ-এর সাথে ব্যাখ্যা করা - জোড়া পদ্ধতি।

পেয়ারওয়াইজ রিগ্রেশন বিশ্লেষণ

রিগ্রেশন বিশ্লেষণ ব্যবহার করার সময় প্রথম পদক্ষেপগুলি সম্পর্কের সহগ গণনার কাঠামোতে আমাদের দ্বারা নেওয়া প্রায় একই রকম হবে। পিয়ারসন পদ্ধতি অনুসারে পারস্পরিক সম্পর্ক বিশ্লেষণের কার্যকারিতার তিনটি প্রধান শর্ত হল ভেরিয়েবলের স্বাভাবিক বন্টন, ভেরিয়েবলের ব্যবধান পরিমাপ, রৈখিক সংযোগভেরিয়েবলের মধ্যে একাধিক রিগ্রেশনের জন্যও প্রাসঙ্গিক। তদনুসারে, প্রথম পর্যায়ে, স্ক্যাটারপ্লটগুলি তৈরি করা হয়, ভেরিয়েবলগুলির একটি পরিসংখ্যানগত এবং বর্ণনামূলক বিশ্লেষণ করা হয় এবং একটি রিগ্রেশন লাইন গণনা করা হয়। পারস্পরিক সম্পর্ক বিশ্লেষণের কাঠামোর মতো, সর্বনিম্ন স্কোয়ার পদ্ধতি ব্যবহার করে রিগ্রেশন লাইন তৈরি করা হয়।

ডেটা বিশ্লেষণের দুটি পদ্ধতির মধ্যে পার্থক্য আরও স্পষ্টভাবে বোঝাতে, আসুন "এসপিএস সমর্থন" এবং "গ্রামীণ জনসংখ্যা ভাগ" ভেরিয়েবলগুলির সাথে ইতিমধ্যে বিবেচিত উদাহরণের দিকে ফিরে আসা যাক। মূল তথ্য অভিন্ন. স্ক্যাটারপ্লটগুলির মধ্যে পার্থক্যটি হবে যে রিগ্রেশন বিশ্লেষণে নির্ভরশীল ভেরিয়েবল প্লট করা সঠিক - আমাদের ক্ষেত্রে, Y অক্ষ বরাবর "এসপিএস সমর্থন", যখন পারস্পরিক সম্পর্ক বিশ্লেষণে এটি কোন ব্যাপার নয়। আউটলিয়ারগুলি পরিষ্কার করার পরে, স্ক্যাটারপ্লটটি এর মতো দেখায়:

রিগ্রেশন বিশ্লেষণের মৌলিক ধারণা হল, ভেরিয়েবলের জন্য একটি সাধারণ প্রবণতা থাকা - একটি রিগ্রেশন লাইনের আকারে - আপনি নির্ভরশীল ভেরিয়েবলের মান ভবিষ্যদ্বাণী করতে পারেন, স্বাধীনের মান রয়েছে।

সাধারণ গাণিতিক কল্পনা করুন লিনিয়ার ফাংশন. ইউক্লিডীয় স্থানের যে কোনো রেখা সূত্র দ্বারা বর্ণনা করা যেতে পারে:

যেখানে a একটি ধ্রুবক যা y-অক্ষ বরাবর অফসেট নির্দিষ্ট করে; b - সহগ যা রেখার কোণ নির্ধারণ করে।

ঢাল এবং ধ্রুবক জেনে, আপনি যে কোনো x এর জন্য y-এর মান গণনা (ভবিষ্যদ্বাণী) করতে পারেন।

এই সহজ ফাংশনটি সতর্কতা সহ রিগ্রেশন বিশ্লেষণ মডেলের ভিত্তি তৈরি করেছে যে আমরা y এর মান ঠিক না, তবে একটি নির্দিষ্ট আত্মবিশ্বাসের ব্যবধানের মধ্যে, যেমন আন্দাজ.

ধ্রুবক হল রিগ্রেশন লাইন এবং y-অক্ষের ছেদ বিন্দু (F-ইন্টারসেপ্ট, সাধারণত পরিসংখ্যানগত প্যাকেজে "ইন্টারসেপ্টর" হিসাবে উল্লেখ করা হয়)। SPS-এর জন্য ভোট দেওয়ার আমাদের উদাহরণে, এর বৃত্তাকার মান হবে 10.55। ঢাল সহগ b প্রায় -0.1 এর সমান হবে (যেমন পারস্পরিক সম্পর্ক বিশ্লেষণে, চিহ্নটি সম্পর্কের ধরন দেখায় - প্রত্যক্ষ বা বিপরীত)। সুতরাং, ফলস্বরূপ মডেলটি SP C = -0.1 x Sel এর মত দেখাবে। আমাদের. + 10.55।

সুতরাং, 47% গ্রামীণ জনসংখ্যার একটি অংশ সহ "অ্যাডিজিয়া প্রজাতন্ত্র" এর ক্ষেত্রে, পূর্বাভাসিত মান হবে 5.63:

ATP \u003d -0.10 x 47 + 10.55 \u003d 5.63।

মূল এবং ভবিষ্যদ্বাণীকৃত মানের মধ্যে পার্থক্যটিকে অবশিষ্টাংশ বলা হয় (আমরা ইতিমধ্যে এই শব্দটির সম্মুখীন হয়েছি - পরিসংখ্যানের জন্য মৌলিক - যখন আকস্মিক সারণী বিশ্লেষণ করার সময়)। সুতরাং, Adygea প্রজাতন্ত্রের ক্ষেত্রে, অবশিষ্ট হবে 3.92 - 5.63 = -1.71৷ অবশিষ্টাংশের মডুলো মান যত বড় হবে, মানটির পূর্বাভাস তত কম হবে।

আমরা সমস্ত ক্ষেত্রে পূর্বাভাসিত মান এবং অবশিষ্টাংশ গণনা করি:
ঘটছে শনি. আমাদের. ধন্যবাদ

(মূল)

ধন্যবাদ

(ভবিষ্যদ্বাণী করা)

থেকে যায়
Adygea প্রজাতন্ত্র 47 3,92 5,63 -1,71 -
আলতাই প্রজাতন্ত্র 76 5,4 2,59 2,81
বাশকোর্তোস্তান প্রজাতন্ত্র 36 6,04 6,78 -0,74
বুরিয়াটিয়া প্রজাতন্ত্র 41 8,36 6,25 2,11
দাগেস্তান প্রজাতন্ত্র 59 1,22 4,37 -3,15
ইঙ্গুশেটিয়া প্রজাতন্ত্র 59 0,38 4,37 3,99
ইত্যাদি।

প্রাথমিক এবং ভবিষ্যদ্বাণীকৃত মানগুলির অনুপাতের বিশ্লেষণ ফলাফলের মডেলের গুণমান, এর ভবিষ্যদ্বাণী করার ক্ষমতা মূল্যায়ন করতে কাজ করে। রিগ্রেশন পরিসংখ্যানের প্রধান সূচকগুলির মধ্যে একটি হল একাধিক পারস্পরিক সম্পর্ক সহগ R - নির্ভরশীল পরিবর্তনশীলের মূল এবং পূর্বাভাসিত মানের মধ্যে পারস্পরিক সম্পর্ক সহগ। পেয়ারড রিগ্রেশন বিশ্লেষণে, এটি নির্ভরশীল এবং স্বাধীন ভেরিয়েবলের মধ্যে সাধারণ পিয়ারসন পারস্পরিক সম্পর্ক সহগের সমান, আমাদের ক্ষেত্রে - 0.63। মাল্টিপল R কে অর্থপূর্ণভাবে ব্যাখ্যা করার জন্য, এটিকে সংকল্পের সহগ-এ রূপান্তর করতে হবে। এটি পারস্পরিক সম্পর্ক বিশ্লেষণের মতো একইভাবে করা হয় - স্কোয়ারিং। নির্ণয়ের সহগ R- বর্গক্ষেত্র (R 2) স্বাধীন (স্বাধীন) ভেরিয়েবল দ্বারা ব্যাখ্যা করা নির্ভরশীল ভেরিয়েবলের পরিবর্তনের অনুপাত দেখায়।

আমাদের ক্ষেত্রে, R 2 = 0.39 (0.63 2); এর মানে হল যে পরিবর্তনশীল "গ্রামীণ জনসংখ্যার অনুপাত" পরিবর্তনশীল "সিপিএসের জন্য সমর্থন" এর প্রায় 40% পরিবর্তনকে ব্যাখ্যা করে। নির্ণয়ের সহগের মান যত বড় হবে, মডেলের গুণমান তত বেশি।

মডেলের মানের আরেকটি পরিমাপ হল অনুমানের স্ট্যান্ডার্ড ত্রুটি। এটি রিগ্রেশন লাইনের চারপাশে বিন্দুগুলি কতটা "বিক্ষিপ্ত" হয় তার একটি পরিমাপ। ব্যবধান ভেরিয়েবলের জন্য বিচ্ছুরণের পরিমাপ হল আদর্শ বিচ্যুতি। তদনুসারে, অনুমানের প্রমিত ত্রুটি হল অবশিষ্টাংশের বিতরণের মানক বিচ্যুতি। এর মান যত বেশি, স্প্রেড তত বেশি এবং মডেল তত খারাপ। আমাদের ক্ষেত্রে, স্ট্যান্ডার্ড ত্রুটি হল 2.18। ভেরিয়েবল "এসপিএস সমর্থন" এর মান ভবিষ্যদ্বাণী করার সময় এই পরিমাণে আমাদের মডেল "গড়ে ভুল" করবে।

রিগ্রেশন পরিসংখ্যান এছাড়াও প্রকরণ বিশ্লেষণ অন্তর্ভুক্ত. এর সাহায্যে, আমরা খুঁজে পাই: 1) নির্ভরশীল চলকের পরিবর্তনের (বিচ্ছুরণ) কোন অনুপাত স্বাধীন চলক দ্বারা ব্যাখ্যা করা হয়েছে; 2) নির্ভরশীল ভেরিয়েবলের পরিবর্তনের কি অনুপাত অবশিষ্টাংশ (অব্যক্ত অংশ) দ্বারা হিসাব করা হয়; 3) এই দুটি মানের অনুপাত কত (/ "-অনুপাত)। নমুনা অধ্যয়নের জন্য বৈচিত্র্যের পরিসংখ্যান বিশেষভাবে গুরুত্বপূর্ণ - এটি দেখায় যে এটিতে স্বাধীন এবং নির্ভরশীল ভেরিয়েবলের মধ্যে একটি সম্পর্ক থাকার সম্ভাবনা কতটা সম্ভব। জনসংখ্যা. যাইহোক, এমনকি ক্রমাগত অধ্যয়নের জন্য (আমাদের উদাহরণ হিসাবে), বৈকল্পিক বিশ্লেষণের ফলাফলগুলি অধ্যয়ন করা কার্যকর নয়। এই ক্ষেত্রে, এটি পরীক্ষা করা হয় যে প্রকাশিত পরিসংখ্যানগত নিয়মিততা র্যান্ডম পরিস্থিতির সংমিশ্রণ দ্বারা সৃষ্ট হয় কিনা, অধ্যয়নের অধীনে জনসংখ্যার অবস্থানের অবস্থার সেটের জন্য এটি কতটা বৈশিষ্ট্যযুক্ত, যেমন এটি কিছু বৃহত্তর সাধারণ জনসংখ্যার জন্য প্রাপ্ত ফলাফলের সত্য নয় যা প্রতিষ্ঠিত হয়েছে, তবে এর নিয়মিততার মাত্রা, এলোমেলো প্রভাব থেকে মুক্তি।

আমাদের ক্ষেত্রে, বৈচিত্র্য পরিসংখ্যানের বিশ্লেষণ নিম্নরূপ:

এসএস df মাইক্রোসফট অর্থ
প্রত্যাবর্তন। 258,77 1,00 258,77 54,29 0.000000001
অবশিষ্ট 395,59 83,00 এল,১১
মোট 654,36

0.0000000001 স্তরে 54.29 এর F-অনুপাত উল্লেখযোগ্য। তদনুসারে, আমরা নিরাপদে শূন্য অনুমানকে প্রত্যাখ্যান করতে পারি (যে সম্পর্কটি আমরা খুঁজে পেয়েছি এলোমেলো)।

একটি অনুরূপ ফাংশন টি মানদণ্ড দ্বারা সঞ্চালিত হয়, কিন্তু রিগ্রেশন সহগ (কৌণিক এবং F-ক্রসিং) এর ক্ষেত্রে। মানদণ্ড / ব্যবহার করে, আমরা অনুমান পরীক্ষা করি যে সাধারণ জনসংখ্যার রিগ্রেশন সহগ শূন্যের সমান। আমাদের ক্ষেত্রে, আমরা আবার আত্মবিশ্বাসের সাথে শূন্য হাইপোথিসিস প্রত্যাখ্যান করতে পারি।

একাধিক রিগ্রেশন বিশ্লেষণ

মাল্টিপল রিগ্রেশন মডেল প্রায় পেয়ারওয়াইজ রিগ্রেশন মডেলের অনুরূপ; শুধুমাত্র পার্থক্য হল যে কয়েকটি স্বাধীন ভেরিয়েবল ক্রমিকভাবে লিনিয়ার ফাংশনে অন্তর্ভুক্ত করা হয়েছে:

Y = b1X1 + b2X2 + …+ bpXp + a.

যদি দুটির বেশি স্বাধীন ভেরিয়েবল থাকে, আমরা তাদের সম্পর্কের একটি চাক্ষুষ উপস্থাপনা পেতে সক্ষম নই; এই বিষয়ে, একাধিক রিগ্রেশন জোড়া রিগ্রেশনের চেয়ে কম "দৃশ্যমান"। যখন দুটি স্বাধীন ভেরিয়েবল থাকে, তখন এটি একটি 3D স্ক্যাটারপ্লটে ডেটা প্রদর্শন করতে উপযোগী হতে পারে। পেশাদার পরিসংখ্যানগত সফ্টওয়্যার প্যাকেজগুলিতে (উদাহরণস্বরূপ, স্ট্যাটিসটিকা) একটি ত্রিমাত্রিক চার্ট ঘোরানোর বিকল্প রয়েছে, যা ডেটা কাঠামোর একটি ভাল ভিজ্যুয়াল উপস্থাপনা করতে দেয়।

একাধিক রিগ্রেশনের সাথে কাজ করার সময়, জোড়া রিগ্রেশনের বিপরীতে, বিশ্লেষণ অ্যালগরিদম নির্ধারণ করা প্রয়োজন। স্ট্যান্ডার্ড অ্যালগরিদম চূড়ান্ত রিগ্রেশন মডেলের সমস্ত উপলব্ধ ভবিষ্যদ্বাণী অন্তর্ভুক্ত করে। ধাপে ধাপে অ্যালগরিদম তাদের ব্যাখ্যামূলক "ওজন" এর উপর ভিত্তি করে স্বাধীন ভেরিয়েবলের অনুক্রমিক অন্তর্ভুক্তি (বর্জন) অনুমান করে। ধাপে ধাপে পদ্ধতিঅনেক স্বাধীন ভেরিয়েবল থাকলে ভাল; এটি স্পষ্টভাবে দুর্বল ভবিষ্যদ্বাণীকারীদের মডেলটিকে "পরিষ্কার" করে, এটিকে আরও কম্প্যাক্ট এবং সংক্ষিপ্ত করে তোলে।

একাধিক রিগ্রেশনের সঠিকতার জন্য একটি অতিরিক্ত শর্ত (ব্যবধান, স্বাভাবিকতা এবং রৈখিকতা সহ) হল মাল্টিকোলিনিয়ারিটির অনুপস্থিতি - স্বাধীন ভেরিয়েবলের মধ্যে শক্তিশালী পারস্পরিক সম্পর্কের উপস্থিতি।

একাধিক রিগ্রেশন পরিসংখ্যানের ব্যাখ্যায় আমরা পেয়ারওয়াইজ রিগ্রেশনের ক্ষেত্রে বিবেচনা করেছি এমন সমস্ত উপাদান অন্তর্ভুক্ত করে। এছাড়াও, একাধিক রিগ্রেশন বিশ্লেষণের পরিসংখ্যানে অন্যান্য গুরুত্বপূর্ণ উপাদান রয়েছে।

আমরা রাশিয়ার অঞ্চলগুলিতে নির্বাচনী কার্যকলাপের স্তরের পার্থক্য ব্যাখ্যা করে এমন অনুমানের পরীক্ষার উদাহরণে একাধিক রিগ্রেশন সহ কাজটি চিত্রিত করব। সুনির্দিষ্ট অভিজ্ঞতামূলক গবেষণায় পরামর্শ দেওয়া হয়েছে যে ভোটারদের ভোটদান প্রভাবিত হয়:

ন্যাশনাল ফ্যাক্টর (ভেরিয়েবল "রাশিয়ান জনসংখ্যা"; রাশিয়ান ফেডারেশনের উপাদান সত্তাগুলিতে রাশিয়ান জনসংখ্যার ভাগ হিসাবে কার্যকর)। এটা অনুমান করা হয় যে রাশিয়ান জনসংখ্যার অনুপাত বৃদ্ধির ফলে ভোটার উপস্থিতি হ্রাস পায়;

নগরায়ন ফ্যাক্টর (পরিবর্তনশীল "শহুরে জনসংখ্যা"; রাশিয়ান ফেডারেশনের গঠনমূলক সত্তায় শহুরে জনসংখ্যার ভাগ হিসাবে কার্যকর, আমরা ইতিমধ্যে পারস্পরিক সম্পর্ক বিশ্লেষণের অংশ হিসাবে এই ফ্যাক্টরটির সাথে কাজ করেছি)। ধারণা করা হয় যে শহুরে জনসংখ্যার অনুপাত বৃদ্ধির ফলেও ভোটার উপস্থিতি হ্রাস পায়।

নির্ভরশীল পরিবর্তনশীল - "নির্বাচনী কার্যকলাপের তীব্রতা" ("সক্রিয়") 1995 থেকে 2003 সাল পর্যন্ত ফেডারেল নির্বাচনে অঞ্চলগুলির জন্য গড় ভোটের ডেটার মাধ্যমে কার্যকর করা হয়৷ দুটি স্বাধীন এবং একটি নির্ভরশীল ভেরিয়েবলের প্রাথমিক ডেটা টেবিলের নিম্নলিখিত ফর্ম থাকবে :

ঘটছে ভেরিয়েবল
সম্পদ। গোর। আমাদের. রস আমাদের.
Adygea প্রজাতন্ত্র 64,92 53 68
আলতাই প্রজাতন্ত্র 68,60 24 60
বুরিয়াটিয়া প্রজাতন্ত্র 60,75 59 70
দাগেস্তান প্রজাতন্ত্র 79,92 41 9
ইঙ্গুশেটিয়া প্রজাতন্ত্র 75,05 41 23
কাল্মিকিয়া প্রজাতন্ত্র 68,52 39 37
কারাচে-চের্কেস প্রজাতন্ত্র 66,68 44 42
কারেলিয়া প্রজাতন্ত্র 61,70 73 73
কোমি প্রজাতন্ত্র 59,60 74 57
মারি এল প্রজাতন্ত্র 65,19 62 47

ইত্যাদি। (নিঃসরণ পরিষ্কার করার পরে, 88 টির মধ্যে 83 টি মামলা বাকি)

মডেলের গুণমান বর্ণনাকারী পরিসংখ্যান:

1. একাধিক R = 0.62; এল-বর্গ = ০.৩৮। অতএব, জাতীয় ফ্যাক্টর এবং নগরায়নের ফ্যাক্টর একসাথে পরিবর্তনশীল "নির্বাচনী কার্যকলাপ" এর বৈচিত্র্যের প্রায় 38% ব্যাখ্যা করে।

2. গড় ত্রুটি 3.38। ভোটের স্তরের পূর্বাভাস দেওয়ার সময় এইভাবে "গড়ে" নির্মিত মডেলটি ভুল।

3. 0.000000003 স্তরে ব্যাখ্যা করা এবং অব্যক্ত প্রকরণের /l-অনুপাত হল 25.2। প্রকাশিত সম্পর্কের এলোমেলোতা সম্পর্কে শূন্য অনুমান প্রত্যাখ্যান করা হয়।

4. "শহুরে জনসংখ্যা" এবং "রাশিয়ান জনসংখ্যা" ভেরিয়েবলগুলির ধ্রুবক এবং রিগ্রেশন সহগগুলির জন্য মানদণ্ড / 0.0000001 স্তরে তাৎপর্যপূর্ণ; যথাক্রমে 0.00005 এবং 0.007। সহগগুলির এলোমেলোতা সম্পর্কে শূন্য অনুমান প্রত্যাখ্যান করা হয়।

নির্ভরশীল ভেরিয়েবলের প্রারম্ভিক এবং পূর্বাভাসিত মানের অনুপাত বিশ্লেষণে অতিরিক্ত দরকারী পরিসংখ্যান হল মহালনোবিস দূরত্ব এবং কুকের দূরত্ব। প্রথমটি হল কেসের স্বতন্ত্রতার একটি পরিমাপ (দেখায় যে প্রদত্ত ক্ষেত্রে সমস্ত স্বাধীন ভেরিয়েবলের মানগুলির সংমিশ্রণ একই সময়ে সমস্ত স্বাধীন ভেরিয়েবলের গড় মান থেকে কতটা বিচ্যুত হয়)। দ্বিতীয়টি মামলার প্রভাবের একটি পরিমাপ। বিভিন্ন পর্যবেক্ষণ বিভিন্ন উপায়ে রিগ্রেশন লাইনের ঢালকে প্রভাবিত করে এবং কুকের দূরত্ব ব্যবহার করে, আপনি এই সূচক অনুসারে তাদের তুলনা করতে পারেন। বহিরাগতদের পরিষ্কার করার সময় এটি কার্যকর (একটি বহিরাগতকে অত্যধিক প্রভাবশালী কেস হিসাবে বিবেচনা করা যেতে পারে)।

আমাদের উদাহরণে, দাগেস্তান একটি অনন্য এবং প্রভাবশালী ক্ষেত্রে।

ঘটছে প্রাথমিক

মান

প্রেডস্কা

মান

থেকে যায় দূরত্ব

মহলনোবিস

দূরত্ব
অডিজিয়া 64,92 66,33 -1,40 0,69 0,00
আলতাই প্রজাতন্ত্র 68,60 69.91 -1,31 6,80 0,01
বুরিয়াটিয়া প্রজাতন্ত্র 60,75 65,56 -4,81 0,23 0,01
দাগেস্তান প্রজাতন্ত্র 79,92 71,01 8,91 10,57 0,44
ইঙ্গুশেটিয়া প্রজাতন্ত্র 75,05 70,21 4,84 6,73 0,08
কাল্মিকিয়া প্রজাতন্ত্র 68,52 69,59 -1,07 4,20 0,00

প্রকৃত রিগ্রেশন মডেলের নিম্নলিখিত পরামিতি রয়েছে: Y-ইন্টারসেপ্ট (ধ্রুবক) = 75.99; b (Hor. sat.) \u003d -0.1; b (Rus. nas.) = -0.06. চূড়ান্ত সূত্র:

সক্রিয়, = -0.1 x Hor। sat.n+- 0.06 x Rus। sat.n + 75.99।

আমরা কি সহগ 61 এর মানের উপর ভিত্তি করে ভবিষ্যদ্বাণীকারীদের "ব্যাখ্যামূলক শক্তি" তুলনা করতে পারি। এই ক্ষেত্রে, হ্যাঁ, যেহেতু উভয় স্বাধীন চলকের একই শতাংশ বিন্যাস রয়েছে। যাইহোক, প্রায়শই, একাধিক রিগ্রেশন বিভিন্ন স্কেলে পরিমাপ করা ভেরিয়েবলের সাথে কাজ করে (উদাহরণস্বরূপ, রুবেলে আয়ের স্তর এবং বছরগুলিতে বয়স)। অতএব, সাধারণ ক্ষেত্রে, রিগ্রেশন সহগ দ্বারা ভেরিয়েবলের ভবিষ্যদ্বাণীমূলক ক্ষমতার তুলনা করা ভুল। একাধিক রিগ্রেশন পরিসংখ্যানে, এই উদ্দেশ্যে একটি বিশেষ বিটা সহগ (B) রয়েছে, প্রতিটি স্বাধীন পরিবর্তনশীলের জন্য আলাদাভাবে গণনা করা হয়। এটি একটি আংশিক (অন্যান্য সমস্ত ভবিষ্যদ্বাণীকারীর প্রভাব বিবেচনায় নেওয়ার পরে গণনা করা হয়) ফ্যাক্টর এবং প্রতিক্রিয়ার পারস্পরিক সম্পর্ক সহগ এবং প্রতিক্রিয়া মানগুলির পূর্বাভাসের জন্য ফ্যাক্টরের স্বাধীন অবদান দেখায়। পেয়ারওয়াইজ রিগ্রেশন অ্যানালাইসিসে, বিটা সহগ বোধগম্যভাবে নির্ভরশীল এবং স্বাধীন ভেরিয়েবলের মধ্যে পেয়ারওয়াইজ পারস্পরিক সম্পর্ক সহগের সমান।

আমাদের উদাহরণে, beta (Hor. nas.) = -0.43, beta (Rusian nas.) = -0.28. এইভাবে, উভয় কারণই নির্বাচনী কার্যকলাপের স্তরকে নেতিবাচকভাবে প্রভাবিত করে, যখন নগরায়ন ফ্যাক্টরের তাত্পর্য জাতীয় ফ্যাক্টরের তাত্পর্যের তুলনায় উল্লেখযোগ্যভাবে বেশি। উভয় কারণের সম্মিলিত প্রভাব পরিবর্তনশীল "নির্বাচনী কার্যকলাপ" এর বৈচিত্র্যের প্রায় 38% নির্ধারণ করে (এল-স্কোয়ার মান দেখুন)।

রিগ্রেশন বিশ্লেষণ হল একটি পরিসংখ্যানগত গবেষণা পদ্ধতি যা আপনাকে এক বা একাধিক স্বাধীন ভেরিয়েবলের উপর একটি প্যারামিটারের নির্ভরতা দেখাতে দেয়। প্রাক-কম্পিউটার যুগে, এটির ব্যবহার বেশ কঠিন ছিল, বিশেষ করে যখন এটি প্রচুর পরিমাণে ডেটা আসে। আজ, কিভাবে Excel এ রিগ্রেশন তৈরি করতে হয় তা শিখে, আপনি মাত্র কয়েক মিনিটের মধ্যে জটিল পরিসংখ্যানগত সমস্যাগুলি সমাধান করতে পারেন। নীচে অর্থনীতির ক্ষেত্র থেকে নির্দিষ্ট উদাহরণ দেওয়া হল।

রিগ্রেশনের প্রকারভেদ

ধারণাটি নিজেই 1886 সালে গণিতে প্রবর্তিত হয়েছিল। রিগ্রেশন ঘটে:

  • রৈখিক
  • পরাবৃত্তীয়;
  • ক্ষমতা
  • সূচকীয়;
  • অতিবলিক;
  • প্রদর্শক
  • লগারিদমিক

উদাহরণ 1

6টি শিল্প প্রতিষ্ঠানে গড় বেতনের উপর অবসরপ্রাপ্ত দলের সদস্যদের সংখ্যার নির্ভরতা নির্ধারণের সমস্যাটি বিবেচনা করুন।

একটি কাজ. ছয়টি এন্টারপ্রাইজে, আমরা গড় মাসিক বেতন এবং কর্মচারীদের সংখ্যা বিশ্লেষণ করেছি যারা তাদের নিজস্ব ইচ্ছায় চলে গেছে। সারণী আকারে আমাদের আছে:

চলে যাওয়া লোকের সংখ্যা

বেতন

30000 রুবেল

35000 রুবেল

40000 রুবেল

45000 রুবেল

50000 রুবেল

55000 রুবেল

60000 রুবেল

6টি এন্টারপ্রাইজে গড় বেতনের উপর অবসরপ্রাপ্ত কর্মীদের সংখ্যার নির্ভরতা নির্ধারণের সমস্যার জন্য, রিগ্রেশন মডেলটিতে Y = a 0 + a 1 x 1 +…+a k x k সমীকরণের ফর্ম রয়েছে, যেখানে x i হল প্রভাবক ভেরিয়েবল , a i হল রিগ্রেশন সহগ, a k হল ফ্যাক্টরের সংখ্যা।

এই কাজের জন্য, Y হল কর্মচারীদের সূচক যারা চলে গেছে, এবং প্রভাবিতকারী ফ্যাক্টর হল বেতন, যা আমরা X দ্বারা চিহ্নিত করি।

স্প্রেডশীট "এক্সেল" এর ক্ষমতা ব্যবহার করে

এক্সেল-এ রিগ্রেশন বিশ্লেষণের আগে উপলব্ধ ট্যাবুলার ডেটাতে বিল্ট-ইন ফাংশন প্রয়োগ করতে হবে। যাইহোক, এই উদ্দেশ্যে, খুব দরকারী অ্যাড-ইন "বিশ্লেষণ টুলকিট" ব্যবহার করা ভাল। এটি সক্রিয় করতে আপনার প্রয়োজন:

  • "ফাইল" ট্যাব থেকে, "বিকল্প" বিভাগে যান;
  • যে উইন্ডোটি খোলে, সেখানে "অ্যাড-অন" লাইনটি নির্বাচন করুন;
  • "ব্যবস্থাপনা" লাইনের ডানদিকে নীচে অবস্থিত "গো" বোতামে ক্লিক করুন;
  • "বিশ্লেষণ প্যাকেজ" নামের পাশের বাক্সটি চেক করুন এবং "ঠিক আছে" ক্লিক করে আপনার কর্ম নিশ্চিত করুন।

সবকিছু সঠিকভাবে সম্পন্ন হলে, এক্সেল ওয়ার্কশীটের উপরে অবস্থিত ডেটা ট্যাবের ডানদিকে কাঙ্খিত বোতামটি প্রদর্শিত হবে।

এক্সেলে

এখন যেহেতু আমাদের কাছে অর্থনৈতিক গণনা সম্পাদনের জন্য প্রয়োজনীয় সমস্ত ভার্চুয়াল সরঞ্জাম রয়েছে, আমরা আমাদের সমস্যার সমাধান করতে শুরু করতে পারি। এই জন্য:

  • "ডেটা বিশ্লেষণ" বোতামে ক্লিক করুন;
  • যে উইন্ডোটি খোলে, সেখানে "রিগ্রেশন" বোতামে ক্লিক করুন;
  • প্রদর্শিত ট্যাবে, Y (যে কর্মচারীরা পদত্যাগ করেছেন) এবং X (তাদের বেতন) এর জন্য মানগুলির পরিসর লিখুন;
  • আমরা "ঠিক আছে" বোতাম টিপে আমাদের ক্রিয়াগুলি নিশ্চিত করি৷

ফলস্বরূপ, প্রোগ্রামটি স্বয়ংক্রিয়ভাবে রিগ্রেশন বিশ্লেষণ ডেটা সহ স্প্রেডশীটের একটি নতুন শীট তৈরি করবে। বিঃদ্রঃ! এই উদ্দেশ্যে আপনার পছন্দের অবস্থানটি ম্যানুয়ালি সেট করার ক্ষমতা Excel এর রয়েছে। উদাহরণস্বরূপ, এটি একই শীট হতে পারে যেখানে Y এবং X মানগুলি রয়েছে বা এমনকি একটি নতুন বই, বিশেষভাবে এই ধরনের ডেটা সংরক্ষণের জন্য ডিজাইন করা হয়েছে।

R-স্কয়ারের জন্য রিগ্রেশন ফলাফলের বিশ্লেষণ

এক্সেলে, বিবেচিত উদাহরণের ডেটা প্রক্রিয়াকরণের সময় প্রাপ্ত ডেটা এইরকম দেখায়:

প্রথমত, আপনার আর-বর্গক্ষেত্রের মানটির দিকে মনোযোগ দেওয়া উচিত। এটি সংকল্পের সহগ। এই উদাহরণে, R-square = 0.755 (75.5%), অর্থাৎ, মডেলের গণনা করা প্যারামিটার 75.5% দ্বারা বিবেচিত পরামিতিগুলির মধ্যে সম্পর্ক ব্যাখ্যা করে। নির্ণয়ের সহগের মান যত বেশি হবে, একটি নির্দিষ্ট কাজের জন্য নির্বাচিত মডেলটি তত বেশি প্রযোজ্য। এটা বিশ্বাস করা হয় যে এটি সঠিকভাবে 0.8 এর উপরে R-স্কয়ার মান সহ বাস্তব পরিস্থিতি বর্ণনা করে। আর-বর্গ হলে<0,5, то такой анализа регрессии в Excel нельзя считать резонным.

অনুপাত বিশ্লেষণ

64.1428 সংখ্যাটি দেখায় যে আমরা যে মডেলটি বিবেচনা করছি তার সমস্ত ভেরিয়েবল xi শূন্য সেট করা থাকলে Y এর মান কী হবে। অন্য কথায়, এটি যুক্তি দেওয়া যেতে পারে যে বিশ্লেষণ করা প্যারামিটারের মান অন্য কারণগুলির দ্বারা প্রভাবিত হয় যা একটি নির্দিষ্ট মডেলে বর্ণিত হয় না।

পরবর্তী সহগ -0.16285, সেল B18-এ অবস্থিত, Y-তে পরিবর্তনশীল X-এর প্রভাবের ওজন দেখায়। এর মানে হল যে বিবেচনাধীন মডেলের মধ্যে কর্মচারীদের গড় মাসিক বেতন -0.16285-এর ওজন সহ ত্যাগকারীদের সংখ্যাকে প্রভাবিত করে, অর্থাৎ সব ছোট তার প্রভাব ডিগ্রী. "-" চিহ্নটি নির্দেশ করে যে সহগটির একটি নেতিবাচক মান রয়েছে। এটি সুস্পষ্ট, যেহেতু সবাই জানে যে এন্টারপ্রাইজে বেতন যত বেশি হবে, কম লোকে কর্মসংস্থান চুক্তি বাতিল বা প্রস্থান করার ইচ্ছা প্রকাশ করবে।

একাধিক সংশ্লেষণ

এই শব্দটি ফর্মের বেশ কয়েকটি স্বাধীন ভেরিয়েবলের সাথে একটি সংযোগ সমীকরণকে বোঝায়:

y \u003d f (x 1 + x 2 + ... x m) + ε, যেখানে y হল কার্যকরী বৈশিষ্ট্য (নির্ভরশীল পরিবর্তনশীল), এবং x 1 , x 2 , ... x m হল ফ্যাক্টর ফ্যাক্টর (স্বাধীন চলক)।

পরামিতি অনুমান

মাল্টিপল রিগ্রেশন (এমআর) এর জন্য এটি সর্বনিম্ন বর্গক্ষেত্র (OLS) পদ্ধতি ব্যবহার করে করা হয়। Y = a + b 1 x 1 +…+b m x m + ε ফর্মের রৈখিক সমীকরণের জন্য, আমরা সাধারণ সমীকরণের একটি সিস্টেম তৈরি করি (নীচে দেখুন)

পদ্ধতির নীতি বোঝার জন্য, দ্বি-ফ্যাক্টর কেস বিবেচনা করুন। তারপর আমরা সূত্র দ্বারা বর্ণিত একটি পরিস্থিতি আছে

এখান থেকে আমরা পাই:

যেখানে σ হল সূচকে প্রতিফলিত সংশ্লিষ্ট বৈশিষ্ট্যের প্রকরণ।

LSM একটি মানযোগ্য স্কেলে এমপি সমীকরণে প্রযোজ্য। এই ক্ষেত্রে, আমরা সমীকরণ পেতে পারি:

যেখানে t y , t x 1, … t xm হল প্রমিত ভেরিয়েবল যার গড় মান হল 0; β i হল প্রমিত রিগ্রেশন সহগ, এবং প্রমিত বিচ্যুতি হল 1।

দয়া করে মনে রাখবেন যে এই ক্ষেত্রে সমস্ত β i স্বাভাবিক এবং কেন্দ্রীভূত হিসাবে সেট করা হয়েছে, তাই একে অপরের সাথে তাদের তুলনা সঠিক এবং গ্রহণযোগ্য বলে বিবেচিত হয়। এছাড়াও, βi-এর ক্ষুদ্রতম মানগুলিকে বাদ দিয়ে ফ্যাক্টরগুলিকে ফিল্টার করার প্রথাগত।

লিনিয়ার রিগ্রেশন সমীকরণ ব্যবহার করে সমস্যা

ধরুন বিগত 8 মাসে একটি নির্দিষ্ট পণ্য N এর মূল্য গতিশীলতার একটি টেবিল রয়েছে। 1850 রুবেল/টি মূল্যে এর ব্যাচ কেনার পরামর্শের বিষয়ে সিদ্ধান্ত নেওয়া প্রয়োজন।

মাসের সংখ্যা

মাসের নাম

আইটেম N এর দাম

প্রতি টন 1750 রুবেল

প্রতি টন 1755 রুবেল

প্রতি টন 1767 রুবেল

প্রতি টন 1760 রুবেল

প্রতি টন 1770 রুবেল

প্রতি টন 1790 রুবেল

প্রতি টন 1810 রুবেল

প্রতি টন 1840 রুবেল

এক্সেল স্প্রেডশীটে এই সমস্যাটি সমাধান করতে, আপনাকে উপরের উদাহরণ থেকে ইতিমধ্যে পরিচিত ডেটা বিশ্লেষণ টুল ব্যবহার করতে হবে। এর পরে, "রিগ্রেশন" বিভাগটি নির্বাচন করুন এবং পরামিতিগুলি সেট করুন। এটি অবশ্যই মনে রাখতে হবে যে "ইনপুট ব্যবধান Y" ক্ষেত্রে, নির্ভরশীল ভেরিয়েবলের জন্য মানগুলির একটি পরিসর (এই ক্ষেত্রে, বছরের নির্দিষ্ট মাসে একটি পণ্যের মূল্য) প্রবেশ করাতে হবে এবং "ইনপুট"-এ ব্যবধান X" - স্বাধীন পরিবর্তনশীল (মাসের সংখ্যা) জন্য। "ঠিক আছে" ক্লিক করে ক্রিয়াটি নিশ্চিত করুন। একটি নতুন শীটে (যদি এটি নির্দেশিত হয়), আমরা রিগ্রেশনের জন্য ডেটা পাই।

তাদের উপর ভিত্তি করে, আমরা y=ax+b ফর্মের একটি রৈখিক সমীকরণ তৈরি করি, যেখানে পরামিতি a এবং b হল মাসের সংখ্যার নাম সহ সারির সহগ এবং সহগ এবং "Y-ছেদ" সারি থেকে রিগ্রেশন বিশ্লেষণের ফলাফল সহ শীট। সুতরাং, সমস্যা 3 এর জন্য রৈখিক রিগ্রেশন সমীকরণ (LE) লেখা হয়েছে:

পণ্যের মূল্য N = 11.714* মাসের সংখ্যা + 1727.54।

অথবা বীজগণিতের স্বরলিপিতে

y = 11.714 x + 1727.54

ফলাফল বিশ্লেষণ

ফলস্বরূপ রৈখিক রিগ্রেশন সমীকরণটি পর্যাপ্ত কিনা তা নির্ধারণ করতে, একাধিক পারস্পরিক সম্পর্ক সহগ (MCC) এবং সংকল্প সহগ ব্যবহার করা হয়, সেইসাথে ফিশার পরীক্ষা এবং ছাত্রের পরীক্ষা। রিগ্রেশন ফলাফল সহ এক্সেল টেবিলে, তারা যথাক্রমে একাধিক R, R-স্কয়ার, F-পরিসংখ্যান এবং t-পরিসংখ্যানের নামে প্রদর্শিত হয়।

KMC R স্বাধীন এবং নির্ভরশীল ভেরিয়েবলের মধ্যে সম্ভাব্য সম্পর্কের নিবিড়তা মূল্যায়ন করা সম্ভব করে। এর উচ্চ মান "মাসের সংখ্যা" এবং "প্রতি 1 টন রুবেলে N পণ্যের মূল্য" ভেরিয়েবলের মধ্যে একটি মোটামুটি শক্তিশালী সম্পর্ক নির্দেশ করে। যাইহোক, এই সম্পর্কের প্রকৃতি অজানা থেকে যায়।

নির্ণয়ের সহগের বর্গ 2 (RI) মোট স্ক্যাটারের ভাগের একটি সংখ্যাগত বৈশিষ্ট্য এবং পরীক্ষামূলক ডেটার কোন অংশের স্ক্যাটার দেখায়, যেমন নির্ভরশীল ভেরিয়েবলের মান রৈখিক রিগ্রেশন সমীকরণের সাথে মিলে যায়। বিবেচনাধীন সমস্যাটিতে, এই মানটি 84.8% এর সমান, অর্থাৎ, পরিসংখ্যানগত ডেটা প্রাপ্ত SD দ্বারা উচ্চ মাত্রার নির্ভুলতার সাথে বর্ণনা করা হয়েছে।

F-পরিসংখ্যান, যাকে ফিশার পরীক্ষাও বলা হয়, একটি রৈখিক সম্পর্কের তাৎপর্য মূল্যায়ন করতে, এর অস্তিত্বের অনুমানকে খণ্ডন বা নিশ্চিত করতে ব্যবহৃত হয়।

(ছাত্রের মাপকাঠি) একটি রৈখিক সম্পর্কের অজানা বা মুক্ত শব্দের সাথে সহগটির তাত্পর্য মূল্যায়ন করতে সহায়তা করে। যদি টি-মাপদণ্ডের মান > t cr, তাহলে মুক্ত পদের তুচ্ছতার হাইপোথিসিস একঘাত সমীকরণপ্রত্যাখ্যাত.

মুক্ত সদস্যের জন্য বিবেচনাধীন সমস্যায়, এক্সেল সরঞ্জামগুলি ব্যবহার করে, এটি প্রাপ্ত হয়েছিল যে t = 169.20903, এবং p = 2.89E-12, অর্থাৎ আমাদের একটি শূন্য সম্ভাবনা রয়েছে যে বিনামূল্যে সদস্যের তুচ্ছতা সম্পর্কে সঠিক অনুমান হবে প্রত্যাখ্যাত. অজানা t=5.79405, এবং p=0.001158-এ সহগের জন্য। অন্য কথায়, অজানা জন্য সহগের তুচ্ছতা সম্পর্কে সঠিক অনুমান বাতিল হওয়ার সম্ভাবনা 0.12%।

সুতরাং, এটি যুক্তি দেওয়া যেতে পারে যে ফলস্বরূপ রৈখিক রিগ্রেশন সমীকরণ পর্যাপ্ত।

শেয়ার ব্লক কেনার সুবিধার সমস্যা

এক্সেলে একাধিক রিগ্রেশন একই ডেটা বিশ্লেষণ টুল ব্যবহার করে সঞ্চালিত হয়। একটি নির্দিষ্ট প্রয়োগ সমস্যা বিবেচনা করুন.

NNN-এর ব্যবস্থাপনাকে অবশ্যই MMM SA-তে 20% শেয়ার কেনার পরামর্শের বিষয়ে সিদ্ধান্ত নিতে হবে। প্যাকেজের মূল্য (JV) 70 মিলিয়ন মার্কিন ডলার। এনএনএন বিশেষজ্ঞরা অনুরূপ লেনদেনের তথ্য সংগ্রহ করেছেন। এই ধরনের পরামিতি অনুসারে শেয়ার ব্লকের মূল্য মূল্যায়ন করার সিদ্ধান্ত নেওয়া হয়েছিল, মিলিয়ন মার্কিন ডলারে প্রকাশ করা হয়েছে, যেমন:

  • প্রদেয় অ্যাকাউন্ট (VK);
  • বার্ষিক টার্নওভার (VO);
  • প্রাপ্য অ্যাকাউন্ট (ভিডি);
  • স্থায়ী সম্পদের খরচ (SOF)।

উপরন্তু, হাজার হাজার মার্কিন ডলারে এন্টারপ্রাইজের প্যারামিটার বেতন বকেয়া (V3 P) ব্যবহার করা হয়।

এক্সেল স্প্রেডশীট ব্যবহার করে সমাধান

প্রথমত, আপনাকে প্রাথমিক ডেটার একটি টেবিল তৈরি করতে হবে। এটি এই মত দেখায়:

  • "ডেটা বিশ্লেষণ" উইন্ডোতে কল করুন;
  • "রিগ্রেশন" বিভাগটি নির্বাচন করুন;
  • "ইনপুট ব্যবধান Y" বক্সে G কলাম থেকে নির্ভরশীল ভেরিয়েবলের মানের পরিসর লিখুন;
  • "ইনপুট ব্যবধান X" বাক্সের ডানদিকে একটি লাল তীর সহ আইকনে ক্লিক করুন এবং শীটে সমস্ত মানগুলির একটি পরিসর নির্বাচন করুন কলাম B, C, ডি, এফ.

"নতুন ওয়ার্কশীট" নির্বাচন করুন এবং "ঠিক আছে" ক্লিক করুন।

প্রদত্ত সমস্যার জন্য রিগ্রেশন বিশ্লেষণ পান।

ফলাফল এবং উপসংহার পরীক্ষা

এক্সেল স্প্রেডশীট শীটে উপরে উপস্থাপিত বৃত্তাকার ডেটা থেকে "আমরা সংগ্রহ করি", রিগ্রেশন সমীকরণ:

SP \u003d 0.103 * SOF + 0.541 * VO - 0.031 * VK + 0.405 * VD + 0.691 * VZP - 265.844।

আরও পরিচিত গাণিতিক আকারে, এটি এভাবে লেখা যেতে পারে:

y = 0.103*x1 + 0.541*x2 - 0.031*x3 +0.405*x4 +0.691*x5 - 265.844

JSC "MMM" এর জন্য ডেটা টেবিলে উপস্থাপন করা হয়েছে:

রিগ্রেশন সমীকরণে তাদের প্রতিস্থাপন করে, তারা 64.72 মিলিয়ন মার্কিন ডলারের অঙ্ক পায়। এর মানে হল JSC MMM-এর শেয়ার কেনা উচিত নয়, যেহেতু তাদের মূল্য 70 মিলিয়ন মার্কিন ডলারের চেয়ে বেশি।

আপনি দেখতে পাচ্ছেন, এক্সেল স্প্রেডশীট এবং রিগ্রেশন সমীকরণের ব্যবহার একটি খুব নির্দিষ্ট লেনদেনের সম্ভাব্যতা সম্পর্কে একটি জ্ঞাত সিদ্ধান্ত নেওয়া সম্ভব করেছে।

এখন আপনি জানেন রিগ্রেশন কি। উপরে আলোচনা করা এক্সেলের উদাহরণগুলি আপনাকে অর্থনীতির ক্ষেত্র থেকে ব্যবহারিক সমস্যাগুলি সমাধান করতে সাহায্য করবে।

রিগ্রেশন বিশ্লেষণ পরিসংখ্যান গবেষণার সবচেয়ে জনপ্রিয় পদ্ধতিগুলির মধ্যে একটি। এটি নির্ভরশীল ভেরিয়েবলের উপর স্বাধীন ভেরিয়েবলের প্রভাবের মাত্রা নির্ধারণ করতে ব্যবহার করা যেতে পারে। মাইক্রোসফ্ট এক্সেলের কার্যকারিতাতে এই ধরণের বিশ্লেষণ চালানোর জন্য ডিজাইন করা সরঞ্জাম রয়েছে। আসুন সেগুলি কী এবং কীভাবে ব্যবহার করবেন তা দেখে নেওয়া যাক।

তবে, যে ফাংশনটি আপনাকে রিগ্রেশন বিশ্লেষণ পরিচালনা করতে দেয় তা ব্যবহার করার জন্য, প্রথমে আপনাকে বিশ্লেষণ প্যাকেজ সক্রিয় করতে হবে। তবেই এই পদ্ধতির জন্য প্রয়োজনীয় সরঞ্জামগুলি এক্সেল রিবনে উপস্থিত হবে।


এখন যখন আমরা ট্যাবে যাই "ডেটা", টুলবক্সের রিবনে "বিশ্লেষণ"আমরা একটি নতুন বোতাম দেখতে পাব - "তথ্য বিশ্লেষণ".

রিগ্রেশন বিশ্লেষণের ধরন

বিভিন্ন ধরনের রিগ্রেশন আছে:

  • পরাবৃত্তীয়;
  • ক্ষমতা
  • লগারিদমিক;
  • সূচকীয়;
  • প্রদর্শন;
  • অতিবলিক;
  • লিনিয়ার রিগ্রেশন।

আমরা পরে এক্সেলে শেষ ধরনের রিগ্রেশন বিশ্লেষণ বাস্তবায়ন সম্পর্কে আরও বিস্তারিতভাবে কথা বলব।

এক্সেলে লিনিয়ার রিগ্রেশন

নীচে, একটি উদাহরণ হিসাবে, একটি টেবিল যা রাস্তায় দৈনিক বায়ুর গড় তাপমাত্রা এবং সংশ্লিষ্ট কাজের দিনের জন্য স্টোর গ্রাহকদের সংখ্যা দেখায়। আসুন রিগ্রেশন বিশ্লেষণের সাহায্যে খুঁজে বের করা যাক ঠিক কীভাবে বায়ুর তাপমাত্রা আকারে আবহাওয়া পরিস্থিতি খুচরা প্রতিষ্ঠানের উপস্থিতিকে প্রভাবিত করতে পারে।

সাধারণ রৈখিক রিগ্রেশন সমীকরণটি এইরকম দেখায়: Y = a0 + a1x1 + ... + axk। এই সূত্রে Yমানে পরিবর্তনশীল যার প্রভাব আমরা অধ্যয়ন করার চেষ্টা করছি। আমাদের ক্ষেত্রে, এটি ক্রেতার সংখ্যা। অর্থ এক্সবিভিন্ন কারণ যা পরিবর্তনশীলকে প্রভাবিত করে। অপশন রিগ্রেশন সহগ হয়। অর্থাৎ, তারা একটি নির্দিষ্ট ফ্যাক্টরের তাত্পর্য নির্ধারণ করে। সূচক kএই একই কারণের মোট সংখ্যা নির্দেশ করে।


বিশ্লেষণ ফলাফল বিশ্লেষণ

রিগ্রেশন বিশ্লেষণের ফলাফলগুলি সেটিংসে নির্দিষ্ট জায়গায় একটি টেবিলের আকারে প্রদর্শিত হয়।

প্রধান সূচক এক আর-বর্গক্ষেত্র. এটি মডেলের গুণমান নির্দেশ করে। আমাদের ক্ষেত্রে, এই সহগ 0.705 বা প্রায় 70.5%। এটি মানের একটি গ্রহণযোগ্য স্তর। 0.5 এর কম সম্পর্ক খারাপ।

আরেকটি গুরুত্বপূর্ণ সূচকসারির সংযোগস্থলে কক্ষে অবস্থিত "Y-ছেদ"এবং কলাম "সহগ". এখানে Y-এর মান কী হবে তা নির্দেশ করা হয়েছে, এবং আমাদের ক্ষেত্রে, এটি ক্রেতার সংখ্যা, অন্যান্য সমস্ত কারণ শূন্যের সমান। এই টেবিলে, এই মান 58.04।

গ্রাফের সংযোগস্থলে মান "ভেরিয়েবল X1"এবং "সহগ" X-এর উপর Y-এর নির্ভরতার স্তর দেখায়৷ আমাদের ক্ষেত্রে, এটি তাপমাত্রার উপর দোকানের গ্রাহকদের সংখ্যার নির্ভরতার স্তর৷ 1.31 এর একটি সহগ প্রভাবের মোটামুটি উচ্চ সূচক হিসাবে বিবেচিত হয়।

আপনি দেখতে পাচ্ছেন, মাইক্রোসফ্ট এক্সেল ব্যবহার করে একটি রিগ্রেশন বিশ্লেষণ টেবিল তৈরি করা বেশ সহজ। কিন্তু, শুধুমাত্র একজন প্রশিক্ষিত ব্যক্তিই আউটপুটে প্রাপ্ত ডেটা নিয়ে কাজ করতে পারেন এবং তাদের সারমর্ম বুঝতে পারেন।


বন্ধ