তাদের সম্ভাব্যতা এবং সংশ্লিষ্ট শর্তাধীন সম্ভাব্যতা জানা যাক। তারপর ঘটনা ঘটার সম্ভাবনা হল:

এই সূত্র বলা হয় মোট সম্ভাব্যতা সূত্র. পাঠ্যপুস্তকগুলিতে, এটি একটি উপপাদ্য দ্বারা প্রণয়ন করা হয়, যার প্রমাণ প্রাথমিক: অনুসারে ঘটনা বীজগণিত, (ঘটনা ঘটেছে এবং বাএকটি ঘটনা ঘটেছে এবংঘটনাটি আসার পর বাএকটি ঘটনা ঘটেছে এবংঘটনাটি আসার পর বা …. বাএকটি ঘটনা ঘটেছে এবংঘটনা অনুসরণ করা হয়েছে). যেহেতু অনুমান বেমানান, এবং ঘটনা নির্ভরশীল, তারপর অনুযায়ী বেমানান ইভেন্টের সম্ভাব্যতার জন্য অতিরিক্ত উপপাদ্য (প্রথম ধাপ)এবং নির্ভরশীল ইভেন্টের সম্ভাবনার গুণনের উপপাদ্য (দ্বিতীয় ধাপ):

সম্ভবত, অনেকে প্রথম উদাহরণের বিষয়বস্তু অনুমান করে =)

যেখানেই থুথু ফেলো - সর্বত্র কলস:

কার্যক্রম 1

তিনটি অভিন্ন urns আছে. প্রথম কলসটিতে 4টি সাদা এবং 7টি কালো বল রয়েছে, দ্বিতীয় কলসটিতে কেবল সাদা বল রয়েছে এবং তৃতীয় কলসে কেবল কালো বল রয়েছে। এলোমেলোভাবে একটি কলস নির্বাচন করা হয় এবং এলোমেলোভাবে এটি থেকে একটি বল টানা হয়। এই বলটি কালো হওয়ার সম্ভাবনা কত?

সমাধান: ঘটনাটি বিবেচনা করুন - একটি এলোমেলোভাবে নির্বাচিত কলস থেকে একটি কালো বল আঁকা হবে৷ নিম্নলিখিত অনুমানগুলির একটির ফলে এই ঘটনা ঘটতে পারে বা নাও হতে পারে:
- ১ম কলস নির্বাচন করা হবে;
- ২য় কলসটি বেছে নেওয়া হবে;
- 3য় কলস নির্বাচন করা হবে.

যেহেতু ভুঁড়িটি এলোমেলোভাবে বেছে নেওয়া হয়েছে, তাই তিনটি কলসের যেকোনো একটির পছন্দ সমানভাবে সম্ভব, অতএব:

উল্লেখ্য যে উপরের অনুমানগুলি গঠন করে ইভেন্টের সম্পূর্ণ গ্রুপ, অর্থাৎ, শর্ত অনুযায়ী, একটি কালো বল শুধুমাত্র এই urns থেকে প্রদর্শিত হতে পারে, এবং উদাহরণস্বরূপ, এটি একটি বিলিয়ার্ড টেবিল থেকে আসতে পারে না। আসুন একটি সাধারণ মধ্যবর্তী পরীক্ষা করি:
ঠিক আছে, চলুন এগিয়ে যাই:

প্রথম কলসটিতে 4টি সাদা + 7টি কালো = 11টি বল রয়েছে শাস্ত্রীয় সংজ্ঞা:
একটি কালো বল আঁকার সম্ভাবনা শর্তেযে 1ম urn নির্বাচন করা হবে.

দ্বিতীয় কলস শুধুমাত্র সাদা বল রয়েছে, তাই যদি নির্বাচিত হয়একটি কালো বলের চেহারা হয়ে যায় অসম্ভব: .

এবং, অবশেষে, তৃতীয় কলসটিতে কেবল কালো বল রয়েছে, যার অর্থ হল সংশ্লিষ্ট শর্তাধীন সম্ভাবনাকালো বল নিষ্কাশন হবে (ঘটনা নিশ্চিত).



এলোমেলোভাবে নির্বাচিত কলস থেকে একটি কালো বল আঁকার সম্ভাবনা।

উত্তর:

বিশ্লেষিত উদাহরণটি আবার পরামর্শ দেয় যে শর্তটি বোঝা কতটা গুরুত্বপূর্ণ। চলুন urns এবং বলের সাথে একই সমস্যা নেওয়া যাক - তাদের বাহ্যিক মিলের সাথে, সমাধানের পদ্ধতিগুলি সম্পূর্ণ ভিন্ন হতে পারে: কোথাও এটি শুধুমাত্র প্রয়োগ করা প্রয়োজন সম্ভাব্যতার শাস্ত্রীয় সংজ্ঞা, কোথাও ঘটনা স্বাধীন, কোথাও নির্ভরশীল, এবং কোথাও আমরা অনুমান সম্পর্কে কথা বলছি। একই সময়ে, সমাধানের পথ বেছে নেওয়ার জন্য কোনও স্পষ্ট আনুষ্ঠানিক মাপকাঠি নেই - আপনাকে প্রায় সবসময় এটি সম্পর্কে চিন্তা করতে হবে। কিভাবে আপনার দক্ষতা উন্নত করতে? আমরা সমাধান করি, আমরা সমাধান করি এবং আমরা আবার সমাধান করি!

টাস্ক 2

শুটিং রেঞ্জে 5টি ভিন্ন রাইফেল রয়েছে। প্রদত্ত শ্যুটারের লক্ষ্যে আঘাত করার সম্ভাবনা যথাক্রমে 0.5 এর সমান; 0.55; 0.7; 0.75 এবং 0.4। শ্যুটার যদি এলোমেলোভাবে নির্বাচিত রাইফেল থেকে একটি গুলি চালায় তবে লক্ষ্যে আঘাত করার সম্ভাবনা কত?

পাঠ শেষে সংক্ষিপ্ত সমাধান এবং উত্তর।

বেশিরভাগ বিষয়গত সমস্যায়, অনুমানগুলি অবশ্যই সমানভাবে সম্ভাব্য নয়:

টাস্ক 3

পিরামিডে 5টি রাইফেল রয়েছে, যার মধ্যে তিনটি অপটিক্যাল দৃষ্টিতে সজ্জিত। টেলিস্কোপিক দৃষ্টিশক্তি সহ একটি রাইফেল থেকে গুলি চালানোর সময় শ্যুটার লক্ষ্যে আঘাত করার সম্ভাবনা 0.95; টেলিস্কোপিক দৃষ্টিবিহীন রাইফেলের জন্য, এই সম্ভাবনা 0.7। শ্যুটার যদি এলোমেলোভাবে নেওয়া একটি রাইফেল থেকে একটি গুলি চালায় তবে লক্ষ্যটি আঘাত করার সম্ভাবনা খুঁজে বের করুন।

সমাধান: এই সমস্যায়, রাইফেলের সংখ্যা ঠিক আগেরটির মতোই, তবে শুধুমাত্র দুটি অনুমান রয়েছে:
- শ্যুটার একটি অপটিক্যাল দৃষ্টিশক্তি সহ একটি রাইফেল বেছে নেবে;
- শ্যুটার টেলিস্কোপিক দৃষ্টি ছাড়াই একটি রাইফেল নির্বাচন করবে।
দ্বারা সম্ভাব্যতার শাস্ত্রীয় সংজ্ঞা: .
নিয়ন্ত্রণ:

ঘটনাটি বিবেচনা করুন: - শ্যুটার একটি এলোমেলোভাবে নির্বাচিত রাইফেল দিয়ে লক্ষ্যে আঘাত করে।
শর্ত দ্বারা: .

মোট সম্ভাব্যতা সূত্র অনুযায়ী:

উত্তর: 0,85

অনুশীলনে, একটি টাস্ক ডিজাইন করার একটি সংক্ষিপ্ত উপায়, যার সাথে আপনিও পরিচিত, এটি বেশ গ্রহণযোগ্য:

সমাধান: শাস্ত্রীয় সংজ্ঞা অনুযায়ী: যথাক্রমে একটি অপটিক্যাল দৃষ্টিশক্তি সহ এবং ছাড়া একটি রাইফেল নির্বাচন করার সম্ভাবনা।

শর্ত অনুসারে, - সংশ্লিষ্ট ধরণের রাইফেল দিয়ে লক্ষ্যে আঘাত করার সম্ভাবনা।

মোট সম্ভাব্যতা সূত্র অনুযায়ী:
শ্যুটার একটি এলোমেলোভাবে নির্বাচিত রাইফেল দিয়ে লক্ষ্যে আঘাত করবে এমন সম্ভাবনা।

উত্তর: 0,85

একটি স্বাধীন সমাধানের জন্য নিম্নলিখিত কাজ:

টাস্ক 4

ইঞ্জিনটি তিনটি মোডে কাজ করে: স্বাভাবিক, বাধ্যতামূলক এবং অলস। নিষ্ক্রিয় মোডে, এর ব্যর্থতার সম্ভাবনা 0.05, সাধারণ মোডে - 0.1, এবং বাধ্যতামূলক মোডে - 0.7। 70% সময় ইঞ্জিন স্বাভাবিক মোডে চলে, এবং 20% বাধ্যতামূলক মোডে। অপারেশন চলাকালীন ইঞ্জিন ব্যর্থতার সম্ভাবনা কি?

ঠিক সেই ক্ষেত্রে, আমি আপনাকে মনে করিয়ে দিই - সম্ভাব্যতা পেতে, শতাংশগুলিকে 100 দ্বারা ভাগ করতে হবে। খুব সাবধান! আমার পর্যবেক্ষণ অনুসারে, মোট সম্ভাব্যতা সূত্রের সমস্যাগুলির শর্তগুলি প্রায়শই বিভ্রান্ত করার চেষ্টা করা হয়; এবং আমি বিশেষভাবে যেমন একটি উদাহরণ বেছে নিলাম। আমি আপনাকে একটি গোপন কথা বলব - আমি প্রায় নিজেই বিভ্রান্ত হয়ে পড়েছিলাম =)

পাঠের শেষে সমাধান (সংক্ষিপ্ত উপায়ে প্রণয়ন)

বেইস সূত্রের জন্য সমস্যা

উপাদানটি পূর্ববর্তী অনুচ্ছেদের বিষয়বস্তুর সাথে ঘনিষ্ঠভাবে সম্পর্কিত। অনুমানগুলির একটি বাস্তবায়নের ফলে ঘটনাটি ঘটতে দিন . কিভাবে একটি নির্দিষ্ট অনুমান ঘটেছে যে সম্ভাব্যতা নির্ধারণ?

শর্তেযে ঘটনা ইতিমধ্যে ঘটেছে, অনুমানের সম্ভাবনা overestimatedইংরেজ যাজক টমাস বেইসের নাম প্রাপ্ত সূত্র অনুসারে:


- অনুমানটি ঘটেছিল এমন সম্ভাবনা;
- অনুমানটি ঘটেছিল এমন সম্ভাবনা;

অনুমানটি সত্য হওয়ার সম্ভাবনা।

প্রথম নজরে, এটি একটি সম্পূর্ণ অযৌক্তিকতা বলে মনে হচ্ছে - কেন অনুমানগুলির সম্ভাব্যতাগুলি পুনঃগণনা করা হবে, যদি তারা ইতিমধ্যেই পরিচিত হয়? কিন্তু আসলে একটি পার্থক্য আছে:

- এই অবরোহী(আনুমানিক আগেপরীক্ষা) সম্ভাবনা।

- এই একটি posteriori(আনুমানিক পরেপরীক্ষা) একই অনুমানগুলির সম্ভাব্যতা, "নতুন আবিষ্কৃত পরিস্থিতিতে" এর সাথে পুনঃগণনা করা হয়েছে - এই ঘটনাটিকে বিবেচনা করে ঘটেছিলো.

আসুন একটি নির্দিষ্ট উদাহরণ দিয়ে এই পার্থক্যটি দেখি:

টাস্ক 5

গুদামটি পণ্যের 2 ব্যাচ পেয়েছে: প্রথমটি - 4000 টুকরা, দ্বিতীয়টি - 6000 টুকরা। প্রথম ব্যাচে অ-মানক পণ্যগুলির গড় শতাংশ 20%, এবং দ্বিতীয়টিতে - 10%। এলোমেলোভাবে গুদাম থেকে নেওয়া, পণ্য মান হতে পরিণত. এটির সম্ভাব্যতা খুঁজুন: ক) প্রথম ব্যাচ থেকে, খ) দ্বিতীয় ব্যাচ থেকে।

অগ্রভাগ সমাধানমোট সম্ভাব্যতা সূত্র ব্যবহার করে গঠিত। অন্য কথায়, গণনা করা হয় অনুমান অধীনে পরীক্ষা যে এখনও উত্পাদিত হয় নাএবং ঘটনা "পণ্যটি মানসম্মত হয়ে উঠেছে"যতক্ষণ না এটি আসে।

আসুন দুটি অনুমান বিবেচনা করুন:
- এলোমেলোভাবে নেওয়া একটি পণ্য 1 ম ব্যাচ থেকে হবে;
- এলোমেলোভাবে নেওয়া একটি পণ্য 2য় ব্যাচ থেকে হবে।

মোট: 4000 + 6000 = 10000 আইটেম স্টকে আছে। শাস্ত্রীয় সংজ্ঞা অনুসারে:
.

নিয়ন্ত্রণ:

নির্ভরশীল ঘটনা বিবেচনা করুন: – গুদাম থেকে এলোমেলোভাবে নেওয়া একটি আইটেম হবেমান

প্রথম ব্যাচে 100% - 20% = 80% স্ট্যান্ডার্ড পণ্য, তাই: শর্তেযে এটি প্রথম পক্ষের অন্তর্গত।

একইভাবে, দ্বিতীয় ব্যাচে 100% - 10% = 90% স্ট্যান্ডার্ড পণ্য এবং গুদামে একটি এলোমেলোভাবে নির্বাচিত আইটেম একটি আদর্শ আইটেম হওয়ার সম্ভাবনা শর্তেযে এটি 2য় পক্ষের অন্তর্গত।

মোট সম্ভাব্যতা সূত্র অনুযায়ী:
গুদাম থেকে এলোমেলোভাবে নির্বাচিত একটি পণ্য একটি আদর্শ পণ্য হওয়ার সম্ভাবনা।

অংশ দুই. ধরুন গুদাম থেকে এলোমেলোভাবে নেওয়া একটি পণ্য মানক হিসাবে পরিণত হয়েছে। এই বাক্যাংশটি শর্তে সরাসরি বানান করা হয় এবং এটি ঘটনাটি সত্য বলে ঘটেছিলো.

বেইসের সূত্র অনুসারে:

ক) - নির্বাচিত মানক পণ্যটি 1ম ব্যাচের অন্তর্গত হওয়ার সম্ভাবনা;

b) - নির্বাচিত মানক পণ্যটি 2য় ব্যাচের অন্তর্গত হওয়ার সম্ভাবনা।

পরে পুনর্মূল্যায়নঅনুমান, অবশ্যই, এখনও গঠন সম্পূর্ণ গ্রুপ:
(পরীক্ষা ;-))

উত্তর:

ইভান ভ্যাসিলিভিচ, যিনি আবার তার পেশা পরিবর্তন করেছেন এবং উদ্ভিদের পরিচালক হয়েছেন, আমাদের অনুমানের পুনর্মূল্যায়নের অর্থ বুঝতে সাহায্য করবে। তিনি জানেন যে আজ প্রথম দোকানটি গুদামে 4000টি আইটেম পাঠিয়েছে, এবং 2য় দোকানটি - 6000টি পণ্য, এবং তিনি এটি নিশ্চিত করতে এসেছেন। ধরুন সমস্ত পণ্য একই ধরণের এবং একই পাত্রে রয়েছে। স্বাভাবিকভাবেই, ইভান ভ্যাসিলিভিচ পূর্বে গণনা করেছিলেন যে তিনি এখন যাচাইয়ের জন্য যে পণ্যটি সরিয়ে ফেলবেন সেটি সম্ভবত 1ম ওয়ার্কশপ দ্বারা এবং দ্বিতীয়টির দ্বারা সম্ভাব্যতা সহ উত্পাদিত হবে। কিন্তু নির্বাচিত আইটেমটি স্ট্যান্ডার্ড হওয়ার পরে, তিনি চিৎকার করে বলেন: “কী দুর্দান্ত বোল্ট! - এটি বরং ২য় কর্মশালার দ্বারা প্রকাশিত হয়েছিল। সুতরাং, দ্বিতীয় হাইপোথিসিসের সম্ভাব্যতাকে আরও ভাল করার জন্য অত্যধিক মূল্যায়ন করা হয়, এবং প্রথম অনুমানের সম্ভাবনাকে অবমূল্যায়ন করা হয়: . এবং এই অত্যধিক মূল্যায়ন অযৌক্তিক নয় - সর্বোপরি, 2য় কর্মশালাটি কেবল আরও বেশি পণ্য তৈরি করেনি, তবে 2 গুণ ভাল কাজ করে!

আপনি বলেন, বিশুদ্ধ বিষয়বাদ? আংশিকভাবে - হ্যাঁ, তদুপরি, বেইস নিজেই ব্যাখ্যা করেছেন একটি posterioriসম্ভাব্যতা হিসাবে আস্থা স্তর. যাইহোক, সবকিছু এত সহজ নয় - বায়েসিয়ান পদ্ধতিতে একটি উদ্দেশ্যমূলক শস্য রয়েছে। সব পরে, সম্ভাবনা যে পণ্য মান হবে (1ম এবং 2য় দোকানের জন্য যথাক্রমে 0.8 এবং 0.9)এই প্রাথমিক(a priori) এবং মধ্যমঅনুমান. কিন্তু, দার্শনিকভাবে কথা বললে, সবকিছু প্রবাহিত হয়, সম্ভাব্যতা সহ সবকিছু পরিবর্তিত হয়। এটা বেশ সম্ভব যে অধ্যয়নের সময়আরও সফল 2য় দোকান মান পণ্য শতাংশ বৃদ্ধি (এবং/অথবা ১ম দোকান কমে গেছে), এবং আপনি যদি স্টকে থাকা আরও বা সমস্ত 10 হাজার আইটেম চেক করেন, তাহলে অতিমূল্যায়িত মানগুলি সত্যের অনেক কাছাকাছি হবে।

যাইহোক, যদি ইভান ভ্যাসিলিভিচ একটি অ-মানক অংশ বের করেন, তবে তার বিপরীতে - তিনি প্রথম দোকানটিকে কম-বেশি "সন্দেহ" করবেন - দ্বিতীয়টি। আমি আপনাকে নিজের জন্য এটি পরীক্ষা করার পরামর্শ দিচ্ছি:

টাস্ক 6

গুদামটি পণ্যের 2 ব্যাচ পেয়েছে: প্রথমটি - 4000 টুকরা, দ্বিতীয়টি - 6000 টুকরা। প্রথম ব্যাচে অ-মানক পণ্যগুলির গড় শতাংশ 20%, দ্বিতীয়টিতে - 10%। গুদাম থেকে এলোমেলোভাবে নেওয়া একটি পণ্য হতে পরিণত নামান এটির সম্ভাব্যতা খুঁজুন: ক) প্রথম ব্যাচ থেকে, খ) দ্বিতীয় ব্যাচ থেকে।

শর্ত দুটি অক্ষর দ্বারা আলাদা করা হবে, যা আমি গাঢ়ভাবে হাইলাইট করেছি। সমস্যাটি স্ক্র্যাচ থেকে সমাধান করা যেতে পারে, অথবা আপনি পূর্ববর্তী গণনার ফলাফলগুলি ব্যবহার করতে পারেন। নমুনায়, আমি একটি সম্পূর্ণ সমাধান করেছি, কিন্তু টাস্ক নং 5 এর সাথে একটি আনুষ্ঠানিক ওভারলে এড়াতে ইভেন্টটি "গুদাম থেকে এলোমেলোভাবে নেওয়া একটি পণ্য অ-মানক হবে"দিয়ে চিহ্নিত।

সম্ভাব্যতার পুনঃমূল্যায়নের বায়েসিয়ান স্কিম সর্বত্র পাওয়া যায় এবং এটি বিভিন্ন ধরণের স্ক্যামারদের দ্বারা সক্রিয়ভাবে শোষিত হয়। একটি তিন-অক্ষরের জয়েন্ট-স্টক কোম্পানির কথা বিবেচনা করুন যা একটি পরিবারের নাম হয়ে উঠেছে, যা জনসংখ্যা থেকে আমানত আকর্ষণ করে, অভিযোগ করা হয় সেগুলিকে কোথাও বিনিয়োগ করে, নিয়মিত লভ্যাংশ প্রদান করে ইত্যাদি। কি হচ্ছে? দিনের পর দিন, মাসের পর মাস অতিবাহিত হয়, এবং বিজ্ঞাপন এবং মুখের কথার মাধ্যমে আরও বেশি করে তথ্য প্রকাশ করা হয়, শুধুমাত্র আর্থিক পিরামিডের প্রতি আস্থার মাত্রা বাড়ায় (অতীতের ঘটনার কারণে পশ্চাৎপদ বায়েসিয়ান পুনর্মূল্যায়ন!). অর্থাত্ আমানতকারীদের দৃষ্টিতে প্রতিনিয়ত সেই সম্ভাবনা বৃদ্ধি পাচ্ছে "এটি একটি গুরুতর অফিস"; যখন বিপরীত অনুমানের সম্ভাবনা ("এরা নিয়মিত স্ক্যামার"), অবশ্যই, হ্রাস এবং হ্রাস. বাকি, আমি মনে করি, পরিষ্কার. এটি লক্ষণীয় যে অর্জিত খ্যাতি আয়োজকদের সফলভাবে ইভান ভ্যাসিলিভিচের কাছ থেকে লুকানোর সময় দেয়, যিনি কেবল বোল্টের ব্যাচ ছাড়াই নয়, প্যান্ট ছাড়াই রেখেছিলেন।

আমরা একটু পরে কম আকর্ষণীয় উদাহরণগুলিতে ফিরে আসব, তবে আপাতত, সম্ভবত তিনটি অনুমানের সাথে সবচেয়ে সাধারণ কেসটি পরবর্তী লাইনে রয়েছে:

টাস্ক 7

তিনটি কারখানায় বৈদ্যুতিক বাতি তৈরি হয়। 1ম উদ্ভিদ মোট প্রদীপের 30% উত্পাদন করে, 2য় - 55%, এবং 3য় - বাকি। 1ম উদ্ভিদের পণ্যগুলিতে 1% ত্রুটিপূর্ণ বাতি রয়েছে, 2য় - 1.5%, 3য় - 2%। দোকান তিনটি কারখানা থেকে পণ্য গ্রহণ. আমি যে বাতিটি কিনেছিলাম তা ত্রুটিপূর্ণ ছিল। এটি উদ্ভিদ 2 দ্বারা উত্পাদিত হয়েছিল এমন সম্ভাবনা কত?

অবস্থার মধ্যে Bayes সূত্রে সমস্যা যে নোট অগত্যাকিছু কি হলোএকটি ঘটনা, এই ক্ষেত্রে, একটি বাতি ক্রয়.

ঘটনা বেড়েছে এবং সমাধান"দ্রুত" শৈলীতে সাজানো আরও সুবিধাজনক।

অ্যালগরিদম ঠিক একই: প্রথম ধাপে, আমরা সম্ভাব্যতা খুঁজে পাই যে কেনা বাতিটি হবে হবেত্রুটিপূর্ণ

প্রাথমিক ডেটা ব্যবহার করে, আমরা শতাংশগুলিকে সম্ভাব্যতায় অনুবাদ করি:
যথাক্রমে 1ম, 2য় এবং 3য় কারখানা দ্বারা বাতি উত্পাদিত হওয়ার সম্ভাবনা।
নিয়ন্ত্রণ:

একইভাবে: - সংশ্লিষ্ট কারখানার জন্য একটি ত্রুটিপূর্ণ বাতি তৈরির সম্ভাবনা।

মোট সম্ভাব্যতা সূত্র অনুযায়ী:

- কেনা বাতিটি ত্রুটিপূর্ণ হওয়ার সম্ভাবনা।

ধাপ দুই. ক্রয়কৃত বাতিটি ত্রুটিপূর্ণ হতে দিন (ঘটনাটি ঘটেছে)

বেইস সূত্র অনুযায়ী:
- সম্ভাব্যতা যে ক্রয়কৃত ত্রুটিপূর্ণ বাতিটি দ্বিতীয় কারখানা দ্বারা নির্মিত

উত্তর:

পুনঃমূল্যায়নের পর কেন ২য় অনুমানের প্রাথমিক সম্ভাবনা বেড়েছে? সর্বোপরি, দ্বিতীয় উদ্ভিদটি গড় মানের প্রদীপ তৈরি করে (প্রথমটি ভাল, তৃতীয়টি আরও খারাপ)। তাহলে কেন বেড়ে গেল একটি posterioriসম্ভাব্যতা যে ত্রুটিপূর্ণ বাতি 2nd কারখানা থেকে? এটি আর "খ্যাতি" এর কারণে নয়, আকারের কারণে। যেহেতু প্ল্যান্ট নং 2 সবচেয়ে বেশি সংখ্যক প্রদীপ তৈরি করেছিল, তারপরে তারা এটিকে দোষ দেয় (অন্তত বিষয়গতভাবে): "সম্ভবত, এই ত্রুটিপূর্ণ বাতিটি সেখান থেকে এসেছে".

এটি লক্ষ্য করা আকর্ষণীয় যে 1 ম এবং 3 য় অনুমানগুলির সম্ভাব্যতাগুলি প্রত্যাশিত দিকনির্দেশগুলিতে অত্যধিক মূল্যায়ন করা হয়েছিল এবং সমান হয়ে গিয়েছিল:

নিয়ন্ত্রণ: , যা যাচাই করতে হবে।

যাইহোক, অবমূল্যায়ন এবং অত্যধিক মূল্যায়ন সম্পর্কে:

টাস্ক 8

ছাত্র গোষ্ঠীতে, 3 জনের উচ্চ স্তরের প্রশিক্ষণ রয়েছে, 19 জনের গড় স্তর রয়েছে এবং 3 জনের নিম্ন স্তর রয়েছে৷ এই ছাত্রদের জন্য সফলভাবে পরীক্ষায় উত্তীর্ণ হওয়ার সম্ভাবনা যথাক্রমে: 0.95; 0.7 এবং 0.4। পরীক্ষায় কয়েকজন শিক্ষার্থী পাস করেছে বলে জানা গেছে। সম্ভাবনা কি যে:

ক) তিনি খুব ভালোভাবে প্রস্তুত ছিলেন;
খ) পরিমিতভাবে প্রস্তুত ছিল;
গ) খারাপভাবে প্রস্তুত ছিল।

গণনা সম্পাদন করুন এবং অনুমানের পুনর্মূল্যায়নের ফলাফল বিশ্লেষণ করুন।

কাজটি বাস্তবতার কাছাকাছি এবং এটি খণ্ডকালীন শিক্ষার্থীদের একটি দলের জন্য বিশেষভাবে প্রশংসনীয়, যেখানে শিক্ষক ব্যবহারিকভাবে এই বা সেই শিক্ষার্থীর ক্ষমতা জানেন না। এই ক্ষেত্রে, ফলাফল বরং অপ্রত্যাশিত পরিণতি হতে পারে। (বিশেষ করে ১ম সেমিস্টারের পরীক্ষার জন্য). যদি একটি দুর্বলভাবে প্রস্তুত ছাত্র একটি টিকিট পাওয়ার জন্য যথেষ্ট ভাগ্যবান হয়, তাহলে শিক্ষক সম্ভবত তাকে একজন ভাল ছাত্র বা এমনকি একজন শক্তিশালী ছাত্র হিসাবে বিবেচনা করবেন, যা ভবিষ্যতে ভাল লভ্যাংশ নিয়ে আসবে। (অবশ্যই, আপনাকে "বার বাড়াতে" এবং আপনার চিত্র বজায় রাখতে হবে). যদি একজন শিক্ষার্থী 7 দিন এবং 7 রাত ধরে অধ্যয়ন করে, ক্র্যাম করে, পুনরাবৃত্তি করে তবে সে কেবল দুর্ভাগ্যজনক ছিল, তবে পরবর্তী ঘটনাগুলি সবচেয়ে খারাপ সম্ভাব্য উপায়ে বিকাশ করতে পারে - অসংখ্য রিটেক এবং প্রস্থানের দ্বারপ্রান্তে ভারসাম্য বজায় রেখে।

বলা বাহুল্য, খ্যাতি হল সবচেয়ে গুরুত্বপূর্ণ মূলধন, এটা কোন কাকতালীয় নয় যে অনেক কর্পোরেশন তাদের প্রতিষ্ঠাতা পিতার নাম বহন করে, যারা 100-200 বছর আগে ব্যবসার নেতৃত্ব দিয়েছিলেন এবং তাদের অনবদ্য খ্যাতির জন্য বিখ্যাত হয়েছিলেন।

হ্যাঁ, বায়েসিয়ান পদ্ধতি একটি নির্দিষ্ট পরিমাণে বিষয়ভিত্তিক, কিন্তু ... জীবন এভাবেই কাজ করে!

আসুন একটি চূড়ান্ত শিল্প উদাহরণ সহ উপাদানটিকে একীভূত করি, যেখানে আমি সমাধানের প্রযুক্তিগত সূক্ষ্মতা সম্পর্কে কথা বলব যা এখনও সম্মুখীন হয়নি:

টাস্ক 9

উদ্ভিদের তিনটি কর্মশালা একই ধরণের অংশ উত্পাদন করে, যা সমাবেশের জন্য একটি সাধারণ পাত্রে একত্রিত হয়। জানা যায়, প্রথম দোকানটি দ্বিতীয় দোকানের চেয়ে 2 গুণ বেশি যন্ত্রাংশ এবং তৃতীয় দোকানের চেয়ে 4 গুণ বেশি যন্ত্রাংশ তৈরি করে। প্রথম কর্মশালায়, ত্রুটিটি 12%, দ্বিতীয়টিতে - 8%, তৃতীয়টিতে - 4%। নিয়ন্ত্রণের জন্য, একটি অংশ ধারক থেকে নেওয়া হয়। এটি ত্রুটিপূর্ণ হওয়ার সম্ভাবনা কত? নিষ্কাশিত ত্রুটিপূর্ণ অংশটি 3য় কর্মশালা দ্বারা উত্পাদিত হওয়ার সম্ভাবনা কত?

টাকি ইভান ভ্যাসিলিভিচ আবার ঘোড়ার পিঠে =) চলচ্চিত্রটির একটি সুখী সমাপ্তি হওয়া উচিত =)

সমাধান: টাস্ক নং 5-8 এর বিপরীতে, এখানে একটি প্রশ্ন স্পষ্টভাবে জিজ্ঞাসা করা হয়েছে, যা মোট সম্ভাব্যতা সূত্র ব্যবহার করে সমাধান করা হয়েছে। কিন্তু অন্যদিকে, শর্তটি একটু "এনক্রিপ্ট করা" এবং সবচেয়ে সহজ সমীকরণ রচনা করার জন্য স্কুলের দক্ষতা আমাদের এই রিবাস সমাধান করতে সাহায্য করবে। "x" এর জন্য সবচেয়ে ছোট মান নেওয়া সুবিধাজনক:

তৃতীয় কর্মশালা দ্বারা উত্পাদিত অংশ ভাগ করা যাক.

শর্ত অনুসারে, প্রথম ওয়ার্কশপটি তৃতীয় ওয়ার্কশপের চেয়ে 4 গুণ বেশি উত্পাদন করে, তাই 1ম ওয়ার্কশপের ভাগ।

উপরন্তু, প্রথম কর্মশালা দ্বিতীয় কর্মশালার তুলনায় 2 গুণ বেশি পণ্য উত্পাদন করে, যার মানে হল যে পরেরটির ভাগ: .

আসুন সমীকরণটি তৈরি করি এবং সমাধান করি:

এইভাবে: - সম্ভাব্যতা যে অংশটি কন্টেইনার থেকে সরানো হয়েছে যথাক্রমে 1ম, 2য় এবং 3য় কর্মশালা দ্বারা প্রকাশ করা হয়েছিল৷

নিয়ন্ত্রণ:. উপরন্তু, এটি শব্দগুচ্ছ আবার তাকান অতিরিক্ত হবে না "এটি জানা যায় যে প্রথম কর্মশালাটি দ্বিতীয় কর্মশালার চেয়ে 2 গুণ বেশি এবং তৃতীয় কর্মশালার থেকে 4 গুণ বেশি পণ্য উত্পাদন করে"এবং নিশ্চিত করুন যে প্রাপ্ত সম্ভাবনাগুলি সত্যিই এই শর্তের সাথে মিলে যায়।

"X" এর জন্য প্রাথমিকভাবে 1ম বা 2য় দোকানের শেয়ার নেওয়া সম্ভব ছিল - সম্ভাবনাগুলি একই রকম হবে৷ তবে, এক বা অন্যভাবে, সবচেয়ে কঠিন বিভাগটি পাস করা হয়েছে, এবং সমাধানটি ট্র্যাকে রয়েছে:

শর্ত থেকে আমরা খুঁজে পাই:
- সংশ্লিষ্ট কর্মশালার জন্য একটি ত্রুটিপূর্ণ অংশ উত্পাদন সম্ভাবনা.

মোট সম্ভাব্যতা সূত্র অনুযায়ী:
ধারক থেকে এলোমেলোভাবে বের করা একটি অংশ অ-মানক হওয়ার সম্ভাবনা।

প্রশ্ন দুই: 3য় কর্মশালা দ্বারা নিষ্কাশিত ত্রুটিপূর্ণ অংশ উত্পাদিত হওয়ার সম্ভাবনা কত? এই প্রশ্নটি অনুমান করে যে অংশটি ইতিমধ্যেই সরানো হয়েছে এবং ত্রুটিপূর্ণ বলে পাওয়া গেছে। আমরা Bayes সূত্র ব্যবহার করে হাইপোথিসিস পুনর্মূল্যায়ন করি:
কাঙ্ক্ষিত সম্ভাবনা। বেশ প্রত্যাশিত - সর্বোপরি, তৃতীয় কর্মশালাটি কেবলমাত্র অংশগুলির ক্ষুদ্রতম অংশই তৈরি করে না, তবে গুণমানের দিকেও নেতৃত্ব দেয়!

এই ক্ষেত্রে, আমি ছিল চার তলা ভগ্নাংশ সরলীকরণ, যা বেইস সূত্রে সমস্যায় প্রায়ই করতে হয়। কিন্তু এই পাঠের জন্য, আমি একরকম ঘটনাক্রমে এমন উদাহরণ তুলেছি যেখানে সাধারণ ভগ্নাংশ ছাড়াই অনেক গণনা করা যেতে পারে।

যেহেতু শর্তে কোন "a" এবং "be" পয়েন্ট নেই, তাই পাঠ্য মন্তব্য সহ উত্তর প্রদান করা ভাল:

উত্তর: - পাত্র থেকে সরানো অংশটি ত্রুটিপূর্ণ হওয়ার সম্ভাবনা; - সম্ভাব্যতা যে নিষ্কাশিত ত্রুটিপূর্ণ অংশটি 3য় কর্মশালার দ্বারা প্রকাশিত হয়েছিল।

আপনি দেখতে পাচ্ছেন, মোট সম্ভাব্যতা সূত্র এবং বেইস সূত্রের সমস্যাগুলি বেশ সহজ, এবং সম্ভবত, এই কারণে তারা প্রায়শই শর্তটিকে জটিল করার চেষ্টা করে, যা আমি ইতিমধ্যে নিবন্ধের শুরুতে উল্লেখ করেছি।

অতিরিক্ত উদাহরণ সঙ্গে ফাইল আছে F.P.V এর জন্য প্রস্তুত সমাধান এবং বেইস সূত্র, উপরন্তু, সম্ভবত যারা অন্যান্য উত্সে এই বিষয়ের সাথে আরও গভীরভাবে পরিচিত হতে চান। এবং বিষয় সত্যিই খুব আকর্ষণীয় - এটা একা মূল্য কি বেইস প্যারাডক্স, যা প্রতিদিনের উপদেশকে প্রমাণ করে যে যদি একজন ব্যক্তির একটি বিরল রোগ ধরা পড়ে, তবে তার জন্য দ্বিতীয় এবং এমনকি দুটি বারবার স্বাধীন পরীক্ষা করাও বোধগম্য। দেখে মনে হবে যে তারা এটি শুধুমাত্র হতাশার কারণে করে ... - কিন্তু না! তবে আসুন দুঃখজনক বিষয় নিয়ে কথা বলি না।


একটি এলোমেলোভাবে নির্বাচিত শিক্ষার্থী পরীক্ষায় উত্তীর্ণ হওয়ার সম্ভাবনা।
শিক্ষার্থী পরীক্ষায় উত্তীর্ণ হোক। বেইসের সূত্র অনুসারে:
ক) - পরীক্ষায় উত্তীর্ণ ছাত্রটি খুব ভালোভাবে প্রস্তুত হওয়ার সম্ভাবনা। উদ্দেশ্য প্রারম্ভিক সম্ভাব্যতা অত্যধিক মূল্যায়ন করা হয়, যেহেতু প্রায় সবসময় কিছু "গড়" প্রশ্নগুলির সাথে ভাগ্যবান এবং তারা খুব দৃঢ়ভাবে উত্তর দেয়, যা অনবদ্য প্রস্তুতির ভুল ধারণা দেয়।
খ) পরীক্ষায় উত্তীর্ণ ছাত্রটি মাঝারিভাবে প্রস্তুত হওয়ার সম্ভাবনা। প্রাথমিক সম্ভাবনা সামান্য overestimated হতে সক্রিয়, কারণ প্রস্তুতির গড় স্তরের ছাত্ররা সাধারণত সংখ্যাগরিষ্ঠ হয়, উপরন্তু, শিক্ষক এখানে অসফলভাবে উত্তর দেওয়া "চমৎকার ছাত্র" এবং মাঝে মাঝে একটি খারাপ পারফরম্যান্সকারী ছাত্রকে অন্তর্ভুক্ত করবেন যিনি টিকিটের সাথে খুব ভাগ্যবান ছিলেন।
ভিতরে) - সম্ভাব্যতা যে পরীক্ষায় উত্তীর্ণ ছাত্রটি খারাপভাবে প্রস্তুত ছিল। প্রাথমিক সম্ভাবনা খারাপের জন্য অত্যধিক মূল্যায়ন করা হয়েছিল। বিস্ময়কর না.
পরীক্ষা:
উত্তর : বেইস সূত্র:

H i হাইপোথিসিসের P(H i) সম্ভাব্যতাগুলিকে প্রাইরি সম্ভাব্যতা বলা হয় - পরীক্ষার আগে সম্ভাব্যতা।
সম্ভাব্যতাগুলিকে P(A/H i) বলা হয় একটি পোস্টেরিওরি সম্ভাব্যতা - পরীক্ষার ফলে H i পরিমার্জিত হাইপোথিসিসের সম্ভাব্যতা।

উদাহরণ # 1। ডিভাইসটি উচ্চ মানের অংশ এবং সাধারণ মানের অংশ থেকে একত্রিত করা যেতে পারে। প্রায় 40% ডিভাইস উচ্চ মানের অংশ থেকে একত্রিত হয়। যদি ডিভাইসটি উচ্চ-মানের অংশগুলি থেকে একত্রিত হয়, তবে সময়ের সাথে সাথে এর নির্ভরযোগ্যতা (ব্যর্থতা-মুক্ত অপারেশনের সম্ভাবনা) 0.95 হয়; যদি সাধারণ মানের অংশ থেকে - এর নির্ভরযোগ্যতা 0.7। ডিভাইসটি সময়ের জন্য পরীক্ষা করা হয়েছিল এবং ত্রুটিহীনভাবে কাজ করেছিল। এটি উচ্চ মানের অংশ থেকে একত্রিত হয় যে সম্ভাবনা খুঁজুন.
সমাধান।দুটি অনুমান সম্ভব: H 1 - ডিভাইসটি উচ্চ-মানের অংশ থেকে একত্রিত হয়; H 2 - ডিভাইসটি সাধারণ মানের অংশ থেকে একত্রিত হয়। পরীক্ষার আগে এই অনুমানগুলির সম্ভাব্যতা: P(H 1) = 0.4, P(H 2) = 0.6। পরীক্ষার ফলস্বরূপ, ইভেন্ট A পরিলক্ষিত হয়েছিল - ডিভাইসটি সময়ের জন্য নির্দোষভাবে কাজ করেছিল। H 1 এবং H 2 অনুমানের অধীনে এই ঘটনার শর্তাধীন সম্ভাবনাগুলি হল: P(A|H 1) = 0.95; P(A|H 2) = 0.7। সূত্র ব্যবহার করে (12), আমরা পরীক্ষার পরে হাইপোথিসিস H 1 এর সম্ভাব্যতা খুঁজে পাই:

উদাহরণ #2। দুই শ্যুটার স্বাধীনভাবে একই লক্ষ্যবস্তুতে গুলি করে, প্রত্যেকে একটি করে গুলি চালায়। প্রথম শ্যুটারের লক্ষ্যে আঘাত করার সম্ভাবনা 0.8, দ্বিতীয়টির জন্য 0.4। গুলি করার পর লক্ষ্যে একটি ছিদ্র পাওয়া গেছে। দুই শ্যুটার একই পয়েন্টে আঘাত করতে পারে না বলে ধরে নিয়ে, প্রথম শ্যুটারটি লক্ষ্যে আঘাত করার সম্ভাবনা খুঁজে বের করুন।
সমাধান।ইভেন্ট A শুটিংয়ের পরে লক্ষ্যে একটি গর্ত পাওয়া যাক। শুটিং শুরুর আগে, অনুমানগুলি সম্ভব:
H 1 - প্রথম বা দ্বিতীয় শুটার কেউই আঘাত করবে না, এই অনুমানের সম্ভাবনা: P(H 1) = 0.2 0.6 = 0.12।
H 2 - উভয় শ্যুটার আঘাত করবে, P(H 2) = 0.8 0.4 = 0.32।
H 3 - প্রথম শ্যুটার আঘাত করবে, এবং দ্বিতীয়টি আঘাত করবে না, P(H 3) = 0.8 0.6 = 0.48৷
H 4 - প্রথম শ্যুটার আঘাত করবে না, তবে দ্বিতীয়টি আঘাত করবে, P (H 4) = 0.2 0.4 = 0.08।
এই অনুমানগুলির অধীনে ইভেন্ট A এর শর্তাধীন সম্ভাবনাগুলি হল:

অভিজ্ঞতার পরে, হাইপোথিসিস H 1 এবং H 2 অসম্ভব হয়ে ওঠে এবং H 3 এবং H 4 হাইপোথিসিসের সম্ভাবনাগুলি
সমান হবে:


সুতরাং, এটি সম্ভবত প্রথম শুটার দ্বারা লক্ষ্যবস্তুতে আঘাত করা হয়।

উদাহরণ #3। সমাবেশ দোকানে, একটি বৈদ্যুতিক মোটর ডিভাইসের সাথে সংযুক্ত করা হয়। বৈদ্যুতিক মোটর তিনটি প্রস্তুতকারকের দ্বারা সরবরাহ করা হয়। গুদামে নামযুক্ত উদ্ভিদের যথাক্রমে 19.6 এবং 11টি বৈদ্যুতিক মোটর রয়েছে, যা 0.85, 0.76 এবং 0.71 এর সম্ভাব্যতা সহ যথাক্রমে ওয়ারেন্টি সময়কাল শেষ না হওয়া পর্যন্ত ব্যর্থতা ছাড়াই কাজ করতে পারে। কর্মী এলোমেলোভাবে একটি ইঞ্জিন নেয় এবং এটি ডিভাইসে মাউন্ট করে। সম্ভাব্যতা খুঁজুন যে বৈদ্যুতিক মোটর, মাউন্ট করা এবং ওয়ারেন্টি মেয়াদ শেষ না হওয়া পর্যন্ত ব্যর্থ না হয়ে কাজ করে, যথাক্রমে প্রথম, দ্বিতীয় বা তৃতীয় প্রস্তুতকারক দ্বারা সরবরাহ করা হয়েছিল।
সমাধান।প্রথম পরীক্ষাটি বৈদ্যুতিক মোটরের পছন্দ, দ্বিতীয়টি হল ওয়ারেন্টি সময়কালে বৈদ্যুতিক মোটরের অপারেশন। নিম্নলিখিত ঘটনা বিবেচনা করুন:
A - বৈদ্যুতিক মোটর ওয়ারেন্টি সময়কাল শেষ না হওয়া পর্যন্ত ত্রুটিহীনভাবে কাজ করে;
H 1 - ফিটার প্রথম উদ্ভিদের পণ্য থেকে ইঞ্জিন নেবে;
H 2 - ফিটার দ্বিতীয় উদ্ভিদের পণ্য থেকে ইঞ্জিন নেবে;
H 3 - ফিটার তৃতীয় উদ্ভিদের পণ্য থেকে ইঞ্জিন নেবে।
ঘটনা A এর সম্ভাব্যতা মোট সম্ভাব্যতা সূত্র দ্বারা গণনা করা হয়:

শর্তযুক্ত সম্ভাব্যতা সমস্যা বিবৃতিতে নির্দিষ্ট করা হয়েছে:

আসুন সম্ভাব্যতা খুঁজে বের করা যাক


Bayes সূত্র ব্যবহার করে (12), আমরা H i অনুমানের শর্তসাপেক্ষ সম্ভাব্যতা গণনা করি:

উদাহরণ #4। তিনটি উপাদান নিয়ে গঠিত সিস্টেমের অপারেশন চলাকালীন 1, 2 এবং 3 সংখ্যার উপাদানগুলি ব্যর্থ হবে এমন সম্ভাবনাগুলি 3: 2: 5 হিসাবে সম্পর্কিত। এই উপাদানগুলির ব্যর্থতা সনাক্ত করার সম্ভাবনা যথাক্রমে 0.95; 0.9 এবং 0.6।

খ) এই কাজের শর্তে, সিস্টেমের অপারেশন চলাকালীন একটি ব্যর্থতা সনাক্ত করা হয়েছিল। কোন উপাদান ব্যর্থ হওয়ার সম্ভাবনা সবচেয়ে বেশি?

সমাধান।
একটি ব্যর্থ ঘটনা হতে দিন. আসুন আমরা হাইপোথিসিসের একটি সিস্টেম চালু করি - প্রথম উপাদানের ব্যর্থতা, H2 - দ্বিতীয় উপাদানের ব্যর্থতা, H3 - তৃতীয় উপাদানটির ব্যর্থতা।
আমরা অনুমানের সম্ভাব্যতা খুঁজে পাই:
P(H1) = 3/(3+2+5) = 0.3
P(H2) = 2/(3+2+5) = 0.2
P(H3) = 5/(3+2+5) = 0.5

সমস্যার শর্ত অনুসারে, ঘটনা A এর শর্তসাপেক্ষ সম্ভাবনাগুলি হল:
P(A|H1) = 0.95, P(A|H2) = 0.9, P(A|H3) = 0.6

ক) সিস্টেমে একটি ব্যর্থতা সনাক্ত করার সম্ভাবনা খুঁজুন।
P(A) = P(H1)*P(A|H1) + P(H2)*P(A|H2) + P(H3)*P(A|H3) = 0.3*0.95 + 0.2*0.9 + 0.5 *০.৬ = ০.৭৬৫

খ) এই কাজের শর্তে, সিস্টেমের অপারেশন চলাকালীন একটি ব্যর্থতা সনাক্ত করা হয়েছিল। কোন উপাদান ব্যর্থ হওয়ার সম্ভাবনা সবচেয়ে বেশি?
P1 = P(H1)*P(A|H1)/ P(A) = 0.3*0.95 / 0.765 = 0.373
P2 = P(H2)*P(A|H2)/ P(A) = 0.2*0.9 / 0.765 = 0.235
P3 = P(H3)*P(A|H3)/ P(A) = 0.5*0.6 / 0.765 = 0.392

তৃতীয় উপাদানের সর্বোচ্চ সম্ভাবনা।

বেইস কে? এবং এটি পরিচালনার সাথে কি করার আছে? - বেশ ন্যায্য প্রশ্ন দ্বারা অনুসরণ করা যেতে পারে. আপাতত, এর জন্য আমার কথা নিন: এটি খুবই গুরুত্বপূর্ণ! .. এবং আকর্ষণীয় (অন্তত আমার জন্য)।

বেশিরভাগ পরিচালকরা কোন দৃষ্টান্তে কাজ করেন: যদি আমি কিছু পর্যবেক্ষণ করি, তাহলে আমি তা থেকে কী সিদ্ধান্ত নিতে পারি? Bayes কি শেখায়: আমার এই কিছু পর্যবেক্ষণ করার জন্য আসলে কি হতে হবে? এইভাবে সমস্ত বিজ্ঞানের বিকাশ ঘটে এবং তিনি এটি সম্পর্কে লিখেছেন (আমি স্মৃতি থেকে উদ্ধৃতি): যে ব্যক্তির মাথায় কোনও তত্ত্ব নেই সে বিভিন্ন ঘটনার (পর্যবেক্ষণ) প্রভাবে এক ধারণা থেকে অন্য ধারণা থেকে দূরে সরে যাবে। কোন কিছুর জন্য নয় তারা বলে: একটি ভাল তত্ত্বের চেয়ে বেশি ব্যবহারিক কিছুই নেই।

অনুশীলন থেকে একটি উদাহরণ। আমার অধস্তন একটি ভুল করে, এবং আমার সহকর্মী (অন্য বিভাগের প্রধান) বলেছেন যে অবহেলাকারী কর্মচারীর উপর ব্যবস্থাপক প্রভাব প্রয়োগ করা প্রয়োজন (অন্য কথায়, শাস্তি / তিরস্কার)। এবং আমি জানি যে এই কর্মচারী প্রতি মাসে একই ধরণের 4-5 হাজার অপারেশন করে এবং এই সময়ে সে 10 টির বেশি ভুল করে না। দৃষ্টান্তের পার্থক্য অনুভব করেন? আমার সহকর্মী পর্যবেক্ষণে প্রতিক্রিয়া জানায়, এবং আমার কাছে একটি প্রাথমিক জ্ঞান রয়েছে যে একজন কর্মচারী নির্দিষ্ট সংখ্যক ভুল করে, যাতে আরও একটি এই জ্ঞানকে প্রভাবিত করে না... এখন, যদি মাসের শেষে দেখা যায় যে সেখানে আছে, উদাহরণস্বরূপ, এই ধরনের 15 টি ত্রুটি!

বায়েসিয়ান পদ্ধতির গুরুত্ব সম্পর্কে নিশ্চিত? কৌতূহলী? আশা করি". এবং এখন মলম মধ্যে একটি মাছি. দুর্ভাগ্যবশত, বায়েসিয়ান ধারণাগুলি খুব কমই প্রথম দিকে দেওয়া হয়। আমি অকপটে দুর্ভাগ্য ছিলাম, কারণ আমি জনপ্রিয় সাহিত্যের মাধ্যমে এই ধারণাগুলির সাথে পরিচিত হয়েছিলাম, যা পড়ার পরে অনেক প্রশ্ন থেকে যায়। একটি নোট লেখার পরিকল্পনা করার সময়, আমি বেইস অনুসারে পূর্বে যে সমস্ত রূপরেখা দিয়েছিলাম তা সংগ্রহ করেছি এবং তারা ইন্টারনেটে যা লিখেছে তাও অধ্যয়ন করেছি। আমি আপনার কাছে এই বিষয়ে আমার সেরা অনুমান উপস্থাপন করছি। Bayesian সম্ভাব্যতার ভূমিকা.

বেইসের উপপাদ্যের উদ্ভব

নিম্নলিখিত পরীক্ষাটি বিবেচনা করুন: আমরা সেগমেন্টে থাকা যেকোনো সংখ্যার নাম দিই এবং যখন এই সংখ্যাটি 0.1 এবং 0.4 (চিত্র 1a) এর মধ্যে হয় তখন ঠিক করি। এই ইভেন্টের সম্ভাব্যতা সেগমেন্টের দৈর্ঘ্যের সাথে সেগমেন্টের মোট দৈর্ঘ্যের অনুপাতের সমান, শর্ত থাকে যে সেগমেন্টে সংখ্যার উপস্থিতি সমান. গাণিতিকভাবে, এটি লেখা যেতে পারে পি(0,1 <= এক্স <= 0,4) = 0,3, или кратко আর(এক্স) = 0.3, কোথায় আর- সম্ভাবনা, এক্সপরিসরে একটি এলোমেলো পরিবর্তনশীল, এক্সপরিসরে একটি এলোমেলো পরিবর্তনশীল। অর্থাৎ, সেগমেন্টে আঘাত করার সম্ভাবনা 30%।

ভাত। 1. সম্ভাব্যতার গ্রাফিক্যাল ব্যাখ্যা

এখন বর্গক্ষেত্র x (চিত্র 1b) বিবেচনা করুন। ধরা যাক আমাদের সংখ্যার জোড়া নাম দিতে হবে ( এক্স, y), যার প্রতিটি শূন্যের চেয়ে বড় এবং একের চেয়ে কম। সম্ভাবনা যে এক্স(প্রথম সংখ্যা) সেগমেন্টের মধ্যে থাকবে (নীল ক্ষেত্রফল 1), নীল ক্ষেত্রফলের ক্ষেত্রফলের সাথে সমগ্র বর্গক্ষেত্রের অনুপাতের সমান, অর্থাৎ (0.4 - 0.1) ) * (1 - 0) / (1 * 1) = 0, 3, অর্থাৎ একই 30%। সম্ভাবনা যে yসেগমেন্টের ভিতরে রয়েছে (সবুজ এলাকা 2) পুরো বর্গক্ষেত্রের ক্ষেত্রফলের সাথে সবুজ এলাকার ক্ষেত্রফলের অনুপাতের সমান পি(0,5 <= y <= 0,7) = 0,2, или кратко আর(Y) = 0,2.

একই সময়ে মান সম্পর্কে কি শেখা যাবে এক্সএবং y. যেমন উভয়েরই সম্ভাবনা কত এক্সএবং yসংশ্লিষ্ট প্রদত্ত সেগমেন্টে আছে? এটি করার জন্য, আপনাকে ডোমেইন 3 (সবুজ এবং নীল স্ট্রাইপের ছেদ) পুরো বর্গক্ষেত্রের ক্ষেত্রের অনুপাত গণনা করতে হবে: পি(এক্স, Y) = (0,4 – 0,1) * (0,7 – 0,5) / (1 * 1) = 0,06.

এখন ধরুন আমরা জানতে চাই যে সম্ভাব্যতা কি yযদি ব্যবধানে থাকে এক্সইতিমধ্যে পরিসীমা মধ্যে আছে. যে, আসলে, আমাদের একটি ফিল্টার আছে এবং যখন আমরা জোড়া কল করি ( এক্স, y), তারপরে আমরা অবিলম্বে সেই জোড়াগুলি বাতিল করে দিই যেগুলি সন্ধানের শর্ত পূরণ করে না এক্সএকটি প্রদত্ত ব্যবধানে, এবং তারপর ফিল্টার করা জোড়া থেকে আমরা সেইগুলি গণনা করি যার জন্য yআমাদের অবস্থাকে সন্তুষ্ট করে এবং সম্ভাব্যতাকে জোড়ার সংখ্যার অনুপাত হিসাবে বিবেচনা করে যার জন্য yউপরের সেগমেন্টে ফিল্টার করা জোড়ার মোট সংখ্যার (অর্থাৎ যার জন্য এক্সসেগমেন্টে রয়েছে)। আমরা এই সম্ভাব্যতা হিসাবে লিখতে পারি পি(Y|এক্স এক্সসীমার মধ্যে আঘাত।" স্পষ্টতই, এই সম্ভাবনাটি ক্ষেত্রফল 3 এর ক্ষেত্রফলের সাথে নীল ক্ষেত্রফল 1 এর অনুপাতের সমান। ক্ষেত্রফল 3 এর ক্ষেত্রফল হল (0.4 - 0.1) * (0.7 - 0.5) = 0.06, এবং নীল ক্ষেত্রফল 1 ( 0.4 - 0.1) * (1 - 0) = 0.3, তারপর তাদের অনুপাত 0.06 / 0.3 = 0.2। অন্য কথায়, খুঁজে পাওয়ার সম্ভাবনা yসেগমেন্টে, যে প্রদান করা হয়েছে এক্সসেগমেন্টের অন্তর্গত পি(Y|এক্স) = 0,2.

পূর্ববর্তী অনুচ্ছেদে, আমরা আসলে পরিচয় প্রণয়ন করেছি: পি(Y|এক্স) = পি(এক্স, Y) /পি( এক্স) এতে লেখা আছে: "আঘাতের সম্ভাবনা পরিসীমা, যে প্রদান এক্সপরিসরে আঘাত একই সাথে আঘাতের সম্ভাবনার অনুপাতের সমান এক্সপরিসীমা এবং সীমার মধ্যে, আঘাতের সম্ভাবনা পর্যন্ত এক্সপরিসরের মধ্যে।"

সাদৃশ্য দ্বারা, সম্ভাবনা বিবেচনা করুন পি(এক্স|Y) আমরা দম্পতি কল এক্স, y) এবং যার জন্য ফিল্টার করুন y 0.5 এবং 0.7 এর মধ্যে থাকে, তারপর সম্ভাব্যতা এক্সযে প্রদান করা সেগমেন্ট মধ্যে আছে yঅংশের অন্তর্গত এলাকা 3 এর ক্ষেত্রফলের সাথে সবুজ এলাকা 2 এর ক্ষেত্রফলের অনুপাতের সমান: পি(এক্স|Y) = পি(এক্স, Y) / পি(Y).

উল্লেখ্য যে সম্ভাবনা পি(এক্স, Y) এবং পি(Y, X) সমান, এবং উভয়ই জোন 3 এর ক্ষেত্রফলের সাথে সমগ্র বর্গক্ষেত্রের ক্ষেত্রফলের অনুপাতের সমান, তবে সম্ভাবনাগুলি পি(Y|এক্স) এবং পি(এক্স|Y) সমান না; যখন সম্ভাবনা পি(Y|এক্স) ক্ষেত্রফল 3 থেকে ক্ষেত্রফল 1 এর অনুপাতের সমান, এবং পি(এক্স|Y) – ডোমেইন 3 থেকে ডোমেইন 2। এটিও নোট করুন পি(এক্স, Y) প্রায়ই হিসাবে চিহ্নিত করা হয় পি(এক্স&Y).

সুতরাং আমাদের দুটি সংজ্ঞা আছে: পি(Y|এক্স) = পি(এক্স, Y) /পি( এক্স) এবং পি(এক্স|Y) = পি(এক্স, Y) / পি(Y)

আসুন এই সমতাগুলিকে এভাবে আবার লিখি: পি(এক্স, Y) = পি(Y|এক্স)*p( এক্স) এবং পি(এক্স, Y) = পি(এক্স|Y) * পি(Y)

যেহেতু বাম দিকগুলি সমান, তাই ডান দিকগুলিও: পি(Y|এক্স)*p( এক্স) = পি(এক্স|Y) * পি(Y)

অথবা আমরা শেষ সমতাকে আবার লিখতে পারি:

এটা বেইসের উপপাদ্য!

এটা কি সম্ভব যে এই ধরনের সহজ (প্রায় টাউটোলজিকাল) রূপান্তরগুলি একটি মহান উপপাদ্যের জন্ম দেয়!? সিদ্ধান্তে তাড়াহুড়ো করবেন না। আমরা কি পেয়েছি তা নিয়ে আবার কথা বলি। কিছু প্রাথমিক (একটি অগ্রাধিকার) সম্ভাবনা ছিল আর(X) যে র‍্যান্ডম পরিবর্তনশীল এক্সসেগমেন্টে সমানভাবে বিতরণ করা সীমার মধ্যে পড়ে এক্স. কিছু ঘটনা ঘটেছে Y, যার ফলস্বরূপ আমরা একই র্যান্ডম ভেরিয়েবলের একটি পোস্টেরিওরি সম্ভাব্যতা পেয়েছি এক্স: আর(X|Y), এবং এই সম্ভাবনা থেকে ভিন্ন আর(X) সহগ দ্বারা। ঘটনা Yপ্রমাণ বলা হয়, কমবেশি নিশ্চিত বা খণ্ডন এক্স. এই সহগকে কখনও কখনও বলা হয় প্রমাণের ক্ষমতা. প্রমাণ যত শক্তিশালী হবে, Y পর্যবেক্ষণের বাস্তবতা পূর্বের সম্ভাব্যতাকে তত বেশি পরিবর্তন করবে, পরবর্তী সম্ভাব্যতা আগের থেকে তত বেশি আলাদা হবে। প্রমাণ দুর্বল হলে, পোস্টেরিয়র প্রায় আগেরটির সমান।

বিযুক্ত র্যান্ডম ভেরিয়েবলের জন্য বেইস সূত্র

পূর্ববর্তী বিভাগে, আমরা ব্যবধানে সংজ্ঞায়িত x এবং y ক্রমাগত র্যান্ডম ভেরিয়েবলের জন্য Bayes সূত্রটি নিয়েছি। বিচ্ছিন্ন র্যান্ডম ভেরিয়েবল সহ একটি উদাহরণ বিবেচনা করুন, প্রতিটি দুটি সম্ভাব্য মান গ্রহণ করে। নিয়মিত চিকিৎসা পরীক্ষায় দেখা গেছে যে চল্লিশ বছর বয়সে 1% মহিলা স্তন ক্যান্সারে ভোগেন। ক্যান্সারে আক্রান্ত 80% মহিলা ম্যামোগ্রাফির ইতিবাচক ফলাফল পান। 9.6% সুস্থ মহিলাও ইতিবাচক ম্যামোগ্রাফি ফলাফল পান। পরীক্ষার সময়, এই বয়সের একজন মহিলার ম্যামোগ্রামের ইতিবাচক ফলাফল পাওয়া গেছে। তার আসলে স্তন ক্যান্সার হওয়ার সম্ভাবনা কত?

যুক্তি/গণনার কোর্সটি নিম্নরূপ। 1% ক্যান্সার রোগীর মধ্যে, ম্যামোগ্রাফি 80% ইতিবাচক ফলাফল দেবে = 1% * 80% = 0.8%। 99% সুস্থ মহিলাদের মধ্যে, ম্যামোগ্রাফি 9.6% ইতিবাচক ফলাফল দেবে = 99% * 9.6% = 9.504%। মোট, 10.304% (9.504% + 0.8%) ইতিবাচক ম্যামোগ্রাম ফলাফলের মধ্যে, শুধুমাত্র 0.8% অসুস্থ, এবং বাকি 9.504% সুস্থ। এইভাবে, পজিটিভ ম্যামোগ্রাম সহ একজন মহিলার ক্যান্সার হওয়ার সম্ভাবনা 0.8% / 10.304% = 7.764%। আপনি কি 80% বা তাই মনে করেন?

আমাদের উদাহরণে, Bayes সূত্র নিম্নলিখিত ফর্ম নেয়:

আসুন এই সূত্রটির "শারীরিক" অর্থ সম্পর্কে আবার কথা বলি। এক্সএকটি এলোমেলো পরিবর্তনশীল (নির্ণয়), যা নিম্নলিখিত মানগুলি নেয়: X 1- অসুস্থ এবং X 2- সুস্থ; Y- এলোমেলো পরিবর্তনশীল (পরিমাপের ফলাফল - ম্যামোগ্রাফি), যা মান নেয়: Y 1- একটি ইতিবাচক ফলাফল এবং Y2- নেতিবাচক ফলাফল; p(X 1)- ম্যামোগ্রাফির আগে অসুস্থতার সম্ভাবনা (একটি অগ্রাধিকার সম্ভাবনা), 1% এর সমান; আর(Y 1 |এক্স 1 ) - রোগী অসুস্থ হলে একটি ইতিবাচক ফলাফলের সম্ভাবনা (শর্তসাপেক্ষ সম্ভাবনা, যেহেতু এটি অবশ্যই কাজের শর্তে নির্দিষ্ট করা উচিত), 80% এর সমান; আর(Y 1 |এক্স 2 ) – রোগী সুস্থ থাকলে একটি ইতিবাচক ফলাফলের সম্ভাবনা (এছাড়াও শর্তসাপেক্ষ সম্ভাবনা), 9.6% এর সমান; p(X 2)- ম্যামোগ্রাফির আগে রোগীর সুস্থ হওয়ার সম্ভাবনা (একটি অগ্রাধিকার সম্ভাবনা), 99% এর সমান; p(X 1|Y 1 ) – রোগীর অসুস্থ হওয়ার সম্ভাবনা, একটি ইতিবাচক ম্যামোগ্রাম ফলাফল দেওয়া হয় (পরবর্তী সম্ভাবনা)।

এটি দেখা যায় যে উত্তরের সম্ভাব্যতা (আমরা যা খুঁজছি) পূর্বের সম্ভাবনার (প্রাথমিক) সাথে কিছুটা জটিল সহগ সমানুপাতিক . আমি আবার জোর দেব. আমার মতে, এটি বায়েসিয়ান পদ্ধতির একটি মৌলিক দিক। মাত্রা ( Y) প্রাথমিকভাবে উপলব্ধ (একটি অগ্রাধিকার) তে একটি নির্দিষ্ট পরিমাণ তথ্য যোগ করেছে, যা বস্তু সম্পর্কে আমাদের জ্ঞানকে স্পষ্ট করেছে।

উদাহরণ

আচ্ছাদিত উপাদান একত্রিত করতে, বিভিন্ন সমস্যা সমাধান করার চেষ্টা করুন।

উদাহরণ 1 3 urns আছে; প্রথম 3টি সাদা বল এবং 1টি কালো; দ্বিতীয়টিতে - 2টি সাদা বল এবং 3টি কালো; তৃতীয়টিতে - 3টি সাদা বল। কেউ এলোমেলোভাবে একটি কলসের কাছে যায় এবং এটি থেকে 1টি বল আঁকে। এই বল সাদা। 1ম, 2য়, 3য় কলস থেকে বলটি আঁকা হয়েছে তার পিছনের সম্ভাব্যতাগুলি খুঁজুন।

সমাধান। আমাদের তিনটি অনুমান রয়েছে: H 1 = (প্রথম কলস নির্বাচিত), H 2 = (দ্বিতীয় কলস নির্বাচিত), H 3 = (তৃতীয় কলস নির্বাচিত)। যেহেতু মূর্তিটি এলোমেলোভাবে বেছে নেওয়া হয়েছে, তাই অনুমানের একটি অগ্রাধিকার সম্ভাব্যতা হল: Р(Н 1) = Р(Н 2) = Р(Н 3) = 1/3৷

পরীক্ষার ফলস্বরূপ, ঘটনা A = উপস্থিত হয়েছিল (নির্বাচিত কলস থেকে একটি সাদা বল নেওয়া হয়েছিল)। H 1, H 2, H 3: P(A|H 1) = 3/4, P(A|H 2) = 2/5, P(A|H 3) = 1 অনুমানের অধীনে ঘটনা A-এর শর্তসাপেক্ষ সম্ভাবনা। উদাহরণস্বরূপ, প্রথম সমতাটি এভাবে পড়ে: "প্রথম কলসটি বেছে নেওয়া হলে একটি সাদা বল আঁকার সম্ভাবনা 3/4 (যেহেতু প্রথম কলসে 4টি বল রয়েছে এবং তাদের মধ্যে 3টি সাদা)"।

Bayes সূত্র প্রয়োগ করে, আমরা অনুমানের পরবর্তী সম্ভাব্যতা খুঁজে পাই:

এইভাবে, ঘটনা A এর সংঘটন সম্পর্কে তথ্যের আলোকে, অনুমানের সম্ভাব্যতাগুলি পরিবর্তিত হয়েছে: সবচেয়ে সম্ভাব্য হাইপোথিসিস H 3 হয়ে উঠেছে, সর্বনিম্ন সম্ভাব্য - হাইপোথিসিস H 2।

উদাহরণ 2দুই শ্যুটার স্বাধীনভাবে একই লক্ষ্যবস্তুতে গুলি করে, প্রত্যেকে একটি করে গুলি চালায়। প্রথম শ্যুটারের লক্ষ্যে আঘাত করার সম্ভাবনা 0.8, দ্বিতীয়টির জন্য - 0.4। গুলি করার পর লক্ষ্যে একটি ছিদ্র পাওয়া গেছে। সম্ভাব্যতা খুঁজুন যে এই গর্তটি প্রথম শুটারের অন্তর্গত (আমরা ফলাফলটি বাতিল করে দিই (উভয় গর্ত একত্রিত হয়) হিসাবে নগণ্যভাবে অসম্ভাব্য)।

সমাধান। পরীক্ষার আগে, নিম্নলিখিত অনুমানগুলি সম্ভব: H 1 = (প্রথম বা দ্বিতীয় তীরটি আঘাত করবে না), H 2 = (উভয় তীর আঘাত করবে), H 3 - (প্রথম শুটার আঘাত করবে, এবং দ্বিতীয়টি আঘাত করবে না ), H 4 = (প্রথম শুটার আঘাত করবে না, এবং দ্বিতীয় আঘাত করবে)। অনুমানের পূর্ব সম্ভাবনা:

P (H 1) \u003d 0.2 * 0.6 \u003d 0.12; P (H 2) \u003d 0.8 * 0.4 \u003d 0.32; P (H 3) \u003d 0.8 * 0.6 \u003d 0.48; P (H 4) \u003d 0.2 * 0.4 \u003d 0.08।

এই অনুমানের অধীনে পর্যবেক্ষিত ইভেন্ট A = (লক্ষ্যে একটি ছিদ্র আছে) এর শর্তসাপেক্ষ সম্ভাবনাগুলি হল: P(A|H 1) = P(A|H 2) = 0; P(A|H 3) = P(A|H 4) = 1

অভিজ্ঞতার পরে, হাইপোথিসিস H 1 এবং H 2 অসম্ভব হয়ে ওঠে এবং Bayes সূত্র অনুসারে হাইপোথিসিস H 3 এবং H 4 এর পরবর্তী সম্ভাব্যতাগুলি হবে:

স্প্যাম বিরুদ্ধে Bayes

বেইসের সূত্র স্প্যাম ফিল্টারগুলির বিকাশে ব্যাপক প্রয়োগ পেয়েছে। ধরা যাক কোন ইমেলগুলি স্প্যাম তা নির্ধারণ করতে আপনি একটি কম্পিউটারকে প্রশিক্ষণ দিতে চান৷ আমরা Bayesian অনুমান ব্যবহার করে অভিধান এবং শব্দ সংমিশ্রণ থেকে শুরু করব। আসুন প্রথমে অনুমানের একটি স্থান তৈরি করি। যেকোনো অক্ষর সম্পর্কে আমাদের 2টি অনুমান আছে: H A হল স্প্যাম, H B স্প্যাম নয়, কিন্তু একটি স্বাভাবিক, প্রয়োজনীয় চিঠি।

প্রথমে, আসুন আমাদের ভবিষ্যত স্প্যাম-বিরোধী সিস্টেমকে "প্রশিক্ষিত" করি। আসুন আমাদের কাছে থাকা সমস্ত অক্ষর নিন এবং সেগুলিকে 10টি অক্ষরের দুটি "স্তূপে" ভাগ করি। আমরা একটিতে স্প্যাম অক্ষর রাখি এবং একে এইচ এ হিপ বলি, অন্যটিতে আমরা প্রয়োজনীয় চিঠিপত্র রাখি এবং একে এইচ বি হিপ বলি। এখন দেখা যাক: স্প্যাম এবং প্রয়োজনীয় ইমেইলে কোন শব্দ এবং বাক্যাংশ পাওয়া যায় এবং কোন ফ্রিকোয়েন্সি সহ? এই শব্দগুলি এবং বাক্যাংশগুলিকে প্রমাণ বলা হবে এবং E 1 , E 2 দ্বারা চিহ্নিত করা হবে ... দেখা যাচ্ছে যে সাধারণত ব্যবহৃত শব্দগুলি (উদাহরণস্বরূপ, শব্দগুলি "লাইক", "আপনার") স্তূপে H A এবং H B এর সাথে ঘটে একই ফ্রিকোয়েন্সি। সুতরাং, একটি চিঠিতে এই শব্দগুলির উপস্থিতি আমাদেরকে কিছুই বলে না যে এটি কোন স্তূপের সাথে সম্পর্কিত (দুর্বল প্রমাণ)। আসুন এই শব্দগুলিকে "স্প্যাম" এর সম্ভাব্যতার অনুমানের একটি নিরপেক্ষ মান নির্ধারণ করি, বলুন, 0.5।

"কথোপকথনমূলক ইংরেজি" বাক্যাংশটি শুধুমাত্র 10টি অক্ষরে এবং আরও প্রায়ই স্প্যাম ইমেলে (উদাহরণস্বরূপ, সমস্ত 10টির মধ্যে 7টি স্প্যাম ইমেলে) সঠিকটির চেয়ে (10টির মধ্যে 3টিতে) উপস্থিত হতে দিন। আসুন এই বাক্যাংশটিকে স্প্যামের জন্য 7/10 এর উচ্চ স্কোর এবং সাধারণ ইমেলের জন্য একটি কম স্কোর দিন: 3/10। বিপরীতভাবে, এটি প্রমাণিত হয়েছে যে "বন্ধু" শব্দটি সাধারণ অক্ষরে বেশি সাধারণ ছিল (10টির মধ্যে 6)। এবং তাই আমরা একটি ছোট চিঠি পেয়েছি: “বন্ধু! আপনার কথ্য ইংরেজি কেমন?. এর "স্প্যামনেস" মূল্যায়ন করার চেষ্টা করা যাক। আমরা কিছুটা সরলীকৃত Bayes সূত্র এবং আমাদের আনুমানিক অনুমান ব্যবহার করে প্রতিটি হিপের সাধারণ অনুমান P(H A), P(H B) রাখব:

P(H A) = A/(A+B), কোথায় A \u003d p a1 * p a2 * ... * প্যান, B \u003d p b1 * p b2 * ... * p b n \u003d (1 - p a1) * (1 - p a2) * ... * ( 1 - p একটি)।

সারণী 1. লেখার সরলীকৃত (এবং অসম্পূর্ণ) বায়েসিয়ান মূল্যায়ন

এইভাবে, আমাদের অনুমানমূলক চিঠি "স্প্যাম" এর দিকে জোর দিয়ে যুক্ত হওয়ার সম্ভাবনার একটি মূল্যায়ন পেয়েছে। আমরা কি একটি গাদা মধ্যে চিঠি নিক্ষেপ করার সিদ্ধান্ত নিতে পারি? সিদ্ধান্তের থ্রেশহোল্ড সেট করা যাক:

  • P(H i) ≥ T হলে আমরা ধরে নেব যে অক্ষরটি H i স্তূপের অন্তর্গত।
  • P(H i) ≤ L হলে অক্ষরটি হিপের অন্তর্গত নয়।
  • যদি L ≤ P(H i) ≤ T হয়, তাহলে কোন সিদ্ধান্ত নেওয়া যাবে না।

আপনি T = 0.95 এবং L = 0.05 নিতে পারেন। যেহেতু প্রশ্নপত্রের জন্য এবং 0.05< P(H A) < 0,95, и 0,05 < P(H В) < 0,95, то мы не сможем принять решение, куда отнести данное письмо: к спаму (H A) или к нужным письмам (H B). Можно ли улучшить оценку, используя больше информации?

হ্যাঁ. আসুন প্রতিটি প্রমাণের জন্য স্কোরকে ভিন্ন উপায়ে গণনা করি, ঠিক যেমন বেইস পরামর্শ দিয়েছেন। দিন:

F a হল মোট স্প্যাম ইমেইলের সংখ্যা;

F ai হল একটি শংসাপত্র সহ অক্ষরের সংখ্যা iস্প্যামের স্তূপে;

F b হল মোট অক্ষর সংখ্যা;

F bi হল একটি শংসাপত্র সহ অক্ষরের সংখ্যা iপ্রয়োজনীয় (প্রাসঙ্গিক) চিঠির স্তূপে।

তারপর: p ai = F ai /F a , p bi = F bi / F b . P(H A) = A/(A+B), P(H B) = B/(A+B), কোথায়А = p a1 *p a2 *…*p an , B = p b1 *p b2 *…*p b n

অনুগ্রহ করে মনে রাখবেন যে p ai এবং p bi প্রমাণ শব্দের স্কোরগুলি উদ্দেশ্যমূলক হয়ে উঠেছে এবং মানুষের অংশগ্রহণ ছাড়াই গণনা করা যেতে পারে।

সারণী 2. একটি চিঠি থেকে উপলব্ধ বৈশিষ্ট্যগুলির জন্য একটি আরো সঠিক (কিন্তু অসম্পূর্ণ) বায়েসিয়ান অনুমান

আমরা একটি সুনির্দিষ্ট ফলাফল পেয়েছি - সম্ভাব্যতার একটি বড় ব্যবধানে, অক্ষরটিকে প্রয়োজনীয় অক্ষরগুলিতে দায়ী করা যেতে পারে, যেহেতু P(H B) = 0.997 > T = 0.95৷ কেন ফলাফল পরিবর্তন? কারণ আমরা আরও তথ্য ব্যবহার করেছি - আমরা প্রতিটি স্তূপের অক্ষরের সংখ্যা বিবেচনায় নিয়েছি এবং যাইহোক, অনুমান p ai এবং p bi অনেক বেশি সঠিকভাবে নির্ধারণ করেছি। শর্তসাপেক্ষ সম্ভাব্যতা গণনা করে বেয়েসের মতোই তারা নির্ধারণ করা হয়েছিল। অন্য কথায়, p a3 হল সম্ভাব্যতা যে ইমেলে "বন্ধু" শব্দটি উপস্থিত হবে, কারণ ইমেলটি ইতিমধ্যেই স্প্যাম স্তূপের অন্তর্গত H A। ফলাফল আসতে দীর্ঘ ছিল না - মনে হচ্ছে আমরা আরও নিশ্চিতভাবে সিদ্ধান্ত নিতে পারি।

বেইস বনাম কর্পোরেট জালিয়াতি

Bayesian পদ্ধতির একটি আকর্ষণীয় প্রয়োগ MAGNUS8 দ্বারা বর্ণিত হয়েছে।

আমার বর্তমান প্রকল্প (একটি উত্পাদন উদ্যোগে জালিয়াতি সনাক্ত করার জন্য IS) প্রতারণার সম্ভাবনার অনুমানের পক্ষে পরোক্ষভাবে বেশ কয়েকটি তথ্যের উপস্থিতি / অনুপস্থিতিতে প্রতারণার (প্রতারণা) সম্ভাবনা নির্ধারণের জন্য বেইস সূত্র ব্যবহার করে। অ্যালগরিদম হল স্ব-শিক্ষা (প্রতিক্রিয়া সহ), অর্থাৎ অর্থনৈতিক নিরাপত্তা পরিষেবা দ্বারা যাচাইকরণের সময় জালিয়াতির প্রকৃত নিশ্চিতকরণ বা অ-নিশ্চিতকরণের ভিত্তিতে এর সহগ (শর্তসাপেক্ষ সম্ভাব্যতা) পুনরায় গণনা করে।

এটি সম্ভবত বলার মতো যে অ্যালগরিদম ডিজাইন করার সময় এই জাতীয় পদ্ধতিগুলির জন্য বিকাশকারীর মোটামুটি উচ্চ গাণিতিক সংস্কৃতির প্রয়োজন, কারণ কম্পিউটেশনাল সূত্রের উৎপত্তি এবং/অথবা বাস্তবায়নের ক্ষেত্রে সামান্যতম ত্রুটি সমগ্র পদ্ধতিটিকে বাতিল এবং অসম্মানিত করবে। সম্ভাব্য পদ্ধতিগুলি বিশেষত এর জন্য দোষী, যেহেতু মানুষের চিন্তাভাবনা সম্ভাব্য বিভাগগুলির সাথে কাজ করার জন্য অভিযোজিত হয় না এবং তদনুসারে, মধ্যবর্তী এবং চূড়ান্ত সম্ভাব্য পরামিতিগুলির "শারীরিক অর্থ" সম্পর্কে কোনও "দৃশ্যমানতা" এবং বোঝা নেই। এই ধরনের বোঝাপড়া শুধুমাত্র সম্ভাব্যতা তত্ত্বের মৌলিক ধারণাগুলির জন্য বিদ্যমান, এবং তারপরে আপনাকে কেবলমাত্র সম্ভাব্যতা তত্ত্বের আইন অনুসারে জটিল জিনিসগুলিকে খুব সাবধানে একত্রিত করতে এবং আহরণ করতে হবে - সাধারণ জ্ঞান আর যৌগিক বস্তুর জন্য সাহায্য করবে না। এটি, বিশেষত, সম্ভাব্যতার দর্শনের উপর আধুনিক বইয়ের পৃষ্ঠাগুলিতে সংঘটিত বেশ গুরুতর পদ্ধতিগত যুদ্ধের সাথে সম্পর্কিত, সেইসাথে এই বিষয়ে প্রচুর সংখ্যক সফিজম, প্যারাডক্স এবং কৌতূহল সমস্যার সাথে জড়িত।

আরেকটি সূক্ষ্মতা যা আমাকে সম্মুখীন হতে হয়েছিল তা হল, দুর্ভাগ্যবশত, এই বিষয়ে প্রায় সবই কমবেশি ব্যবহারিকভাবে ইংরেজিতে লেখা। রাশিয়ান-ভাষার উত্সগুলিতে, শুধুমাত্র সবচেয়ে আদিম ক্ষেত্রে প্রদর্শনের উদাহরণ সহ একটি সুপরিচিত তত্ত্ব রয়েছে।

আমি শেষ মন্তব্যের সাথে সম্পূর্ণ একমত। উদাহরণস্বরূপ, Google, যখন "বায়েসিয়ান সম্ভাব্যতা" বইয়ের মতো কিছু খুঁজে বের করার চেষ্টা করেছিল, তখন বোধগম্য কিছু দেয়নি। সত্য, তিনি বলেছিলেন যে বায়েসিয়ান পরিসংখ্যান সহ একটি বই চীনে নিষিদ্ধ করা হয়েছিল। (পরিসংখ্যানের অধ্যাপক অ্যান্ড্রু গেলম্যান একটি কলম্বিয়া বিশ্ববিদ্যালয়ের ব্লগে রিপোর্ট করেছেন যে তার বই, ডেটা অ্যানালাইসিস উইথ রিগ্রেশন অ্যান্ড মাল্টিলেভেল/হাইরার্কিক্যাল মডেলস, চীনে প্রকাশনা নিষিদ্ধ করা হয়েছিল৷ পাঠ্য৷) রাশিয়ায় সম্ভাবনা?

মানুষের তথ্য প্রক্রিয়াকরণ প্রক্রিয়ায় রক্ষণশীলতা

সম্ভাবনাগুলি অনিশ্চয়তার মাত্রা নির্ধারণ করে। বেইস এবং আমাদের অন্তর্দৃষ্টি উভয়ের মতেই সম্ভাব্যতা হল শূন্যের মধ্যবর্তী একটি সংখ্যা এবং যা সেই মাত্রার প্রতিনিধিত্ব করে যেখানে একজন কিছুটা আদর্শবান ব্যক্তি বিবৃতিটিকে সত্য বলে বিশ্বাস করেন। যে কারণে মানুষ কিছুটা আদর্শবান হয় তা হল যে দুটি পারস্পরিক একচেটিয়া ঘটনার জন্য তার সম্ভাব্যতার যোগফল অবশ্যই সেই ঘটনার যে কোনো একটি ঘটানোর সম্ভাবনার সমান হবে। সংযোজন বৈশিষ্ট্যের এমন প্রভাব রয়েছে যে কিছু সত্যিকারের মানুষ তাদের সবগুলিকে মেলতে পারে।

বায়েসের উপপাদ্য হল সংযোজন বৈশিষ্ট্যের একটি তুচ্ছ পরিণতি, যা অনস্বীকার্য এবং সকল সম্ভাব্যবাদী, বায়েসিয়ান এবং অন্যথায় একমত। এটি লিখতে একটি উপায় নিম্নলিখিত. যদি P(H A |D) পরবর্তী সম্ভাব্যতা হয় যে অনুমান A প্রদত্ত মান D পরিলক্ষিত হওয়ার পরে ছিল, P(H A) হল প্রদত্ত মান D পরিলক্ষিত হওয়ার আগে এর পূর্ব সম্ভাবনা, P(D|H A) হল সম্ভাব্যতা যে a প্রদত্ত মান D পর্যবেক্ষণ করা হবে, যদি H A সত্য হয়, এবং P(D) একটি প্রদত্ত মানের D এর শর্তহীন সম্ভাব্যতা হয়, তাহলে

(1) P(H A |D) = P(D|H A) * P(H A) / P(D)

P(D) কে একটি স্বাভাবিক ধ্রুবক হিসাবে সর্বোত্তমভাবে বিবেচনা করা হয়, যার ফলে পরবর্তী সম্ভাব্যতাগুলি বিবেচনা করা হচ্ছে পারস্পরিক একচেটিয়া অনুমানগুলির সম্পূর্ণ সেটের উপরে একটি পর্যন্ত যোগ করে। যদি এটি গণনা করা প্রয়োজন, এটি এই মত হতে পারে:

কিন্তু প্রায়শই P(D) গণনা করার পরিবর্তে বাদ দেওয়া হয়। এটি নির্মূল করার একটি সুবিধাজনক উপায় হল Bayes এর উপপাদ্যটিকে একটি সম্ভাব্যতা-বিজোড় সম্পর্কের আকারে রূপান্তর করা।

আরেকটি হাইপোথিসিস বিবেচনা করুন, H B, পারস্পরিকভাবে H A এর সাথে একচেটিয়া, এবং একই প্রদত্ত পরিমাণের উপর ভিত্তি করে এটি সম্পর্কে আপনার মন পরিবর্তন করুন যা H A সম্পর্কে আপনার মন পরিবর্তন করেছে। বেয়েসের উপপাদ্য বলে যে

(2) P(H B |D) = P(D|H B) * P(H B) / P(D)

এখন আমরা সমীকরণ 1 কে সমীকরণ 2 দ্বারা ভাগ করি; ফলাফল এই মত হবে:

যেখানে Ω 1 হল H B এর পরিপ্রেক্ষিতে H A-এর পক্ষে পশ্চাত্তর মতবাদ, Ω 0 হল পূর্বের মতভেদ, এবং L হল সম্ভাব্যতার অনুপাত হিসাবে পরিসংখ্যানবিদদের কাছে পরিচিত একটি সংখ্যা। সমীকরণ 3 হল বেয়েসের উপপাদ্যের সমীকরণ 1-এর মতো একই প্রাসঙ্গিক সংস্করণ, এবং প্রায়শই অনেক বেশি উপযোগী, বিশেষ করে অনুমান সম্পর্কিত পরীক্ষাগুলির জন্য। বায়েসিয়ান প্রবক্তারা যুক্তি দেন যে বেইসের উপপাদ্য হল নতুন তথ্যের আলোকে মতামত সংশোধন করার জন্য একটি আনুষ্ঠানিকভাবে সর্বোত্তম নিয়ম।

আমরা মানুষের প্রকৃত আচরণের সাথে বেয়েসের উপপাদ্য দ্বারা সংজ্ঞায়িত আদর্শ আচরণের তুলনা করতে আগ্রহী। এর অর্থ কী তা সম্পর্কে আপনাকে কিছুটা ধারণা দিতে, আসুন বিষয় হিসাবে আপনার সাথে একটি পরীক্ষা করার চেষ্টা করি। এই ব্যাগে 1000টি জুজু চিপ রয়েছে। আমার কাছে এই দুটি ব্যাগ আছে, একটিতে 700টি লাল এবং 300টি নীল চিপ রয়েছে এবং অন্যটিতে 300টি লাল এবং 700টি নীল। কোনটি ব্যবহার করতে হবে তা নির্ধারণ করতে আমি একটি মুদ্রা উল্টিয়েছি। এইভাবে, যদি আমাদের মতামত একই হয়, তাহলে আপনার আরও লাল চিপস সহ একটি ব্যাগ আঁকার বর্তমান সম্ভাবনা 0.5। এখন, আপনি এলোমেলোভাবে নমুনা, প্রতিটি টোকেন পরে ফিরে. 12 টি চিপে, আপনি 8 টি লাল এবং 4 টি নীল পাবেন। এখন, আপনি জানেন সবকিছুর উপর ভিত্তি করে, একটি ব্যাগ আরও লাল দিয়ে আসার সম্ভাবনা কত? এটা স্পষ্ট যে এটি 0.5 এর চেয়ে বেশি। আপনি আপনার রেটিং রেকর্ড না হওয়া পর্যন্ত পড়া চালিয়ে যান না দয়া করে.

আপনি যদি একটি সাধারণ বিষয়ের মতো দেখতে পান তবে আপনার স্কোর 0.7 থেকে 0.8 এর মধ্যে পড়ে। আমরা যদি সংশ্লিষ্ট গণনা করি, তবে উত্তরটি হবে 0.97। প্রকৃতপক্ষে, এমন একজন ব্যক্তির পক্ষে যাকে আগে রক্ষণশীলতার প্রভাব দেখানো হয়নি তার পক্ষে এত উচ্চ অনুমানের সাথে আসা খুবই বিরল, এমনকি যদি সে বেইসের উপপাদ্যের সাথে পরিচিত ছিল।

ব্যাগে লাল চিপস অনুপাতে থাকলে আর, তাহলে পাওয়ার সম্ভাবনা rলাল চিপস এবং ( n-r) নীল nরিটার্ন সহ নমুনা - pr (1-পি)n-r. এইভাবে, একটি সাধারণ ব্যাগ এবং জুজু চিপ পরীক্ষা, যদি এইচমানে লাল চিপসের অনুপাত r এএবং এইচমানে শেয়ার হল আর, তারপর সম্ভাবনা অনুপাত:

Bayes এর সূত্র প্রয়োগ করার সময়, শুধুমাত্র প্রকৃত পর্যবেক্ষণের সম্ভাব্যতা বিবেচনায় নিতে হবে, এবং অন্যান্য পর্যবেক্ষণের সম্ভাব্যতা নয় যা তিনি করেছিলেন কিন্তু করেননি। বেইসের উপপাদ্যের সমস্ত পরিসংখ্যানগত এবং অ-পরিসংখ্যানগত প্রয়োগের জন্য এই নীতির ব্যাপক প্রভাব রয়েছে; এটি Bayesian চিন্তার সবচেয়ে গুরুত্বপূর্ণ প্রযুক্তিগত হাতিয়ার।

বায়েসিয়ান বিপ্লব

আপনার বন্ধুরা এবং সহকর্মীরা "বায়েস থিওরেম" বা "বায়েসিয়ান নিয়ম" বা বায়েসিয়ান চিন্তাভাবনা বলে কিছু কথা বলছেন। তারা সত্যিই এটির মধ্যে রয়েছে, তাই আপনি অনলাইনে যান এবং আপনি বেইসের উপপাদ্য সম্পর্কে একটি পৃষ্ঠা খুঁজে পান এবং... এটি একটি সমীকরণ। আর এতটুকুই... কেন একটা গাণিতিক ধারণা মনের মধ্যে এমন উৎসাহের জন্ম দেয়? বিজ্ঞানীদের মধ্যে কি ধরনের "বায়েসিয়ান বিপ্লব" ঘটছে, এবং এটি যুক্তি দেওয়া হয় যে এমনকি পরীক্ষামূলক পদ্ধতিকেও এর বিশেষ ক্ষেত্রে বর্ণনা করা যেতে পারে? বায়েসের অনুসারীরা কী রহস্য জানেন? তারা কি ধরনের আলো দেখতে পায়?

বিজ্ঞানে বায়েসিয়ান বিপ্লব ঘটেনি কারণ আরও বেশি জ্ঞানী বিজ্ঞানীরা হঠাৎ লক্ষ্য করতে শুরু করেছিলেন যে মানসিক ঘটনাগুলির একটি বায়েসিয়ান কাঠামো রয়েছে; প্রত্যেক ক্ষেত্রে বিজ্ঞানীরা বায়েসিয়ান পদ্ধতি ব্যবহার শুরু করেছেন বলে নয়; কিন্তু কারণ বিজ্ঞান নিজেই বেইসের উপপাদ্যের একটি বিশেষ ক্ষেত্রে; পরীক্ষামূলক প্রমাণ হল বায়েসিয়ান প্রমাণ। বায়েসিয়ান বিপ্লবীরা যুক্তি দেন যে আপনি যখন একটি পরীক্ষা করেন এবং আপনি প্রমাণ পান যে আপনার তত্ত্বকে "সমর্থন" বা "খণ্ডন" করে, সেই নিশ্চিতকরণ বা খণ্ডন ঘটে বায়েসিয়ান নিয়ম অনুসারে। উদাহরণস্বরূপ, আপনাকে অবশ্যই বিবেচনা করতে হবে যে আপনার তত্ত্বটি ঘটনাটি ব্যাখ্যা করতে পারে না, তবে অন্যান্য সম্ভাব্য ব্যাখ্যাও রয়েছে যা এই ঘটনাটির পূর্বাভাস দিতে পারে।

পূর্বে, বিজ্ঞানের সবচেয়ে জনপ্রিয় দর্শন ছিল পুরানো দর্শন যা বায়েসিয়ান বিপ্লব দ্বারা স্থানচ্যুত হয়েছিল। কার্ল পপারের ধারণা যে তত্ত্বগুলি সম্পূর্ণরূপে মিথ্যা প্রমাণিত হতে পারে, কিন্তু কখনই সম্পূর্ণরূপে নিশ্চিত করা যায় না, এটি বায়েসিয়ান নিয়মের আরেকটি বিশেষ ঘটনা; যদি p(X|A) ≈ 1 - যদি তত্ত্বটি সঠিক ভবিষ্যদ্বাণী করে, তাহলে পর্যবেক্ষণ ~X A কে খুব জোরালোভাবে মিথ্যা করে। অন্যদিকে, যদি p(X|A) ≈ 1 এবং আমরা X পর্যবেক্ষণ করি, এটি সমর্থন করে না তত্ত্ব খুব বেশি; অন্য কিছু শর্ত B সম্ভব, যেমন p(X|B) ≈ 1, এবং যার অধীনে X-এর পর্যবেক্ষণ A-এর প্রমাণ নয় কিন্তু B-এর জন্য প্রমাণ। X-কে নিশ্চিতভাবে A নিশ্চিত করতে পর্যবেক্ষণ করতে, আমাদের জানতে হবে যে p(এ) নয় X|A) ≈ 1 এবং সেই p(X|~A) ≈ 0, যা আমরা জানতে পারি না কারণ আমরা সমস্ত সম্ভাব্য বিকল্প ব্যাখ্যা বিবেচনা করতে পারি না। উদাহরণস্বরূপ, যখন আইনস্টাইনের সাধারণ আপেক্ষিকতার তত্ত্ব নিউটনের মহাকর্ষের অত্যন্ত যাচাইযোগ্য তত্ত্বকে অতিক্রম করেছিল, তখন এটি নিউটনের তত্ত্বের সমস্ত ভবিষ্যদ্বাণীকে আইনস্টাইনের একটি বিশেষ ক্ষেত্রে পরিণত করেছিল।

একইভাবে, পপারের দাবি যে একটি ধারণা অবশ্যই মিথ্যা হতে হবে, সম্ভাব্যতা সংরক্ষণের বিষয়ে বায়েসিয়ান নিয়মের একটি প্রকাশ হিসাবে ব্যাখ্যা করা যেতে পারে; যদি ফলাফল X তত্ত্বের জন্য ইতিবাচক প্রমাণ হয়, তাহলে ফলাফল ~X কিছু পরিমাণে তত্ত্বটিকে মিথ্যা প্রমাণ করতে হবে। আপনি যদি X এবং ~X উভয়কেই একটি তত্ত্বকে "সমর্থনকারী" হিসাবে ব্যাখ্যা করার চেষ্টা করছেন, বায়েসিয়ান নিয়ম বলে যে এটি অসম্ভব! একটি তত্ত্বের সম্ভাবনা বাড়ানোর জন্য, আপনাকে অবশ্যই এটিকে পরীক্ষা করতে হবে যা সম্ভাব্যভাবে এর সম্ভাবনা হ্রাস করতে পারে; এটি শুধুমাত্র বিজ্ঞানে চার্লাটান সনাক্ত করার একটি নিয়ম নয়, তবে বায়েসিয়ান সম্ভাব্যতা উপপাদ্যের ফলাফল। অন্যদিকে, পপারের ধারণা যে শুধুমাত্র মিথ্যা প্রমাণের প্রয়োজন এবং কোন নিশ্চিতকরণের প্রয়োজন নেই। বেয়েসের উপপাদ্য দেখায় যে মিথ্যাকরণ নিশ্চিতকরণের তুলনায় অত্যন্ত শক্তিশালী প্রমাণ, তবে মিথ্যাকরণ এখনও প্রকৃতিতে সম্ভাব্য; এটি মৌলিকভাবে ভিন্ন নিয়ম দ্বারা নিয়ন্ত্রিত নয় এবং এটি নিশ্চিতকরণ থেকে ভিন্ন নয়, যেমন পপার যুক্তি দেন।

এইভাবে আমরা দেখতে পাই যে জ্ঞানীয় বিজ্ঞানের অনেক ঘটনা, এবং বিজ্ঞানীদের দ্বারা ব্যবহৃত পরিসংখ্যানগত পদ্ধতি, এবং বৈজ্ঞানিক পদ্ধতি নিজেই, সবই বেইসের উপপাদ্যের বিশেষ ক্ষেত্রে। এই বায়েসিয়ান বিপ্লবের কথা।

Bayesian ষড়যন্ত্রে স্বাগতম!

Bayesian সম্ভাব্যতা উপর সাহিত্য

2. অর্থনীতিতে নোবেল বিজয়ী Kahneman (et al.) একটি চমৎকার বইয়ে Bayes-এর বিভিন্ন প্রয়োগের অনেক বর্ণনা দিয়েছেন। শুধুমাত্র এই খুব বড় বইটির আমার সংক্ষিপ্তসারে, আমি একজন প্রেসবিটেরিয়ান মন্ত্রীর নামের 27টি রেফারেন্স গণনা করেছি। ন্যূনতম সূত্র। (.. আমি সত্যিই এটি পছন্দ করেছি। সত্য, এটি জটিল, প্রচুর গণিত (এবং যেখানে এটি ছাড়া), তবে পৃথক অধ্যায় (উদাহরণস্বরূপ, অধ্যায় 4। তথ্য), বিষয়টিতে স্পষ্টভাবে। আমি সবাইকে পরামর্শ দিই। এমনকি যদি গণিত হয় আপনার জন্য কঠিন, লাইনটি পড়ুন, গণিত এড়িয়ে যান এবং দরকারী শস্যের জন্য মাছ ধরা...

14. (15 জানুয়ারী, 2017 তারিখের সম্পূরক), টনি ক্রিলির বই থেকে একটি অধ্যায়। 50 টি ধারণা সম্পর্কে আপনার জানা দরকার। গণিত।

পদার্থবিজ্ঞানী রিচার্ড ফাইনম্যান, নোবেল বিজয়ী, একজন দার্শনিক সম্পর্কে বিশেষভাবে মহান অহংকার নিয়ে কথা বলতে গিয়ে একবার বলেছিলেন: "এটি একটি বিজ্ঞান হিসাবে দর্শন নয় যা আমাকে মোটেও বিরক্ত করে, তবে এটিকে ঘিরে আড়ম্বর তৈরি করা হয়েছে। দার্শনিকরা যদি নিজেরাই হাসতে পারতেন! যদি কেবল তারা বলতে পারত: "আমি বলি এটা এরকম, কিন্তু ভন লাইপজিগ ভেবেছিলেন এটি ভিন্ন, এবং তিনিও এটি সম্পর্কে কিছু জানেন।" যদি তারা স্পষ্ট করে মনে রাখে যে এটি শুধুমাত্র তাদের ছিল .

আপনি Bayes এর উপপাদ্য কখনও শুনেন নি, কিন্তু আপনি এটি সব সময় ব্যবহার করেছেন. উদাহরণস্বরূপ, আপনি প্রাথমিকভাবে 50% হিসাবে বেতন বৃদ্ধি পাওয়ার সম্ভাবনা অনুমান করেছেন। ম্যানেজারের কাছ থেকে ইতিবাচক প্রতিক্রিয়া পাওয়ার পরে, আপনি আপনার রেটিং আরও ভাল করার জন্য সামঞ্জস্য করেছেন, এবং বিপরীতভাবে, আপনি যদি কর্মক্ষেত্রে কফি মেকার ভেঙে ফেলেন তবে এটি হ্রাস করেছেন। তথ্য জমা হওয়ার সাথে সাথে সম্ভাব্যতার মানটি এভাবেই পরিমার্জিত হয়।

বেয়েসের তত্ত্বের মূল ধারণাঅতিরিক্ত তথ্য বিবেচনা করে ইভেন্ট সম্ভাব্যতা অনুমানের একটি বৃহত্তর নির্ভুলতা প্রাপ্ত করা হয়।

নীতি সহজ: সম্ভাব্যতার একটি প্রাথমিক প্রাথমিক অনুমান রয়েছে, যা আরও তথ্যের সাথে পরিমার্জিত।

বেইস সূত্র

স্বজ্ঞাত ক্রিয়াগুলি একটি সহজ কিন্তু শক্তিশালী সমীকরণে আনুষ্ঠানিক করা হয় ( Bayes সম্ভাব্যতা সূত্র):

সমীকরণের বাম দিকটি ঘটনা B (তথাকথিত শর্তসাপেক্ষ সম্ভাবনা) হওয়ার শর্তের অধীনে ইভেন্ট A এর সম্ভাব্যতার একটি উত্তরোত্তর অনুমান।

  • P(A)- ঘটনা A এর সম্ভাবনা (মৌলিক, একটি অগ্রাধিকার অনুমান);
  • P(B|A) —সম্ভাব্যতা (এছাড়াও শর্তসাপেক্ষ) যা আমরা আমাদের ডেটা থেকে পাই;
  • P(B)একটি স্বাভাবিককরণ ধ্রুবক যা সম্ভাব্যতাকে 1 এ সীমাবদ্ধ করে।

এই সংক্ষিপ্ত সমীকরণের ভিত্তি বায়েসিয়ান পদ্ধতি.

ঘটনা A এবং B এর বিমূর্ত প্রকৃতি আমাদের এই সূত্রটির অর্থ স্পষ্টভাবে বুঝতে দেয় না। বেইসের তত্ত্বের সারমর্ম বোঝার জন্য, আসুন একটি বাস্তব সমস্যা বিবেচনা করা যাক।

উদাহরণ

আমি যে বিষয়গুলিতে কাজ করছি তা হল ঘুমের ধরণগুলির অধ্যয়ন৷ আমার Garmin Vivosmart ঘড়ির সাথে রেকর্ড করা দুই মাসের ডেটা আছে যা দেখায় যে আমি কখন ঘুমাতে যাই এবং জেগে উঠি। চূড়ান্ত মডেল দেখাচ্ছে সম্ভবতসময়ের ফাংশন হিসাবে ঘুমের সম্ভাব্যতা বন্টন (MCMC - আনুমানিক পদ্ধতি) নীচে দেওয়া হল।

গ্রাফটি শুধুমাত্র সময়ের উপর নির্ভর করে আমার ঘুমানোর সম্ভাবনা দেখায়। বেডরুমে আলো জ্বলার সময়টি যদি আপনি বিবেচনায় নেন তবে এটি কীভাবে পরিবর্তন হবে? অনুমান পরিমার্জিত করতে, Bayes এর উপপাদ্য প্রয়োজন। পরিমার্জিত অনুমানটি একটি অগ্রাধিকারের উপর ভিত্তি করে এবং ফর্ম রয়েছে:

বাম দিকের অভিব্যক্তি হল সম্ভাব্যতা যে আমি ঘুমিয়ে আছি, কারণ আমার বেডরুমের আলো জ্বলছে বলে জানা গেছে। একটি নির্দিষ্ট সময়ে পূর্বের অনুমান (উপরের গ্রাফে দেখানো হয়েছে) হিসাবে চিহ্নিত করা হয় পি (ঘুম). উদাহরণস্বরূপ, রাত 10:00 টায়, আমি ঘুমিয়ে থাকার পূর্ব সম্ভাবনা 27.34%।

সম্ভাব্যতা ব্যবহার করে আরও তথ্য যোগ করুন P(বেডরুমের আলো|ঘুম)পর্যবেক্ষণ করা তথ্য থেকে প্রাপ্ত।

আমার নিজস্ব পর্যবেক্ষণ থেকে, আমি নিম্নলিখিতগুলি জানি: আলো জ্বললে আমার ঘুমানোর সম্ভাবনা 1%।

ঘুমের সময় আলো বন্ধ হওয়ার সম্ভাবনা 1-0.01 = 0.99 (সূত্রে "-" চিহ্নের অর্থ বিপরীত ঘটনা), কারণ বিপরীত ঘটনাগুলির সম্ভাব্যতার যোগফল হল 1। আমি যখন ঘুমাই, তখন আলো বেডরুমে হয় সক্রিয় বা অক্ষম।

অবশেষে, সমীকরণটি স্বাভাবিককরণ ধ্রুবকও অন্তর্ভুক্ত করে পি (আলো)আলো জ্বালানোর সম্ভাবনা। আমি যখন ঘুমাই এবং যখন আমি জেগে থাকি তখন উভয়ই আলো জ্বলে। অতএব, ঘুমের একটি অগ্রাধিকার সম্ভাব্যতা জেনে, আমরা নিম্নরূপ স্বাভাবিককরণ ধ্রুবক গণনা করি:

আলো জ্বলে থাকার সম্ভাবনা উভয় বিকল্পে বিবেচনা করা হয়: হয় আমি ঘুমাই বা না ( P(-ঘুম) = 1 — পি (ঘুম)আমি জেগে থাকার সম্ভাবনা।)

আমি যখন জেগে থাকি তখন আলো জ্বালানোর সম্ভাবনা P(আলো|-ঘুম),এবং পর্যবেক্ষণ দ্বারা নির্ধারিত। আমি জানি যে আমি যখন জাগ্রত থাকি তখন 80% সম্ভাবনার সাথে আলো জ্বলে থাকে (অর্থাৎ আমি যদি জেগে থাকি তাহলে আলো না জ্বলার সম্ভাবনা 20% আছে)।

চূড়ান্ত বেইস সমীকরণটি হয়ে যায়:

এটি আপনাকে সম্ভাব্যতা গণনা করতে দেয় যে আমি ঘুমিয়ে আছি, আলো জ্বলে আছে। যদি আমরা আলো বন্ধ হওয়ার সম্ভাবনায় আগ্রহী হই, তবে আমাদের প্রতিটি নির্মাণের প্রয়োজন P(আলো |…পরিবর্তে P(-আলো |….

আসুন দেখি কিভাবে ফলস্বরূপ প্রতীকী সমীকরণগুলি অনুশীলনে ব্যবহার করা হয়।

22:30 সময়ে সূত্রটি প্রয়োগ করা যাক এবং আলো জ্বলছে কিনা তা বিবেচনা করুন। আমরা জানি 73.90% সম্ভাবনা আছে যে আমি ঘুমিয়ে ছিলাম। এই সংখ্যাটি আমাদের মূল্যায়নের সূচনা বিন্দু।

আলো সম্পর্কে তথ্য বিবেচনায় নিয়ে এর পরিমার্জন করা যাক। আলো জ্বলছে জেনে, আমরা বেইসের সূত্রে সংখ্যাগুলি প্রতিস্থাপন করি:

অতিরিক্ত ডেটা নাটকীয়ভাবে সম্ভাব্যতার অনুমান পরিবর্তন করেছে, 70% থেকে 3.42%। এটি বেয়েসের উপপাদ্যের শক্তি দেখায়: আমরা আরও তথ্য অন্তর্ভুক্ত করে পরিস্থিতির আমাদের প্রাথমিক মূল্যায়ন পরিমার্জন করতে সক্ষম হয়েছি। আমরা হয়তো স্বজ্ঞাতভাবে এটি আগে করেছি, কিন্তু এখন, আনুষ্ঠানিক সমীকরণের পরিপ্রেক্ষিতে এটি সম্পর্কে চিন্তা করে, আমরা আমাদের ভবিষ্যদ্বাণীগুলি নিশ্চিত করতে সক্ষম হয়েছি।

আরও একটি উদাহরণ বিবেচনা করা যাক। ঘড়ির কাঁটা 21:45 হলে এবং লাইট বন্ধ হলে কী হবে? 0.1206 এর পূর্বের অনুমান ধরে নিয়ে নিজেই সম্ভাব্যতা গণনা করার চেষ্টা করুন।

প্রতিটি সময় ম্যানুয়ালি গণনা করার পরিবর্তে, আমি এই গণনাগুলি করার জন্য একটি সাধারণ পাইথন কোড লিখেছি, যা আপনি জুপিটার নোটবুকে চেষ্টা করতে পারেন। আপনি নিম্নলিখিত প্রতিক্রিয়া পাবেন:

সময়: 09:45:00 PM আলো বন্ধ।

ঘুমের পূর্ব সম্ভাবনা: 12.06%
ঘুমের আপডেট হওয়ার সম্ভাবনা: 40.44%

আবার, অতিরিক্ত তথ্য আমাদের অনুমান পরিবর্তন করে। এখন, যদি আমার বোন আমাকে রাত 9:45 এ ফোন করতে চায় যে আমার আলো জ্বলছে জেনে, তিনি এই সমীকরণটি ব্যবহার করে নির্ধারণ করতে পারেন যে আমি ফোন ধরতে পারি কিনা (ধরে নিচ্ছি যে আমি যখন জেগে থাকি তখনই তুলব)! কে বলে যে পরিসংখ্যান দৈনন্দিন জীবনে প্রযোজ্য নয়?

সম্ভাব্যতা ভিজ্যুয়ালাইজেশন

গণনা পর্যবেক্ষণ করা উপকারী, কিন্তু ভিজ্যুয়ালাইজেশন ফলাফলের গভীর উপলব্ধি অর্জনে সহায়তা করে। আমি সবসময় গ্রাফ ব্যবহার করার চেষ্টা করি ধারণা তৈরি করতে যখন সেগুলি শুধুমাত্র সমীকরণ অধ্যয়ন থেকে আসে না। আমরা অতিরিক্ত ডেটা ব্যবহার করে ঘুমের পূর্ববর্তী এবং পরবর্তী সম্ভাব্যতা বন্টন কল্পনা করতে পারি:

আলো জ্বললে, গ্রাফটি ডানদিকে সরে যায়, ইঙ্গিত করে যে সেই সময়ে আমার ঘুমানোর সম্ভাবনা কম। একইভাবে, আমার আলো বন্ধ থাকলে গ্রাফটি বামে স্থানান্তরিত হয়। বেইসের উপপাদ্যের অর্থ বোঝা সহজ নয়, তবে এই চিত্রটি স্পষ্টভাবে দেখায় যে কেন এটি ব্যবহার করতে হবে। Bayes সূত্র হল অতিরিক্ত ডেটা সহ পূর্বাভাস পরিমার্জন করার একটি টুল।

আরও বেশি ডেটা থাকলে কী হবে?

বেডরুমের আলোতে কেন থামবেন? অনুমানটিকে আরও পরিমার্জিত করতে আমরা আমাদের মডেলে আরও বেশি ডেটা ব্যবহার করতে পারি (যতক্ষণ ডেটা বিবেচনাধীন ক্ষেত্রে উপযোগী থাকে)। উদাহরণস্বরূপ, আমি জানি যে যদি আমার ফোন চার্জ হয়, তাহলে আমার ঘুমানোর সম্ভাবনা 95% আছে। এই সত্য আমাদের মডেল অ্যাকাউন্টে নেওয়া যেতে পারে.

আসুন ধরে নিই যে আমার ফোন চার্জ হওয়ার সম্ভাবনা বেডরুমের আলো থেকে স্বাধীন (ইভেন্টগুলির স্বাধীনতা একটি শক্তিশালী অতি সরলীকরণ, তবে এটি কাজটিকে আরও সহজ করে তুলবে)। আসুন সম্ভাব্যতার জন্য একটি নতুন, এমনকি আরও সুনির্দিষ্ট অভিব্যক্তি তৈরি করি:

ফলস্বরূপ সূত্রটি কষ্টকর দেখাচ্ছে, কিন্তু পাইথন কোড ব্যবহার করে, আমরা একটি ফাংশন লিখতে পারি যা গণনা করবে। যেকোন সময় এবং ফোনের আলো/চার্জিং এর যেকোন সংমিশ্রণের জন্য, এই ফাংশনটি সামঞ্জস্যপূর্ণ সম্ভাব্যতা ফিরিয়ে দেয় যে আমি ঘুমিয়ে আছি।

সময় হল 11:00:00 PM আলো জ্বলছে ফোন চার্জ হচ্ছে না৷

ঘুমের পূর্ব সম্ভাবনা: 95.52%
ঘুমের আপডেট হওয়ার সম্ভাবনা: 1.74%

রাত 11:00 টায়, আরও তথ্য ছাড়াই, আমরা প্রায় নিশ্চিতভাবে বলতে পারি যে আমি স্বপ্ন দেখছিলাম। যাইহোক, একবার আমাদের কাছে অতিরিক্ত তথ্য আছে যে আলো জ্বলছে এবং ফোন চার্জ হচ্ছে না, আমরা উপসংহারে পৌঁছেছি যে আমার ঘুমানোর সম্ভাবনা কার্যত শূন্য। এখানে আরেকটি উদাহরণ:

সময় হল 10:15:00 PM আলো বন্ধ আছে ফোন চার্জ হচ্ছে৷

ঘুমের পূর্ব সম্ভাবনা: 50.79%
ঘুমের আপডেট হওয়ার সম্ভাবনা: 95.10%

সম্ভাব্যতা নির্দিষ্ট পরিস্থিতির উপর নির্ভর করে নিচে বা উপরে স্থানান্তরিত হয়। এটি প্রদর্শন করতে, চারটি অতিরিক্ত ডেটা কনফিগারেশন বিবেচনা করুন এবং কীভাবে তারা সম্ভাব্যতা বন্টন পরিবর্তন করে:

এই গ্রাফে অনেক তথ্য রয়েছে, কিন্তু মূল বিষয় হল সম্ভাব্য বক্ররেখা অতিরিক্ত কারণের উপর নির্ভর করে পরিবর্তিত হয়। আরও তথ্য যোগ করা হলে, আমরা আরও সঠিক অনুমান পাব।

উপসংহার

বেইসের উপপাদ্য এবং অন্যান্য পরিসংখ্যানগত ধারণাগুলি বোঝা কঠিন হতে পারে যখন সেগুলিকে শুধুমাত্র অক্ষর বা কাল্পনিক পরিস্থিতি ব্যবহার করে বিমূর্ত সমীকরণ দ্বারা উপস্থাপন করা হয়। প্রকৃত শিক্ষা আসে যখন আমরা বাস্তব সমস্যাগুলিতে বিমূর্ত ধারণাগুলি প্রয়োগ করি।

ডেটা সায়েন্সে সাফল্য হল ক্রমাগত শেখা, আপনার দক্ষতা সেটে নতুন পদ্ধতি যোগ করা এবং সমস্যা সমাধানের জন্য সর্বোত্তম পদ্ধতি খুঁজে বের করা। বেইসের উপপাদ্য আমাদেরকে আরও ভালো মডেল বাস্তবতার জন্য অতিরিক্ত তথ্য দিয়ে আমাদের সম্ভাব্যতা অনুমান পরিমার্জন করতে দেয়। তথ্যের পরিমাণ বাড়ালে আরও সঠিক ভবিষ্যদ্বাণী করা যায়, এবং বেইস এই কাজের জন্য একটি দরকারী টুল হিসেবে প্রমাণিত হচ্ছে।

আমি প্রতিক্রিয়া, আলোচনা এবং গঠনমূলক সমালোচনাকে স্বাগত জানাই। আপনি Twitter এ আমার সাথে যোগাযোগ করতে পারেন.

পাঠ নম্বর 4।

বিষয়: মোট সম্ভাব্যতা সূত্র। বেইস সূত্র। বার্নোলি স্কিম। বহুপদ প্রকল্প। হাইপারজিওমেট্রিক স্কিম।

মোট সম্ভাবনার সূত্র

BAYES সূত্র

তত্ত্ব

মোট সম্ভাব্যতা সূত্র:

বেমানান ইভেন্টের একটি সম্পূর্ণ গ্রুপ হতে দিন:

(, ) তাহলে ঘটনা A এর সম্ভাব্যতা সূত্র দ্বারা গণনা করা যেতে পারে

(4.1)

ঘটনাকে অনুমান বলা হয়। পরীক্ষার যে অংশে অনিশ্চয়তা রয়েছে সেই বিষয়ে অনুমানগুলি সামনে রাখা হয়।

, অনুমানগুলির একটি অগ্রাধিকার সম্ভাব্যতা কোথায়

বেইস সূত্র:

পরীক্ষাটি সম্পূর্ণ করা যাক এবং এটি জানা যায় যে পরীক্ষার ফলাফল হিসাবে ঘটনা A ঘটেছে। তারপর, এই তথ্যগুলিকে বিবেচনায় নিয়ে, আমরা করতে পারি অনুমানগুলির সম্ভাব্যতাকে অত্যধিক মূল্যায়ন করুন:

(4.2)

, কোথায় অনুমানের পরবর্তী সম্ভাব্যতা

সমস্যা সমাধান

কার্যক্রম 1.

অবস্থা

গুদামে প্রাপ্ত অংশের 3 ব্যাচের মধ্যে, ভাল বেশী হয় 89 %, 92 % এবং 97 % যথাক্রমে ব্যাচে অংশের সংখ্যা হিসাবে উল্লেখ করা হয় 1:2:3.

গুদাম থেকে এলোমেলোভাবে নির্বাচিত একটি অংশ ত্রুটিপূর্ণ হওয়ার সম্ভাবনা কত। এটা জানা যাক যে একটি এলোমেলোভাবে নির্বাচিত অংশ ত্রুটিপূর্ণ হতে পরিণত. সম্ভাব্যতা খুঁজুন যে এটি প্রথম, দ্বিতীয় এবং তৃতীয় পক্ষের অন্তর্গত।

সমাধান:

A দ্বারা নির্দেশ করুন যে একটি এলোমেলোভাবে নির্বাচিত অংশ ত্রুটিপূর্ণ হতে দেখা যায়।

১ম প্রশ্ন- মোট সম্ভাব্যতা সূত্রে

২য় প্রশ্ন- বেইস সূত্রে

পরীক্ষার যে অংশে অনিশ্চয়তা রয়েছে সেই বিষয়ে অনুমানগুলি সামনে রাখা হয়। এই সমস্যায়, অনিশ্চয়তা হল কোন ব্যাচ থেকে এলোমেলোভাবে নির্বাচিত অংশটি।

প্রথম খেলা যাক বিস্তারিত তারপর দ্বিতীয় খেলায়- 2 বিশদ বিবরণ, এবং তৃতীয়টিতে - 3 বিস্তারিত মাত্র তিনটি খেলা 6 বিস্তারিত

(প্রথম লাইনে বিবাহের শতাংশ সম্ভাব্যতায় অনুবাদ করা হয়েছিল)


(দ্বিতীয় লাইনে বিবাহের শতাংশ সম্ভাব্যতায় অনুবাদ করা হয়েছিল)

(তৃতীয় লাইনে বিবাহের শতকরা হার সম্ভাব্যতায় রূপান্তরিত)

মোট সম্ভাব্যতা সূত্র ব্যবহার করে, আমরা একটি ঘটনার সম্ভাব্যতা গণনা করি

-1টি প্রশ্নের উত্তর

ত্রুটিপূর্ণ অংশটি প্রথম, দ্বিতীয় এবং তৃতীয় ব্যাচের অন্তর্ভুক্ত হওয়ার সম্ভাবনাগুলি Bayes সূত্র ব্যবহার করে গণনা করা হয়:

টাস্ক 2।

শর্ত:

প্রথম কলস মধ্যে 10 বল: 4 সাদা বালি 6 কালো দ্বিতীয় কলস মধ্যে 20 বল: 2 সাদা বালি 18 কালো প্রতিটি কলস থেকে একটি বল এলোমেলোভাবে নির্বাচন করা হয় এবং তৃতীয় কলসে রাখা হয়। তারপরে তৃতীয় কলস থেকে একটি বল এলোমেলোভাবে নির্বাচন করা হয়। তৃতীয় কলস থেকে আঁকা বলটি সাদা হওয়ার সম্ভাবনা খুঁজুন।

সমাধান:

মোট সম্ভাব্যতা সূত্র ব্যবহার করে সমস্যার প্রশ্নের উত্তর পাওয়া যেতে পারে:

অনিশ্চয়তা যেখানে বল তৃতীয় কলস শেষ হয়েছে. আমরা তৃতীয় কলসে বলের গঠন সম্পর্কিত অনুমানগুলি সামনে রেখেছি।

H1=(তৃতীয় কলসে 2টি সাদা বল আছে)

H2=(তৃতীয় কলসে 2টি কালো বল আছে)

H3=(তৃতীয় কলসটিতে 1টি সাদা বল এবং 1টি কালো বল রয়েছে)

A=(3 নং কলস থেকে নেওয়া বল সাদা হবে)

টাস্ক 3।

একটি সাদা বল অজানা রঙের 2টি বল সম্বলিত একটি কলসে ফেলে দেওয়া হয়। এর পরে, আমরা এই কলস থেকে 1 বল বের করি। কলস থেকে আঁকা বলটি সাদা হওয়ার সম্ভাবনা খুঁজুন। উপরে বর্ণিত কলস থেকে নেওয়া বলটি সাদা হয়ে গেল। সম্ভাব্যতা খুঁজুন যে স্থানান্তরের আগে ভুঁড়িতে 0টি সাদা বল, 1টি সাদা বল এবং 2টি সাদা বল ছিল .

১টি প্রশ্ন c - মোট সম্ভাব্যতা সূত্রে

2 প্রশ্ন-বেইস সূত্রে

অনিশ্চয়তা মূত্রের বলগুলির প্রাথমিক রচনার মধ্যে রয়েছে। কলসের মধ্যে বলের প্রাথমিক রচনা সম্পর্কে, আমরা নিম্নলিখিত অনুমানগুলি সামনে রাখি:

হাই =( শিফ্ট হওয়ার আগে কলসে ছিলi-1 সাদা বল),i=1,2,3

, i=1,2,3(সম্পূর্ণ অনিশ্চয়তার পরিস্থিতিতে, আমরা অনুমানগুলির অগ্রাধিকার সম্ভাব্যতাগুলিকে একই হিসাবে গ্রহণ করি, যেহেতু আমরা বলতে পারি না যে একটি বিকল্প অন্যটির চেয়ে বেশি সম্ভাবনাময়)

A = (স্থানান্তরের পরে কলস থেকে আঁকা বলটি সাদা হবে)

চলুন শর্তসাপেক্ষ সম্ভাব্যতা গণনা করা যাক:

মোট সম্ভাব্যতা সূত্র ব্যবহার করে একটি গণনা করা যাক:

১টি প্রশ্নের উত্তর

দ্বিতীয় প্রশ্নের উত্তর দিতে, আমরা Bayes সূত্র ব্যবহার করি:

(আগের সম্ভাবনার তুলনায় কমে গেছে)

(আগের সম্ভাবনা থেকে অপরিবর্তিত)

(আগের সম্ভাবনার তুলনায় বৃদ্ধি)

অনুমানের পূর্ববর্তী এবং পরবর্তী সম্ভাব্যতার তুলনা থেকে উপসংহার: প্রাথমিক অনিশ্চয়তা পরিমাণগতভাবে পরিবর্তিত হয়েছে

টাস্ক 4।

শর্ত:

রক্ত দেওয়ার সময়, দাতা এবং রোগীর রক্তের গ্রুপগুলি বিবেচনায় নেওয়া প্রয়োজন। যার আছে চতুর্থ গ্রুপরক্ত যে কোন ধরনের রক্ত ​​ট্রান্সফিউজ করা যেতে পারে, একজন ব্যক্তির কাছে দ্বিতীয় এবং তৃতীয় গ্রুপের সাথেঢেলে দেওয়া যেতে পারে অথবা তার গ্রুপের রক্ত, বা প্রথম।একজন ব্যক্তির কাছে প্রথম রক্তের গ্রুপের সাথেআপনি রক্ত ​​দিতে পারেন শুধুমাত্র প্রথম দল।জানা গেছে, জনসংখ্যার মধ্যে ড 33,7 % আছে প্রথম দলপু, 37,5 % আছে দ্বিতীয় গ্রুপ, 20.9%আছে তৃতীয় গ্রুপএবং 7.9% 4র্থ গ্রুপ আছে.এলোমেলোভাবে নেওয়া রোগীকে এলোমেলোভাবে নেওয়া দাতার রক্ত ​​দিয়ে ট্রান্সফিউজ করা যেতে পারে এমন সম্ভাবনা খুঁজুন।


সমাধান:

এলোমেলোভাবে নেওয়া রোগীর রক্তের গ্রুপ সম্পর্কে আমরা হাইপোথিসিস সামনে রেখেছি:

হাই = (একটি রোগীর মধ্যেi-ম রক্তের গ্রুপ),i=1,2,3,4

(শতাংশ সম্ভাব্যতায় রূপান্তরিত)

A=(স্থানান্তরিত করা যেতে পারে)

মোট সম্ভাব্যতা সূত্র অনুসারে, আমরা পাই:

অর্থাত্ স্থানান্তর প্রায় 60% ক্ষেত্রে সঞ্চালিত হতে পারে

বার্নোলি স্কিম (বা দ্বিপদ স্কিম)

বার্নোলি ট্রায়াল -এই স্বাধীন পরীক্ষা 2 ফলাফল, যা আমরা শর্তসাপেক্ষে কল করি সাফল্য এবং ব্যর্থতা.

পি-সফলতার মাত্রা

q- ব্যর্থতার সম্ভাবনা

সফলতার সম্ভাবনা অভিজ্ঞতা থেকে অভিজ্ঞতার পরিবর্তন হয় না

আগের পরীক্ষার ফলাফল পরবর্তী পরীক্ষায় প্রভাব ফেলে না।

উপরে বর্ণিত পরীক্ষাগুলিকে বার্নৌলি স্কিম বা দ্বিপদ স্কিম বলা হয়।

বার্নোলি পরীক্ষার উদাহরণ:

মুদ্রা শিরসঁচালন

সাফল্য -অস্ত্রের কোট

ব্যর্থতা-পুচ্ছ

সঠিক মুদ্রার ক্ষেত্রে

ভুল মুদ্রা কেস

পিএবং qঅভিজ্ঞতা থেকে অভিজ্ঞতা পরিবর্তন করবেন না যদি আমরা পরীক্ষার সময় মুদ্রা পরিবর্তন না করি

একটি পাশা নিক্ষেপ

সাফল্য -রোল "6"

ব্যর্থতা -বাকি সব

একটি নিয়মিত পাশা মামলা

ভুল পাশা মামলা

পিএবং qঅভিজ্ঞতা থেকে অভিজ্ঞতা পরিবর্তন করবেন না, যদি পরীক্ষা পরিচালনার প্রক্রিয়ায় আমরা পাশা পরিবর্তন না করি

লক্ষ্যে তীর নিক্ষেপ

সাফল্য -আঘাত

ব্যর্থতা -হারানো

p =0.1 (10টির মধ্যে একটি শটে শুটার হিট)

পিএবং qঅভিজ্ঞতা থেকে অভিজ্ঞতায় পরিবর্তন করবেন না, যদি পরীক্ষা পরিচালনার প্রক্রিয়ায় আমরা তীর পরিবর্তন না করি

বার্নোলি সূত্র।

দিনঅনুষ্ঠিত n পি. ঘটনা বিবেচনা করুন

(ভিতরেn সাফল্যের সম্ভাবনা সহ বার্নোলি ট্রায়ালp ঘটবেআমি সাফল্য),

-এই ধরনের ইভেন্টের সম্ভাব্যতার জন্য একটি আদর্শ স্বরলিপি আছে

<-সম্ভাব্যতা গণনার জন্য বার্নউলির সূত্র (4.3)

সূত্রের ব্যাখ্যা : m সাফল্য হওয়ার সম্ভাবনা (সম্ভাব্যতাগুলি গুণিত হয়, কারণ ট্রায়ালগুলি স্বাধীন, এবং যেহেতু সেগুলি একই, একটি ডিগ্রী উপস্থিত হয়), - n-m ব্যর্থতা ঘটবে এমন সম্ভাবনা (ব্যাখ্যাটি সাফল্যের মতোই), - ইভেন্ট বাস্তবায়নের উপায়ের সংখ্যা, অর্থাৎ, কত উপায়ে n জায়গায় সফলতা স্থাপন করা যায়।

বার্নোলি সূত্রের পরিণতি:

ফলাফল 1:

দিনঅনুষ্ঠিত nসাফল্যের সম্ভাবনা সহ বার্নোলি ট্রায়াল পি. ঘটনা বিবেচনা করুন

ক(m1,m2)=(সাফল্যের সংখ্যাn বার্নোলি ট্রায়ালগুলি পরিসরে আবদ্ধ করা হবে [m1;m2])

(4.4)

সূত্রের ব্যাখ্যা: সূত্র (4.4) সূত্র (4.3) থেকে অনুসরণ করে এবং বেমানান ঘটনাগুলির জন্য সম্ভাব্যতা যোগ উপপাদ্য, কারণ - বেমানান ইভেন্টের যোগফল (ইউনিয়ন), এবং প্রতিটির সম্ভাব্যতা সূত্র দ্বারা নির্ধারিত হয় (4.3)।

পরিণতি 2

দিনঅনুষ্ঠিত nসাফল্যের সম্ভাবনা সহ বার্নোলি ট্রায়াল পি. একটি ঘটনা বিবেচনা করুন

A=( মধ্যেn Bernoulli ট্রায়ালের ফলে কমপক্ষে 1টি সাফল্য আসবে৷}

(4.5)

সূত্রের ব্যাখ্যা: ={ n Bernoulli ট্রায়ালে কোন সাফল্য হবে না)=

(সমস্ত এন ট্রায়াল ব্যর্থ হবে)

সমস্যা (বার্নোলি সূত্রে এবং এর পরিণতি) 1.6-D সমস্যার জন্য উদাহরণ। জ.

সঠিক মুদ্রা 10 বার টস. নিম্নলিখিত ইভেন্টগুলির সম্ভাব্যতা খুঁজুন:

A=(হাতের আবরণ ঠিক 5 বার নেমে যাবে)

B=(হাতের কোট 5 বারের বেশি নামবে না)

সি = (অন্তত একবার নামবে অস্ত্রের কোট)

সমাধান:

আসুন বার্নোলি পরীক্ষার পরিপ্রেক্ষিতে সমস্যাটিকে সংস্কার করি:

n = 10 নম্বর ট্রায়াল

সাফল্য- অস্ত্রের কোট

p=0.5 - সাফল্যের সম্ভাবনা

q=1-p=0.5 – ব্যর্থতার সম্ভাবনা

ঘটনা A এর সম্ভাব্যতা গণনা করতে, আমরা ব্যবহার করি বার্নোলি সূত্র:

ঘটনা B এর সম্ভাব্যতা গণনা করতে, আমরা ব্যবহার করি পরিণতি 1প্রতি বার্নোলির সূত্র:

একটি ঘটনা C এর সম্ভাব্যতা গণনা করতে, আমরা ব্যবহার করি ফলাফল 2প্রতি বার্নোলির সূত্র:

বার্নোলি স্কিম। আনুমানিক সূত্র দ্বারা গণনা।

মোয়াভর-ল্যাপ্লেসের আনুমানিক সূত্র

স্থানীয় সূত্র

পিসাফল্য এবং qব্যর্থতা, তারপর সবার জন্য মিআনুমানিক সূত্রটি বৈধ:

, (4.6)

মি

ফাংশনের মান বিশেষ পাওয়া যাবে টেবিল এটি শুধুমাত্র এর জন্য মান ধারণ করে। কিন্তু ফাংশনটি সমান, যেমন ..

যদি, তাহলে ধরুন

অবিচ্ছেদ্য সূত্র

যদি Bernoulli স্কিমে n ট্রায়ালের সংখ্যা বড় হয়, এবং সম্ভাবনাও বড় হয় পিসাফল্য এবং qব্যর্থতা, তারপর আনুমানিক সূত্র সকলের জন্য বৈধ (4.7) :

ফাংশনের মান একটি বিশেষ টেবিলে পাওয়া যাবে। এটি শুধুমাত্র এর জন্য মান ধারণ করে। কিন্তু ফাংশনটি অদ্ভুত, যেমন .

যদি, তাহলে ধরুন

আনুমানিক পয়সন সূত্র

স্থানীয় সূত্র

বিচার সংখ্যা যাক nবার্নোলি স্কিম অনুসারে বড়, এবং একটি পরীক্ষায় সাফল্যের সম্ভাবনা কম, এবং পণ্যটিও ছোট। তারপর এটি আনুমানিক সূত্র দ্বারা নির্ধারিত হয়:

, (4.8)

n Bernoulli ট্রায়ালে সাফল্যের সংখ্যার সম্ভাবনা মি

ফাংশন মান একটি বিশেষ টেবিলে দেখা যেতে পারে।

অবিচ্ছেদ্য সূত্র

বিচার সংখ্যা যাক nবার্নোলি স্কিম অনুসারে বড়, এবং একটি পরীক্ষায় সাফল্যের সম্ভাবনা কম, এবং পণ্যটিও ছোট।

তারপর আনুমানিক সূত্র দ্বারা নির্ধারিত:

, (4.9)

n Bernoulli ট্রায়ালে সাফল্যের সংখ্যা সীমার মধ্যে রয়েছে এমন সম্ভাবনা।

ফাংশন মান একটি বিশেষ সারণীতে দেখা যায় এবং তারপর পরিসরে সংকলন করা যায়।

সূত্র

বিষের সূত্র

Moivre-Laplace সূত্র

গুণমান

অনুমান

অনুমান মোটামুটি

10

মোটামুটি অনুমানের জন্য ব্যবহৃত

গণনা

প্রয়োগের জন্য ব্যবহৃত হয়

ইঞ্জিনিয়ারিং গণনা

100 0

যে কোন ইঞ্জিনিয়ারিং গণনার জন্য ব্যবহৃত হয়

n>1000

খুব ভাল গ্রেড

আপনি টাস্ক 1.7 এবং 1.8 D. z-এর উদাহরণের গুণমান দেখতে পারেন।

পয়সন সূত্র দ্বারা গণনা।

সমস্যা (পয়সনের সূত্র)।

শর্ত:

যোগাযোগ লাইনে একটি বার্তা প্রেরণ করার সময় একটি প্রতীকের বিকৃতির সম্ভাবনা সমান 0.001. বার্তাটি গ্রহণযোগ্য বলে বিবেচিত হয় যদি এতে কোন বিকৃতি না থাকে। সমন্বিত একটি বার্তা প্রাপ্তির সম্ভাবনা খুঁজুন 20 শব্দ 100 প্রতিটিঅক্ষর প্রতিটি

সমাধান:

দ্বারা নির্দেশ করুন কিন্তু

-বার্তায় অক্ষরের সংখ্যা

সাফল্য: চরিত্র বিকৃত হয় না

সফলতার সম্ভাবনা

হিসাব করা যাক। আনুমানিক সূত্র ব্যবহার করার জন্য সুপারিশ দেখুন ( ) : গণনার জন্য আপনাকে আবেদন করতে হবে পয়সনের সূত্র

এবং সাপেক্ষে পয়সন সূত্রের সম্ভাব্যতাm একটি বিশেষ টেবিলে পাওয়া যাবে।

শর্ত:

টেলিফোন এক্সচেঞ্জ 1000 গ্রাহকদের সেবা করে। সম্ভাব্যতা যে এক মিনিটের মধ্যে কোনো গ্রাহকের একটি সংযোগ প্রয়োজন হবে 0.0007। এক মিনিটে টেলিফোন এক্সচেঞ্জে কমপক্ষে 3টি কল আসার সম্ভাবনা গণনা করুন।

সমাধান:

বার্নোলি স্কিমের পরিপ্রেক্ষিতে সমস্যাটি সংস্কার করুন

সফলতা: কল রিসিভ হয়েছে

সফলতার সম্ভাবনা

– যে পরিসরের মধ্যে সাফল্যের সংখ্যা থাকতে হবে

A = (অন্তত তিনটি কল আসবে) - একটি ইভেন্ট, যার সম্ভাব্যতা প্রয়োজন। টাস্ক খুঁজে

(তিনটিরও কম কল আসবে) আমরা অতিরিক্তের দিকে এগিয়ে যাই। ঘটনা, যেহেতু এর সম্ভাব্যতা গণনা করা সহজ।

(পদ গণনা বিশেষ টেবিল দেখুন)

এইভাবে,

সমস্যা (স্থানীয় Mouvre-Laplace সূত্র)

অবস্থা

এক শটে লক্ষ্যে আঘাত করার সম্ভাবনা 0.8 এর সমান।সম্ভাব্যতা নির্ধারণ করুন যে 400 এশট ঘটবে ঠিক 300আঘাত.

সমাধান:

বার্নোলি স্কিমের পরিপ্রেক্ষিতে সমস্যাটি সংস্কার করুন

n=400 – পরীক্ষার সংখ্যা

m=300 – সাফল্যের সংখ্যা

সাফল্য - আঘাত

(বার্নোলি স্কিমের পরিপ্রেক্ষিতে সমস্যা প্রশ্ন)

অনুমান:

আমরা কাটাই স্বাধীন পরীক্ষা, যার প্রতিটিতে আমরা পার্থক্য করি m অপশন।

p1 - ​​একটি পরীক্ষায় প্রথম বিকল্প পাওয়ার সম্ভাবনা

p2 - একটি পরীক্ষায় দ্বিতীয় বিকল্প পাওয়ার সম্ভাবনা

…………..

pm পাওয়ার সম্ভাবনাএক পরীক্ষায় m-th বিকল্প

p1,p2, ………………..,pm অভিজ্ঞতা থেকে অভিজ্ঞতা পরিবর্তন না

উপরে বর্ণিত পরীক্ষার ক্রম বলা হয় বহুপদী স্কিম।

(যখন m=2, বহুপদী স্কিম দ্বিপদী হয়ে যায়), অর্থাৎ, উপরে বর্ণিত দ্বিপদী স্কিমটি বহুপদী নামে পরিচিত একটি সাধারণ স্কিমের একটি বিশেষ ক্ষেত্রে)।

নিম্নলিখিত ঘটনা বিবেচনা করুন

А(n1,n2,….,nm)=(উপরে বর্ণিত n ট্রায়ালে, বৈকল্পিক 1 n1 বার উপস্থিত হয়েছে, ভেরিয়েন্ট 2 n2 বার উপস্থিত হয়েছে, ..., ইত্যাদি, nm বার বৈকল্পিক m উপস্থিত হয়েছে)

একটি বহুপদী স্কিম ব্যবহার করে সম্ভাব্যতা গণনার সূত্র

অবস্থা

ছক্কা 10 বার নিক্ষেপ।এটি "6" পড়ে যাওয়ার সম্ভাবনা খুঁজে বের করতে হবে ২ বার, এবং "5" পড়ে যাবে 3 বার.

সমাধান:

দ্বারা নির্দেশ করুন কিন্তু ঘটনা যার সম্ভাব্যতা সমস্যা খুঁজে পাওয়া যায়.

n=10 -পরীক্ষার সংখ্যা

m=3

1 বিকল্প - ড্রপ 6

p1=1/6n1=2

বিকল্প 2 - ড্রপ 5

p2=1/6n2=3

বিকল্প 3 - 5 এবং 6 ব্যতীত যেকোনো মুখ বাদ দিন

p3=4/6n3=5

P(2,3,5)-? (সমস্যা অবস্থায় উল্লেখ করা ইভেন্টের সম্ভাবনা)

বহুপদী সার্কিটের জন্য সমস্যা

অবস্থা

মধ্যে যে সম্ভাবনা খুঁজুন 10 এলোমেলোভাবে নির্বাচিত ব্যক্তিদের প্রথম ত্রৈমাসিকে চারটি জন্মদিন, দ্বিতীয়টিতে তিনটি, তৃতীয়টিতে দুটি এবং চতুর্থ ত্রৈমাসিকে একজনের জন্মদিন থাকবে৷

সমাধান:

দ্বারা নির্দেশ করুন কিন্তু ঘটনা যার সম্ভাব্যতা সমস্যা খুঁজে পাওয়া যায়.

আসুন একটি বহুপদী স্কিমের পরিপ্রেক্ষিতে সমস্যাটিকে সংস্কার করি:

n=10 -পরীক্ষার সংখ্যা = মানুষের সংখ্যা

মি = 4প্রতিটি ট্রায়ালে আমরা আলাদা করা বিকল্পগুলির সংখ্যা

বিকল্প 1 - 1 কোয়ার্টারে জন্ম

p1=1/4n1=4

বিকল্প 2 - ২য় ত্রৈমাসিকে জন্ম

p2=1/4n2=3

বিকল্প 3 - 3য় ত্রৈমাসিকে জন্ম

p3=1/4n3=2

বিকল্প 4 - 4র্থ ত্রৈমাসিকে জন্ম

p4=1/4n4=1

P(4,3,2,1)-? (সমস্যা অবস্থায় উল্লেখ করা ইভেন্টের সম্ভাবনা)

আমরা ধরে নিই যে কোন ত্রৈমাসিকে জন্ম নেওয়ার সম্ভাবনা একই এবং 1/4 সমান।চলুন বহুপদ স্কিমের সূত্র অনুযায়ী গণনা করা যাক:

বহুপদী সার্কিটের জন্য সমস্যা

অবস্থা

কলস মধ্যে 30 বল: ফিরে আসার জন্য স্বাগতম.3 সাদা, 2 সবুজ, 4টি নীল এবং 1টি হলুদ।

সমাধান:

দ্বারা নির্দেশ করুন কিন্তু ঘটনা যার সম্ভাব্যতা সমস্যা খুঁজে পাওয়া যায়.

আসুন একটি বহুপদী স্কিমের পরিপ্রেক্ষিতে সমস্যাটিকে সংস্কার করি:

n=10 -পরীক্ষার সংখ্যা = নির্বাচিত বলের সংখ্যা

মি = 4প্রতিটি ট্রায়ালে আমরা আলাদা করা বিকল্পগুলির সংখ্যা

বিকল্প 1 - একটি সাদা বল বেছে নিন

p1=1/3n1=3

বিকল্প 2 - সবুজ বল নির্বাচন করুন

p2=1/6n2=2

3য় বিকল্প - নীল বলের পছন্দ

p3=4/15n3=4

বিকল্প 4 - হলুদ বল নির্বাচন করুন

p4=7/30n4=1

P(3,2,4,1)-? (সমস্যা অবস্থায় উল্লেখ করা ইভেন্টের সম্ভাবনা)

p1,p2, p3,p4 অভিজ্ঞতা থেকে অভিজ্ঞতা পরিবর্তন করবেন না, যেহেতু পছন্দটি রিটার্ন দিয়ে তৈরি করা হয়

চলুন বহুপদ স্কিমের সূত্র অনুযায়ী গণনা করা যাক:

হাইপারজিওমেট্রিক স্কিম

k প্রকারের n উপাদান থাকতে দিন:

প্রথম প্রকারের n1

দ্বিতীয় প্রকারের n2

nk টাইপ k

এলোমেলোভাবে এই n উপাদান থেকে ফেরত নেই m উপাদান নির্বাচন করুন

A(m1,…,mk) ইভেন্টটি বিবেচনা করুন, যার মধ্যে রয়েছে যে নির্বাচিত m উপাদানগুলির মধ্যে থাকবে

প্রথম ধরনের m1

দ্বিতীয় প্রকারের m2

mk k-th প্রকার

এই ঘটনার সম্ভাব্যতা সূত্র দ্বারা গণনা করা হয়

P(A(m1,…,mk))= (4.11)

উদাহরণ 1

হাইপারজিওমেট্রিক স্কিমের জন্য সমস্যা (সমস্যা 1.9 D. h এর জন্য নমুনা)

অবস্থা

কলস মধ্যে 30 বল: 10টি সাদা, 5টি সবুজ, 8টি নীল এবং 7টি হলুদ(বলের রং শুধুমাত্র ভিন্ন)। 10টি বল এলোমেলোভাবে কলস থেকে নির্বাচন করা হয়। ফেরত নেই. সম্ভাব্যতা খুঁজুন যে নির্বাচিত বলের মধ্যে থাকবে: 3 সাদা, 2 সবুজ, 4টি নীল এবং 1টি হলুদ।

আমাদের আছেn=30,k=4,

n1=10,n2=5,n3=8,n4=7,

m1=3,m2=2,m3=4,m4=1

P(A(3,2,4,1))= = সংমিশ্রণের সূত্র জেনে একটি সংখ্যায় গণনা করা যেতে পারে

উদাহরণ 2

এই স্কিম অনুযায়ী গণনার একটি উদাহরণ: স্পোর্টলোটো গেমের জন্য গণনা দেখুন (বিষয় 1)


বন্ধ