مجموع النتيجة

الجدول 8.3a. إحصائيات الانحدار
إحصائيات الانحدار
متعددة r. 0,998364
R-square. 0,99673
R-Square الطبيعي 0,996321
خطأ تقليدي 0,42405
الملاحظات 10

أولا، النظر في الجزء العلوي من الحسابات، المقدمة في الجدول 8.3A، هي إحصاءات الانحدار.

قيمة R-Square، التي تسمى أيضا مقياس اليقين، يميز جودة الانحدار الذي تم الحصول عليه مباشرة. يتم التعبير عن هذه الجودة من خلال درجة المطابقة بين البيانات المصدر ونموذج الانحدار (البيانات المحسوبة). مقياس اليقين هو دائما ضمن الفاصل الزمني.

في معظم الحالات، تكون قيمة R-Square بين هذه القيم، تسمى متطرف، أي بين الصفر والوحدة.

إذا كانت قيمة R-Square بالقرب من واحد، فهذا يعني أن النموذج الذي تم إنشاؤه يشرح تقريبا كل التباينات للمتغيرات المقابلة. على العكس من ذلك، فإن قيمة R-Square، بالقرب من الصفر، تعني نوعية رديئة للنموذج الذي تم إنشاؤه.

في مثالنا، فإن مقياس اليقين هو 0.99673، مما يدل على انحدار جيد للغاية يصلح مباشرة إلى البيانات الأولية.

متعددة r. - يعبر معامل الارتباط المتعدد R - عن درجة الاعتماد على المتغيرات المستقلة (X) والمتغير التابع (Y).

S متعددة مساوية للجذر المربع من معامل التصميم، وتأخذ هذه القيمة القيم في النطاق من الصفر إلى واحد.

في تحليل الانحدار الخطي البسيط، فإن R متعددة يساوي معامل الارتباط بيرسون. في الواقع، فإن R متعددة في قضيتنا يساوي معامل الارتباط بيرسون من المثال السابق (0.998364).

الجدول 8.3B. معامل الركود
عوامل خطأ تقليدي t الإحصائيات
ص العبور 2,694545455 0,33176878 8,121757129
متغير x 1. 2,305454545 0,04668634 49,38177965
* يتم إعطاء خيار الحساب مقطوع.

الآن النظر في الجزء الأوسط من الحسابات، المقدمة في الجدول 8.3B. معامل الانحدار ب (2.305454545) والإزاحة على طول المحور، أي ثابت (2،694545455).

بناء على الحسابات، يمكننا كتابة معادلة الانحدار بهذه الطريقة:

Y \u003d X * 2،305454545 + 2،694545455

يتم تحديد اتجاه التواصل بين المتغيرات على أساس العلامات (سلبية أو إيجابية) معامل الركود (معامل ب).

إذا كانت علامة معامل الركود - إيجابي، علاقة المتغير التابع مع مستقل ستكون إيجابية. في حالتنا، فإن معامل الانحدار إيجابيا، وبالتالي، فإن الاتصال موجب أيضا.

إذا كانت علامة معامل الركود - سلبية، علاقة المتغير التابع مع مستقلة سلبية (عكس).

الجدول 8.3B. يتم تقديم نتائج إخراج المخلفات. من أجل ظهور هذه النتائج في التقرير، من الضروري تنشيط مربع الاختيار "لا يزال" عند بدء تشغيل أداة "الانحدار".

خاتمة بقايا

الجدول 8.3B. بقايا
ملاحظة توقعت ص. بقايا بقايا قياسية
1 9,610909091 -0,610909091 -1,528044662
2 7,305454545 -0,305454545 -0,764022331
3 11,91636364 0,083636364 0,209196591
4 14,22181818 0,778181818 1,946437843
5 16,52727273 0,472727273 1,182415512
6 18,83272727 0,167272727 0,418393181
7 21,13818182 -0,138181818 -0,34562915
8 23,44363636 -0,043636364 -0,109146047
9 25,74909091 -0,149090909 -0,372915662
10 28,05454545 -0,254545455 -0,636685276

مع هذا الجزء من التقرير، يمكننا أن نرى انحرافات لكل نقطة من خط الانحدار الذي شيد. أكبر قيمة مطلقة

تحليل الانحدار - طريقة النمذجة البيانات والدراسات المقاسة لممتلكاتها. تتكون البيانات من قيم البخار المتغير التابع (متغير الاستجابة) و متغير مستقل (شرح المتغير). نموذج الانحدار هو وظيفة متغير مستقل ومعلمات مع المتغير العشوائي الإضافي. يتم تكوين المعلمات النموذجية بطريقة تجعل النموذج أفضل البيانات. عادة ما يكون المعيار لجودة التقريب (الوظيفة المستهدفة) هو الخطأ القياسي: مجموع مربعات النمط الفرق من القيم النموذجية والمتغير التابع لجميع قيم المتغير المستقل كوسيطة. تحليل الانحدار - قسم الإحصاء الرياضي والتعلم الآلي. من المفترض أن المتغير التابع هو مجموع قيم نموذج معين ومتغير عشوائي. فيما يتعلق بطبيعة توزيع هذا الحجم، يتم الافتراضات، تسمى فرضية توليد البيانات. لتأكيد أو دحض هذه الفرضية، يتم إجراء الاختبارات الإحصائية، وتسمى تحليل البقايا. يفترض أن متغير مستقل لا يحتوي على أخطاء. يستخدم تحليل الانحدار للتنبؤ وتحليل السلسلة الزمنية واختبار الفرضيات وتحديد الترابط المخفية في البيانات.

تعريف تحليل الانحدار

قد لا تكون العينة وظيفة، ولكن الموقف. على سبيل المثال، قد تكون البيانات اللازمة لإنشاء الانحدار مثل :. في مثل هذه العينة، تتوافق قيمة واحدة للمتغير مع العديد من القيم المتغيرة.

الانحدارالخطي

ينفص الانحدار الخطي أن الوظيفة تعتمد على المعلمات خطيا. في هذه الحالة، الاعتماد الخطي على المتغير الحر هو اختياري،

في الحالة عندما تكون ميزة الانحدار الخطي

فيما يلي مكونات المتجه.

تم العثور على قيم المعلمات في حالة الانحدار الخطي باستخدام أسلوب المربعات الصغرى. يتم إثبات استخدام هذه الطريقة من خلال افتراض توزيع غاوسي لمتغير عشوائي.

يتم استدعاء الاختلافات بين القيم الفعلية للمتغير التابع واستعادة بقايا الانحدار (المتبقية). كما تستخدم المرادفات أيضا في الأدب: كيسيتس و أخطاءوبعد أحد التقديرات المهمة لمعيار الجودة الذي تم الحصول عليه هو مجموع مربعات المخلفات:

هنا - مجموع الأخطاء التربيعي.

يتم احتساب تشتت المخلفات من قبل الصيغة

هنا - يعني خطأ مربع، الخطأ القياسي.

الرسوم البيانية الحالية العينات المشار إليها بواسطة النقاط الزرقاء، وتبعية الانحدار المشار إليها من قبل خطوط صلبة. على محور ABSCASSA، تم تأجيل متغير مجاني، وعلى طول المحور التابع. جميع التبعيات الثلاثة خطية نسبة إلى المعلمات.

الانحدار غير الخطي

نماذج الانحدار غير الخطية - نماذج النموذج

التي لا يمكن تمثيلها كمنتج فرش

أين - معلمات نموذج الانحدار، عبارة عن متغير مجاني من المساحة، متغير يعتمد، - قيمة عشوائية وهي وظيفة من مجموعة مجموعة معينة.

تم العثور على قيم المعلمات في حالة الانحدار غير الخطي باستخدام إحدى طرق نزول التدرج، على سبيل المثال، خوارزمية Levenberg-Marquardt.

حول المصرفات

تم تقديم مصطلح "الانحدار" من قبل فرانسيس جالتون في نهاية القرن التاسع عشر. وجدت غالتون أن أطفال الآباء والأمهات ذي النمو العالي أو المنخفض عادة لا يرثون نمو رائعا ودعا هذه الظاهرة "الانحدار إلى mealoCense". في البداية، تم استخدام هذا المصطلح حصريا في المعنى البيولوجي. بعد أعمال تشارلز بيرسون، بدأ هذا المصطلح في استخدام وإحصائيات.

في الأدب الإحصائي يميز الانحدار بمشاركة أحد متغير واحد مجانا ومع العديد من المتغيرات المجانية - أحادية الأبعاد و متعدد الأبعاد تراجع. من المفترض أن نستخدم العديد من المتغيرات المجانية، أي متغير مجاني - ناقل. في حالات خاصة، عندما يكون المتغير المجاني علقا، سيتم تعيينه. يميز خطي و غير الخطية تراجع. إذا لم يكن نموذج الانحدار مزيجا خطيا من الوظائف من المعلمات، فإنها تتحدث عن الانحدار غير الخطي. في الوقت نفسه، يمكن أن يكون النموذج تراكبا تعسفيا للوظائف من بعض المجموعة. النماذج غير الخطية هي، الأسي، المثلثية وغيرها (على سبيل المثال، وظائف أساس شعاعي أو penspond rosenblatt)، قم بتعيين العلاقة بين المعلمات وغير الخطية المتغيرة التابعة.

يميز غير رسمي و غير معلمية تراجع. من الصعب أن تنفق الحدود الصارمة بين هذين النوعين من الانحدارات. الآن لا يوجد معيار مقبول عموما لتمييز نوع واحد من النماذج من الآخر. على سبيل المثال، يعتقد أن النماذج الخطية هي حديثة، والنماذج التي تتضمن متوسط \u200b\u200bالمتغير التابع في مساحة متغير مجاني - notparametric. مثال على نموذج الانحدار غير الرسمي: توقع خطي، Perceptron متعدد الطبقات. أمثلة على نموذج الانحدار المختلط: وظائف قاعدة شعاعية. النموذج غير المعياري هو المتوسط \u200b\u200bانزلاق في نافذة بعض العرض. بشكل عام، يختلف الانحدار غير المعياري غير المعلم عن المعهد غير المعياري في أن المتغير التابع يعتمد ليس من قيمة واحدة لمتغير مجاني، ولكن من حي معين مقدم لهذه القيمة.

هناك تمييز بين المصطلحات: "تقريب الوظائف"، "تقريب"، "الاستيفاء"، و "الانحدار". وهي كالاتي.

تقريب الوظائف. يتم تقديم وظيفة حجة منفصلة أو مستمرة. يطلب من ذلك العثور على وظيفة من بعض عائلة حدوامية، على سبيل المثال، بين متعدد الحدود الجبرية من درجة معينة. يجب أن توفر معلمات الوظائف الحد الأدنى من بعض الوظائف، على سبيل المثال،

مصطلح تقريب - مرادف للمصطلح "تقريب الوظائف". غالبا ما تستخدم عندما يتعلق الأمر بوظيفة معينة كدالة للحجة المنفصلة. يتطلب ذلك أيضا العثور على مثل هذه الوظيفة التي تحدث الأقرب إلى جميع نقاط الوظيفة المحددة. في هذه الحالة، يتم تقديم المفهوم كيسيتس - المسافات بين النقاط من الوظائف المستمرة والنقاط المقابلة من وظيفة الحجة المنفصلة.

إقحام وظائف - حالة خاصة لمهمة التقريب، عند الحاجة إلى أن تكون في نقاط معينة، عقد الاستيفاء تتزامن قيم الوظيفة ووظائف الاقتراب. في حالة أكثر عمومية، يتم فرض قيود على قيم بعض المشتقات. وهذا هو، وترد وظيفة الحجة المنفصلة. مطلوب لإيجاد مثل هذه الوظيفة التي تمر عبر جميع النقاط. في هذه الحالة، عادة ما يتم استخدام المترية، ومع ذلك، فإن مفهوم "نعومة" يتم تقديمه في كثير من الأحيان.

الغرض من تحليل الانحدار هو قياس العلاقة بين المتغير التابع واحد (تحليل الانحدار المقترن) أو العديد من المتغيرات المستقلة (متعددة). وتسمى أيضا المتغيرات المستقلة العامل، وشرح، والحاسي والتراجعين والتنبؤ.

يشار في بعض الأحيان إلى المتغير التابع كما هو موضح محدد، "استجابة". لا يرتبط تحليل الانحدار الشديد للغاية في الدراسات التجريبية فقط بحقيقة أن هذه فرضيات أداة اختبار مريحة. الانحدار، وخاصة متعددة، هو طريقة فعالة للنمذجة والتنبؤ.

سيبدأ شرح مبادئ العمل مع تحليل الانحدار بطريقة زوج الزوج أبسط.

تحليل الانحدار المقترن

ستكون الإجراءات الأولى التي تستخدم تحليل الانحدار متطابقا لنا في إطار حساب معامل الارتباط. ثلاث شروط رئيسية لفعالية تحليل الارتباط باستخدام طريقة بيرسون - التوزيع الطبيعي للمتغيرات، قياس الفاصل الزمني للمتغيرات، السندات الخطية بين المتغيرات ذات صلة بانحدار متعدد. وفقا لذلك، في المرحلة الأولى، يتم بناء المخططات المتناثرة، يتم إجراء تحليل وصفية إحصائية للمتغيرات ويتم حساب خط الانحدار. كما هو الحال في إطار تحليل الارتباط، يتم بناء خطوط الانحدار من قبل أصغر طريقة مربع.

لتوضيح الاختلافات بين طريقتي تحليل البيانات، ننتقل إلى المثال الذي يعتبر بالفعل مع المتغيرات "دعم ATP" و "حصة سكان الريف". البيانات المصدر متطابقة. سيكون الفرق في المخططات المتناثرة هو أنه في تحليل الانحدار، فإن المتغير التابع مخيب للآمال بشكل صحيح - في علمنا "دعم ATP" على طول محور Y، في حين أن تحليل الارتباط لا يهم. بعد تنظيف الانبعاثات، مخطط الانتثار هو:

إن الفكرة الأساسية لتحليل الانحدار هي أن اتجاه عام للمتغيرات - في شكل خط الانحدار، - يمكنك التنبؤ بقيمة المتغير التابع، وجود قيمة مستقلة.

تخيل وظيفة خطية رياضية تقليدية. يمكن وصف أي مباشرة في مساحة الإقليدية من قبل الصيغة:

حيث يوجد ثابت يضع الإزاحة على طول محور التنسيق؛ ب هو معامل يحدد زاوية الخطوط.

معرفة المعامل الزاوي والمستمر، يمكنك حساب قيمة (التنبؤ) لأي X.

شكلت هذه الوظيفة أبسط أساس نموذج تحليل الانحدار مع التحفظ على أن قيمة سنكسر غير بدقة، ولكن ضمن فاصل ثقة معينة، أي. حول.

الثابت هو نقطة التقاطع لخط الانحدار والتحويل المحور (معبر F، في الحزم الإحصائية، كقاعدة عامة، مدلعة من "اعتراض"). في مثالنا مع التصويت ل ATP، ستكون قيمتها المدورة 10.55. ستكون Kommersant المعامل الزاوي حوالي -0.1 (كما هو الحال في تحليل الارتباط، تظهر الإشارة نوع الاتصال - مباشر أو عكسي). وبالتالي، سيكون للنموذج الناتج شكل المشروع المشترك C \u003d -0.1 × القرى. نحن. + 10.55.

لذلك، لأن حالة "جمهورية أداغيا" مع أسهم سكان الريف البالغ 47٪ من القيمة المتوقعة ستكون 5.63:

ATP \u003d -0.10 × 47 + 10.55 \u003d 5.63.

يسمى الفرق بين القيم الأولية والتنبؤ بقايا (مع هذا المصطلح - المبدئي للإحصاءات - لقد صادفنا بالفعل عند تحليل الجداول الاقتصاصية). لذلك، لأن بقايا "جمهورية أديغال" ستكون البقايا تساوي 3.92 - 5.63 \u003d -1.71. كلما كانت القيمة المعيارية للمقايضة، كلما كانت القيمة أقل نجحت القيمة المتوقعة.

حساب القيم المتوقعة والمخلفات لجميع الحالات:
يحدث سيل. نحن. شكرا

(مبدئي)

شكرا

(وتوقع)

بقايا
جمهورية أديغال 47 3,92 5,63 -1,71 -
altai جمهورية 76 5,4 2,59 2,81
جمهورية باشكورتوستان 36 6,04 6,78 -0,74
جمهورية بويتا 41 8,36 6,25 2,11
جمهورية داغستان 59 1,22 4,37 -3,15
جمهورية إنغوشيا 59 0,38 4,37 3,99
إلخ.

يتم استخدام تحليل نسبة القيم الأولية والتنبية لتقييم جودة النموذج الذي تم الحصول عليه، وقدرته النذيرية. أحد المؤشرات الرئيسية لإحصاءات الانحدار هو معامل الارتباط المتعدد R - معامل الارتباط بين القيم الأولية والتنبؤ بالمتغير التابع. في تحليل الانحدار الزوجي، فإنه يساوي معامل ارتباط بيوني المعتاد بين المتغير التابع والمستقلة، في حالتنا - 0.63. لتفسير بشكل جوهري المتعدد، يجب تحويله إلى معامل التصميم. يتم ذلك بنفس طريقة تحليل الارتباط - بناء الساحة. يعرض معامل تحديد R -KVADRAT (R 2) نسبة الاختلاف في المتغير التابع، أوضح بواسطة متغيرات مستقلة (مستقلة).

في حالتنا، ص 2 \u003d 0.39 (0.63 2)؛ وهذا يعني أن "حصة" المتغير "من سكان الريف" يشرح حوالي 40٪ من تباين اختلاف "دعم ATP". كلما زادت قيمة معامل التصميم، كلما ارتفعت جودة النموذج.

مؤشر جودة نموذج آخر هو خطأ تقدير قياسي (خطأ قياسي لتقدير). هذا مؤشر على مقدار هذه النقطة "منتشرة" حول خط الانحدار. مقياس الاختلاف للمتغيرات الفاصلة هو الانحراف المعياري. وفقا لذلك، فإن خطأ التقييم القياسي هو الانحراف المعياري لتوزيع البقايا. كلما ارتفعت قيمتها، أقوى الانتشار وأسوأ النموذج. في حالتنا، الخطأ القياسي هو 2.18. لهذا الحجم أن طرازنا "سيكون خطأ في المتوسط" عند التنبؤ بقيمة متغير "الدعم ل ATP".

تتضمن إحصاءات الانحدار أيضا تحليل التشتت. مع ذلك، نكتشف: 1) ما هي نسبة الاختلاف (التشتت) للمتغير التابع يفسرها متغير مستقل؛ 2) ما هي نسبة تشتت المتغير التابع للمتغير على الرصيد (جزء لا يمكن تفسيره)؛ 3) ما هو موقف هاتين هاتين القيمتين (/ "- الموقف). إحصاءات التشتت مهمة بشكل خاص لدراسات العينة - إنها تظهر مدى احتمال توافر التواصل بين المتغيرات المستقلة والمعالين في عامة السكان. ومع ذلك، للاستمرار البحث (كما هو الحال في مثالنا)، تعلم نتائج تحليل التشتت. في هذه الحالة، يتم فحصها إذا كان النمط الإحصائي المحدد ناتج عن صدفة أن تكون مميزة لهذا المعقدة من الظروف التي تم مسحها يتم تعيين، أي ليس حقيقة النتيجة التي تم الحصول عليها لبعض التجمع العام الأكثر شمولا، ودرجة أنماطها، والتحرر من التأثير العرضي.

في حالتنا، فإن إحصائيات تحليل التشتت هي كما يلي:

SS. dF. السيدة. F. القيمة
ريجاتر. 258,77 1,00 258,77 54,29 0.000000001
غادر. 395,59 83,00 ل، 11.
مجموع 654,36

نسبة F 54.29 بشكل كبير على مستوى 0.0000000001. وفقا لذلك، يمكننا رفض فرضية الصفر بثقة (أن الاتصال الذي اكتشفناه هو شخصية عشوائية).

يتم تنفيذ وظيفة مماثلة من قبل المعيار T، ولكن بالفعل فيما يتعلق معاملات الانحدار (الزاوي و F-interersection). بمساعدة معيار / نتحقق من الفرضية التي تكون في معاملات الانحدار العامة العامة صفرية. في حالتنا، يمكننا مرة أخرى تجاهل بثقة فرضية الصفر.

تحليل الانحدار المتعدد

نموذج الانحدار المتعدد متطابق تقريبا لنموذج الانحدار المقترن؛ الفرق الوحيد هو أن العديد من المتغيرات المستقلة تضم بالتسلسل في الوظيفة الخطية:

y \u003d b1x1 + b2x2 + ... + bpxp + a.

إذا كانت المتغيرات المستقلة أكثر من اثنين، فلن نتوقع الفرصة للحصول على فكرة مرئية عن اتصالها، في هذا الصدد الانحدار المتعدد أقل "بصرية" من غرفة البخار. إذا كان هناك اثنين من المتغيرات المستقلة، فستكون البيانات مفيدة للعرض على مخطط مبتش ثلاثي الأبعاد. في حزم البرامج الإحصائية المهنية (على سبيل المثال، إحصائية)، هناك خيار لتدوير مخطط ثلاثي الأبعاد، مما يتيح لك تخيل بنية بنية البيانات بصريا.

عند العمل مع الانحدار المتعدد، على النقيض من غرفة البخار، من الضروري تحديد خوارزمية التحليل. تتضمن الخوارزمية القياسية جميع المتنبئين الموجودين في نموذج الانحدار النهائي. تعني خوارزمية خطوة بخطوة إدراج متسلسل (استثناء) من المتغيرات المستقلة، بناء على "وزنها" التوضيحي. طريقة خطوة بخطوة جيدة عندما يكون هناك العديد من المتغيرات المستقلة؛ "ينظف" نموذجا من تنبؤات ضعيفة بصراحة، مما يجعلها أكثر إحكاما ولائس.

شرط إضافي لصحة الانحدار المتعدد (جنبا إلى جنب مع الزيادة الطبيعية، والحياة الخطية) هو عدم وجود عدد كبير من السندات الارتباط القوي بين المتغيرات المستقلة.

تشمل تفسير إحصاءات الانحدار المتعددة جميع الملاحظات التي نظرت فيها لنا لقضية انحدار الزوج. بالإضافة إلى ذلك، هناك مكونات مهمة أخرى في إحصاءات تحليل الانحدار المتعدد.

سوف نوضح العمل مع الانحدار المتعدد على مثال اختبار الفرضيات التي تشرح الاختلافات في النشاط الانتخابي في مناطق روسيا. في سياق الدراسات التجريبية الخرسانية، أدلى الافتراضات بأن مستوى دوران الناخبين يؤثر على:

العامل الوطني (المتغير "السكان الروس"؛ يتم مناجي كحصى من السكان الروس في مواضيع الاتحاد الروسي). يفترض أن الزيادة في حصة السكان الروس تؤدي إلى انخفاض في نشاط الناخبين؛

يتم مسح عامل التحضر (المتغير "سكان الحضر"؛ مسح كحصة من سكان الحضر في مواضيع الاتحاد الروسي، لقد عملنا بالفعل مع هذا العامل في إطار تحليل الارتباط). يفترض أن الزيادة في حصة سكان الحضر تؤدي أيضا إلى انخفاض في نشاط الناخبين.

المتغير التابع - نجا "شدة النشاط الانتخابي" ("الأصول" ("الأصل") من خلال البيانات الموسعة لمظهر المناطق في الانتخابات الفيدرالية من 1995 إلى 2003. وسادة البيانات المصدر لشؤون متغيرين مستقلين وآخرين لديك النموذج التالي:

يحدث المتغيرات
أصول. الجبال نحن. روس. نحن.
جمهورية أديغال 64,92 53 68
altai جمهورية 68,60 24 60
جمهورية بويتا 60,75 59 70
جمهورية داغستان 79,92 41 9
جمهورية إنغوشيا 75,05 41 23
جمهورية كالميكيا 68,52 39 37
karachay-sercassian. 66,68 44 42
جمهورية كاريليا 61,70 73 73
جمهورية كومي 59,60 74 57
ماري الجمهورية 65,19 62 47

إلخ. (بعد تنظيف الانبعاثات 83 حالات من 88)

إحصائيات تصف جودة النموذج:

1. متعددة R \u003d 0.62؛ L- مربع \u003d 0.38. وبالتالي، فإن العوامل الوطنية وعامل التحضر معا توضح حوالي 38٪ من تباين من "النشاط الانتخابي" المتغير.

2. الخطأ المتوسط \u200b\u200bهو 3.38. هذا هو "المتوسط \u200b\u200bخطأ" النموذج الذي تم بناؤه عند التنبؤ بمستوى المظهر.

3. / L- نسبة الاختلاف الموضح وغير قابل للتفسير 25.2 على مستوى 0.000000003. يتم رفض فرضية الصفر حول فرصة الاتصالات المحددة.

4. المعيار / لمعاملات الانحدار والانحدار للمتغيرات "سكان الحضر" و "السكان الروس" معنى على مستوى 0.0000001؛ 0.00005 و 0.007، على التوالي. يتم رفض فرضية الصفر حول العشوائية للمعاملات.

توجد إحصاءات مفيدة إضافية في تحليل نسبة القيم الأولية والمتوقعة للمتغير التابع للمسافة من محالابيس ومسافة الطبخ. أول قياس تفرد الحالة (يوضح مقدار مزيج من قيم جميع المتغيرات المستقلة لحالة معينة ينحرف عن القيمة المتوسطة على جميع المتغيرات المستقلة في وقت واحد). ثانيا - قياس تأثير القضية. تؤثر الملاحظات المختلفة بطرق مختلفة على منحدر خط الانحدار، وبمساعدة مسافة الطهي، يمكن مقارنتها بهذا المؤشر. هذا مفيد عند تنظيف الانبعاثات (يمكن تمثيل الانبعاث كحالة مؤثرة للغاية).

في مثالنا، يشير داغستان إلى حالات فريدة ومؤثرة.

يحدث مصدر

قيم

predica.

قيم

بقايا مسافة

mahalanobis.

مسافة
أديجيا 64,92 66,33 -1,40 0,69 0,00
altai جمهورية 68,60 69.91 -1,31 6,80 0,01
جمهورية بويتا 60,75 65,56 -4,81 0,23 0,01
جمهورية داغستان 79,92 71,01 8,91 10,57 0,44
جمهورية إنغوشيا 75,05 70,21 4,84 6,73 0,08
جمهورية كالميكيا 68,52 69,59 -1,07 4,20 0,00

يحتوي نموذج الانحدار الفعلي على المعلمات التالية: تقاطع U (ثابت) \u003d 75.99؛ ب (الجبال. الولايات المتحدة) \u003d -0.1؛ kommersant (روس. الولايات المتحدة.) \u003d -0.06. الصيغة النهائية:

مولع، \u003d -0.1 × الجبال. R + - 0.06 × RUS. r + 75.99.

هل يمكننا مقارنة "القوة التوضيحية" من المتنبئين، بناء على قيمة المعامل 61. في هذه الحالة، نعم، لأن كل من المتغيرات المستقلة لها نفس النسبة المئوية. ومع ذلك، في أغلب الأحيان، يتناول الانحدار المتعدد المتعدد بالمتغيرات المقاسة في موازين مختلفة (على سبيل المثال، مستوى الدخل في روبل والعمر في السنوات). لذلك، بشكل عام، لمقارنة إمكانيات المتغيرات التنبؤية من خلال نسبة الانحدار بشكل غير صحيح. في إحصائيات الانحدار المتعدد لهذا الغرض، هناك معامل بيتا خاص (B) محسوبة بشكل منفصل لكل متغير مستقل. إنه خاص (محسوب بعد مراعاة تأثير جميع النباتات الأخرى) مع معامل الارتباط للعامل والاستجابة ويظهر المساهمة المستقلة للعامل في التنبؤ بقيم الاستجابة. في تحليل الانحدار الزوجي، يعد معاملات بيتا لأسباب واضحة مساوية لمعامل ارتباط الزوج بين المتغير التابع والمستقلة.

في مثالنا بيتا (الجبال. الولايات المتحدة.) \u003d -0.43، بيتا (روس. نحن.) \u003d -0.28. وبالتالي، فإن كلا العاملين يؤثرون سلبا على مستوى النشاط الانتخابي، في حين أن أهمية عامل التحضر أعلى بكثير من أهمية العامل الوطني. يحدد التأثير التراكمي لكلا العاملين حوالي 38٪ من اختلاف "النشاط الانتخابي" المتغير (انظر قيمة L-Square).

تحليل الانحدار هو طريقة بحث إحصائية تظهر الاعتماد على المعلمة من واحد أو عدة متغيرات مستقلة. كان التطبيق صعب استخدامه في عصر مكواة، خاصة إذا كان حول كميات كبيرة من البيانات. اليوم، تعلم كيفية بناء الانحدار في Excel، يمكنك حل المهام الإحصائية المعقدة في حرفيا في بضع دقائق. فيما يلي أمثلة ملموسة من مجال الاقتصاد.

أنواع الانحدار

تم تقديم هذا المفهوم للغاية في الرياضيات في عام 1886. يحدث الانحدار:

  • خطي؛
  • مكافئ؛
  • قوة؛
  • متسارع؛
  • القطعي؛
  • إرشاد
  • لوغاريتمي.

مثال 1.

النظر في مهمة تحديد اعتماد عدد أولئك الذين تكروا أعضاء الفريق من متوسط \u200b\u200bالراتب في 6 مؤسسات صناعية.

مهمة. في المؤسسات الست، قامت بتحليل متوسط \u200b\u200bالأجر الشهري وعدد الموظفين الذين استقالوا إلى طلبهم الخاص. في شكل جدول لدينا:

عدد تلاشى

الراتب

30000 روبل

35000 روبل

40000 روبل

45،000 روبل

50،000 روبل

55،000 روبل

60000 روبل

بالنسبة لمشكلة تحديد تكاليف كمية العمال غمرت من متوسط \u200b\u200bالراتب في 6 شركات، فإن نموذج الانحدار لديه شكل معادلة Y \u003d A 0 + A 1 × 1 + ... + AKXK، حيث Xi هو التأثير على المتغيرات ومعاملات الانحدار، AK هي عدد العوامل.

لهذه المهمة، ص مؤشر لأولئك الذين يتظاهرون بالموظفين، والعامل المؤثر - الراتب الذي يشار إليه X.

باستخدام قدرات معالج الجدول "Excel"

يجب أن يسبق تطبيق الانحدار في Excel التطبيق على بيانات الجدول الموجودة للوظائف المضمنة. ومع ذلك، لهذه الأغراض من الأفضل استخدام "حزمة التحليل" المفيدة للغاية ". لتنشيطها، تحتاج:

  • من علامة تبويب الملف، انتقل إلى قسم "المعلمات"؛
  • في النافذة التي تفتح، حدد سلسلة "الفوز"؛
  • انقر فوق "الزر" أدناه، إلى يمين "الإدارة"؛
  • ضع علامة بجوار اسم "حزمة التحليل" وتأكيد أفعالك بالنقر فوق "موافق".

إذا تم كل شيء بشكل صحيح، على الجانب الأيمن من علامة التبويب "البيانات"، الموجود أعلى محطة عمل "Excel"، سيظهر الزر المطلوب.

في اكسل

الآن، عندما يكون لديك جميع الأدوات الافتراضية اللازمة لتنفيذ الحسابات الاقتصادية الاقتصادية، يمكننا المتابعة لحل مهمتنا. لهذا:

  • انقر فوق الزر "تحليل البيانات"؛
  • في النافذة التي تفتح، انقر فوق الزر "الانحدار"؛
  • في علامة التبويب التي تظهر، ندخل مجموعة من القيم ل Y (عدد الموظفين الذين ألغوا أملهم) و X (رواتبهم)؛
  • أكد أفعالك عن طريق الضغط على زر "موافق".

نتيجة لذلك، سيقوم البرنامج تلقائيا بملء ورقة جديدة من معالج الجدول مع بيانات تحليل الانحدار. ملحوظة! يحتوي Excel على القدرة على طلب المكان الذي تفضله بشكل مستقل بهذه الغرض. على سبيل المثال، قد تكون نفس الورقة حيث تكون القيم y و x، أو حتى كتاب جديد مصمم خصيصا لتخزين هذه البيانات.

تحليل نتائج الانحدار ل R-Square

في Excel، يبدو أن البيانات التي تم الحصول عليها أثناء معالجة البيانات قيد النظر:

بادئ ذي بدء، يجب عليك الانتباه إلى قيمة R-Square. هذا هو معامل التصميم. في هذا المثال، R-Square \u003d 0.755 (75.5٪)، أي المعلمات المحسوبة للنموذج شرح العلاقة بين المعلمات قيد النظر بنسبة 75.5٪. كلما ارتفعت قيمة معامل التصميم، يعتبر النموذج المحدد أكثر قابلية للتطبيق لمهمة معينة. يعتقد أنه يصف بشكل صحيح الوضع الفعلي بقيمة R-Square فوق 0.8. إذا ص المربع<0,5, то такой анализа регрессии в Excel нельзя считать резонным.

تحليل المعاملات

يوضح الرقم 64،1428 ما سيكون Y إذا كان كل المتغيرات الحادي عشر في النموذج الذي نعيد إعادة تعيينه. بمعنى آخر، يمكن القول بأن قيمة المعلمة التي تم تحليلها تؤثر أيضا على عوامل أخرى غير موضحة في النموذج المحدد.

المعامل التالي -0.16285، الموجود في خلية B18، يدل على تأثير تأثير المتغير X على Y. وهذا يعني أن متوسط \u200b\u200bراتب الموظفين الشهري في النموذج قيد النظر يؤثر على عدد -0،16285، أي درجة نفوذها على الإطلاق. يشير علامة "-" إلى أن المعامل له قيمة سلبية. هذا واضح، كما يعلم الجميع أن المزيد من الراتب في المؤسسة، فإن الأشخاص الأقل يعبرون عن الرغبة في إنهاء عقد العمل أو رفضه.

الانحدار المتعدد

بموجب مثل هذا المصطلح مفهوم بأنه معادلة التواصل مع العديد من المتغيرات المستقلة للنموذج:

y \u003d f (x 1 + x 2 + ... x m) + ε، حيث Y هي ميزة ناتجة (متغير التابع)، و X 1، X 2، ... X M هو علامات العوامل (المتغيرات المستقلة).

تقييم المعلمات

لتحديد الانحدار المتعدد (MR)، يتم تنفيذه باستخدام طريقة أصغر المربعات (MNC). لمعادلات خطية للنموذج Y \u003d A + B 1 × 1 + ... + B M X M + ε نبني نظام المعادلات العادية (انظر أدناه)

لفهم مبدأ الطريقة، والنظر في قضية عامين. ثم لدينا الوضع الذي وصفه الصيغة

من هنا نحصل على:

حيث σ هو تشتت الميزة المقابلة تنعكس في الفهرس.

ينطبق MNK على معادلة السيد في مقياس موحد. في هذه الحالة، نحصل على المعادلة:

التي تي ص، تي × 1، ... T XM هي المتغيرات الموحدة التي تكون فيها القيم المتوسطة 0؛ β أنا معاملات الانحدار الموحدة، والانحراف المعياري هو 1.

يرجى ملاحظة أن جميع β أنا في هذه الحالة محددة كطبيعة ومكافحة، وبالتالي، فإن مقارنةها تعتبر صحيحة ومقبولة. بالإضافة إلى ذلك، من المعتاد إجراء فرق العوامل، وتجاهل تلك التي أصغر قيم βi.

المهمة باستخدام معادلة الانحدار الخطي

لنفترض أن هناك جدول ديناميات سعر منتج معين ن أكثر من 8 أشهر الماضية. من الضروري اتخاذ قرار بشأن جدوى الحصول على حزبه بسعر 1850 روبل / ر.

عدد الشهر

اسم الشهر

سعر المنتج N.

1750 روبل للطن

1755 روبل للطن

1767 روبل للطن

1760 روبل للطن

1770 روبل للطن

1790 روبل للطن

1810 روبل للطن

1840 روبل لكل طن

لحل هذه المهمة في معالج جدول Excel، يطلب من ذلك استخدام أداة "تحليل البيانات" المقدمة أعلاه. بعد ذلك، اختر قسم "الانحدار" وقم بتعيين المعلمات. يجب أن نتذكر أن مجموعة قيم المتغير التابع يجب تقديمها في "فاصل إدخال الإدخال Y" (في هذه الحالة، ثمن البضائع في أشهر محددة)، وفي "إدخال الإدخال X" - ل مستقلة (عدد الشهر). تأكيد الإجراءات عن طريق الضغط على موافق. على ورقة جديدة (إذا تم الإشارة إليها)، فإننا نحصل على بيانات للانحدار.

نحن نبني المعادلة الخطية للنموذج Y \u003d AX + B، حيث تكون نسبة عدد الشهر والمعاملات والخطوط "Y-intersection" بمثابة معلمات A و B. وبالتالي، فإن المعادلة الخطية الانحدار (UR) للمهمة 3 مكتوب في النموذج:

السعر إلى المنتج N \u003d 11.714 * شهر شهر + 1727.54.

أو في تدوين الجبرية

y \u003d 11،714 X + 1727،54

تحليل النتائج

لتحديد ما إذا كانت معادلات الانحدار الخطي الناتجة بشكل كاف، يتم استخدام معاملات الارتباط المتعددة (KMK) والتصميم، بالإضافة إلى معيار فيشر ومعيار الطالب. في الجدول "Excel" مع نتائج الانحدار، فإنها تعمل كتعدد R، R-Square، إحصائيات F وإحصاءات T، على التوالي.

يجعل KMK R من تقييم تقارب العلاقة الاحتمالية بين المتغيرات المستقلة والمعالين. تشير قيمة عالية إلى وجود صلة قوية بما فيه الكفاية بين المتغيرات "عدد شهر" و "سعر المنتج N في روبل لكل طن." ومع ذلك، فإن طبيعة هذا الاتصال لا تزال غير معروفة.

ميدان معامل التصميم R 2 (RI) هو سمة رقمية من حصة الإثراء الكلي ويظهر مبعثر أي جزء من البيانات التجريبية، أي. تتوافق قيم المتغير التابع مع معادلة الانحدار الخطي. في المشكلة قيد النظر، هذه القيمة هي 84.8٪، أي البيانات الإحصائية مع درجة عالية من الدقة يتم وصفها من قبل أو الحصول عليها.

يتم استخدام إحصائيات F، تسمى أيضا معيار فيشر، لتقييم أهمية الاعتماد الخطي، دحض أو تأكيد فرضية وجودها.

(معيار الطالب) يساعد في تقييم أهمية المعامل في عضو غير معروف أو مجاني في الاعتماد الخطي. إذا كانت قيمة معيار T\u003e T، فسيتم رفض فرضية عدم أهمية عضو مجاني في المعادلة الخطية.

في المشكلة قيد النظر لعضو مجاني، باستخدام أدوات "Excel"، تم الحصول عليها أن T \u003d 169،20903، و P \u003d 2.89E-12، أي لدينا احتمال صفر أن الفرضية الصحيحة للخطأ سيتم رفض العضو. لمعامل معامل في T غير معروف \u003d 5،79405، و P \u003d 0.001158. وبعبارة أخرى، فإن احتمال رفض الفرضية الصحيحة لشؤون عدم كفاية المعامل في مجهول، هو 0.12٪.

وبالتالي، يمكن القول أن المعادلة الناتجة عن الانحدار الخطي هو كافية.

المهمة على جدوى شراء حزمة من الأسهم

يتم إجراء الانحدار المتعدد في Excel باستخدام أداة "تحليل البيانات" بأكملها. النظر في مهمة تطبيقية محددة.

يجب أن تقرر شركة الإدارة "NNN" جدوى شراء حصة بنسبة 20٪ في ط ط ط ط. تبلغ تكلفة الحزمة (SP) 70 مليون دولار أمريكي. المتخصصين "NNN" جمعوا البيانات حول معاملات مماثلة. تقرر تقييم تكلفة حصة في هذه المعلمات المعبر عنها بملايين الدولارات الأمريكية على النحو التالي:

  • الحسابات المستحقة الدفع (VK)؛
  • حجم دوران السنوي (VO)؛
  • الذمم المدينة (VD)؛
  • تكلفة الأصول الثابتة (SOF).

بالإضافة إلى ذلك، يتم استخدام تسوية مؤسسة الأجور (V3 P) في آلاف الدولارات الأمريكية.

أدوات الحلول لمعالج الجدول Excel

بادئ ذي بدء، تحتاج إلى تقديم جدول بيانات المصدر. لديها النموذج التالي:

  • استدعاء نافذة "تحليل البيانات"؛
  • حدد القسم "الانحدار"؛
  • في نافذة "Input Informal Y"، يتم تقديم مجموعة من قيم المتغيرات المعتمدة من العمود G؛
  • انقر على الرمز بسهم أحمر إلى يمين نافذة "إدخال الإدخال X" وتخصيص نطاق جميع القيم من الأعمدة B، C، D، F.

العنصر "قائمة عمل جديدة" وانقر فوق "موافق".

تلقي تحليل لهذه المهمة.

دراسة النتائج والاستنتاجات

"جمع" من البيانات المدورة المقدمة أعلاه على ورقة معالج الجدول Excel، معادلة الانحدار:

SP \u003d 0.103 * SOF + 0.541 * VO - 0.031 * VK + 0.405 * VD + 0.691 * VZP - 265،844.

في شكل رياضي أكثر دراية، يمكن كتابته على النحو التالي:

y \u003d 0.103 * x1 + 0،541 * x2 - 0.031 * x3 + 0،405 * x4 + 0،691 * x5 - 265،844

يتم تقديم بيانات MMM JSC في الجدول:

يلاحظهم في معادلة الانحدار، يحصلون على رقم 64.72 مليون دولار أمريكي. هذا يعني أنه لا ينبغي شراؤها أسهم MMM JSC، حيث تجاوزت تكلفتها البالغة 70 مليون دولار أمريكي بما فيه الكفاية.

ونحن نرى، فإن استخدام معالج الجدول "Excel" ومعادلات الانحدار جعلت من الممكن اعتماد قرار معقول فيما يتعلق بجدوى معاملة محددة تماما.

الآن أنت تعرف ما هو الانحدار. سيساعدك أمثلة Excel التي تمت مناقشتها أعلاه في حل المهام العملية من مجال الاقتصاد القياسي.

يعد تحليل الانحدار واحدا من أكثر الطرق بحثا عن البحوث الإحصائية. مع ذلك، من الممكن تحديد درجة تأثير القيم المستقلة على المتغير التابع. تحتوي وظيفة Microsoft Excel على أدوات مخصصة لنوع مماثل من التحليل. دعونا نحلل أنهم يمثلون أنفسهم وكيفية استخدامها.

ولكن، من أجل استخدام وظيفة تتيح لك تنفيذ تحليل الانحدار، أولا وقبل كل شيء، تحتاج إلى تنشيط حزمة التحليل. عندها فقط الأدوات اللازمة لهذا الإجراء ستظهر على شريط المنفى.


الآن، عندما ننتقل إلى علامة التبويب "البيانات"على الشريط في كتلة الأداة "تحليل" سنرى زر جديد - "تحليل البيانات".

أنواع تحليل الانحدار

هناك عدة أنواع من الانحدارات:

  • مكافئ؛
  • قوة؛
  • اللوغاريتمي؛
  • متسارع؛
  • إرشاد
  • القطعي؛
  • الانحدارالخطي.

سنتحدث أكثر عن تنفيذ النوع الأخير من تحليل الانحدار في Excele أكثر من ذلك.

الانحدار الخطي في برنامج Excel

فيما يلي، على سبيل المثال، يتم عرض جدول متوسط \u200b\u200bدرجة حرارة الهواء اليومية في الشارع، ويشار إلى عدد المشترين المتاجر ليوم العمل المناسب. دعونا نكتشف بمساعدة تحليل الانحدار، بالضبط كيف قد تؤثر الظروف الجوية في شكل درجة حرارة الهواء على حضور المؤسسة التجارية.

المعادلة العامة لانحدار الأنواع الخطية هي كما يلي: Y \u003d A0 + A1X1 + ... + AKK. في هذه الصيغة Y. يعني متغير، تأثير العوامل التي نحاول استكشافها. في حالتنا، هذا هو عدد المشترين. قيمة عاشر - هذه هي عوامل مختلفة تؤثر على المتغير. المعلمات أ. هي معاملات الانحدار. وهذا هو، هو هم الذين يحددون أهمية عامل معين. فهرس ك. يشير إلى العدد الإجمالي لهذه العوامل.


تحليل نتائج التحليل

يتم عرض نتائج تحليل الانحدار في شكل جدول في المكان المشار إليه في الإعدادات.

واحدة من المؤشرات الرئيسية R-square.وبعد يشير إلى جودة النموذج. في حالتنا، هذا المعامل هو 0.705 أو حوالي 70.5٪. هذا هو مستوى مقبول من الجودة. الاعتماد أقل من 0.5 سيئة.

يوجد مؤشر مهم آخر في الخلية على خط المعبر "تقاطع ص" وعمود "عوامل"وبعد يشير إلى القيمة التي ستكون فيها في ذ، وفي حالتنا، هذا هو عدد المشترين، مع جميع العوامل الأخرى التي تساوي الصفر. هذا الجدول هو 58.04 في هذا الجدول.

القيمة عند تقاطع الرسم البياني "المتغير X1" و "عوامل" يظهر مستوى Y اعتمادا على X. في حالتنا، فإن مستوى الاعتماد على عدد عملاء المتجر من درجة الحرارة. يعتبر معامل 1.31 مؤشرا مرتفعا إلى حد ما.

كما ترون، باستخدام برنامج Microsoft Excel، من السهل جدا إجراء جدول تحليل الانحدار. ولكن، للعمل مع البيانات التي تم الحصول عليها عند الخروج، وفهم جوهرها، فإن الشخص المعد فقط سيكون قادرا على ذلك.


يغلق