კორელაციური დამოკიდებულება x ფაქტორს (ერთ სულ მოსახლეზე საარსებო მინიმუმი დღეში ერთი შრომისუნარიანი პირის) და მიღებულ მახასიათებელს შორის (საშუალო დღიური ხელფასი). წრფივი რეგრესიის განტოლების პარამეტრები, რეგრესიის კოეფიციენტის ეკონომიკური ინტერპრეტაცია.

y=f(x)+E ,y t =f(x) – თეორიული ფუნქცია, E=y- y t

y t =a+bx – საშუალო დღიური ხელფასის (y) კორელაციური დამოკიდებულება ერთი შრომისუნარიანი ადამიანის საშუალო ერთ სულ მოსახლეზე საარსებო მინიმუმზე (x)

ა+ბ =

+ბ =

b=
- რეგრესიის კოეფიციენტი.

ის გვიჩვენებს, რამდენი ერთეულით იცვლება საშუალო ხელფასი (Y), როდესაც ერთ სულ მოსახლეზე საარსებო მინიმუმი დღეში ერთი შრომისუნარიანი ადამიანის (X) იზრდება 1 ერთეულით.

b=
= 0,937837482

ეს ნიშნავს, რომ ერთი შრომისუნარიანი ადამიანის (x) დღეში საშუალო საარსებო მინიმუმის 1 ერთეულით ზრდასთან ერთად, საშუალო დღიური ხელფასი გაიზრდება საშუალოდ 0,937 ერთეულით.

a= -ბ , a=135.4166667-0.937837482 86.75=54.05926511

3) ვარიაციის კოეფიციენტი

ვარიაციის კოეფიციენტი გვიჩვენებს SV-ის საშუალო მნიშვნელობის რა პროპორციას შეადგენს მისი საშუალო გავრცელება.

υ x = δх/x = 0,144982838, υ y = δy/y = 0,105751299

4) Კორელაციის კოეფიციენტი

კორელაციის კოეფიციენტი გამოიყენება წრფივი კავშირის სიახლოვის შესაფასებლად ერთი შრომისუნარიანი ადამიანის საშუალო საარსებო მინიმუმს დღეში ერთ სულ მოსახლეზე და საშუალო დღიურ ხელფასს შორის.

rxy = b δх/δy = 0.823674909 რადგან rxy ˃0 , მაშინ ცვლადებს შორის კორელაციას პირდაპირი ეწოდება

ეს ყველაფერი გვიჩვენებს საშუალო დღიური ანაზღაურების დამოკიდებულებას ერთი შრომისუნარიანი ადამიანის საშუალო ერთ სულ მოსახლეზე საარსებო მინიმუმზე.

5) განსაზღვრის კოეფიციენტი

განსაზღვრის კოეფიციენტი გამოიყენება წრფივი რეგრესიის განტოლებების მორგების ხარისხის შესაფასებლად.

დეტერმინაციის კოეფიციენტი ახასიათებს ეფექტური ატრიბუტის Y (საშუალო დღიური ხელფასის) დისპერსიის პროპორციას, რომელიც აიხსნება რეგრესით ეფექტური ატრიბუტის მთლიან დისპერსიაში.

R 2 xy = (∑(y t - y საშუალო) 2) / (∑(y - y საშუალო) 2) = 0.678440355, 0.5< R 2 < 0,7 ,

ეს ნიშნავს, რომ კავშირის სიძლიერე შესამჩნევია, ახლოს არის მაღალთან და კარგად არის შერჩეული რეგრესიის განტოლება.

6) მოდელის სიზუსტის შეფასება, ან დაახლოების შეფასება.

=1/n ∑ ׀(y i - y t)/y i ׀ 100% - საშუალო მიახლოების შეცდომა.

5-7%-ზე ნაკლები შეცდომა მიუთითებს მოდელის კარგ მორგებაზე.

თუ შეცდომა 10%-ზე მეტია, თქვენ უნდა განიხილოთ მოდელის განტოლების სხვა ტიპის არჩევა.

მიახლოების შეცდომა =0.015379395 100%=1.53%, რაც მიუთითებს მოდელის კარგ მორგებაზე თავდაპირველ მონაცემებთან

7) დისპერსიის სქემის ანალიზი.

∑(y - y საშუალო) 2 =∑(y t - y საშუალო) 2 +∑(y i - y t) 2 n – დაკვირვებების რაოდენობა, m – x ცვლადის პარამეტრების რაოდენობა

ვარიაციის კომპონენტები

კვადრატების ჯამი

თავისუფლების ხარისხების რაოდენობა

დისპერსია თავისუფლების ხარისხზე

∑(y - y საშუალო) 2

S 2 სულ =(∑(y - y საშუალო) 2)/(n-1)

ფაქტორული

∑(y t - y av) 2

S 2 ფაქტი =(∑(y t - y av) 2)/მ

ნარჩენი

∑(y i - y t) 2

S 2 დანარჩენი =(∑(y i - y t) 2)/ (n-m-1)

დისპერსიის ანალიზი

კომპონენტები

კვადრატების ჯამი

თავისუფლების ხარისხების რაოდენობა

დისპერსია

გენერალი

ფაქტორული

ნარჩენი

8) მოდელის ადეკვატურობის შემოწმება მიხედვით-ფიშერის კრიტერიუმი (α=0.05).

მთლიანობაში რეგრესიის განტოლების სტატისტიკური მნიშვნელობის შეფასება ხორციელდება გამოყენებით-ფიშერის კრიტერიუმი.

H 0 – ჰიპოთეზა რეგრესიის განტოლების სტატისტიკური მნიშვნელობის შესახებ.

H 1 – რეგრესიის განტოლების სტატისტიკური მნიშვნელობა.

გათვლილი განისაზღვრება ფაქტორებისა და ნარჩენი დისპერსიების მნიშვნელობების თანაფარდობიდან, რომელიც გამოითვლება თავისუფლების ხარისხზე.

F გამოითვლება = S 2 ფაქტი / S 2 დანარჩენი = ((∑(y t - y av) 2)/m) / ((∑(y i - y t) 2)/ (n-m-1)) =1669.585177 / 79.13314895 = 21.0984296

ცხრილის - კრიტერიუმის მაქსიმალური შესაძლო მნიშვნელობა, რომელიც შეიძლება ჩამოყალიბდეს შემთხვევითი ფაქტორების გავლენის ქვეშ მოცემული თავისუფლების ხარისხით, ე.ი. TO 1 = , TO 2 = - -1, და მნიშვნელოვნების დონე α (α=0.05)

F ცხრილი (0.05; 1; n-2), F ცხრილი (0.05; 1; 10), F ცხრილი = 4.964602701

თუ მაგიდა < გაანგარიშება , შემდეგ ჰიპოთეზა 0 უარყოფილია სავარაუდო მახასიათებლების შემთხვევითი ბუნება და აღიარებულია მათი სტატისტიკური მნიშვნელობა და რეგრესიის განტოლების სანდოობა. წინააღმდეგ შემთხვევაში 0 არ არის უარყოფილი და აღიარებულია რეგრესიის განტოლების სტატისტიკური უმნიშვნელოობა და არასანდო.ჩვენს შემთხვევაში F ცხრილი< F расч, следовательно признаётся статистическая значимость и надёжность уравнения регрессии.

9) რეგრესიის და კორელაციის კოეფიციენტების სტატისტიკური მნიშვნელობის შეფასება-სტუდენტის t-ტესტი (α=0.05).

კოეფიციენტის მნიშვნელოვნების შეფასება. რეგრესია., t – მოსწავლის კრიტერიუმი შევამოწმოთ b პარამეტრის სტატისტიკური მნიშვნელობა.

ჰიპოთეზა H 0: b=0, t b (calc) = ׀b ׀/ m b, m b = S დანარჩენი / (δ x
) , სადაც n არის დაკვირვებების რაოდენობა

m b = 79.13314895 / (12.57726123
) = 0,204174979

t b (გამოთვლილი) = 0,937837482 / 0,204174979 = 4,593302697

t ცხრილი არის კრიტერიუმის მაქსიმალური შესაძლო მნიშვნელობა შემთხვევითი ფაქტორების გავლენის ქვეშ მოცემული თავისუფლების ხარისხით (K=n-2) და მნიშვნელოვნების დონის α (α=0.05). t ცხრილი = 2.2281, თუ t (calc) > t ცხრილი, მაშინ ჰიპოთეზა H 0 უარყოფილია და აღიარებულია განტოლების პარამეტრების მნიშვნელობა.

ჩვენს შემთხვევაში t b (გამოითვლება) > t ცხრილი, ამიტომ ჰიპოთეზა H 0 უარყოფილია და აღიარებულია b პარამეტრის სტატისტიკური მნიშვნელობა.

შევამოწმოთ a პარამეტრის სტატისტიკური მნიშვნელობა. ჰიპოთეზა H 0: a=0 t a (გამოითვლება) = ׀а ׀/ m a

m a = (S დანარჩენი
)/(n δ x), m a = (79.13314895
)/(12 12.57726123)= 17.89736655, t a (გამოთვლილი) = 54.05926511 / 17.89736655=3.020515055

t a (გამოითვლება) > t ცხრილი, ამიტომ ჰიპოთეზა H 0 უარყოფილია და a პარამეტრის სტატისტიკური მნიშვნელობა აღიარებულია.

კორელაციის მნიშვნელობის შეფასება.შევამოწმოთ კორელაციის კოეფიციენტის სტატისტიკური მნიშვნელობა.

mrxy =
, mrxy =
=0,179320842, trxy = 0,823674909/ 0,179320842 = 4,593302697

tr = t b , tr > t ცხრილი, შესაბამისად აღიარებულია კორელაციის კოეფიციენტის სტატისტიკური მნიშვნელობა.

დავუშვათ, რომ ჩვენ ვიპოვეთ ეს შეფასებები და შეგვიძლია დავწეროთ განტოლება:

ŷ = + X,

სად - რეგრესიის მუდმივი, რეგრესიის ხაზის ღერძთან გადაკვეთის წერტილი OY;

- რეგრესიის კოეფიციენტი, ურთიერთობის დამახასიათებელი რეგრესიის ხაზის დახრილობა ¤DX;

ŷ - ახსნილი ცვლადის თეორიული მნიშვნელობა.

როგორც ცნობილია წყვილთა რეგრესიაში, მათემატიკური მოდელის ტიპის არჩევანი შეიძლება განხორციელდეს სამი გზით:

1. გრაფიკული.

2. ანალიტიკური.

3. ექსპერიმენტული.

გრაფიკული მეთოდი შეიძლება გამოყენებულ იქნას ფუნქციის შესარჩევად, რომელიც აღწერს დაკვირვებულ მნიშვნელობებს. წყაროს მონაცემები გამოსახულია კოორდინატულ სიბრტყეზე. ფაქტორების მახასიათებლის მნიშვნელობები გამოსახულია აბსცისის ღერძზე, ხოლო მიღებული მახასიათებლის მნიშვნელობები გამოსახულია ორდინატთა ღერძზე. წერტილების მდებარეობა აჩვენებს კავშირის სავარაუდო ფორმას. როგორც წესი, ეს ურთიერთობა მრუდია. თუ ამ ხაზის გამრუდება მცირეა, მაშინ შეგვიძლია მივიღოთ სწორხაზოვანი კავშირის არსებობის ჰიპოთეზა.

მოდით გამოვსახოთ მოხმარების ფუნქცია სკატერის დიაგრამის სახით. ამისათვის კოორდინატთა სისტემაში გამოვსახავთ შემოსავლის მნიშვნელობას აბსცისის ღერძზე, ორდინატებზე კი პირობითი პროდუქტის მოხმარების ხარჯებს. პუნქტების ადგილმდებარეობა, რომლებიც შეესაბამება მნიშვნელობების კომპლექტს "შემოსავალი - მოხმარების ხარჯი" აჩვენებს ურთიერთობის სავარაუდო ფორმას (სურათი 1).

ვიზუალურად, დიაგრამაზე დაყრდნობით, თითქმის არასოდეს არის შესაძლებელი საუკეთესო დამოკიდებულების ერთმნიშვნელოვნად იდენტიფიცირება.

გადავიდეთ არჩეული ფუნქციის პარამეტრების შეფასებაზე და მინიმალური კვადრატების მეთოდი.

შეფასების პრობლემა შეიძლება შემცირდეს მინიმუმის პოვნის „კლასიკურ“ პრობლემამდე. ცვლადები ახლა ქულებია და შემოთავაზებული კავშირის უცნობი პარამეტრები ზედა X. ნებისმიერი ფუნქციის უმცირესი მნიშვნელობის საპოვნელად, ჯერ უნდა იპოვოთ პირველი რიგის ნაწილობრივი წარმოებულები. შემდეგ გაათანაბრეთ თითოეული მათგანი ნულთან და ამოიღეთ მიღებული განტოლებათა სისტემა ცვლადებთან მიმართებაში. ჩვენს შემთხვევაში, ასეთი ფუნქცია არის კვადრატული გადახრების ჯამი - და ცვლადები არიან და . ანუ, ჩვენ უნდა ვიპოვოთ = 0 და = 0 და გადავწყვიტოთ განტოლებათა სისტემა და .

მოდით გამოვიტანოთ პარამეტრების შეფასებები უმცირესი კვადრატების მეთოდით, თუ დავუშვებთ, რომ დაწყვილების განტოლებას აქვს ფორმა ŷ = + X. შემდეგ ფუნქცია როგორც ჩანს

. ფუნქციის დიფერენცირება მიერ , ჩვენ ვიღებთ პირველ ნორმალურ განტოლებას დიფერენცირების გზით - მეორე ნორმალური განტოლება. , ,

შესაბამისი გარდაქმნების შემდეგ ვიღებთ:

(*)

ნორმალური განტოლებათა სისტემის აგების გამარტივებული წესები არსებობს. მოდით გამოვიყენოთ ისინი წრფივ ფუნქციაზე:

1) გაამრავლეთ განტოლების თითოეული წევრი ŷ = + Xპირველი პარამეტრის კოეფიციენტით ( ), ანუ ერთით.

2) ყოველი ცვლადის წინ ვსვამთ შემაჯამებელ ნიშანს.

3) გაამრავლეთ განტოლების თავისუფალი წევრი .

4) ვიღებთ პირველ ნორმალურ განტოლებას

5) გავამრავლოთ საწყისი განტოლების თითოეული წევრი მეორე პარამეტრის კოეფიციენტზე ( ), ანუ ზე X.

6) ყოველი ცვლადის წინ ვსვამთ შემაჯამებელ ნიშანს.

7) ვიღებთ მეორე ნორმალურ განტოლებას

ამ წესების გამოყენებით, ნორმალური განტოლებათა სისტემა შედგენილია ნებისმიერი წრფივი ფუნქციისთვის. წესები პირველად ჩამოაყალიბა ინგლისელმა ეკონომისტმა რ.პერლმა.

განტოლების პარამეტრები გამოითვლება შემდეგი ფორმულების გამოყენებით:

, ,

მოდით, 1 ცხრილის საწყისი მონაცემების გამოყენებით ავაშენოთ ნორმალური განტოლებათა სისტემა (*) და ამოხსნათ იგი უცნობებთან მიმართებაში. და :


1677=11*a+4950*ba = -3309

790 400=4950*a+2 502 500*bb = 7.6923

რეგრესიის განტოლება არის:

ŷ = -3309 + 7,6923 x ,

შევადაროთ A პროდუქტის მოხმარების ფაქტობრივი და სავარაუდო ხარჯები (ცხრილი 2).

ცხრილი 2 საქონლის მოხმარების ხარჯების ფაქტობრივი და სავარაუდო ღირებულებების შედარება წრფივი ურთიერთობით:

ჯგუფის ნომერი

მოხმარების ხარჯები

საქონელი

ფაქტობრივი ხარჯების გადახრა გათვლილიდან

რეალური(ები)

დასახლება

აბსოლუტური

(y – ŷ)

1 120 -1770,54 1890,54
2 129 -1385,92 1514,92
3 135 -1001,31 1136,31
4 140 -616,45 756,45
5 145 -232,08 377,08
6 151 152,53 -1,53
7 155 537,15 -382,15
8 160 921,76 -761,76
9 171 1306,38 -1135,38
10 182 1690,99 -1508,99
11 189 2075,61 -1886,61
სულ - - 0

მოდით დავხატოთ მიღებული ფუნქცია ŷ და scatterplot ფაქტობრივი მნიშვნელობების (y) და გამოთვლილი მნიშვნელობების გამოყენებით ( ŷ) .

გამოთვლილი მნიშვნელობები გადახრის რეალურს იმის გამო, რომ მახასიათებლებს შორის კავშირი კორელაციურია.

ურთიერთობის სიახლოვის საზომად გამოიყენება კორელაციის კოეფიციენტი:

=

ჩვენ ვიღებთ ცხრილი 1-ის საწყისი მონაცემების გამოყენებით:

σ x =158;

σ = 20,76;

= 0,990.

წრფივი კორელაციის კოეფიციენტმა შეიძლება მიიღოს ნებისმიერი მნიშვნელობა მინუს 1-დან პლუს 1-მდე. რაც უფრო ახლოს არის კორელაციის კოეფიციენტი აბსოლუტურ მნიშვნელობაში 1-თან, მით უფრო მჭიდროა კავშირი მახასიათებლებს შორის. წრფივი კორელაციის კოეფიციენტის ნიშანი მიუთითებს ურთიერთობის მიმართულებაზე - პირდაპირი მიმართება შეესაბამება პლუს ნიშანს, ხოლო შებრუნებული ურთიერთობა შეესაბამება მინუს ნიშანს.

დასკვნა: ღირებულებებს შორის ურთიერთობა Xდა შესაბამისი მნიშვნელობები ზე

ახლო, პირდაპირი დამოკიდებულება.

ჩვენს მაგალითში = 0,9801

ეს ნიშნავს, რომ იცვლება პროდუქტის ღირებულება 98,01%-ით შეიძლება აიხსნას შემოსავლის ცვლილებებით.

დარჩენილი 1.99% შეიძლება იყოს:

1) არასაკმარისად კარგად შერჩეული კომუნიკაციის ფორმა;

2) ნებისმიერი სხვა გაუთვალისწინებელი ფაქტორების გავლენა დამოკიდებულ ცვლადზე.

ჰიპოთეზების სტატისტიკური ტესტირება.

ჩვენ წამოვაყენეთ ნულოვანი ჰიპოთეზა, რომ რეგრესიის კოეფიციენტი სტატისტიკურად უმნიშვნელოა:

0 : = 0.

რეგრესიის კოეფიციენტის სტატისტიკური მნიშვნელოვნება მოწმდება გამოყენებით -სტუდენტის t-ტესტი. ამისათვის ჯერ განსაზღვრეთ კვადრატების ნარჩენი ჯამი

2 ost= å (y მე – ŷ მე) 2

2 ost = 1,3689.

და მისი სტანდარტული გადახრა

= 0,39. სე ( ) = 0,018.

Რეალური ღირებულება -მოსწავლის ტესტი რეგრესიის კოეფიციენტისთვის:

.

ტ ბ = 427,35.

მნიშვნელობა |t b |>t cr (t cr =2.26 95% მნიშვნელოვნების დონისთვის) საშუალებას გვაძლევს გამოვიტანოთ დასკვნა იმის შესახებ, რომ რეგრესიის კოეფიციენტი განსხვავდება ნულიდან (მნიშვნელოვნების შესაბამის დონეზე) და, შესაბამისად, გავლენის არსებობის შესახებ. (კავშირი) Xდა u.

დასკვნა: რეალური ღირებულება -სტუდენტის t-ტესტი აჭარბებს ცხრილის მნიშვნელობას, რაც ნიშნავს, რომ უარყოფილია ნულოვანი ჰიპოთეზა და 95%-იანი ალბათობით მიიღება ალტერნატიული ჰიპოთეზა რეგრესიის კოეფიციენტის სტატისტიკური მნიშვნელობის შესახებ.

[– t cr *se( ), + t cr *se( )]- 95% ნდობის ინტერვალი b-სთვის.

ნდობის ინტერვალი ფარავს პარამეტრის ნამდვილ მნიშვნელობას მოცემული ალბათობით (ამ შემთხვევაში 95%).

7,6516 < < 7,7329.

მოდით გადავიდეთ კორელაციისა და განსაზღვრის კოეფიციენტების სტატისტიკური მნიშვნელობის შემოწმებაზე:

= 0,990;

= 2 = 0,9801.

ჩვენ წამოვაყენეთ ნულოვანი ჰიპოთეზა, რომ რეგრესიის განტოლება მთლიანობაში სტატისტიკურად უმნიშვნელოა:

0 : 2 = 0.

მთლიანობაში აგებული რეგრესიის მოდელის სტატისტიკური მნიშვნელოვნების შეფასება ხორციელდება გამოყენებით -ფიშერის კრიტერიუმი. Რეალური ღირებულება - დაწყვილებული რეგრესიის განტოლების კრიტერიუმები წრფივი პარამეტრებით განისაზღვრება როგორც:

სადაც s 2 ფაქტორი არის თეორიული მნიშვნელობების დისპერსია ŷ (ვარიაცია ახსნილია);

s 2 დანარჩენი - კვადრატების ნარჩენი ჯამი;

2 - განსაზღვრის კოეფიციენტი.

Რეალური ღირებულება -ფიშერის კრიტერიუმი:

= 443,26

დასკვნა: ჩვენ უარვყოფთ ნულოვანი ჰიპოთეზას და 95%-იანი ალბათობით ვიღებთ ალტერნატიულ ჰიპოთეზას რეგრესიის განტოლების სტატისტიკური მნიშვნელობის შესახებ.

1. კორელაცია-რეგრესიული ანალიზის არსი და მისი ამოცანები.

2. რეგრესიის განმარტება და მისი სახეები.

3. მოდელის სპეციფიკაციის მახასიათებლები. შემთხვევითი ცვლადის არსებობის მიზეზები.

4. დაწყვილებული რეგრესიის შერჩევის მეთოდები.

5. უმცირესი კვადრატების მეთოდი.

6. შეერთების შებოჭილობისა და სიძლიერის საზომი ინდიკატორები.

7. სტატისტიკური მნიშვნელობის შეფასებები.

8. y ცვლადის პროგნოზირებული მნიშვნელობა და პროგნოზის ნდობის ინტერვალები.

1. კორელაცია-რეგრესიული ანალიზის არსი და მისი ამოცანები.ეკონომიკური ფენომენები, რომლებიც ძალიან მრავალფეროვანია, ხასიათდება მრავალი მახასიათებლით, რომლებიც ასახავს ამ პროცესებისა და ფენომენების გარკვეულ თვისებებს და ექვემდებარება ურთიერთდამოკიდებულ ცვლილებებს. ზოგიერთ შემთხვევაში, მახასიათებლებს შორის ურთიერთობა ძალიან მჭიდრო აღმოჩნდება (მაგალითად, თანამშრომლის საათობრივი გამომუშავება და მისი ხელფასი), ხოლო ზოგ შემთხვევაში ასეთი ურთიერთობა საერთოდ არ არის გამოხატული ან უკიდურესად სუსტია (მაგალითად, სქესი. სტუდენტებისა და მათი აკადემიური მოსწრების შესახებ). რაც უფრო მჭიდროა კავშირი ამ მახასიათებლებს შორის, მით უფრო ზუსტი იქნება მიღებული გადაწყვეტილებები.

არსებობს ორი სახის დამოკიდებულება ფენომენებსა და მათ მახასიათებლებს შორის:

    ფუნქციური (დეტერმინისტული, მიზეზობრივი) დამოკიდებულება . იგი მითითებულია ფორმულის სახით, რომელიც აკავშირებს ერთი ცვლადის თითოეულ მნიშვნელობას მეორე ცვლადის მკაცრად განსაზღვრულ მნიშვნელობასთან (შემთხვევითი ფაქტორების გავლენა უგულებელყოფილია). Სხვა სიტყვებით, ფუნქციური დამოკიდებულება არის ურთიერთობა, რომელშიც x დამოუკიდებელი ცვლადის თითოეული მნიშვნელობა შეესაბამება y დამოკიდებული ცვლადის ზუსტად განსაზღვრულ მნიშვნელობას. ეკონომიკაში ცვლადებს შორის ფუნქციონალური ურთიერთობები გამონაკლისია ზოგადი წესიდან;

    სტატისტიკური (სტოქასტური, არადეტერმინისტული) დამოკიდებულება – ეს არის ცვლადების კავშირი, რომელზეც გავლენას ახდენს შემთხვევითი ფაქტორები, ე.ი. ეს არის ურთიერთობა, რომელშიც x დამოუკიდებელი ცვლადის თითოეული მნიშვნელობა შეესაბამება y დამოკიდებული ცვლადის მნიშვნელობების ერთობლიობას და წინასწარ არ არის ცნობილი, თუ რა მნიშვნელობას მიიღებს y.

სტატისტიკური დამოკიდებულების განსაკუთრებული შემთხვევაა კორელაციური დამოკიდებულება.

კორელაციური დამოკიდებულება არის ურთიერთობა, რომელშიც x დამოუკიდებელი ცვლადის თითოეული მნიშვნელობა შეესაბამება y დამოკიდებული ცვლადის გარკვეულ მათემატიკურ მოლოდინს (საშუალო მნიშვნელობას).

კორელაციური დამოკიდებულება არის „არასრული“ დამოკიდებულება, რომელიც არ ვლინდება ყოველ ცალკეულ შემთხვევაში, არამედ მხოლოდ საშუალო მნიშვნელობებში საკმაოდ დიდი რაოდენობის შემთხვევებისთვის. მაგალითად, ცნობილია, რომ დასაქმებულის კვალიფიკაციის ამაღლება იწვევს შრომის პროდუქტიულობის ზრდას. ეს განცხადება ხშირად დასტურდება პრაქტიკაში, მაგრამ არ ნიშნავს იმას, რომ მსგავს პროცესში ჩართული ერთი და იმავე კატეგორიის/დონის ორ ან მეტ მუშაკს ექნება შრომის ერთი და იგივე პროდუქტიულობა.

კორელაციური დამოკიდებულების შესწავლა ხდება კორელაციისა და რეგრესიული ანალიზის მეთოდების გამოყენებით.

კორელაციური და რეგრესიული ანალიზი საშუალებას გაძლევთ დაადგინოთ ცვლადებს შორის კავშირის სიახლოვე, მიმართულება და ამ კავშირის ფორმა, ე.ი. მისი ანალიტიკური გამოხატულება.

კორელაციის ანალიზის მთავარი ამოცანა მოიცავს რაოდენობრივად განსაზღვრავს კავშირის სიახლოვეს ორ მახასიათებელს შორის წყვილ კავშირში და ეფექტურ და რამდენიმე ფაქტორულ მახასიათებელს შორის მრავალფაქტორულ კავშირში და დადგენილი კავშირის სანდოობის სტატისტიკურ შეფასებას.

2. რეგრესიის განმარტება და მისი სახეები.რეგრესიული ანალიზი არის მთავარი მათემატიკური და სტატისტიკური ინსტრუმენტი ეკონომეტრიაში. რეგრესია ჩვეულებრივია დავარქვათ სიდიდის (y) საშუალო მნიშვნელობის დამოკიდებულება სხვა სიდიდეზე ან რამდენიმე სიდიდეზე (x i).

რეგრესიის განტოლებაში შემავალი ფაქტორების რაოდენობის მიხედვით, ჩვეულებრივია განასხვავოთ მარტივი (დაწყვილებული) და მრავალჯერადი რეგრესია.

მარტივი (წყვილი) რეგრესია არის მოდელი, სადაც დამოკიდებული (ახსნილი) y ცვლადის საშუალო მნიშვნელობა განიხილება, როგორც ერთი დამოუკიდებელი (ახსნითი) x ცვლადის ფუნქცია. ირიბად, წყვილთა რეგრესია არის ფორმის მოდელი:

აშკარად:

,

სადაც a და b არის რეგრესიის კოეფიციენტების შეფასება.

მრავალჯერადი რეგრესია არის მოდელი, სადაც დამოკიდებული (ახსნილი) y ცვლადის საშუალო მნიშვნელობა განიხილება, როგორც რამდენიმე დამოუკიდებელი (განმარტებითი) ცვლადის x 1, x 2, ... x n ფუნქცია. ირიბად, წყვილთა რეგრესია არის ფორმის მოდელი:

.

აშკარად:

სადაც a და b 1, b 2, b n არის რეგრესიის კოეფიციენტების შეფასება.

ასეთი მოდელის მაგალითია თანამშრომლის ხელფასის დამოკიდებულება მის ასაკზე, განათლებაზე, კვალიფიკაციაზე, სტაჟზე, ინდუსტრიაზე და ა.შ.

რაც შეეხება დამოკიდებულების ფორმას, არსებობს:

      წრფივი რეგრესია;

      არაწრფივი რეგრესია, რომელიც ითვალისწინებს შესაბამისი არაწრფივი ფუნქციით გამოხატულ ფაქტორებს შორის არაწრფივი ურთიერთობების არსებობას. ხშირად, მოდელები, რომლებიც გარეგნულად არაწრფივია, შეიძლება შემცირდეს ხაზოვან ფორმამდე, რაც საშუალებას აძლევს მათ კლასიფიცირებას ხაზოვანად.

3. მოდელის სპეციფიკაციის მახასიათებლები. შემთხვევითი ცვლადის არსებობის მიზეზები.ნებისმიერი ეკონომეტრიული კვლევა იწყება მოდელის სპეციფიკაციები , ე.ი. მოდელის ტიპის ფორმულირებიდან, ცვლადებს შორის ურთიერთობის შესაბამის თეორიაზე დაყრდნობით.

უპირველეს ყოვლისა, ეფექტურ ატრიბუტზე მოქმედი ფაქტორების მთელი დიაპაზონიდან აუცილებელია გამოვყოთ ყველაზე მნიშვნელოვანი გავლენის ფაქტორები. წყვილთა რეგრესია საკმარისია, თუ არსებობს დომინანტური ფაქტორი, რომელიც გამოიყენება როგორც განმარტებითი ცვლადი. მარტივი რეგრესიული განტოლება ახასიათებს ურთიერთობას ორ ცვლადს შორის, რომელიც ვლინდება გარკვეული ნიმუშის სახით მხოლოდ საშუალოდ დაკვირვებების მთლიანობაში. რეგრესიის განტოლებაში კორელაციური ურთიერთობა წარმოდგენილია ფუნქციური დამოკიდებულების სახით, რომელიც გამოხატულია შესაბამისი მათემატიკური ფუნქციით. თითქმის ყველა ინდივიდუალურ შემთხვევაში, მნიშვნელობა y შედგება ორი ტერმინისგან:

,

სადაც y არის მიღებული მახასიათებლის რეალური მნიშვნელობა;

– შედეგიანი მახასიათებლის თეორიული მნიშვნელობა, ნაპოვნი რეგრესიის განტოლების საფუძველზე;

– შემთხვევითი ცვლადი, რომელიც ახასიათებს მიღებული მახასიათებლის რეალური მნიშვნელობის გადახრას რეგრესიის განტოლების გამოყენებით ნაპოვნი თეორიული მნიშვნელობიდან.

შემთხვევითი მნიშვნელობა ასევე მოუწოდა დარღვევას. იგი მოიცავს მოდელში გაუთვალისწინებელი ფაქტორების გავლენას, შემთხვევით შეცდომებს და გაზომვის მახასიათებლებს. შემთხვევითი ცვლადის არსებობა მოდელში გენერირდება სამი წყაროდან:

    მოდელის სპეციფიკაცია,

    წყაროს მონაცემების შერჩევითი ბუნება,

    საზომი ცვლადების მახასიათებლები.

სპეციფიკაციის შეცდომები მოიცავს არა მხოლოდ კონკრეტული მათემატიკური ფუნქციის არასწორ არჩევანს, არამედ რეგრესიის განტოლებაში რაიმე მნიშვნელოვანი ფაქტორის არასაკმარის შეფასებას (დაწყვილებული რეგრესიის გამოყენება მრავალჯერადი ნაცვლად).

სპეციფიკაციის შეცდომებთან ერთად შეიძლება მოხდეს შერჩევის შეცდომები, რადგან მკვლევარი ყველაზე ხშირად ეხება ნიმუშის მონაცემებს, როდესაც ადგენს მახასიათებლებს შორის ურთიერთობის შაბლონებს. შერჩევის შეცდომები ასევე ხდება თავდაპირველ სტატისტიკურ პოპულაციაში მონაცემების ჰეტეროგენურობის გამო, რაც ჩვეულებრივ ხდება ეკონომიკური პროცესების შესწავლისას. თუ პოპულაცია ჰეტეროგენულია, მაშინ რეგრესიის განტოლებას პრაქტიკული მნიშვნელობა არ აქვს. კარგი შედეგის მისაღებად, შესწავლილი მახასიათებლების ანომალიური მნიშვნელობების მქონე ერთეულები ჩვეულებრივ გამოირიცხება პოპულაციისგან. კვლავ, რეგრესიის შედეგები წარმოადგენს ნიმუშის მახასიათებლებს. წყაროს მონაცემები

თუმცა, რეგრესიის მეთოდების პრაქტიკული გამოყენებისას ყველაზე დიდი საფრთხე გაზომვის შეცდომებია. თუ დაზუსტების შეცდომები შეიძლება შემცირდეს მოდელის ფორმის შეცვლით (მათემატიკური ფორმულის ტიპი), და შერჩევის შეცდომები შეიძლება შემცირდეს საწყისი მონაცემების მოცულობის გაზრდით, მაშინ გაზომვის შეცდომები პრაქტიკულად გააუქმებს ყველა მცდელობას მახასიათებლებს შორის კავშირის რაოდენობრივი დასადგენად.

4. დაწყვილებული რეგრესიის შერჩევის მეთოდები.თუ ვივარაუდებთ, რომ გაზომვის შეცდომები მინიმუმამდეა დაყვანილი, ეკონომეტრიული კვლევის ყურადღება გამახვილებულია მოდელის სპეციფიკაციის შეცდომებზე. წყვილ რეგრესიაში, მათემატიკური ფუნქციის ტიპის არჩევა
შეიძლება გაკეთდეს სამი გზით:

    გრაფიკული;

    ანალიტიკური, ე.ი. შესწავლილი ურთიერთობის თეორიაზე დაყრდნობით;

    ექსპერიმენტული.

ორ მახასიათებელს შორის ურთიერთობის შესწავლისას გრაფიკული მეთოდი რეგრესიის განტოლების ტიპის არჩევა საკმაოდ ნათელია. იგი ეფუძნება კორელაციის ველს. მრუდების ძირითადი ტიპები, რომლებიც გამოიყენება რაოდენობრივად ურთიერთობებში




მათემატიკური ფუნქციების კლასი ორ ცვლადს შორის ურთიერთობის აღსაწერად საკმაოდ ფართოა; ასევე გამოიყენება სხვა ტიპის მრუდები.

ანალიტიკური მეთოდი რეგრესიული განტოლების ტიპის არჩევანი ეფუძნება შესასწავლი მახასიათებლების შეერთების მატერიალური ბუნების შესწავლას, აგრეთვე კავშირის ბუნების ვიზუალურ შეფასებას. იმათ. თუ ვსაუბრობთ ლაფერის მრუდზე, რომელიც გვიჩვენებს ურთიერთობას საგადასახადო პროგრესულობასა და ბიუჯეტის შემოსავლებს შორის, მაშინ ვსაუბრობთ პარაბოლურ მრუდზე, ხოლო მიკროანალიზში იზოკვანტები არის ჰიპერბოლები.

დისპერსია სტატისტიკაშიგვხვდება როგორც მახასიათებლის ინდივიდუალური მნიშვნელობები კვადრატიდან. საწყისი მონაცემებიდან გამომდინარე, იგი განისაზღვრება მარტივი და შეწონილი დისპერსიის ფორმულების გამოყენებით:

1. (დაჯგუფებული მონაცემებისთვის) გამოითვლება ფორმულის გამოყენებით:

2. შეწონილი ვარიაცია (ვარიაციის სერიებისთვის):

სადაც n არის სიხშირე (X ფაქტორის განმეორებადობა)

დისპერსიის პოვნის მაგალითი

ეს გვერდი აღწერს დისპერსიის პოვნის სტანდარტულ მაგალითს, ასევე შეგიძლიათ იხილოთ სხვა პრობლემები მის პოვნაში

მაგალითი 1. შემდეგი მონაცემები ხელმისაწვდომია 20 მიმოწერ სტუდენტთა ჯგუფისთვის. აუცილებელია მახასიათებლის განაწილების ინტერვალური სერიის აგება, მახასიათებლის საშუალო მნიშვნელობის გამოთვლა და მისი დისპერსიის შესწავლა.

მოდით ავაშენოთ ინტერვალის დაჯგუფება. მოდით განვსაზღვროთ ინტერვალის დიაპაზონი ფორმულის გამოყენებით:

სადაც X max არის დაჯგუფების მახასიათებლის მაქსიმალური მნიშვნელობა;
X min – დაჯგუფების მახასიათებლის მინიმალური მნიშვნელობა;
n – ინტერვალების რაოდენობა:

ჩვენ ვიღებთ n=5. ნაბიჯი არის: h = (192 - 159)/ 5 = 6.6

მოდით შევქმნათ ინტერვალის დაჯგუფება

შემდგომი გამოთვლებისთვის ჩვენ ავაშენებთ დამხმარე ცხრილს:

X'i არის შუალედი. (მაგალითად, 159 - 165.6 = 162.3 ინტერვალის შუა).

ჩვენ განვსაზღვრავთ სტუდენტების საშუალო სიმაღლეს შეწონილი საშუალო არითმეტიკული ფორმულის გამოყენებით:

მოდით განვსაზღვროთ განსხვავება ფორმულის გამოყენებით:

დისპერსიის ფორმულა შეიძლება გარდაიქმნას შემდეგნაირად:

ამ ფორმულიდან გამომდინარეობს, რომ განსხვავება უდრის სხვაობა ვარიანტების კვადრატების საშუალოსა და კვადრატსა და საშუალოს შორის.

დისპერსია ვარიაციულ სერიებშითანაბარი ინტერვალებით მომენტების მეთოდის გამოყენებით შეიძლება გამოვთვალოთ შემდეგი გზით დისპერსიის მეორე თვისების გამოყენებით (ყველა ვარიანტის დაყოფა ინტერვალის მნიშვნელობით). დისპერსიის განსაზღვრა, გამოითვლება მომენტების მეთოდით, შემდეგი ფორმულის გამოყენებით ნაკლებად შრომატევადია:

სადაც i არის ინტერვალის მნიშვნელობა;
A არის ჩვეულებრივი ნული, რისთვისაც მოსახერხებელია ყველაზე მაღალი სიხშირით ინტერვალის შუა გამოყენება;
m1 არის პირველი რიგის მომენტის კვადრატი;
მ2 - მეორე შეკვეთის მომენტი

(თუ სტატისტიკურ პოპულაციაში მახასიათებელი იცვლება ისე, რომ არსებობს მხოლოდ ორი ურთიერთგამომრიცხავი ვარიანტი, მაშინ ასეთ ცვალებადობას ალტერნატივა ეწოდება) შეიძლება გამოითვალოს ფორმულის გამოყენებით:

ამ დისპერსიის ფორმულაში q = 1-p ჩანაცვლებით, მივიღებთ:

დისპერსიის ტიპები

ტოტალური დისპერსიაზომავს მახასიათებლის ცვალებადობას მთელ პოპულაციაში, როგორც მთლიანობაში, ყველა ფაქტორის გავლენის ქვეშ, რომელიც იწვევს ამ ცვალებადობას. ის უდრის x-ის მახასიათებლის ცალკეული მნიშვნელობების გადახრების საშუალო კვადრატს x-ის საერთო საშუალო მნიშვნელობიდან და შეიძლება განისაზღვროს, როგორც მარტივი დისპერსიული ან შეწონილი ვარიაცია.

ახასიათებს შემთხვევით ვარიაციას, ე.ი. ვარიაციის ნაწილი, რომელიც განპირობებულია გაუთვალისწინებელი ფაქტორების გავლენით და არ არის დამოკიდებული ფაქტორ-ატრიბუტზე, რომელიც ქმნის ჯგუფის საფუძველს. ასეთი დისპერსია უდრის X ჯგუფში ატრიბუტის ცალკეული მნიშვნელობების გადახრების საშუალო კვადრატს ჯგუფის არითმეტიკული საშუალოდან და შეიძლება გამოითვალოს როგორც მარტივი დისპერსია ან როგორც შეწონილი დისპერსია.

ამრიგად, ჯგუფური დისპერსიის ზომებითვისების ცვალებადობა ჯგუფში და განისაზღვრება ფორმულით:

სადაც xi არის ჯგუფის საშუალო;
ni არის ჯგუფში ერთეულების რაოდენობა.

მაგალითად, შიდაჯგუფური ვარიაციები, რომლებიც უნდა განისაზღვროს საამქროში მუშაკთა კვალიფიკაციის გავლენის შესასწავლად შრომის პროდუქტიულობის დონეზე, აჩვენებს ცვალებადობას თითოეულ ჯგუფში, რომელიც გამოწვეულია ყველა შესაძლო ფაქტორით (აღჭურვილობის ტექნიკური მდგომარეობა, ხელმისაწვდომობა. იარაღები და მასალები, მუშაკთა ასაკი, შრომის ინტენსივობა და ა.შ.), გარდა კვალიფიკაციის კატეგორიაში განსხვავებებისა (ჯგუფში ყველა მუშაკს აქვს იგივე კვალიფიკაცია).

ჯგუფური დისპერსიების საშუალო ასახავს შემთხვევითობას, ანუ ვარიაციის იმ ნაწილს, რომელიც მოხდა ყველა სხვა ფაქტორების გავლენის ქვეშ, დაჯგუფების ფაქტორის გარდა. იგი გამოითვლება ფორმულის გამოყენებით:

ახასიათებს მიღებული მახასიათებლის სისტემურ ცვალებადობას, რაც განპირობებულია იმ ფაქტორი-ნიშნის გავლენით, რომელიც ქმნის ჯგუფის საფუძველს. იგი უდრის ჯგუფური საშუალებების გადახრების საშუალო კვადრატს საერთო საშუალოდან. ჯგუფთაშორისი განსხვავება გამოითვლება ფორმულის გამოყენებით:

სტატისტიკაში დისპერსიის დამატების წესი

Მიხედვით ვარიაციების დამატების წესიმთლიანი დისპერსია უდრის ჯგუფური და ჯგუფთაშორის ვარიაციების საშუალო ჯამის:

ამ წესის მნიშვნელობაარის ის, რომ მთლიანი დისპერსია, რომელიც წარმოიქმნება ყველა ფაქტორის გავლენის ქვეშ, უდრის ყველა სხვა ფაქტორების გავლენის ქვეშ წარმოქმნილი დისპერსიებისა და დაჯგუფების ფაქტორის გამო წარმოქმნილი დისპერსიის ჯამს.

დისპერსიების დამატების ფორმულის გამოყენებით, შეგიძლიათ დაადგინოთ მესამე უცნობი ვარიაცია ორი ცნობილი ვარიაციებიდან და ასევე განსაჯოთ დაჯგუფების მახასიათებლის გავლენის სიძლიერე.

დისპერსიული თვისებები

1. თუ მახასიათებლის ყველა მნიშვნელობა შემცირდება (იზრდება) იგივე მუდმივი რაოდენობით, მაშინ დისპერსია არ შეიცვლება.
2. თუ მახასიათებლის ყველა მნიშვნელობა მცირდება (გაიზრდება) n-ჯერ ერთნაირი რაოდენობით, მაშინ დისპერსიაც შესაბამისად შემცირდება (გაიზრდება) n^2-ჯერ.

ეკონომიკაარის მეცნიერება, რომელიც იძლევა ეკონომიკური ფენომენებისა და პროცესების ურთიერთმიმართების რაოდენობრივ გამოხატვას. ამ დროისთვის, ონლაინ ხელმისაწვდომია შემდეგი ეკონომეტრიული პრობლემების გადაწყვეტილებები:

ანალიზის კორელაციულ-რეგრესიული მეთოდი

ასოციაციის არაპარამეტრული ზომები

შემთხვევითი კომპონენტის ჰეტეროსკედასტიურობა

ავტოკორელაცია

  1. დროის სერიების დონეების ავტოკორელაცია. კორელოგრამის აგებასთან ავტოკორელაციის ტესტირება;

საექსპერტო კვლევის ჩატარების ეკონომეტრიული მეთოდები

  1. დისპერსიის ანალიზის მეთოდის გამოყენებით შეამოწმეთ ნულოვანი ჰიპოთეზა ობიექტის ხარისხზე ფაქტორის გავლენის შესახებ.

შედეგად მიღებული გამოსავალი წარმოდგენილია Word ფორმატში. გადაწყვეტის შემდეგ დაუყოვნებლივ არის ბმული Excel-ში შაბლონის ჩამოსატვირთად, რაც შესაძლებელს ხდის ყველა მიღებული ინდიკატორის შემოწმებას. თუ ამოცანა მოითხოვს გამოსავალს Excel-ში, მაშინ შეგიძლიათ გამოიყენოთ სტატისტიკური ფუნქციები Excel-ში.

დროის სერიის კომპონენტები

  1. Analytical Smoothing სერვისი შეიძლება გამოყენებულ იქნას დროის სერიების ანალიტიკური გლუვებისთვის (სწორი ხაზის გასწვრივ) და ტრენდის განტოლების პარამეტრების მოსაძებნად. ამისათვის თქვენ უნდა მიუთითოთ წყაროს მონაცემების რაოდენობა. თუ ბევრი მონაცემია, შეგიძლიათ ჩასვათ Excel-დან.
  2. ტრენდის განტოლების პარამეტრების გაანგარიშება.
    ტენდენციის ფუნქციის ტიპის არჩევისას შეგიძლიათ გამოიყენოთ სასრული სხვაობის მეთოდი. თუ ზოგადი ტენდენცია გამოიხატება მეორე რიგის პარაბოლით, მაშინ ვიღებთ მეორე რიგის მუდმივ სასრულ განსხვავებებს. თუ ზრდის ტემპები დაახლოებით მუდმივია, მაშინ ექსპონენციალური ფუნქცია გამოიყენება ნიველირებისთვის.
    განტოლების ფორმის არჩევისას უნდა იხელმძღვანელოთ არსებული ინფორმაციის რაოდენობით. რაც უფრო მეტ პარამეტრს შეიცავს განტოლება, მით მეტი უნდა იყოს დაკვირვება შეფასების სანდოობის იგივე ხარისხით.
  3. გლუვი მოძრავი საშუალო მეთოდით. გამოყენება

დახურვა