X faktörü (sağlıklı bir kişinin günlük kişi başına ortalama geçim düzeyi) ile sonuçta ortaya çıkan y özelliği (ortalama günlük ücret) arasındaki korelasyon bağımlılığı. Doğrusal regresyon denkleminin parametreleri, regresyon katsayısının ekonomik yorumu.

y=f(x)+E ,y t =f(x) – teorik fonksiyon, E=y- y t

y t =a+bx – Ortalama günlük ücretin (y), sağlıklı bir kişinin (x) günlük kişi başına düşen ortalama geçim düzeyine olan korelasyon bağımlılığı

a+b =

A +b =

b=
- regresyon katsayısı.

Bir engelsiz kişinin (X) günlük kişi başına geçim seviyesi 1 birim arttığında ortalama ücretinin (Y) kaç birim değiştiğini gösterir.

b=
= 0,937837482

Bu, sağlıklı bir kişinin (x) günlük kişi başına düşen ortalama geçim seviyesinin 1 birim artmasıyla, ortalama günlük ücretin ortalama 0,937 birim artacağı anlamına gelmektedir.

a= -B , a=135,4166667-0,937837482 86,75=54,05926511

3) Değişim katsayısı

Değişim katsayısı, SV'nin ortalama değerinin ne kadarının ortalama yayılım olduğunu gösterir.

υ x = δх/x = 0,144982838, υ y = δy/y = 0,105751299

4) Korelasyon katsayısı

Korelasyon katsayısı, sağlıklı bir kişinin günlük kişi başına ortalama geçim düzeyi ile ortalama günlük ücret arasındaki doğrusal ilişkinin yakınlığını değerlendirmek için kullanılır.

rxy = b δх/δy = 0,823674909 çünkü rxy ˃0 ise değişkenler arasındaki korelasyona doğrudan denir

Bütün bunlar, ortalama günlük ücretin, sağlıklı bir kişinin günlük kişi başına düşen ortalama geçim düzeyine bağlı olduğunu gösteriyor.

5) Belirleme katsayısı

Belirleme katsayısı, doğrusal regresyon denklemlerinin uyumunun kalitesini değerlendirmek için kullanılır.

Belirleme katsayısı, etkili özelliğin Y (ortalama günlük ücret) varyansının, etkili özelliğin toplam varyansındaki regresyonla açıklanan oranını karakterize eder.

R 2 xy = (∑(y t - y ort) 2) / (∑(y - y ort) 2) = 0,678440355, 0,5< R 2 < 0,7 ,

Bu, bağlantının gücünün fark edilebilir, yükseğe yakın olduğu ve regresyon denkleminin iyi seçildiği anlamına gelir.

6) Model doğruluğunun değerlendirilmesi veya yaklaşımın değerlendirilmesi.

=1/n ∑ ׀(y i - y t)/y i ׀ %100 - ortalama yaklaşım hatası.

%5-7'den az bir hata, modelin iyi uyumunu gösterir.

Hata %10'dan büyükse farklı türde bir model denklemi seçmeyi düşünmelisiniz.

Yaklaşım hatası =0,015379395 %100=%1,53, bu, modelin orijinal verilere iyi uyum sağladığını gösterir

7) Varyans şemasının analizi.

∑(y - y ort) 2 =∑(y t - y ort) 2 +∑(y i - y t) 2 n – gözlem sayısı, m – x değişkeni için parametre sayısı

Varyans Bileşenleri

Karelerin toplamı

Serbestlik derecesi sayısı

Serbestlik derecesi başına dağılım

∑(y - y ort) 2

S 2 toplam =(∑(y - y ort) 2)/(n-1)

Faktöriyel

∑(y t - y av) 2

S 2 olgusu =(∑(y t - y av) 2)/m

Artık

∑(y ben - y t) 2

S 2 geri kalan =(∑(y ben - y t) 2)/ (n-m-1)

Varyans analizi

Bileşenler

Karelerin toplamı

Serbestlik derecesi sayısı

Dağılım

genel

faktöriyel

artık

8) Modelin uygunluğunun kontrol edilmesiF-Fisher kriteri (α=0.05).

Regresyon denkleminin istatistiksel öneminin bir bütün olarak değerlendirilmesi,F-Fisher kriteri.

H 0 – regresyon denkleminin istatistiksel önemine ilişkin hipotez.

H 1 – regresyon denkleminin istatistiksel önemi.

F hesaplanmış serbestlik derecesi başına hesaplanan faktör ve artık varyans değerlerinin oranından belirlenir.

F hesaplanan = S 2 olgusu / S 2 geri kalan = ((∑(y t - y av) 2)/m) / ((∑(y i - y t) 2)/ (n-m-1)) =1669,585177 / 79,13314895 = 21,09842966

F tablo şeklinde - belirli bir serbestlik derecesine sahip rastgele faktörlerin etkisi altında oluşturulabilecek kriterin mümkün olan maksimum değeri, yani; İLE 1 = M, İLE 2 = N- M-1 ve anlamlılık düzeyi α (α=0,05)

F tablosu (0,05; 1; n-2), F tablosu (0,05; 1; 10), F tablosu = 4,964602701

EğerF masa < F hesaplama , o zaman hipotezH 0 Tahmin edilen özelliklerin rastgele doğası reddedilir ve bunların istatistiksel anlamlılığı ve regresyon denkleminin güvenilirliği kabul edilir. Aksi takdirdeH 0 reddedilmez ve regresyon denkleminin istatistiksel anlamsızlığı ve güvenilmezliği kabul edilir. Bizim durumumuzda F tablosu< F расч, следовательно признаётся статистическая значимость и надёжность уравнения регрессии.

9) Regresyon ve korelasyon katsayılarının istatistiksel anlamlılığının aşağıdaki ölçütlere göre değerlendirilmesi:T-Student'in t-testi (α=0.05).

Katsayının anlamlılığının değerlendirilmesi. gerileme., t – Öğrenci kriteri b parametresinin istatistiksel anlamlılığını kontrol edelim.

Hipotez H 0: b=0, t b (hesap) = ׀b ׀/ m b, m b = S dinlenme / (δ x
) , burada n gözlem sayısıdır

m b = 79,13314895 / (12,57726123
) = 0,204174979

t b (hesaplanan) = 0,937837482 / 0,204174979 = 4,593302697

t tablosu, belirli bir serbestlik derecesine (K=n-2) ve anlamlılık düzeyi α'ya (α=0.05) sahip, rastgele faktörlerin etkisi altında kriterin mümkün olan maksimum değeridir. t tablosu = 2.2281, Eğer t (calc) > t tablosu ise H 0 hipotezi reddedilir ve denklemin parametrelerinin önemi kabul edilir.

Bizim durumumuzda t b (hesaplanan) > t tablosu olduğundan H 0 hipotezi reddedilir ve b parametresinin istatistiksel anlamlılığı kabul edilir.

a parametresinin istatistiksel önemini kontrol edelim. Hipotez H 0: a=0 t a (hesaplanan) = ׀а ׀/ m a

m a = (S dinlenme
)/(n δ x), ma = (79,13314895
)/(12 12,57726123)= 17,89736655, ta (hesaplanan) = 54,05926511 / 17,89736655=3,020515055

t a (hesaplanan) > t tablosu dolayısıyla H 0 hipotezi reddedilir ve a parametresinin istatistiksel önemi kabul edilir.

Korelasyonun öneminin değerlendirilmesi. Korelasyon katsayısının istatistiksel önemini kontrol edelim.

mrxy =
, bayxy =
=0,179320842, trxy = 0,823674909/ 0,179320842 = 4,593302697

tr = t b , tr > t tablosu, dolayısıyla korelasyon katsayısının istatistiksel anlamlılığı kabul edilmektedir.

Bu tahminleri bulduğumuzu ve denklemi yazabildiğimizi varsayalım:

ŷ = A + BX,

Nerede A- regresyon sabiti, regresyon çizgisinin eksenle kesişme noktası OY;

B- regresyon katsayısı, ilişkiyi karakterize eden regresyon çizgisinin eğimi De¤DX;

ŷ - açıklanan değişkenin teorik değeri.

İkili regresyonda bilindiği gibi matematiksel model tipinin seçimi üç şekilde gerçekleştirilebilir:

1. Grafik.

2. Analitik.

3. Deneysel.

Gözlemlenen değerleri tanımlayan bir fonksiyonu seçmek için grafiksel bir yöntem kullanılabilir. Kaynak verileri koordinat düzleminde çizilir. Faktör karakteristiğinin değerleri apsis ekseninde, ortaya çıkan özelliğin değerleri ise ordinat ekseninde çizilir. Noktaların konumu bağlantının yaklaşık şeklini gösterecektir. Kural olarak bu ilişki eğriseldir. Bu çizginin eğriliği küçükse, doğrusal bir bağlantının varlığı hipotezini kabul edebiliriz.

Tüketim fonksiyonunu dağılım diyagramı olarak gösterelim. Bunu yapmak için, koordinat sisteminde gelirin değerini apsis eksenine ve koordinat eksenine koşullu bir ürünü tüketme maliyetlerini çizeriz. “Gelir - tüketim harcaması” değer kümelerine karşılık gelen noktaların konumu ilişkinin yaklaşık şeklini gösterecektir (Şekil 1).

Görsel olarak, şemaya dayanarak, en iyi bağımlılığı kesin olarak belirlemek neredeyse hiçbir zaman mümkün değildir.

Seçilen fonksiyonun parametrelerini değerlendirmeye geçelim A Ve B en küçük kareler yöntemi.

Tahmin problemi “klasik” minimum bulma problemine indirgenebilir. Değişkenler artık notlardır A Ve Bönerilen bağlantının bilinmeyen parametreleri en Ve X. Herhangi bir fonksiyonun en küçük değerini bulmak için öncelikle birinci dereceden kısmi türevleri bulmanız gerekir. Daha sonra her birini sıfıra eşitleyin ve ortaya çıkan denklem sistemini değişkenlere göre çözün. Bizim durumumuzda böyle bir fonksiyon sapmaların karelerinin toplamıdır - S ve değişkenler A Ve B. Yani, = 0 ve = 0'ı bulmalı ve ortaya çıkan denklem sistemini buna göre çözmeliyiz. A Ve B.

Bağlama denkleminin şu şekilde olduğunu varsayarak, en küçük kareler yöntemini kullanarak parametre tahminleri elde edelim. ŷ = A + BX. Daha sonra fonksiyon S benziyor

. Fonksiyonun farklılaştırılması Sİle A göre türev alarak ilk normal denklemi elde ederiz. B- ikinci normal denklem. , ,

Uygun dönüşümlerden sonra şunu elde ederiz:

(*)

Bir normal denklem sistemi oluşturmak için basitleştirilmiş kurallar vardır. Bunları doğrusal bir fonksiyona uygulayalım:

1) Denklemin her terimini çarpın ŷ = A + BX ilk parametrenin katsayısı ile ( A), yani tek tek.

2) Her değişkenin önüne bir toplama işareti koyarız.

3) Denklemin serbest terimini şununla çarpın: N.

4) İlk normal denklemi elde ederiz

5) Orijinal denklemin her terimini ikinci parametrenin katsayısıyla çarpın ( B), yani X.

6) Her değişkenin önüne bir toplama işareti koyuyoruz.

7) İkinci normal denklemi elde ederiz

Bu kuralları kullanarak herhangi bir doğrusal fonksiyon için bir normal denklem sistemi derlenir. Kurallar ilk olarak İngiliz ekonomist R. Pearl tarafından formüle edildi.

Denklemlerin parametreleri aşağıdaki formüller kullanılarak hesaplanır:

, ,

Tablo 1'deki başlangıç ​​verilerini kullanarak bir normal denklemler sistemi (*) oluşturalım ve bunu bilinmeyenlere göre çözelim A Ve B:


1677=11*a+4950*ba = -3309

790 400=4950*a+2 502 500*bb = 7,6923

Regresyon denklemi:

ŷ = -3309 + 7,6923 x ,

A ürününün gerçek ve tahmini tüketim maliyetlerini karşılaştıralım (Tablo 2).

Tablo 2 Mal tüketimine ilişkin giderlerin gerçek ve tahmini değerlerinin karşılaştırılması A doğrusal bir ilişkiyle:

Grup numarası

Tüketim giderleri

mal A

Gerçek giderlerin hesaplananlardan sapması

gerçek(ler)

yerleşme

mutlak

(y – ŷ)

1 120 -1770,54 1890,54
2 129 -1385,92 1514,92
3 135 -1001,31 1136,31
4 140 -616,45 756,45
5 145 -232,08 377,08
6 151 152,53 -1,53
7 155 537,15 -382,15
8 160 921,76 -761,76
9 171 1306,38 -1135,38
10 182 1690,99 -1508,99
11 189 2075,61 -1886,61
Toplam - - 0

Ortaya çıkan fonksiyonun grafiğini çizelim ŷ ve gerçek değerleri (y) ve hesaplanan değerleri kullanan bir dağılım grafiği ( ŷ) .

Özellikler arasındaki ilişkinin korelasyonel olmasından dolayı hesaplanan değerler gerçek değerlerden farklılık göstermektedir.

Korelasyon katsayısı ilişkinin yakınlığının bir ölçüsü olarak kullanılır:

=

Tablo 1'deki ilk verileri kullanarak şunu elde ederiz:

σ X =158;

σ sen = 20,76;

R = 0,990.

Doğrusal korelasyon katsayısı eksi 1'den artı 1'e kadar herhangi bir değeri alabilir. Mutlak değerdeki korelasyon katsayısı 1'e ne kadar yakınsa, özellikler arasındaki ilişki de o kadar yakın olur. Doğrusal korelasyon katsayısının işareti ilişkinin yönünü gösterir; doğrudan ilişki artı işaretine karşılık gelir ve ters ilişki eksi işaretine karşılık gelir.

Çözüm: değerler arasındaki ilişki X ve karşılık gelen değerler en

yakın, doğrudan bağımlılık.

Örneğimizde D = 0,9801

Bu, ürün maliyetlerindeki değişikliklerin A%98,01'i gelirdeki değişikliklerle açıklanabilir.

Kalan %1,99 şunlardan kaynaklanabilir:

1) yeterince iyi seçilmemiş iletişim biçimi;

2) hesaba katılmayan diğer faktörlerin bağımlı değişken üzerindeki etkisi.

Hipotezlerin istatistiksel testi.

Regresyon katsayısının istatistiksel olarak anlamsız olduğuna dair boş bir hipotez ileri sürdük:

H 0 : B = 0.

Regresyon katsayısının istatistiksel anlamlılığı kullanılarak kontrol edilir. T-Öğrencinin t testi. Bunu yapmak için önce kalan kareler toplamını belirleyin

S 2 ost= å (sen ben – ŷ Ben) 2

S 2 ost = 1,3689.

ve standart sapması

S = 0,39. se ( B ) = 0,018.

Gerçek değer T-Regresyon katsayısı için öğrenci testi:

.

tb = 427,35.

|t b |>t cr değeri (%95 anlamlılık düzeyi için t cr =2,26), regresyon katsayısının sıfırdan farklı olduğu (karşılık gelen anlamlılık düzeyinde) ve dolayısıyla bir etkinin varlığı hakkında bir sonuca varmamızı sağlar. (bağlantı) X Ve sen.

Çözüm: gerçek değer T-Student'in t testinin tablo değerini aşması, sıfır hipotezinin reddedildiği ve %95 olasılıkla regresyon katsayısının istatistiksel anlamlılığına ilişkin alternatif hipotezin kabul edildiği anlamına gelir.

[B– t cr *se( B), B+ t cr *se( B)]- b için %95 güven aralığı.

Güven aralığı parametrenin gerçek değerini kapsar B belirli bir olasılıkla (bu durumda %95).

7,6516 < B < 7,7329.

Korelasyon ve belirleme katsayılarının istatistiksel önemini kontrol etmeye geçelim:

R = 0,990;

D = R 2 = 0,9801.

Regresyon denkleminin bir bütün olarak istatistiksel olarak anlamsız olduğuna dair boş bir hipotez ileri sürdük:

H 0 : R 2 = 0.

Oluşturulan regresyon modelinin istatistiksel anlamlılığının bir bütün olarak değerlendirilmesi, F-Fisher kriteri. Gerçek değer F-parametrelerde doğrusal olan ikili regresyon denklemi için kriterler şu şekilde tanımlanır:

burada s 2 faktörü teorik değerlerin dağılımıdır ŷ (varyasyon açıklandı);

s 2 geri kalan - kalan kareler toplamı;

R 2 - determinasyon katsayısı.

Gerçek değer F-Fisher kriteri:

F F = 443,26

Çözüm: sıfır hipotezini reddediyoruz ve %95 olasılıkla regresyon denkleminin istatistiksel anlamlılığına ilişkin alternatif hipotezi kabul ediyoruz.

1. Korelasyon-regresyon analizinin özü ve görevleri.

2. Regresyonun tanımı ve çeşitleri.

3. Model spesifikasyonunun özellikleri. Rasgele bir değişkenin varlığının nedenleri.

4. Eşleştirilmiş regresyonu seçme yöntemleri.

5. En küçük kareler yöntemi.

6. Bağlantının sıkılığını ve gücünü ölçmek için göstergeler.

7. İstatistiksel anlamlılık tahminleri.

8. Y değişkeninin tahmin edilen değeri ve tahminin güven aralıkları.

1. Korelasyon-regresyon analizinin özü ve görevleri.Çok çeşitli olan ekonomik olaylar, bu süreçlerin ve olayların belirli özelliklerini yansıtan ve birbirine bağlı değişikliklere tabi olan birçok özellik ile karakterize edilir. Bazı durumlarda, özellikler arasındaki ilişki çok yakın çıkarken (örneğin, bir çalışanın saatlik çıktısı ve maaşı), bazı durumlarda ise böyle bir ilişki hiç ifade edilmemekte veya son derece zayıftır (örneğin cinsiyet) öğrencilerin sayısı ve akademik performansları). Bu özellikler arasındaki bağlantı ne kadar yakınsa, alınan kararlar da o kadar doğru olur.

Olgular ve özellikleri arasında iki tür bağımlılık vardır:

    fonksiyonel (deterministik, nedensel) bağımlılık . Bir değişkenin her değerini başka bir değişkenin kesin olarak tanımlanmış bir değeriyle ilişkilendiren bir formül şeklinde belirtilir (rastgele faktörlerin etkisi ihmal edilir). Başka bir deyişle, fonksiyonel bağımlılık bağımsız değişken x'in her değerinin, bağımlı değişken y'nin kesin olarak tanımlanmış bir değerine karşılık geldiği bir ilişkidir. Ekonomide değişkenler arasındaki fonksiyonel ilişkiler genel kuralın istisnalarıdır;

    istatistiksel (stokastik, deterministik olmayan) bağımlılık – bu, rastgele faktörlerden etkilenen değişkenlerin bir bağlantısıdır; Bu, bağımsız değişken x'in her değerinin, bağımlı değişken y'nin bir dizi değere karşılık geldiği ve y'nin hangi değeri alacağının önceden bilinmediği bir ilişkidir.

İstatistiksel bağımlılığın özel bir durumu korelasyon bağımlılığıdır.

Korelasyon bağımlılığı bağımsız değişken x'in her değerinin, bağımlı değişken y'nin belirli bir matematiksel beklentisine (ortalama değer) karşılık geldiği bir ilişkidir.

Korelasyon bağımlılığı, her bir durumda ortaya çıkmayan, ancak yeterince büyük sayıda vaka için yalnızca ortalama değerlerde ortaya çıkan "eksik" bir bağımlılıktır. Örneğin, bir çalışanın niteliklerinin iyileştirilmesinin işgücü verimliliğinde artışa yol açtığı bilinmektedir. Bu ifade sıklıkla pratikte doğrulanır, ancak benzer bir süreçte görev alan aynı kategori/düzeydeki iki veya daha fazla işçinin aynı emek verimliliğine sahip olacağı anlamına gelmez.

Korelasyon bağımlılığı, korelasyon ve regresyon analizi yöntemleri kullanılarak incelenir.

Korelasyon ve regresyon analizi değişkenler arasındaki yakınlığı, bağlantının yönünü ve bu bağlantının biçimini belirlemenizi sağlar; analitik ifadesi.

Korelasyon analizinin ana görevi ikili bir bağlantıda iki özellik arasındaki ve çok faktörlü bir bağlantıda etkili ve çok faktörlü özellikler arasındaki bağlantının yakınlığının niceliksel olarak belirlenmesi ve kurulan bağlantının güvenilirliğinin istatistiksel olarak değerlendirilmesinden oluşur.

2. Regresyonun tanımı ve çeşitleri. Regresyon analizi ekonometride temel matematiksel ve istatistiksel araçtır. Regresyon Bir miktarın (y) ortalama değerinin başka bir miktara veya birkaç miktara (x i) bağımlılığını çağırmak gelenekseldir.

Regresyon denkleminde yer alan faktörlerin sayısına bağlı olarak basit (eşleştirilmiş) ve çoklu regresyon arasında ayrım yapmak gelenekseldir.

Basit (çift yönlü) regresyon bağımlı (açıklanan) değişken y'nin ortalama değerinin, bağımsız (açıklayıcı) değişken x'in bir fonksiyonu olarak kabul edildiği bir modeldir. Dolaylı olarak ikili regresyon şu formun bir modelidir:

Açıkça:

,

burada a ve b regresyon katsayılarının tahminleridir.

Çoklu regresyon bağımlı (açıklanan) değişken y'nin ortalama değerinin, birkaç bağımsız (açıklayıcı) değişken x 1, x 2, ... x n'nin bir fonksiyonu olarak kabul edildiği bir modeldir. Dolaylı olarak ikili regresyon şu formun bir modelidir:

.

Açıkça:

burada a ve b 1, b 2, b n regresyon katsayılarının tahminleridir.

Böyle bir modelin örneği, bir çalışanın maaşının yaşına, eğitimine, niteliklerine, hizmet süresine, endüstrisine vb. bağlı olmasıdır.

Bağımlılığın şekliyle ilgili olarak:

      doğrusal regresyon;

      karşılık gelen doğrusal olmayan fonksiyon tarafından ifade edilen faktörler arasında doğrusal olmayan ilişkilerin varlığını varsayan doğrusal olmayan regresyon. Çoğu zaman, görünüşte doğrusal olmayan modeller, doğrusal olarak sınıflandırılmalarına olanak tanıyan doğrusal bir forma indirgenebilir.

3. Model spesifikasyonunun özellikleri. Rasgele bir değişkenin varlığının nedenleri. Herhangi bir ekonometrik çalışma şununla başlar: model özellikleri yani değişkenler arasındaki ilgili ilişkiler teorisine dayalı olarak model tipinin formülasyonundan.

Her şeyden önce, etkili özelliği etkileyen tüm faktörler arasından, en önemli etkileyen faktörleri belirlemek gerekir. Açıklayıcı değişken olarak kullanılan baskın bir faktör varsa ikili regresyon yeterlidir. Basit bir regresyon denklemi, iki değişken arasındaki ilişkiyi karakterize eder ve bu, yalnızca gözlemlerin toplamı için ortalama olarak belirli bir model olarak kendini gösterir. Regresyon denkleminde korelasyon ilişkisi, karşılık gelen matematiksel fonksiyonla ifade edilen fonksiyonel bağımlılık biçiminde temsil edilir. Hemen hemen her durumda, y değeri iki terimden oluşur:

,

burada y, ortaya çıkan özelliğin gerçek değeridir;

– regresyon denklemine dayanarak bulunan, sonuçta ortaya çıkan özelliğin teorik değeri;

– Ortaya çıkan özelliğin gerçek değerinin, regresyon denklemi kullanılarak bulunan teorik değerden sapmasını karakterize eden rastgele bir değişken.

Rastgele değer rahatsızlık da denir. Modelde dikkate alınmayan faktörlerin etkisini, rastgele hataları ve ölçüm özelliklerini içerir. Modelde rastgele bir değişkenin varlığı üç kaynaktan kaynaklanmaktadır:

    Model Şartnamesi,

    Kaynak verinin seçici doğası,

    Değişkenlerin ölçülmesinin özellikleri.

Spesifikasyon hataları, yalnızca belirli bir matematiksel fonksiyonun yanlış seçimini değil, aynı zamanda regresyon denklemindeki herhangi bir önemli faktörün (çoklu yerine eşleştirilmiş regresyon kullanılarak) eksik tahmin edilmesini de içerecektir.

Belirleme hatalarının yanı sıra örnekleme hataları da meydana gelebilir; çünkü araştırmacı, özellikler arasındaki ilişki kalıplarını oluştururken çoğunlukla örnek verilerle ilgilenir. Örnekleme hataları aynı zamanda orijinal istatistiksel popülasyondaki verilerin heterojenliği nedeniyle de ortaya çıkar; bu genellikle ekonomik süreçleri incelerken meydana gelir. Popülasyon heterojen ise regresyon denkleminin pratik bir anlamı yoktur. İyi bir sonuç elde etmek için, incelenen özelliklerin anormal değerlerine sahip birimler genellikle popülasyonun dışında bırakılır. Regresyon sonuçları yine örneklem özelliklerini temsil etmektedir. Kaynak verileri

Ancak regresyon yöntemlerinin pratik kullanımındaki en büyük tehlike ölçüm hatalarıdır. Modelin biçimini değiştirerek (bir tür matematiksel formül) spesifikasyon hataları azaltılabiliyorsa ve başlangıç ​​verilerinin hacmi artırılarak örnekleme hataları azaltılabiliyorsa, o zaman ölçüm hataları, özellikler arasındaki ilişkiyi ölçmeye yönelik tüm çabaları pratik olarak geçersiz kılar.

4. Eşleştirilmiş regresyonu seçme yöntemleri.Ölçüm hatalarının en aza indirildiği varsayılarak ekonometrik araştırmanın odak noktası model belirleme hatalarıdır. İkili regresyonda matematiksel fonksiyonun türünün seçilmesi
üç şekilde yapılabilir:

    grafik;

    analitik, yani incelenen ilişkinin teorisine dayanarak;

    deneysel.

İki özellik arasındaki ilişkiyi incelerken grafik yöntemi Regresyon denkleminin türünü seçmek oldukça açıktır. Korelasyon alanına dayanmaktadır. İlişkilerin nicelendirilmesinde kullanılan temel eğri türleri




İki değişken arasındaki ilişkiyi tanımlayan matematiksel fonksiyonların sınıfı oldukça geniştir; diğer eğri türleri de kullanılır.

Analitik metod Regresyon denklemi türünün seçimi, incelenen özelliklerin bağlantısının maddi doğasının incelenmesine ve ayrıca bağlantının doğasının görsel bir değerlendirmesine dayanır. Onlar. vergi artanlığı ile bütçe gelirleri arasındaki ilişkiyi gösteren Laffer eğrisinden bahsediyorsak, o zaman parabolik bir eğriden bahsediyoruz ve mikroanalizde eş anlamlılar hiperbollerdir.

İstatistiklerde dağılım karakteristiğin bireysel değerlerinin karesi olarak bulunur. Başlangıç ​​verilerine bağlı olarak basit ve ağırlıklı varyans formülleri kullanılarak belirlenir:

1. (gruplandırılmamış veriler için) aşağıdaki formül kullanılarak hesaplanır:

2. Ağırlıklı varyans (varyasyon serileri için):

burada n frekanstır (X faktörünün tekrarlanabilirliği)

Varyansı bulma örneği

Bu sayfada varyans bulmanın standart bir örneği açıklanmaktadır; bunu bulmak için diğer problemlere de bakabilirsiniz.

Örnek 1. Aşağıdaki veriler 20 yazışma öğrencisinden oluşan bir grup için mevcuttur. Karakteristiğin dağılımına ilişkin bir aralık serisi oluşturmak, özelliğin ortalama değerini hesaplamak ve dağılımını incelemek gerekir.

Bir aralık gruplaması oluşturalım. Aşağıdaki formülü kullanarak aralığın aralığını belirleyelim:

burada Xmax, gruplandırma karakteristiğinin maksimum değeridir;
X min – gruplandırma karakteristiğinin minimum değeri;
n – aralık sayısı:

n=5 kabul ediyoruz. Adım: h = (192 - 159)/ 5 = 6,6

Bir aralık gruplaması oluşturalım

Daha fazla hesaplama için yardımcı bir tablo oluşturacağız:

X'i aralığın ortasıdır. (örneğin 159 – 165,6 aralığının ortası = 162,3)

Ağırlıklı aritmetik ortalama formülünü kullanarak öğrencilerin ortalama boyunu belirleriz:

Aşağıdaki formülü kullanarak varyansı belirleyelim:

Dispersiyon formülü aşağıdaki gibi dönüştürülebilir:

Bu formülden şu sonuç çıkıyor varyans eşittir seçeneklerin karelerinin ortalaması ile kare ve ortalama arasındaki fark.

Varyasyon serisindeki dağılım Momentler yöntemini kullanarak eşit aralıklarla, ikinci dağılım özelliği kullanılarak (tüm seçeneklerin aralığın değerine bölünmesiyle) aşağıdaki şekilde hesaplanabilir. Varyansın belirlenmesi Momentler yöntemi kullanılarak hesaplanan aşağıdaki formülü kullanmak daha az zahmetlidir:

burada i aralığın değeridir;
A, aralığın ortasını en yüksek frekansla kullanmanın uygun olduğu geleneksel bir sıfırdır;
m1 birinci dereceden momentin karesidir;
m2 - ikinci derecenin anı

(istatistiksel bir popülasyonda bir özellik yalnızca iki birbirini dışlayan seçenek olacak şekilde değişirse, bu tür değişkenliğe alternatif denir) aşağıdaki formül kullanılarak hesaplanabilir:

Bu dağılım formülünde q = 1-p'yi yerine koyarsak şunu elde ederiz:

Varyans türleri

Toplam varyans Bir özelliğin, bu varyasyona neden olan tüm faktörlerin etkisi altında popülasyonun tamamındaki değişimini bir bütün olarak ölçer. Bir x karakteristiğinin bireysel değerlerinin, x'in genel ortalama değerinden sapmalarının ortalama karesine eşittir ve basit varyans veya ağırlıklı varyans olarak tanımlanabilir.

rastgele değişimi karakterize eder, yani Değişimin hesaba katılmayan faktörlerin etkisinden kaynaklanan ve grubun temelini oluşturan faktör özelliğine bağlı olmayan kısmı. Bu tür bir dağılım, X grubu içindeki özelliğin bireysel değerlerinin grubun aritmetik ortalamasından sapmalarının ortalama karesine eşittir ve basit dağılım veya ağırlıklı dağılım olarak hesaplanabilir.

Böylece, grup içi varyans ölçümleri Bir grup içindeki bir özelliğin varyasyonu aşağıdaki formülle belirlenir:

burada xi grup ortalamasıdır;
ni gruptaki birimlerin sayısıdır.

Örneğin, bir atölyede işçilerin niteliklerinin işgücü üretkenliği düzeyi üzerindeki etkisini inceleme görevinde belirlenmesi gereken grup içi farklılıklar, her gruptaki çıktıda tüm olası faktörlerin (ekipmanın teknik durumu, ekipmanın mevcudiyeti) neden olduğu değişiklikleri gösterir. araç ve gereçler, işçilerin yaşı, iş yoğunluğu vb.), nitelik kategorisindeki farklılıklar hariç (bir grup içindeki tüm işçiler aynı niteliklere sahiptir).

Grup içi varyansların ortalaması, rastgeleliği, yani varyasyonun gruplandırma faktörü haricindeki tüm diğer faktörlerin etkisi altında meydana gelen kısmını yansıtır. Aşağıdaki formül kullanılarak hesaplanır:

Grubun temelini oluşturan faktör işaretinin etkisinden kaynaklanan, ortaya çıkan özelliğin sistematik varyasyonunu karakterize eder. Grup ortalamalarının genel ortalamadan sapmalarının ortalama karesine eşittir. Gruplar arası varyans aşağıdaki formül kullanılarak hesaplanır:

İstatistiklere varyans ekleme kuralı

Buna göre varyans ekleme kuralı toplam varyans, grup içi ve gruplar arası varyansların ortalamasının toplamına eşittir:

Bu kuralın anlamı tüm faktörlerin etkisi altında ortaya çıkan toplam varyansın, diğer tüm faktörlerin etkisi altında ortaya çıkan varyanslar ile gruplama faktöründen dolayı ortaya çıkan varyansın toplamına eşit olmasıdır.

Varyans ekleme formülünü kullanarak, bilinen iki varyanstan üçüncü bilinmeyen varyansı belirleyebilir ve ayrıca gruplandırma özelliğinin etkisinin gücünü değerlendirebilirsiniz.

Dispersiyon özellikleri

1. Bir özelliğin tüm değerleri aynı sabit miktarda azaltılırsa (artırılırsa) dağılım değişmeyecektir.
2. Bir özelliğin tüm değerleri aynı sayıda n kadar azaltılırsa (artırılırsa), varyans buna karşılık olarak n^2 kat azalacak (artacaktır).

Ekonometri ekonomik olgular ve süreçler arasındaki ilişkilerin niceliksel bir ifadesini sağlayan bir bilimdir. Şu anda aşağıdaki ekonometri sorunlarının çözümleri çevrimiçi olarak mevcuttur:

Korelasyon-regresyon analiz yöntemi

Parametrik olmayan ilişkilendirme ölçümleri

Rastgele bileşenin değişen varyanslığı

Otokorelasyon

  1. Zaman serisi seviyelerinin otokorelasyonu. Bir korelogramın oluşturulmasıyla otokorelasyonun test edilmesi;

Uzman araştırması yürütmek için ekonometrik yöntemler

  1. Varyans analizi yöntemini kullanarak, bir faktörün bir nesnenin kalitesi üzerindeki etkisi hakkındaki boş hipotezi test edin.

Ortaya çıkan çözüm Word formatında sunulmaktadır. Çözümün hemen ardından şablonu Excel'de indirmek için bir bağlantı bulunur ve bu, elde edilen tüm göstergeleri kontrol etmeyi mümkün kılar. Görev Excel'de bir çözüm gerektiriyorsa, Excel'deki istatistiksel işlevleri kullanabilirsiniz.

Zaman Serisi Bileşenleri

  1. Analitik Düzeltme hizmeti, bir zaman serisinin (düz bir çizgi boyunca) analitik olarak yumuşatılması ve eğilim denkleminin parametrelerinin bulunması için kullanılabilir. Bunu yapmak için kaynak veri miktarını belirtmeniz gerekir. Çok fazla veri varsa Excel'den yapıştırabilirsiniz.
  2. Trend denklemi parametrelerinin hesaplanması.
    Trend fonksiyonunun türünü seçerken sonlu farklar yöntemini kullanabilirsiniz. Genel eğilim ikinci dereceden bir parabol ile ifade edilirse, o zaman ikinci dereceden sabit sonlu farklar elde ederiz. Büyüme oranları yaklaşık olarak sabitse, seviyelendirme için üstel bir fonksiyon kullanılır.
    Bir denklemin biçimini seçerken mevcut bilgi miktarından yola çıkmalısınız. Denklem ne kadar çok parametre içerirse, aynı tahmin güvenilirliği derecesine sahip daha fazla gözlem olmalıdır.
  3. Hareketli ortalama yöntemini kullanarak yumuşatma. Kullanma

Kapalı