Pagdepende sa ugnayan sa pagitan ng salik na x (average per capita subsistence level bawat araw ng isang matipunong tao) at ang nagresultang katangian na y (average na pang-araw-araw na sahod). Mga parameter ng linear regression equation, economic interpretation ng regression coefficient.

y=f(x)+E,y t =f(x) – theoretical function, E=y-y t

y t =a+bx – ugnayang pagdepende ng average na pang-araw-araw na sahod (y) sa average na per capita subsistence level bawat araw ng isang matipunong tao (x)

a+b =

a +b =

b=
- koepisyent ng regression.

Ipinapakita nito kung gaano karaming mga yunit ang nagbabago ng average na sahod (Y) kapag ang antas ng pangkabuhayan sa bawat araw ng isang taong may kakayahan (X) ay tumaas ng 1 yunit.

b=
= 0,937837482

Nangangahulugan ito na sa pagtaas ng average per capita subsistence level bawat araw ng isang matipunong tao (x) ng 1 unit, ang average na arawang sahod ay tataas ng average na 0.937 units.

a= -b , a=135.4166667-0.937837482 86.75=54.05926511

3) Coefficient ng variation

Ipinapakita ng koepisyent ng variation kung anong proporsyon ng average na halaga ng SV ang average na spread nito.

υ x = δх/x = 0.144982838, υ y = δy/y = 0.105751299

4) Koepisyent ng ugnayan

Ginagamit ang correlation coefficient upang masuri ang lapit ng linear na ugnayan sa pagitan ng average na antas ng subsistence ng bawat kapita bawat araw ng isang taong may kakayahan at ng average na arawang sahod.

rxy = b δх/δy = 0.823674909 dahil rxy ˃0 , kung gayon ang ugnayan sa pagitan ng mga variable ay tinatawag na direkta

Ang lahat ng ito ay nagpapakita ng pag-asa ng average na pang-araw-araw na sahod sa average na per capita subsistence level bawat araw ng isang taong may kakayahan.

5) Koepisyent ng pagpapasiya

Ang coefficient of determination ay ginagamit upang masuri ang kalidad ng fit ng mga linear regression equation.

Ang koepisyent ng determinasyon ay nagpapakilala sa proporsyon ng pagkakaiba-iba ng epektibong katangiang Y (average na pang-araw-araw na sahod) na ipinaliwanag sa pamamagitan ng regression sa kabuuang pagkakaiba ng epektibong katangian.

R 2 xy = (∑(y t - y avg) 2) / (∑(y - y avg) 2) = 0.678440355, 0.5< R 2 < 0,7 ,

Nangangahulugan ito na ang lakas ng koneksyon ay kapansin-pansin, malapit sa mataas, at ang equation ng regression ay mahusay na napili.

6) Pagtatasa ng katumpakan ng modelo, o pagtatasa ng approximation.

=1/n ∑ ׀(y i - y t)/y i ׀ 100% - average na error sa pagtatantya.

Ang isang error na mas mababa sa 5-7% ay nagpapahiwatig ng isang mahusay na akma ng modelo.

Kung mas malaki sa 10% ang error, dapat mong isaalang-alang ang pagpili ng ibang uri ng equation ng modelo.

Error sa pagtatantya =0.015379395 100%=1.53%, na nagpapahiwatig ng magandang akma ng modelo sa orihinal na data

7) Pagsusuri ng variance scheme.

∑(y - y avg) 2 =∑(y t - y avg) 2 +∑(y i - y t) 2 n – bilang ng mga obserbasyon, m – bilang ng mga parameter para sa variable x

Mga Bahagi ng Pagkakaiba

Kabuuan ng mga parisukat

Bilang ng antas ng kalayaan

Pagpapakalat sa bawat antas ng kalayaan

∑(y - y avg) 2

S 2 kabuuan =(∑(y - y avg) 2)/(n-1)

Factorial

∑(y t - y av) 2

S 2 katotohanan =(∑(y t - y av) 2)/m

Nalalabi

∑(y i - y t) 2

S 2 pahinga =(∑(y i - y t) 2)/ (n-m-1)

Pagsusuri ng pagkakaiba-iba

Mga bahagi

Kabuuan ng mga parisukat

Bilang ng antas ng kalayaan

Pagpapakalat

pangkalahatan

factorial

nalalabi

8) Sinusuri ang kasapatan ng modelo ayon saF-Fisher criterion (α=0.05).

Ang pagtatasa ng istatistikal na kahalagahan ng regression equation sa kabuuan ay isinasagawa gamit angF- Pamantayan ng mangingisda.

H 0 - hypothesis tungkol sa statistical significance ng regression equation.

H 1 - istatistikal na kahalagahan ng equation ng regression.

F kalkulado ay tinutukoy mula sa ratio ng mga halaga ng kadahilanan at natitirang mga pagkakaiba-iba na kinakalkula sa bawat antas ng kalayaan.

F nakalkula = S 2 fact / S 2 rest = ((∑(y t - y av) 2)/m) / ((∑(y i - y t) 2)/ (n-m-1)) =1669.585177 / 79.13314895 = 21.0984296

F tabular - ang pinakamataas na posibleng halaga ng criterion na maaaring mabuo sa ilalim ng impluwensya ng mga random na kadahilanan na may ibinigay na antas ng kalayaan, i.e. SA 1 = m, SA 2 = n- m-1, at antas ng kahalagahan α (α=0.05)

F table (0.05; 1; n-2), F table (0.05; 1; 10), F table = 4.964602701

KungF mesa < F pagkalkula , pagkatapos ay ang hypothesisH 0 ang random na kalikasan ng mga tinantyang katangian ay tinanggihan, at ang kanilang istatistikal na kahalagahan at ang pagiging maaasahan ng regression equation ay kinikilala. Kung hindiH 0 ay hindi tinatanggihan, at ang statistical insignificance at unreliability ng regression equation ay kinikilala. Sa aming kaso F table< F расч, следовательно признаётся статистическая значимость и надёжность уравнения регрессии.

9) Pagtatasa ng istatistikal na kahalagahan ng regression at correlation coefficients ayon sat-T-test ng mag-aaral (α=0.05).

Pagtatasa ng kahalagahan ng koepisyent. pagbabalik., t – Pamantayan ng mag-aaral. Suriin natin ang istatistikal na kahalagahan ng parameter b.

Hypothesis H 0: b=0, t b (calc) = ׀b ׀/ m b, m b = S rest / (δ x
), kung saan ang n ay ang bilang ng mga obserbasyon

m b = 79.13314895 / (12.57726123
) = 0,204174979

t b (kinakalkula) = 0.937837482 / 0.204174979 = 4.593302697

Ang t table ay ang pinakamataas na posibleng halaga ng criterion sa ilalim ng impluwensya ng mga random na salik na may ibinigay na antas ng kalayaan (K=n-2), at antas ng kabuluhan α (α=0.05). t table = 2.2281, Kung t (calc) > t table, ang hypothesis H 0 ay tinanggihan, at ang kahalagahan ng mga parameter ng equation ay kinikilala.

Sa aming kaso, t b (kinakalkula) > t talahanayan, samakatuwid ang hypothesis H 0 ay tinanggihan, at ang istatistikal na kahalagahan ng parameter b ay kinikilala.

Suriin natin ang istatistikal na kahalagahan ng parameter a. Hypothesis H 0: a=0 t a (kinakalkula) = ׀а ׀/ m a

m a = (S pahinga
)/(n δ x), m a = (79.13314895
)/(12 12.57726123)= 17.89736655, t a (kinakalkula) = 54.05926511 / 17.89736655=3.020515055

t a (kinakalkula) > t table samakatuwid ang hypothesis H 0 ay tinanggihan, at ang istatistikal na kahalagahan ng parameter a ay kinikilala.

Pagtatasa ng kahalagahan ng ugnayan. Suriin natin ang statistical significance ng correlation coefficient.

mrxy =
, mrxy =
=0.179320842, trxy = 0.823674909/ 0.179320842 = 4.593302697

tr = t b , tr > t table, samakatuwid ang istatistikal na kahalagahan ng koepisyent ng ugnayan ay kinikilala.

Ipagpalagay natin na nahanap na natin ang mga pagtatantya na ito at maaari nating isulat ang equation:

ŷ = a + bX,

saan A- pare-pareho ang regression, ang punto ng intersection ng linya ng regression na may axis OY;

b- regression coefficient, ang slope ng regression line na nagpapakilala sa relasyon DY¤DX;

ŷ - teoretikal na halaga ng ipinaliwanag na variable.

Tulad ng alam sa pairwise regression, ang pagpili ng uri ng modelo ng matematika ay maaaring isagawa sa tatlong paraan:

1. Graphic.

2. Analitikal.

3. Eksperimento.

Maaaring gumamit ng graphical na paraan upang pumili ng function na naglalarawan sa mga naobserbahang halaga. Naka-plot ang source data sa coordinate plane. Ang mga halaga ng katangian ng kadahilanan ay naka-plot sa abscissa axis, at ang mga halaga ng nagresultang katangian ay naka-plot sa ordinate axis. Ipapakita ng lokasyon ng mga tuldok ang tinatayang hugis ng koneksyon. Bilang isang patakaran, ang relasyon na ito ay curvilinear. Kung ang kurbada ng linyang ito ay maliit, maaari nating tanggapin ang hypothesis ng pagkakaroon ng isang rectilinear na koneksyon.

Ilarawan natin ang function ng pagkonsumo bilang isang scatter diagram. Upang gawin ito, sa sistema ng coordinate, inilalagay namin ang halaga ng kita sa abscissa axis, at sa ordinate axis, ang mga gastos sa pagkonsumo ng isang kondisyong produkto. Ang lokasyon ng mga puntos na tumutugma sa mga hanay ng mga halaga "kita - paggasta sa pagkonsumo" ay magpapakita ng tinatayang anyo ng relasyon (Larawan 1).

Biswal, batay sa diagram, halos hindi posible na malinaw na matukoy ang pinakamahusay na pag-asa.

Magpatuloy tayo sa pagsusuri sa mga parameter ng napiling function a At b paraan ng least squares.

Ang problema sa pagtatantya ay maaaring bawasan sa "klasikal" na problema ng paghahanap ng pinakamababa. Ang mga variable ay grades na ngayon A At b hindi kilalang mga parameter ng iminungkahing koneksyon sa At X. Upang mahanap ang pinakamaliit na halaga ng anumang function, kailangan mo munang hanapin ang unang pagkakasunud-sunod ng mga partial derivatives. Pagkatapos ay i-equate ang bawat isa sa kanila sa zero at lutasin ang nagresultang sistema ng mga equation na may paggalang sa mga variable. Sa aming kaso, ang naturang function ay ang kabuuan ng mga squared deviations - S, at ang mga variable ay A At b. Iyon ay, kailangan nating hanapin ang = 0 at = 0 at lutasin ang resultang sistema ng mga equation na may kinalaman sa A At b.

Kunin natin ang mga pagtatantya ng parameter gamit ang paraan ng least squares, sa pag-aakalang may anyo ang coupling equation ŷ = a + bX. Pagkatapos ang function S parang

. Pag-iiba ng function S Sa pamamagitan ng A, nakukuha natin ang unang normal na equation sa pamamagitan ng pagkakaiba-iba na may kinalaman sa b- pangalawang normal na equation. ,,

Pagkatapos ng naaangkop na mga pagbabagong-anyo, nakukuha namin ang:

(*)

May mga pinasimple na panuntunan para sa pagbuo ng isang sistema ng mga normal na equation. Ilapat natin ang mga ito sa isang linear na function:

1) I-multiply ang bawat termino ng equation ŷ = a + bX sa pamamagitan ng koepisyent para sa unang parameter ( A), iyon ay, sa pamamagitan ng isa.

2) Bago ang bawat variable ay naglalagay kami ng summation sign.

3) I-multiply ang libreng termino ng equation sa pamamagitan ng n.

4) Nakukuha namin ang unang normal na equation

5) I-multiply ang bawat termino ng orihinal na equation sa coefficient ng pangalawang parameter ( b), ibig sabihin, sa X.

6) Bago ang bawat variable ay naglalagay kami ng summation sign.

7) Nakukuha namin ang pangalawang normal na equation

Gamit ang mga panuntunang ito, ang isang sistema ng mga normal na equation ay pinagsama-sama para sa anumang linear function. Ang mga patakaran ay unang binuo ng Ingles na ekonomista na si R. Pearl.

Ang mga parameter ng mga equation ay kinakalkula gamit ang mga sumusunod na formula:

, ,

Bumuo tayo, gamit ang paunang data sa talahanayan 1, isang sistema ng mga normal na equation (*) at lutasin ito nang may paggalang sa mga hindi alam A At b:


1677=11*a+4950*ba = -3309

790 400=4950*a+2 502 500*bb = 7.6923

Ang equation ng regression ay:

ŷ = -3309 + 7.6923 x ,

Ihambing natin ang aktwal at tinantyang mga gastos sa pagkonsumo ng produkto A (Talahanayan 2).

Talahanayan 2 Paghahambing ng aktwal at tinantyang halaga ng mga gastos para sa pagkonsumo ng mga kalakal A na may linear na relasyon:

Numero ng pangkat

Mga gastos sa pagkonsumo

kalakal A

Paglihis ng mga aktwal na gastos mula sa mga kinakalkula

aktwal (mga)

kasunduan

ganap

(y – ŷ)

1 120 -1770,54 1890,54
2 129 -1385,92 1514,92
3 135 -1001,31 1136,31
4 140 -616,45 756,45
5 145 -232,08 377,08
6 151 152,53 -1,53
7 155 537,15 -382,15
8 160 921,76 -761,76
9 171 1306,38 -1135,38
10 182 1690,99 -1508,99
11 189 2075,61 -1886,61
Kabuuan - - 0

I-plot natin ang resultang function ŷ at isang scatterplot gamit ang aktwal na mga halaga (y) at mga kinakalkula na halaga ( ŷ) .

Ang mga kinakalkula na halaga ay lumihis mula sa aktwal na mga halaga dahil sa ang katunayan na ang relasyon sa pagitan ng mga katangian ay may kaugnayan.

Ang koepisyent ng ugnayan ay ginagamit bilang isang sukatan ng pagiging malapit ng relasyon:

=

Nakukuha namin, gamit ang paunang data mula sa Talahanayan 1:

σ x =158;

σ y = 20,76;

r = 0,990.

Ang linear correlation coefficient ay maaaring tumagal ng anumang halaga mula minus 1 hanggang plus 1. Kung mas malapit ang correlation coefficient sa absolute value sa 1, mas malapit ang relasyon sa pagitan ng mga katangian. Ang tanda ng linear correlation coefficient ay nagpapahiwatig ng direksyon ng relasyon - ang direktang relasyon ay tumutugma sa isang plus sign, at ang kabaligtaran na relasyon ay tumutugma sa isang minus sign.

Konklusyon: relasyon sa pagitan ng mga halaga X at kaukulang halaga sa

malapit, direktang pag-asa.

Sa ating halimbawa d = 0,9801

Nangangahulugan ito na ang mga pagbabago sa mga gastos sa produkto A maaaring 98.01% na ipinaliwanag ng mga pagbabago sa kita.

Ang natitirang 1.99% ay maaaring magresulta mula sa:

1) hindi sapat na napiling paraan ng komunikasyon;

2) ang impluwensya ng anumang iba pang hindi natukoy na mga kadahilanan sa dependent variable.

Pagsusuri ng istatistika ng mga hypotheses.

Naglagay kami ng null hypothesis na ang regression coefficient ay hindi gaanong mahalaga sa istatistika:

H 0 : b = 0.

Ang statistical significance ng regression coefficient ay sinusuri gamit ang t-T-test ng mag-aaral. Upang gawin ito, tukuyin muna ang natitirang kabuuan ng mga parisukat

s 2 ost= å (y i – ŷ i) 2

s 2 ost = 1,3689.

at ang standard deviation nito

s = 0,39. se ( b ) = 0,018.

Tunay na halaga t-Pagsusulit ng mag-aaral para sa regression coefficient:

.

t b = 427,35.

Ang halaga |t b |>t cr (t cr =2.26 para sa 95% na antas ng kahalagahan) ay nagbibigay-daan sa amin upang makagawa ng isang konklusyon tungkol sa koepisyent ng regression na naiiba sa zero (sa katumbas na antas ng kahalagahan) at, samakatuwid, tungkol sa pagkakaroon ng isang impluwensya (koneksyon) X At u.

Konklusyon: tunay na halaga t-Ang t-test ng mag-aaral ay lumampas sa halaga ng talahanayan, na nangangahulugan na ang null hypothesis ay tinanggihan at may posibilidad na 95% ang alternatibong hypothesis tungkol sa statistical significance ng regression coefficient ay tinatanggap.

[b– t cr *se( b), b+ t cr *se( b)]- 95% agwat ng kumpiyansa para sa b.

Sinasaklaw ng confidence interval ang tunay na halaga ng parameter b na may ibinigay na posibilidad (sa kasong ito 95%).

7,6516 < b < 7,7329.

Magpatuloy tayo sa pagsuri sa istatistikal na kahalagahan ng mga coefficient ng ugnayan at pagpapasiya:

r = 0,990;

d = r 2 = 0,9801.

Naglagay kami ng null hypothesis na ang regression equation sa kabuuan ay hindi gaanong mahalaga sa istatistika:

H 0 : r 2 = 0.

Ang pagtatasa ng istatistikal na kahalagahan ng itinayong modelo ng regression sa kabuuan ay isinasagawa gamit ang F- Pamantayan ng mangingisda. Tunay na halaga F-criteria para sa isang paired regression equation linear sa mga parameter ay tinukoy bilang:

kung saan ang s 2 factor ay ang dispersion para sa theoretical values ŷ (ipinaliwanag ang pagkakaiba-iba);

s 2 pahinga - natitirang kabuuan ng mga parisukat;

r 2 - koepisyent ng pagpapasiya.

Tunay na halaga F- Pamantayan ng mangingisda:

F f = 443,26

Konklusyon: tinatanggihan namin ang null hypothesis at, na may posibilidad na 95%, tinatanggap ang alternatibong hypothesis tungkol sa statistical significance ng regression equation.

1. Ang kakanyahan ng pagsusuri ng ugnayan-regression at mga gawain nito.

2. Kahulugan ng regression at mga uri nito.

3. Mga tampok ng detalye ng modelo. Mga dahilan para sa pagkakaroon ng isang random variable.

4. Mga paraan para sa pagpili ng paired regression.

5. Pinakamababang parisukat na paraan.

6. Mga tagapagpahiwatig para sa pagsukat ng higpit at lakas ng koneksyon.

7. Mga pagtatantya ng istatistikal na kahalagahan.

8. Hinulaang halaga ng variable y at confidence intervals ng forecast.

1. Ang kakanyahan ng pagsusuri ng ugnayan-regression at mga gawain nito. Ang mga pang-ekonomiyang phenomena, na napaka-magkakaibang, ay nailalarawan sa pamamagitan ng maraming mga tampok na sumasalamin sa ilang mga katangian ng mga proseso at phenomena na ito at napapailalim sa magkakaugnay na mga pagbabago. Sa ilang mga kaso, ang ugnayan sa pagitan ng mga katangian ay lumalabas na napakalapit (halimbawa, ang oras-oras na output ng isang empleyado at ang kanyang suweldo), habang sa ibang mga kaso, ang gayong relasyon ay hindi ipinahayag o napakahina (halimbawa, ang kasarian ng mga mag-aaral at ang kanilang akademikong pagganap). Kung mas malapit ang koneksyon sa pagitan ng mga feature na ito, mas tumpak ang mga desisyong ginawa.

Mayroong dalawang uri ng dependencies sa pagitan ng phenomena at ng kanilang mga katangian:

    functional (deterministic, causal) dependence . Ito ay tinukoy sa anyo ng isang formula na nag-uugnay sa bawat halaga ng isang variable sa isang mahigpit na tinukoy na halaga ng isa pang variable (ang impluwensya ng mga random na kadahilanan ay napapabayaan). Sa ibang salita, functional dependence ay isang relasyon kung saan ang bawat halaga ng independent variable x ay tumutugma sa isang tiyak na tinukoy na halaga ng dependent variable y. Sa ekonomiya, ang mga functional na relasyon sa pagitan ng mga variable ay mga eksepsiyon sa pangkalahatang tuntunin;

    statistical (stochastic, non-deterministic) dependence – ito ay isang koneksyon ng mga variable, na naiimpluwensyahan ng mga random na kadahilanan, i.e. Ito ay isang relasyon kung saan ang bawat halaga ng independiyenteng variable x ay tumutugma sa isang hanay ng mga halaga ng umaasa na variable na y, at hindi alam nang maaga kung anong halaga ang kukunin ng y.

Ang isang espesyal na kaso ng statistical dependence ay correlation dependence.

Pagdepende sa ugnayan ay isang relasyon kung saan ang bawat halaga ng independent variable x ay tumutugma sa isang tiyak na mathematical expectation (average value) ng dependent variable na y.

Ang pag-asa sa ugnayan ay isang "hindi kumpleto" na pag-asa, na hindi lilitaw sa bawat indibidwal na kaso, ngunit sa mga average na halaga lamang para sa isang sapat na malaking bilang ng mga kaso. Halimbawa, alam na ang pagpapabuti ng mga kwalipikasyon ng isang empleyado ay humahantong sa pagtaas ng produktibidad ng paggawa. Ang pahayag na ito ay madalas na nakumpirma sa pagsasanay, ngunit hindi nangangahulugan na ang dalawa o higit pang mga manggagawa ng parehong kategorya/antas na nakikibahagi sa isang katulad na proseso ay magkakaroon ng parehong produktibidad sa paggawa.

Ang pag-asa sa ugnayan ay pinag-aaralan gamit ang mga pamamaraan ng pagsusuri ng ugnayan at regression.

Pagsusuri ng ugnayan at regression ay nagbibigay-daan sa iyo upang maitaguyod ang pagiging malapit, direksyon ng koneksyon at ang anyo ng koneksyon na ito sa pagitan ng mga variable, i.e. analytical expression nito.

Ang pangunahing gawain ng pagsusuri ng ugnayan binubuo ng quantitatively na pagtukoy sa lapit ng koneksyon sa pagitan ng dalawang katangian sa isang pairwise na koneksyon at sa pagitan ng epektibo at ilang factor na katangian sa isang multifactorial na koneksyon at istatistikal na pagtatasa ng pagiging maaasahan ng itinatag na koneksyon.

2. Kahulugan ng regression at mga uri nito. Ang pagsusuri ng regression ay ang pangunahing kasangkapan sa matematika at istatistika sa econometrics. Regression Nakaugalian na tawagan ang dependence ng average na halaga ng isang quantity (y) sa ilang ibang quantity o sa ilang quantity (x i).

Depende sa bilang ng mga kadahilanan na kasama sa equation ng regression, kaugalian na makilala sa pagitan ng simple (pares) at maramihang regression.

Simple (pairwise) regression ay isang modelo kung saan ang average na halaga ng dependent (ipinaliwanag) na variable na y ay itinuturing bilang isang function ng isang independent (explanatory) variable x. Implicitly, ang pairwise regression ay isang modelo ng form:

Tahasang:

,

kung saan ang a at b ay mga pagtatantya ng mga coefficient ng regression.

Maramihang pagbabalik ay isang modelo kung saan ang average na halaga ng umaasa (ipinaliwanag) na variable na y ay itinuturing bilang isang function ng ilang independiyenteng (nagpapaliwanag) na mga variable x 1, x 2, ... x n. Implicitly, ang pairwise regression ay isang modelo ng form:

.

Tahasang:

kung saan ang a at b 1, b 2, b n ay mga pagtatantya ng mga coefficient ng regression.

Ang isang halimbawa ng gayong modelo ay ang pagdepende sa suweldo ng isang empleyado sa kanyang edad, edukasyon, kwalipikasyon, haba ng serbisyo, industriya, atbp.

Tungkol sa anyo ng pagtitiwala, mayroong:

      linear regression;

      nonlinear regression, na ipinapalagay ang pagkakaroon ng mga nonlinear na relasyon sa pagitan ng mga salik na ipinahayag ng kaukulang nonlinear na function. Kadalasan, ang mga modelo na hindi linear sa hitsura ay maaaring bawasan sa isang linear na anyo, na nagpapahintulot sa kanila na mauri bilang linear.

3. Mga tampok ng detalye ng modelo. Mga dahilan para sa pagkakaroon ng isang random variable. Ang anumang pag-aaral sa ekonomiya ay nagsisimula sa mga pagtutukoy ng modelo , ibig sabihin. mula sa pagbabalangkas ng uri ng modelo, batay sa kaukulang teorya ng mga relasyon sa pagitan ng mga variable.

Una sa lahat, mula sa buong hanay ng mga salik na nakakaimpluwensya sa mabisang katangian, ito ay kinakailangan upang matukoy ang pinaka makabuluhang nakakaimpluwensya sa mga salik. Ang pairwise regression ay sapat kung mayroong dominanteng salik, na ginagamit bilang paliwanag na variable. Ang isang simpleng equation ng regression ay nagpapakilala sa relasyon sa pagitan ng dalawang variable, na nagpapakita ng sarili bilang isang tiyak na pattern sa karaniwan lamang para sa kabuuan ng mga obserbasyon. Sa equation ng regression, ang relasyon ng ugnayan ay kinakatawan sa anyo ng isang functional dependence, na ipinahayag ng kaukulang mathematical function. Sa halos bawat indibidwal na kaso, ang halaga y ay binubuo ng dalawang termino:

,

kung saan ang y ay ang aktwal na halaga ng nagresultang katangian;

– theoretical value ng resultang katangian, na natagpuan batay sa regression equation;

– isang random na variable na nagpapakilala sa paglihis ng tunay na halaga ng nagresultang katangian mula sa teoretikal na halaga na natagpuan gamit ang regression equation.

Random na halaga tinatawag ding kaguluhan. Kabilang dito ang impluwensya ng mga salik na hindi isinasaalang-alang sa modelo, mga random na error at mga tampok sa pagsukat. Ang pagkakaroon ng isang random na variable sa modelo ay nabuo ng tatlong mapagkukunan:

    detalye ng modelo,

    piling katangian ng pinagmumulan ng data,

    mga tampok ng pagsukat ng mga variable.

Kasama sa mga error sa pagtutukoy hindi lamang ang maling pagpili ng isang partikular na mathematical function, kundi pati na rin ang underestimation ng anumang makabuluhang salik sa regression equation (gamit ang paired regression sa halip na maramihan).

Kasama ng mga error sa pagtutukoy, maaaring mangyari ang mga error sa pag-sample, dahil kadalasang tinatalakay ng mananaliksik ang sample na data kapag nagtatatag ng mga pattern ng mga ugnayan sa pagitan ng mga katangian. Nagaganap din ang mga error sa pag-sample dahil sa heterogeneity ng data sa orihinal na populasyon ng istatistika, na kadalasang nangyayari kapag pinag-aaralan ang mga prosesong pang-ekonomiya. Kung ang populasyon ay heterogenous, ang equation ng regression ay walang praktikal na kahulugan. Upang makakuha ng isang mahusay na resulta, ang mga yunit na may mga maanomalyang halaga ng mga pinag-aralan na katangian ay karaniwang hindi kasama sa populasyon. Muli, ang mga resulta ng regression ay kumakatawan sa mga sample na katangian. Pinagmulan ng data

Gayunpaman, ang pinakamalaking panganib sa praktikal na paggamit ng mga pamamaraan ng regression ay ang mga error sa pagsukat. Kung ang mga error sa espesipikasyon ay maaaring mabawasan sa pamamagitan ng pagbabago ng anyo ng modelo (isang uri ng mathematical formula), at ang mga error sa pag-sample ay maaaring mabawasan sa pamamagitan ng pagtaas ng volume ng paunang data, kung gayon ang mga error sa pagsukat ay halos nagpapawalang-bisa sa lahat ng pagsisikap na mabilang ang ugnayan sa pagitan ng mga katangian.

4. Mga paraan para sa pagpili ng paired regression. Ipagpalagay na ang mga error sa pagsukat ay mababawasan, ang focus ng econometric na pananaliksik ay sa mga error sa detalye ng modelo. Sa pairwise regression, pagpili ng uri ng mathematical function
maaaring gawin sa tatlong paraan:

    graphic;

    analitikal, i.e. batay sa teorya ng relasyong pinag-aaralan;

    eksperimental.

Kapag pinag-aaralan ang ugnayan ng dalawang katangian graphic na pamamaraan ang pagpili ng uri ng regression equation ay medyo malinaw. Ito ay batay sa larangan ng ugnayan. Mga pangunahing uri ng kurba na ginagamit sa pagbibilang ng mga relasyon




Ang klase ng mga pag-andar ng matematika upang ilarawan ang ugnayan sa pagitan ng dalawang variable ay medyo malawak; ginagamit din ang iba pang mga uri ng mga kurba.

Paraan ng analitikal ang pagpili ng uri ng equation ng regression ay batay sa pag-aaral ng materyal na kalikasan ng koneksyon ng mga katangian na pinag-aaralan, pati na rin ang isang visual na pagtatasa ng likas na katangian ng koneksyon. Yung. kung pinag-uusapan natin ang Laffer curve, na nagpapakita ng kaugnayan sa pagitan ng pag-unlad ng buwis at mga kita sa badyet, kung gayon ang pinag-uusapan natin ay isang parabolic curve, at sa microanalysis, ang mga isoquants ay hyperbolas.

Pagkalat sa mga istatistika ay matatagpuan bilang ang mga indibidwal na halaga ng katangian na nakakuwadrado mula sa . Depende sa paunang data, natutukoy ito gamit ang simple at weighted variance formula:

1. (para sa hindi nakagrupong data) ay kinakalkula gamit ang formula:

2. Natimbang na pagkakaiba-iba (para sa serye ng variation):

kung saan ang n ay frequency (reatability ng factor X)

Isang halimbawa ng paghahanap ng pagkakaiba

Ang pahinang ito ay naglalarawan ng isang karaniwang halimbawa ng paghahanap ng pagkakaiba, maaari mo ring tingnan ang iba pang mga problema para sa paghahanap nito

Halimbawa 1. Ang sumusunod na data ay magagamit para sa isang pangkat ng 20 mga mag-aaral sa pagsusulatan. Kinakailangan na bumuo ng isang serye ng pagitan ng pamamahagi ng katangian, kalkulahin ang average na halaga ng katangian at pag-aralan ang pagpapakalat nito

Bumuo tayo ng interval grouping. Tukuyin natin ang hanay ng pagitan gamit ang formula:

kung saan ang X max ay ang pinakamataas na halaga ng katangian ng pagpapangkat;
X min – pinakamababang halaga ng katangian ng pagpapangkat;
n – bilang ng mga pagitan:

Tinatanggap namin ang n=5. Ang hakbang ay: h = (192 - 159)/ 5 = 6.6

Gumawa tayo ng interval grouping

Para sa karagdagang mga kalkulasyon, bubuo kami ng isang auxiliary table:

Ang X'i ay ang gitna ng pagitan. (halimbawa, ang gitna ng pagitan 159 – 165.6 = 162.3)

Tinutukoy namin ang average na taas ng mga mag-aaral gamit ang weighted arithmetic average formula:

Tukuyin natin ang pagkakaiba-iba gamit ang formula:

Ang dispersion formula ay maaaring mabago tulad ng sumusunod:

Mula sa formula na ito ay sinusundan iyon ang pagkakaiba ay katumbas ng ang pagkakaiba sa pagitan ng average ng mga parisukat ng mga pagpipilian at ang parisukat at ang average.

Pagpapakalat sa serye ng variation na may pantay na pagitan gamit ang paraan ng mga sandali ay maaaring kalkulahin sa sumusunod na paraan gamit ang pangalawang pag-aari ng pagpapakalat (paghahati sa lahat ng mga pagpipilian sa halaga ng pagitan). Pagtukoy sa pagkakaiba-iba, kinakalkula gamit ang paraan ng mga sandali, gamit ang sumusunod na formula ay hindi gaanong matrabaho:

kung saan ang i ay ang halaga ng pagitan;
Ang A ay isang maginoo na zero, kung saan ito ay maginhawa upang gamitin ang gitna ng agwat na may pinakamataas na dalas;
m1 ay ang parisukat ng unang pagkakasunud-sunod sandali;
m2 - sandali ng pangalawang pagkakasunud-sunod

(kung sa isang istatistikal na populasyon ang isang katangian ay nagbabago sa paraang mayroon lamang dalawang magkaparehong eksklusibong mga opsyon, kung gayon ang gayong pagkakaiba-iba ay tinatawag na alternatibo) ay maaaring kalkulahin gamit ang pormula:

Ang pagpapalit ng q = 1- p sa dispersion formula na ito, makuha natin ang:

Mga uri ng pagkakaiba-iba

Kabuuang pagkakaiba sinusukat ang pagkakaiba-iba ng isang katangian sa buong populasyon sa kabuuan sa ilalim ng impluwensya ng lahat ng salik na nagdudulot ng pagkakaiba-iba na ito. Ito ay katumbas ng ibig sabihin ng parisukat ng mga paglihis ng mga indibidwal na halaga ng isang katangiang x mula sa pangkalahatang mean na halaga ng x at maaaring tukuyin bilang simpleng pagkakaiba o timbang na pagkakaiba.

nagpapakilala ng random na pagkakaiba-iba, i.e. bahagi ng pagkakaiba-iba na dahil sa impluwensya ng hindi nabilang na mga salik at hindi nakadepende sa kadahilanan-katangian na nagiging batayan ng pangkat. Ang nasabing dispersion ay katumbas ng mean square ng mga deviations ng mga indibidwal na value ng attribute sa loob ng group X mula sa arithmetic mean ng grupo at maaaring kalkulahin bilang simpleng dispersion o bilang weighted dispersion.

kaya, mga hakbang sa pagkakaiba-iba sa loob ng pangkat pagkakaiba-iba ng isang katangian sa loob ng isang pangkat at tinutukoy ng formula:

kung saan ang xi ay ang average ng grupo;
ni ay ang bilang ng mga yunit sa pangkat.

Halimbawa, ang mga pagkakaiba-iba ng intragroup na kailangang matukoy sa gawain ng pag-aaral ng impluwensya ng mga kwalipikasyon ng mga manggagawa sa antas ng produktibidad ng paggawa sa isang workshop ay nagpapakita ng mga pagkakaiba-iba sa output sa bawat grupo na sanhi ng lahat ng posibleng mga kadahilanan (teknikal na kondisyon ng kagamitan, pagkakaroon ng mga kasangkapan at materyales, edad ng mga manggagawa, lakas ng paggawa, atbp.), maliban sa mga pagkakaiba sa kategorya ng kwalipikasyon (sa loob ng isang grupo ang lahat ng mga manggagawa ay may parehong mga kwalipikasyon).

Ang average ng mga pagkakaiba-iba sa loob ng pangkat ay nagpapakita ng random, ibig sabihin, ang bahaging iyon ng pagkakaiba-iba na naganap sa ilalim ng impluwensya ng lahat ng iba pang mga kadahilanan, maliban sa kadahilanan ng pagpapangkat. Kinakalkula ito gamit ang formula:

Nailalarawan ang sistematikong pagkakaiba-iba ng nagresultang katangian, na dahil sa impluwensya ng factor-sign na bumubuo sa batayan ng grupo. Ito ay katumbas ng ibig sabihin ng parisukat ng mga paglihis ng ibig sabihin ng pangkat mula sa pangkalahatang mean. Kinakalkula ang pagkakaiba-iba ng intergroup gamit ang formula:

Ang panuntunan para sa pagdaragdag ng pagkakaiba-iba sa mga istatistika

Ayon kay panuntunan para sa pagdaragdag ng mga pagkakaiba-iba ang kabuuang pagkakaiba ay katumbas ng kabuuan ng average ng mga pagkakaiba-iba sa loob ng pangkat at pagitan ng pangkat:

Ang kahulugan ng panuntunang ito ay ang kabuuang pagkakaiba-iba na lumitaw sa ilalim ng impluwensya ng lahat ng mga salik ay katumbas ng kabuuan ng mga pagkakaiba-iba na lumitaw sa ilalim ng impluwensya ng lahat ng iba pang mga salik at ang pagkakaiba-iba na lumitaw dahil sa pangkat na kadahilanan.

Gamit ang formula para sa pagdaragdag ng mga pagkakaiba-iba, matutukoy mo ang pangatlong hindi kilalang pagkakaiba-iba mula sa dalawang kilalang pagkakaiba-iba, at hatulan din ang lakas ng impluwensya ng katangian ng pagpapangkat.

Mga katangian ng pagpapakalat

1. Kung ang lahat ng mga halaga ng isang katangian ay nabawasan (nadagdagan) ng parehong pare-parehong halaga, kung gayon ang pagpapakalat ay hindi magbabago.
2. Kung ang lahat ng mga halaga ng isang katangian ay nabawasan (nadagdagan) ng parehong bilang ng beses n, kung gayon ang pagkakaiba ay naaayon sa pagbaba (pagtaas) ng n^2 beses.

Econometrics ay isang agham na nagbibigay ng isang quantitative expression ng interrelations ng economic phenomena at mga proseso. Sa ngayon, available online ang mga solusyon sa mga sumusunod na problema sa ekonometrika:

Correlation-regression na paraan ng pagsusuri

Nonparametric na mga sukat ng pagkakaugnay

Heteroscedasticity ng random na bahagi

Autocorrelation

  1. Autocorrelation ng mga antas ng serye ng oras. Pagsubok para sa autocorrelation sa pagbuo ng isang correlogram;

Econometric na pamamaraan para sa pagsasagawa ng ekspertong pananaliksik

  1. Gamit ang pagsusuri ng paraan ng pagkakaiba, subukan ang null hypothesis tungkol sa impluwensya ng isang salik sa kalidad ng isang bagay.

Ang resultang solusyon ay iniharap sa Word format. Kaagad pagkatapos ng solusyon mayroong isang link upang i-download ang template sa Excel, na ginagawang posible upang suriin ang lahat ng nakuha na mga tagapagpahiwatig. Kung ang gawain ay nangangailangan ng solusyon sa Excel, maaari mong gamitin ang mga istatistikal na function sa Excel.

Mga Bahagi ng Serye ng Oras

  1. Ang serbisyong Analytical Smoothing ay maaaring gamitin para sa analytical smoothing ng isang time series (sa isang tuwid na linya) at para sa paghahanap ng mga parameter ng trend equation. Upang gawin ito, kailangan mong tukuyin ang dami ng source data. Kung mayroong maraming data, maaari mo itong i-paste mula sa Excel.
  2. Pagkalkula ng mga parameter ng equation ng trend.
    Kapag pumipili ng uri ng pag-andar ng trend, maaari mong gamitin ang paraan ng finite difference. Kung ang pangkalahatang ugali ay ipinahayag ng isang pangalawang-order na parabola, pagkatapos ay makakakuha tayo ng pare-parehong may hangganan na pagkakaiba ng pangalawang pagkakasunud-sunod. Kung ang mga rate ng paglago ay humigit-kumulang pare-pareho, pagkatapos ay isang exponential function ay ginagamit para sa leveling.
    Kapag pumipili ng anyo ng isang equation, dapat kang magpatuloy mula sa dami ng magagamit na impormasyon. Kung mas maraming mga parameter ang nilalaman ng equation, mas maraming mga obserbasyon ang dapat magkaroon ng parehong antas ng pagiging maaasahan ng pagtatantya.
  3. Smoothing gamit ang moving average method. Gamit

Isara