TRABAHO NG KURSO

Paksa: Pagsusuri ng ugnayan

Panimula

1. Pagsusuri ng ugnayan

1.1 Ang konsepto ng ugnayan

1.2 Pangkalahatang pag-uuri ng mga ugnayan

1.3 Mga patlang ng ugnayan at ang layunin ng kanilang pagtatayo

1.4 Mga yugto ng pagsusuri ng ugnayan

1.5 Mga koepisyent ng ugnayan

1.6 Normalized Bravais-Pearson correlation coefficient

1.7 Koepisyent ng ugnayan ng ranggo ng Spearman

1.8 Mga pangunahing katangian ng mga coefficient ng ugnayan

1.9 Sinusuri ang kahalagahan ng mga koepisyent ng ugnayan

1.10 Mga kritikal na halaga ng coefficient ng ugnayan ng pares

2. Pagpaplano ng multivariate na eksperimento

2.1 Kondisyon ng problema

2.2 Pagpapasiya ng sentro ng plano (pangunahing antas) at ang antas ng pagkakaiba-iba ng mga salik

2.3 Pagbuo ng planning matrix

2.4 Sinusuri ang homogeneity ng dispersion at ang pantay na katumpakan ng mga sukat sa iba't ibang serye

2.5 Coefficients ng regression equation

2.6 Pagpapakalat ng reproducibility

2.7 Sinusuri ang kahalagahan ng mga coefficient ng equation ng regression

2.8 Sinusuri ang kasapatan ng equation ng regression

Konklusyon

Bibliograpiya

PANIMULA

Ang pagpaplano ng eksperimento ay isang matematikal at istatistikal na disiplina na nag-aaral ng mga pamamaraan ng rasyonal na organisasyon ng eksperimentong pananaliksik - mula sa pinakamainam na pagpili ng mga pinag-aralan na mga kadahilanan at ang pagpapasiya ng aktwal na plano ng eksperimento alinsunod sa layunin nito hanggang sa mga pamamaraan para sa pagsusuri ng mga resulta. Ang simula ng pagpaplano ng eksperimento ay inilatag ng mga gawa ng English statistician na si R. Fisher (1935), na nagbigay-diin na ang nakapangangatwiran na pagpaplano ng eksperimento ay nagbibigay ng hindi gaanong makabuluhang pakinabang sa katumpakan ng mga pagtatantya kaysa sa pinakamainam na pagproseso ng mga resulta ng pagsukat. Noong dekada 60 ng ika-20 siglo, lumitaw ang isang modernong teorya ng pagpaplano ng eksperimento. Ang mga pamamaraan nito ay malapit na nauugnay sa teorya ng approximation ng mga function at mathematical programming. Ang mga pinakamainam na plano ay binuo at ang kanilang mga ari-arian ay sinisiyasat para sa isang malawak na klase ng mga modelo.

Pagpaplano ng eksperimento - ang pagpili ng isang plano ng eksperimento na nakakatugon sa mga tinukoy na kinakailangan, isang hanay ng mga aksyon na naglalayong bumuo ng isang diskarte sa pag-eksperimento (mula sa pagkuha ng isang priori na impormasyon hanggang sa pagkuha ng isang magagamit na modelo ng matematika o pagtukoy ng mga pinakamainam na kondisyon). Ito ay isang may layuning kontrol ng eksperimento, na ipinatupad sa mga kondisyon ng hindi kumpletong kaalaman sa mekanismo ng hindi pangkaraniwang bagay na pinag-aaralan.

Sa proseso ng mga sukat, ang kasunod na pagproseso ng data, pati na rin ang pormalisasyon ng mga resulta sa anyo ng isang modelo ng matematika, ang mga error ay nangyayari at ang bahagi ng impormasyon na nilalaman sa orihinal na data ay nawala. Ang paggamit ng mga pamamaraan sa pagpaplano ng eksperimento ay ginagawang posible upang matukoy ang pagkakamali ng modelo ng matematika at hatulan ang kasapatan nito. Kung ang katumpakan ng modelo ay hindi sapat, kung gayon ang paggamit ng mga pamamaraan sa pagpaplano ng eksperimento ay ginagawang posible na gawing makabago ang modelo ng matematika na may karagdagang mga eksperimento nang hindi nawawala ang nakaraang impormasyon at sa minimal na gastos.

Ang layunin ng pagpaplano ng eksperimento ay upang mahanap ang mga naturang kundisyon at mga patakaran para sa pagsasagawa ng mga eksperimento kung saan posible na makakuha ng maaasahan at maaasahang impormasyon tungkol sa bagay na may pinakamababang gastos sa paggawa, pati na rin ipakita ang impormasyong ito sa isang compact at maginhawang anyo na may isang quantitative. pagtatasa ng katumpakan.

Kabilang sa mga pangunahing pamamaraan ng pagpaplano na ginamit sa iba't ibang yugto ng pag-aaral, ang mga sumusunod ay ginagamit:

Pagpaplano ng isang eksperimento sa screening, ang pangunahing kahulugan nito ay ang pagpili ng isang pangkat ng mga makabuluhang salik mula sa kabuuan ng mga salik na napapailalim sa karagdagang detalyadong pag-aaral;

Pagdidisenyo ng isang eksperimento para sa pagsusuri ng pagkakaiba, i.e. pagguhit ng mga plano para sa mga bagay na may husay na mga kadahilanan;

Pagpaplano ng eksperimento sa regression na nagbibigay-daan sa iyong makakuha ng mga modelo ng regression (polynomial at iba pa);

Pagpaplano ng isang matinding eksperimento, kung saan ang pangunahing gawain ay ang pang-eksperimentong pag-optimize ng bagay ng pag-aaral;

Pagpaplano sa pag-aaral ng mga dinamikong proseso, atbp.

Ang layunin ng pag-aaral ng disiplina ay upang ihanda ang mga mag-aaral para sa produksyon at teknikal na aktibidad sa espesyalidad gamit ang mga pamamaraan ng teorya ng pagpaplano at mga modernong teknolohiya ng impormasyon.

Mga layunin ng disiplina: ang pag-aaral ng mga modernong pamamaraan ng pagpaplano, pag-aayos at pag-optimize ng mga eksperimento sa siyensya at pang-industriya, pagsasagawa ng mga eksperimento at pagproseso ng mga resulta.

1. PAGSUSURI NG KORELASYON

1.1 Ang konsepto ng ugnayan

Madalas na interesado ang mananaliksik sa kung paano nauugnay ang dalawa o higit pang mga variable sa isa't isa sa isa o higit pa sa mga pinag-aralan na sample. Halimbawa, makakaapekto ba ang taas sa timbang ng isang tao, o makakaapekto ba ang pressure sa kalidad ng produkto?

Ang ganitong uri ng ugnayan sa pagitan ng mga variable ay tinatawag na ugnayan, o ugnayan. Ang isang ugnayan ay isang pare-parehong pagbabago sa dalawang tampok, na nagpapakita ng katotohanan na ang pagkakaiba-iba ng isang tampok ay naaayon sa pagkakaiba-iba ng isa pa.

Ito ay kilala, halimbawa, na sa karaniwan ay may positibong ugnayan sa pagitan ng taas ng mga tao at ng kanilang timbang, at kung gaano kalaki ang taas, mas malaki ang bigat ng isang tao. Gayunpaman, may mga pagbubukod sa panuntunang ito kapag ang mga medyo maikling tao ay sobra sa timbang, at, sa kabaligtaran, ang mga asthenic, na may mataas na paglaki, ay magaan. Ang dahilan para sa mga naturang pagbubukod ay ang bawat biyolohikal, pisyolohikal o sikolohikal na katangian ay tinutukoy ng impluwensya ng maraming mga kadahilanan: kapaligiran, genetic, panlipunan, ekolohikal, atbp.

Ang mga ugnayan ay mga probabilistikong pagbabago na maaari lamang pag-aralan sa mga kinatawan ng sample sa pamamagitan ng mga pamamaraan ng matematikal na istatistika. Ang parehong mga termino - ugnayan at pag-asa sa ugnayan - ay kadalasang ginagamit nang palitan. Ang pag-asa ay nangangahulugang impluwensya, koneksyon - anumang pinag-ugnay na pagbabago na maaaring ipaliwanag ng daan-daang dahilan. Ang mga ugnayan ay hindi maaaring ituring bilang katibayan ng isang sanhi na relasyon, ipinapahiwatig lamang nila na ang mga pagbabago sa isang tampok, bilang panuntunan, ay sinamahan ng ilang mga pagbabago sa isa pa.

Pag-asa sa ugnayan - Ito ang mga pagbabago na ginagawa ng mga halaga ng isang tampok sa posibilidad ng paglitaw ng iba't ibang mga halaga ng isa pang tampok.

Ang gawain ng pagsusuri ng ugnayan ay nabawasan sa pagtatatag ng direksyon (positibo o negatibo) at ang anyo (linear, non-linear) ng ugnayan sa pagitan ng iba't ibang mga tampok, pagsukat ng higpit nito, at, sa wakas, pagsuri sa antas ng kahalagahan ng nakuha na ugnayan. coefficients.

Ang mga ugnayan ay naiiba sa anyo, direksyon at antas (lakas) .

Ang hugis ng ugnayan ay maaaring rectilinear o curvilinear. Halimbawa, ang ugnayan sa pagitan ng bilang ng mga sesyon ng pagsasanay sa simulator at ang bilang ng mga tamang nalutas na problema sa control session ay maaaring maging diretso. Ang curvilinear ay maaaring, halimbawa, ang kaugnayan sa pagitan ng antas ng pagganyak at ang pagiging epektibo ng gawain (Larawan 1). Sa pagtaas ng pagganyak, ang kahusayan ng gawain ay unang tumataas, pagkatapos ay naabot ang pinakamainam na antas ng pagganyak, na tumutugma sa pinakamataas na kahusayan ng gawain; ang karagdagang pagtaas sa pagganyak ay sinamahan ng pagbaba ng kahusayan.

Figure 1 - Ang kaugnayan sa pagitan ng pagiging epektibo ng paglutas ng problema at ang lakas ng motivational tendency

Sa direksyon, ang ugnayan ay maaaring positibo ("direkta") at negatibo ("reverse"). Sa isang positibong ugnayan ng tuwid na linya, ang mas mataas na mga halaga ng isang katangian ay tumutugma sa mas mataas na mga halaga ng isa pa, at ang mas mababang mga halaga ng isang katangian ay tumutugma sa mga mababang halaga ng isa pa (Larawan 2). Sa isang negatibong ugnayan, ang mga ratio ay nababaligtad (Larawan 3). Sa isang positibong ugnayan, ang koepisyent ng ugnayan ay may positibong tanda, na may negatibong ugnayan - isang negatibong tanda.

Figure 2 - Direktang ugnayan

Figure 3 - Baliktad na ugnayan


Figure 4 - Walang ugnayan

Ang antas, lakas o higpit ng ugnayan ay tinutukoy ng halaga ng koepisyent ng ugnayan. Ang lakas ng koneksyon ay hindi nakasalalay sa direksyon nito at tinutukoy ng ganap na halaga ng koepisyent ng ugnayan.

1.2 Pangkalahatang pag-uuri ng mga ugnayan

Depende sa koepisyent ng ugnayan, ang mga sumusunod na ugnayan ay nakikilala:

Malakas o malapit sa correlation coefficient r>0.70;

Katamtaman (sa 0.50

Katamtaman (sa 0.30

Mahina (sa 0.20

Napakahina (sa r<0,19).

1.3 Mga patlang ng ugnayan at ang layunin ng kanilang pagtatayo

Ang ugnayan ay pinag-aralan batay sa pang-eksperimentong data, na kung saan ay ang mga sinusukat na halaga (x i , y i) ng dalawang tampok. Kung mayroong maliit na pang-eksperimentong data, ang dalawang-dimensional na empirikal na pamamahagi ay kinakatawan bilang isang dobleng serye ng mga halaga ng x i at y i. Sa kasong ito, ang ugnayan sa pagitan ng mga tampok ay maaaring ilarawan sa iba't ibang paraan. Ang pagsusulatan sa pagitan ng isang argumento at isang function ay maaaring ibigay ng isang talahanayan, formula, graph, atbp.

Ang pagsusuri ng ugnayan, tulad ng iba pang mga istatistikal na pamamaraan, ay batay sa paggamit ng mga probabilistikong modelo na naglalarawan sa pag-uugali ng mga pinag-aralan na tampok sa isang tiyak na pangkalahatang populasyon, kung saan nakuha ang mga pang-eksperimentong halaga x i at y i. Kapag ang ugnayan sa pagitan ng mga quantitative na katangian, ang mga halaga nito ay maaaring tumpak na masukat sa mga yunit ng panukat na kaliskis (metro, segundo, kilo, atbp.), Ang modelo ng isang dalawang-dimensional na karaniwang ipinamamahaging pangkalahatang populasyon ay napakadalas. pinagtibay. Ang ganitong modelo ay nagpapakita ng ugnayan sa pagitan ng mga variable x i at y i bilang isang locus ng mga puntos sa isang rectangular coordinate system. Ang graphical na dependence na ito ay tinatawag ding scatterplot o correlation field.
Ang modelong ito ng isang two-dimensional na normal na distribution (correlation field) ay nagbibigay-daan sa iyong magbigay ng visual graphical na interpretasyon ng correlation coefficient, dahil ang pamamahagi sa pinagsama-samang pamamahagi ay nakasalalay sa limang mga parameter: μ x , μ y - average na mga halaga (mga inaasahan sa matematika); Ang σ x ,σ y ay ang standard deviations ng random variables X at Y at p ay ang correlation coefficient, na isang sukatan ng relasyon sa pagitan ng random variables X at Y.
Kung p \u003d 0, kung gayon ang mga halaga, x i, y i, na nakuha mula sa isang dalawang-dimensional na normal na hanay, ay matatagpuan sa graph sa x, y na mga coordinate sa loob ng lugar na nalilimitahan ng isang bilog (Larawan 5, a). Sa kasong ito, walang ugnayan sa pagitan ng mga random na variable X at Y at ang mga ito ay tinatawag na uncorrelated. Para sa isang dalawang-dimensional na normal na distribusyon, ang kawalan ng pagkakaugnay ay nangangahulugan ng kasabay na kalayaan ng mga random na variable na X at Y.

Isa itong value na maaaring mag-iba mula sa +1 hanggang -1. Sa kaso ng isang kumpletong positibong ugnayan, ang koepisyent na ito ay katumbas ng plus 1 (sinasabi nila na sa pagtaas ng halaga ng isang variable, tumataas ang halaga ng isa pang variable), at may kumpletong negatibo - minus 1 (ipahiwatig ang feedback, i.e. Sa pagtaas ng mga halaga ng isang variable, bumababa ang mga halaga ng isa pa).

Dependence graph ng pagkamahihiyain at depresyon. Tulad ng nakikita mo, ang mga tuldok (mga paksa) ay hindi matatagpuan nang random, ngunit pumila sa paligid ng isang linya, at, sa pagtingin sa linyang ito, maaari nating sabihin na mas mataas ang pagkamahiyain ay ipinahayag sa isang tao, mas depressive, i.e. ang mga phenomena na ito. ay magkakaugnay.

Hal 2: Graph para sa Mahiyain at Sociability. Nakikita natin na habang tumataas ang pagkamahiyain, bumababa ang pakikisalamuha. Ang kanilang correlation coefficient ay 0.43. Kaya, ang isang koepisyent ng ugnayan na mas malaki mula 0 hanggang 1 ay nagpapahiwatig ng isang direktang proporsyonal na relasyon (mas marami ... mas marami ...), at isang koepisyent mula -1 hanggang 0 ay nagpapahiwatig ng isang inversely proporsyonal na relasyon (mas marami ... mas mababa . ..)

Kung ang koepisyent ng ugnayan ay 0, ang parehong mga variable ay ganap na independyente sa bawat isa.

ugnayan- ito ay isang relasyon kung saan ang epekto ng mga indibidwal na salik ay lumilitaw lamang bilang isang trend (sa karaniwan) na may mass observation ng aktwal na data. Ang mga halimbawa ng pag-asa sa ugnayan ay maaaring ang pag-asa sa pagitan ng laki ng mga ari-arian ng bangko at ang halaga ng tubo ng bangko, ang paglago ng produktibidad ng paggawa at ang haba ng serbisyo ng mga empleyado.

Dalawang sistema ng pag-uuri ng mga ugnayan ayon sa kanilang lakas ang ginagamit: pangkalahatan at partikular.

Pangkalahatang pag-uuri ng mga ugnayan:

1) malakas, o malapit sa isang koepisyent ng ugnayan r > 0.70;

2) average sa 0.50< r < 0,69;

3) katamtaman sa 0.30< r < 0,49;

4) mahina sa 0.20< r < 0,29;5) очень слабая при r < 0,19.

Pribadong pag-uuri ng mga ugnayan:

1) mataas na makabuluhang ugnayan sa r na tumutugma sa antas ng istatistikal na kahalagahan ρ ≤ 0.01

2) makabuluhang ugnayan sa r na tumutugma sa antas ng istatistikal na kahalagahan ρ ≤ 0.05;

3) ang takbo ng isang makabuluhang relasyon sa r na tumutugma sa antas ng istatistikal na kahalagahan ρ ≤ 0.10;

4) hindi gaanong ugnayan sa r hindi umabot sa antas ng istatistikal na kahalagahan. Hindi magkatugma ang dalawang klasipikasyong ito.

Ang una ay nakatuon lamang sa halaga ng koepisyent ng ugnayan, at tinutukoy ng pangalawa kung anong antas ng kahalagahan ang naabot ng ibinigay na halaga ng koepisyent ng ugnayan para sa isang ibinigay na laki ng sample. Kung mas malaki ang sample size, mas mababa ang value ng correlation coefficient ay sapat para makilala ang correlation bilang maaasahan. Bilang isang resulta, na may maliit na sukat ng sample, maaaring lumabas na ang isang malakas na ugnayan ay hindi maaasahan. Kasabay nito, na may malalaking sukat ng sample, kahit na ang mahinang ugnayan ay maaaring maging makabuluhan. Karaniwang tinatanggap na tumuon sa pangalawang pag-uuri, dahil isinasaalang-alang nito ang laki ng sample. Gayunpaman, dapat tandaan na ang isang malakas, o mataas, ugnayan ay isang ugnayan na may r > 0.70, at hindi lamang isang ugnayan ng isang mataas na antas ng kahalagahan.


Inililista ng sumusunod na talahanayan ang mga pangalan ng mga koepisyent ng ugnayan para sa iba't ibang uri ng mga kaliskis.

Dichotomous scale (1/0) Ranggo (ordinal) na sukat
Dichotomous scale (1/0) Pearson's association coefficient, Pearson's four-cell conjugation coefficient. Biserial na ugnayan
Ranggo (ordinal) na sukat Rank-biserial correlation. Ang koepisyent ng ugnayan ng ranggo ng Spearman o Kendall.
Interval at ganap na sukat Biserial na ugnayan Ang mga halaga ng sukat ng agwat ay na-convert sa mga ranggo at ginagamit ang koepisyent ng ranggo Pearson correlation coefficient (linear correlation coefficient)

Sa r= 0 walang linear na ugnayan. Sa kasong ito, ang pangkat na paraan ng mga variable ay nag-tutugma sa kanilang pangkalahatang paraan, at ang mga linya ng regression ay kahanay sa mga coordinate axes.

Pagkakapantay-pantay r= 0 nagsasalita lamang ng kawalan ng isang linear correlation dependence (uncorrelated variables), ngunit hindi sa pangkalahatan tungkol sa kawalan ng isang correlation, at higit pa kaya, isang statistical dependence.

Minsan ang konklusyon na walang ugnayan ay mas mahalaga kaysa sa pagkakaroon ng isang malakas na ugnayan. Ang isang zero na ugnayan ng dalawang variable ay maaaring magpahiwatig na walang impluwensya ng isang variable sa isa pa, basta't pinagkakatiwalaan namin ang mga resulta ng mga sukat.

Sa SPSS: 11.3.2 Mga koepisyent ng ugnayan

Hanggang ngayon, nalaman lamang namin ang mismong katotohanan ng pagkakaroon ng istatistikal na relasyon sa pagitan ng dalawang tampok. Susunod, susubukan naming malaman kung anong mga konklusyon ang maaaring makuha tungkol sa lakas o kahinaan ng pag-asa na ito, pati na rin ang tungkol sa anyo at direksyon nito. Ang mga pamantayan para sa pagsukat ng ugnayan sa pagitan ng mga variable ay tinatawag na coefficient ng ugnayan o mga sukat ng pagkakakonekta. Ang dalawang variable ay positibong magkakaugnay kung mayroong direktang, unidirectional na relasyon sa pagitan nila. Sa isang unidirectional na relasyon, ang mga maliliit na halaga ng isang variable ay tumutugma sa maliliit na halaga ng iba pang variable, ang mga malalaking halaga ay tumutugma sa mga malalaking halaga. Ang dalawang variable ay negatibong nauugnay kung mayroong isang kabaligtaran na relasyon sa pagitan ng mga ito. Sa isang multidirectional na relasyon, ang mga maliliit na halaga ng isang variable ay tumutugma sa malalaking halaga ng iba pang variable at vice versa. Ang mga halaga ng mga coefficient ng ugnayan ay palaging nasa hanay mula -1 hanggang +1.

Bilang koepisyent ng ugnayan sa pagitan ng mga variable na kabilang sa ordinal na sukat, ginagamit ang koepisyent ng Spearman, at para sa mga variable na kabilang sa sukat ng agwat, ang coefficient ng ugnayan ng Pearson (sandali ng mga produkto). Sa kasong ito, dapat tandaan na ang bawat dichotomous variable, iyon ay, isang variable na kabilang sa nominal scale at may dalawang kategorya, ay maaaring ituring na ordinal.

Una, susuriin natin kung mayroong ugnayan sa pagitan ng mga variable ng sex at psyche mula sa studyum.sav file. Sa paggawa nito, isinasaalang-alang namin na ang dichotomous variable sex ay maaaring ituring na isang ordinal variable.

Gawin ang sumusunod:

· Pumili mula sa command menu na Pag-aralan (Pagsusuri) Descriptive Statistics (Descriptive statistics) Crosstabs. (Mga talahanayan ng contingency)

· Ilipat ang variable na kasarian sa isang listahan ng mga row at ang variable na psyche sa isang listahan ng mga column.

· I-click ang Statistics... button. Sa Crosstabs: Statistics dialog, lagyan ng check ang Correlations box. Kumpirmahin ang iyong pinili gamit ang button na Magpatuloy.

· Sa dialog ng Crosstabs, ihinto ang pagpapakita ng mga talahanayan sa pamamagitan ng paglalagay ng check sa checkbox na Supress tables. I-click ang OK button.

Ang ugnayan ay ang antas ng koneksyon sa pagitan ng 2 o higit pang independiyenteng phenomena.

Maaaring positibo o negatibo ang ugnayan.

Positibong ugnayan (direkta) nangyayari kapag ang 2 variable ay nagbabago nang sabay-sabay sa parehong direksyon (positibo o negatibo). Halimbawa, ang kaugnayan sa pagitan ng bilang ng mga user na pumupunta sa site mula sa mga resulta ng paghahanap at ang pag-load sa server: mas maraming user, mas malaki ang load.

Ang ugnayan ay negatibo (kabaligtaran) kung ang pagbabago sa isang dami ay nagdudulot ng kabaligtaran na pagbabago sa isa pa. Halimbawa, sa pagtaas ng pasanin sa buwis sa mga kumpanya, bumababa ang kanilang kita. Ang mas maraming buwis, mas kaunting pera para sa pagpapaunlad.

Ang pagiging epektibo ng correlation bilang isang statistical tool ay nakasalalay sa kakayahang ipahayag ang relasyon sa pagitan ng dalawang variable gamit ang correlation coefficient.

Ang correlation coefficient (CC) ay nasa hanay ng mga numero mula -1 hanggang 1.

Kapag ang halaga ng QC ay katumbas ng 1, dapat itong maunawaan na sa bawat pagbabago sa 1st variable, isang katumbas na pagbabago sa 2nd variable ay nangyayari sa parehong direksyon.


Kung ang halaga ng QC ay -1, kung gayon sa bawat pagbabago ay mayroong katumbas na pagbabago sa pangalawang variable sa kabaligtaran na direksyon.


Kung mas malapit ang ugnayan sa -1 o 1, mas malakas ang ugnayan sa pagitan ng mga variable. Sa halagang zero (o malapit sa 0), walang makabuluhang ugnayan sa pagitan ng 2 variable o napakaliit.

Ang pamamaraang ito ng pagproseso ng istatistikal na impormasyon ay popular sa pang-ekonomiya, teknikal, panlipunan at iba pang mga agham dahil sa pagiging simple ng pagkalkula ng QC, ang kadalian ng pagbibigay-kahulugan sa mga resulta at ang kawalan ng pangangailangan para sa mataas na antas ng matematika.

Ang ugnayan ay sumasalamin lamang sa ugnayan sa pagitan ng mga variable at hindi nagsasalita ng sanhi: ang isang positibo o negatibong ugnayan sa pagitan ng 2 mga variable ay hindi nangangahulugang ang isang pagbabago sa isang variable ay nagdudulot ng pagbabago sa isa pa.

Halimbawa, mayroong isang positibong ugnayan sa pagitan ng pagtaas ng suweldo ng mga tagapamahala ng benta at ang kalidad ng trabaho sa mga kliyente (pagpapabuti ng kalidad ng serbisyo, pagtatrabaho sa mga pagtutol, pag-alam sa mga positibong katangian ng produkto kumpara sa mga kakumpitensya) na may naaangkop na pagganyak ng kawani. Ang tumaas na dami ng mga benta, at dahil dito ang mga suweldo ng mga tagapamahala, ay hindi nangangahulugan na ang mga tagapamahala ay napabuti ang kalidad ng trabaho sa mga kliyente. Malamang na ang malalaking order ay hindi sinasadyang dumating at naipadala, o tinaasan ng departamento ng marketing ang badyet sa advertising, o iba pa ang nangyari.

Marahil mayroong ilang ikatlong variable na nakakaapekto sa dahilan ng pagkakaroon o kawalan ng isang ugnayan.

Ang koepisyent ng ugnayan ay hindi kinakalkula:

  • kapag ang relasyon sa pagitan ng dalawang variable ay hindi linear, tulad ng quadratic;
  • mayroong higit sa 1 obserbasyon para sa bawat kaso sa data;
  • may mga maanomalyang obserbasyon (outlier, "renegades");
  • ang data ay naglalaman ng mga natatanging subgroup ng mga obserbasyon.

Ang koepisyent ng ugnayan ay ang antas ng pagkakaugnay sa pagitan ng dalawang variable. Ang pagkalkula nito ay nagbibigay ng ideya kung mayroong kaugnayan sa pagitan ng dalawang set ng data. Hindi tulad ng regression, hindi pinapayagan ng correlation ang paghula ng mga halaga. Gayunpaman, ang pagkalkula ng koepisyent ay isang mahalagang hakbang sa paunang pagsusuri sa istatistika. Halimbawa, nalaman namin na ang koepisyent ng ugnayan sa pagitan ng antas ng dayuhang direktang pamumuhunan at paglago ng GDP ay mataas. Nagbibigay ito sa atin ng ideya na upang matiyak ang kaunlaran, kinakailangan na lumikha ng isang paborableng klima partikular para sa mga dayuhang negosyante. Hindi masyadong halatang konklusyon sa unang tingin!

Kaugnayan at sanhi

Marahil ay walang isang lugar ng mga istatistika na magiging matatag na maitatag sa ating buhay. Ang koepisyent ng ugnayan ay ginagamit sa lahat ng lugar ng kaalaman ng publiko. Ang pangunahing panganib nito ay nakasalalay sa katotohanan na madalas na ang mataas na halaga nito ay haka-haka upang kumbinsihin ang mga tao at maniwala sila sa ilang mga konklusyon. Gayunpaman, sa katunayan, ang isang malakas na ugnayan ay hindi talaga nagpapahiwatig ng isang sanhi ng relasyon sa pagitan ng mga dami.

Coefficient ng ugnayan: Pearson at Spearman formula

Mayroong ilang mga pangunahing tagapagpahiwatig na nagpapakilala sa relasyon sa pagitan ng dalawang variable. Sa kasaysayan, ang una ay ang linear correlation coefficient ni Pearson. Ito ay ipinasa sa paaralan. Ito ay binuo nina K. Pearson at J. Yule batay sa gawa ni Fr. Galton. Nagbibigay-daan sa iyo ang coefficient na ito na makita ang ugnayan sa pagitan ng mga makatwirang numero na nagbabago nang makatwiran. Ito ay palaging mas malaki sa -1 at mas mababa sa 1. Ang isang negatibong numero ay nagpapahiwatig ng isang inversely proportional na relasyon. Kung ang koepisyent ay zero, kung gayon walang kaugnayan sa pagitan ng mga variable. Katumbas ng positibong numero - mayroong direktang proporsyonal na relasyon sa pagitan ng mga pinag-aralan na dami. Ginagawang posible ng rank correlation coefficient ng Spearman na pasimplehin ang mga kalkulasyon sa pamamagitan ng pagbuo ng hierarchy ng mga variable na halaga.

Mga ugnayan sa pagitan ng mga variable

Nakakatulong ang ugnayan sa pagsagot sa dalawang tanong. Una, kung ang relasyon sa pagitan ng mga variable ay positibo o negatibo. Pangalawa, gaano kalakas ang addiction. Ang pagsusuri ng ugnayan ay isang makapangyarihang kasangkapan upang makuha ang mahalagang impormasyong ito. Madaling makita na ang mga kita at gastos ng sambahayan ay tumaas at bumaba nang proporsyonal. Ang ganitong relasyon ay itinuturing na positibo. Sa kabaligtaran, kapag tumaas ang presyo ng isang produkto, bumababa ang demand para dito. Ang ganitong relasyon ay tinatawag na negatibo. Ang mga halaga ng koepisyent ng ugnayan ay nasa pagitan ng -1 at 1. Ang zero ay nangangahulugan na walang kaugnayan sa pagitan ng mga pinag-aralan na halaga. Kung mas malapit ang indicator sa mga extreme value, mas malakas ang relasyon (negatibo o positibo). Ang kawalan ng pag-asa ay pinatunayan ng isang koepisyent mula -0.1 hanggang 0.1. Dapat itong maunawaan na ang naturang halaga ay nagpapahiwatig lamang ng kawalan ng isang linear na relasyon.

Mga tampok ng application

Ang paggamit ng parehong mga tagapagpahiwatig ay napapailalim sa ilang mga pagpapalagay. Una, ang pagkakaroon ng isang malakas na relasyon ay hindi tumutukoy sa katotohanan na ang isang halaga ay tumutukoy sa isa pa. Maaaring may pangatlong dami na tumutukoy sa bawat isa sa kanila. Pangalawa, ang isang mataas na koepisyent ng ugnayan ng Pearson ay hindi nagpapahiwatig ng isang sanhi ng kaugnayan sa pagitan ng mga pinag-aralan na variable. Pangatlo, nagpapakita ito ng eksklusibong linear na relasyon. Maaaring gamitin ang ugnayan upang suriin ang makabuluhang dami ng data (hal. barometric pressure, air temperature) sa halip na mga kategorya tulad ng kasarian o paboritong kulay.

Multiple correlation coefficient

Sinisiyasat nina Pearson at Spearman ang kaugnayan sa pagitan ng dalawang variable. Ngunit ano ang gagawin kung mayroong tatlo o higit pa sa kanila. Dito pumapasok ang multiple correlation coefficient. Halimbawa, ang kabuuang pambansang produkto ay apektado hindi lamang ng dayuhang direktang pamumuhunan, kundi pati na rin ng mga patakaran sa pananalapi at pananalapi ng estado, pati na rin ang antas ng mga pag-export. Ang rate ng paglago at ang dami ng GDP ay resulta ng pakikipag-ugnayan ng ilang mga kadahilanan. Gayunpaman, dapat itong maunawaan na ang maramihang modelo ng ugnayan ay batay sa isang bilang ng mga pagpapasimple at pagpapalagay. Una, hindi kasama ang multicollinearity sa pagitan ng mga dami. Pangalawa, ang relasyon sa pagitan ng dependent variable at ng mga variable na nakakaapekto dito ay ipinapalagay na linear.

Mga lugar ng paggamit ng pagsusuri ng ugnayan at regression

Ang pamamaraang ito ng paghahanap ng ugnayan sa pagitan ng mga dami ay malawakang ginagamit sa mga istatistika. Ito ay madalas na ginagamit sa tatlong pangunahing mga kaso:

  1. Para sa pagsubok ng mga ugnayang sanhi sa pagitan ng mga halaga ng dalawang variable. Bilang resulta, umaasa ang mananaliksik na makahanap ng isang linear na relasyon at makakuha ng isang pormula na naglalarawan sa mga ugnayang ito sa pagitan ng mga dami. Maaaring magkaiba ang kanilang mga yunit ng pagsukat.
  2. Upang suriin ang isang relasyon sa pagitan ng mga halaga. Sa kasong ito, walang sinuman ang tumutukoy kung aling variable ang nakasalalay. Maaaring lumabas na ang halaga ng parehong dami ay tumutukoy sa ilang iba pang salik.
  3. Upang makakuha ng isang equation. Sa kasong ito, maaari mo lamang palitan ang mga numero dito at alamin ang mga halaga ng hindi kilalang variable.

Isang lalaking naghahanap ng isang sanhi na relasyon

Ang kamalayan ay inayos sa paraang tiyak na kailangan nating ipaliwanag ang mga pangyayaring nagaganap sa paligid. Ang isang tao ay laging naghahanap ng koneksyon sa pagitan ng larawan ng mundong kanyang ginagalawan at ng impormasyong kanyang natatanggap. Kadalasan ang utak ay lumilikha ng kaayusan dahil sa kaguluhan. Madali niyang makita ang isang sanhi na relasyon kung saan wala. Dapat na partikular na matutunan ng mga siyentipiko na malampasan ang kalakaran na ito. Ang kakayahang suriin ang mga relasyon sa pagitan ng data ay talagang mahalaga sa isang akademikong karera.

bias ng media

Isaalang-alang kung paano maaaring ma-misinterpret ang pagkakaroon ng isang ugnayan. Tinanong ang isang grupo ng mga mag-aaral na British na masama ang ugali kung naninigarilyo ang kanilang mga magulang. Pagkatapos ang pagsusulit ay inilathala sa pahayagan. Ang resulta ay nagpakita ng isang malakas na ugnayan sa pagitan ng paninigarilyo ng mga magulang at pagkadelingkuwensya ng kanilang mga anak. Ang propesor na nagsagawa ng pag-aaral na ito ay nagmungkahi pa na maglagay ng babala tungkol dito sa mga pakete ng sigarilyo. Gayunpaman, mayroong isang bilang ng mga problema sa konklusyon na ito. Una, hindi ipinapahiwatig ng ugnayan kung alin sa mga dami ang independyente. Samakatuwid, medyo posible na ipagpalagay na ang nakapipinsalang ugali ng mga magulang ay sanhi ng pagsuway ng mga bata. Pangalawa, imposibleng sabihin nang may katiyakan na ang parehong mga problema ay hindi lumitaw dahil sa ilang ikatlong kadahilanan. Halimbawa, ang mga pamilyang may mababang kita. Dapat pansinin ang emosyonal na aspeto ng mga paunang konklusyon ng propesor na nagsagawa ng pag-aaral. Siya ay isang masigasig na kalaban ng paninigarilyo. Kaya naman, hindi kataka-taka na sa ganitong paraan niya binigyang-kahulugan ang mga resulta ng kanyang pag-aaral.

natuklasan

Ang maling pagbibigay-kahulugan sa ugnayan bilang sanhi ng relasyon sa pagitan ng dalawang variable ay maaaring humantong sa mga nakakahiyang pagkakamali sa pananaliksik. Ang problema ay na ito ay namamalagi sa pinakasentro ng kamalayan ng tao. Maraming mga trick sa marketing ang nakabatay sa feature na ito. Ang pag-unawa sa pagkakaiba sa pagitan ng sanhi at ugnayan ay nagbibigay-daan sa iyong makatwirang pag-aralan ang impormasyon kapwa sa pang-araw-araw na buhay at sa iyong propesyonal na karera.

Pinapayagan ka ng pagsusuri ng regression na suriin kung paano nakasalalay ang isang variable sa isa pa at kung ano ang pagkalat ng mga halaga ng umaasa na variable sa paligid ng tuwid na linya na tumutukoy sa relasyon. Ginagawang posible ng mga pagtatantya na ito at ng kaukulang mga agwat ng kumpiyansa na mahulaan ang halaga ng dependent variable at matukoy ang katumpakan ng hulang ito.

Ang mga resulta ng pagsusuri ng regression ay maaari lamang ipakita sa isang medyo kumplikadong digital o graphical na anyo. Gayunpaman, madalas kaming interesado hindi sa paghula ng halaga ng isang variable mula sa halaga ng isa pa, ngunit sa simpleng pagkilala sa higpit (lakas) ng relasyon sa pagitan nila, habang ipinahayag bilang isang solong numero.

Ang katangiang ito ay tinatawag na correlation coefficient, ito ay karaniwang tinutukoy ng letrang r. Ang correlation coefficient ay maaaring

maaaring tumagal ng mga halaga mula -1 hanggang +1. Ang tanda ng koepisyent ng ugnayan ay nagpapakita ng direksyon ng koneksyon (direkta o kabaligtaran), at ang ganap na halaga ay nagpapakita ng kalapitan ng koneksyon. Ang isang koepisyent na katumbas ng -1 ay tumutukoy sa parehong matibay na koneksyon bilang katumbas ng 1. Sa kawalan ng isang koneksyon, ang koepisyent ng ugnayan ay zero.

Sa fig. Ang 8.10 ay nagpapakita ng mga halimbawa ng mga dependency at ang kanilang mga katumbas na halaga ng r. Isasaalang-alang namin ang dalawang coefficient ng ugnayan.

Ang koepisyent ng ugnayan ng Pearson ay inilaan upang ilarawan ang linear na relasyon ng dami ng mga katangian; tulad ng regression
ionic analysis, nangangailangan ito ng normal na pamamahagi. Kapag pinag-uusapan lang ng mga tao ang tungkol sa "correlation coefficient" halos palaging ibig sabihin ay ang correlation coefficient ni Pearson, at iyon mismo ang gagawin natin.

Maaaring gamitin ang rank correlation coefficient ng Spearman kapag ang relasyon ay hindi linear - at hindi lamang para sa quantitative, kundi pati na rin para sa mga ordinal na feature. Ito ay isang non-parametric na pamamaraan at hindi nangangailangan ng anumang partikular na uri ng pamamahagi.

Napag-usapan na natin ang tungkol sa quantitative, qualitative at ordinal features sa Chap. 5. Ang mga quantitative sign ay ordinaryong numerical data, tulad ng taas, timbang, temperatura. Ang mga halaga ng isang quantitative na katangian ay maaaring ihambing sa isa't isa at sabihin kung alin sa kanila ang mas malaki, kung gaano karami at kung gaano karaming beses. Halimbawa, kung ang isang Martian ay tumitimbang ng 15 g at ang isa ay 10, kung gayon ang una ay mas mabigat kaysa sa pangalawa at isa at kalahating beses at 5 g. kung gaano karaming beses. Sa gamot, ang mga ordinal na palatandaan ay karaniwan. Halimbawa, ang mga resulta ng vaginal Pap test ay sinusuri sa sumusunod na sukat: 1) normal, 2) mild dysplasia, 3) moderate dysplasia, 4) malubhang dysplasia, 5) cancer in situ. Parehong quantitative at ordinal na mga tampok ay maaaring isaayos sa pagkakasunud-sunod - isang malaking pangkat ng mga non-parametric na pamantayan ay batay sa pangkalahatang katangian na ito, na kinabibilangan ng Spearman rank correlation coefficient. Makikilala natin ang iba pang pamantayang hindi parametric sa Chap. sampu.

Pearson correlation coefficient

At gayon pa man, bakit hindi maaaring gamitin ang pagsusuri ng regression upang ilarawan ang higpit ng relasyon? Ang natitirang standard deviation ay maaaring gamitin bilang sukatan ng lapit ng relasyon. Gayunpaman, kung papalitan mo ang dependent at independent variable, ang natitirang standard deviation, tulad ng iba pang indicator ng regression analysis, ay magiging iba.

Tingnan natin ang fig. 8.11. Batay sa isang sample ng 10 Martian na kilala sa amin, dalawang linya ng regression ang ginawa. Sa isang kaso, ang timbang ay ang dependent variable, sa pangalawa ito ay ang independent variable. Ang mga linya ng pagbabalik ay kapansin-pansing naiiba



20

Kung palitan mo ang x at y, ang equation ng regression ay magkakaiba, ngunit ang koepisyent ng ugnayan ay mananatiling pareho.

pag-asa. Ito ay lumiliko na ang kaugnayan ng taas sa timbang ay isa, at ang timbang sa taas ay isa pa. Ang kawalaan ng simetrya ng pagsusuri ng regression ay kung ano ang pumipigil dito mula sa direktang paggamit upang makilala ang lakas ng isang relasyon. Ang koepisyent ng ugnayan, bagama't ang ideya nito ay nagmumula sa pagsusuri ng regression, ay libre mula sa pagkukulang na ito. Ipinakita namin ang formula.

rY(X - X)(Y - Y)

&((- X) S(y - Y)2"

kung saan ang X at Y ay ang mga average na halaga ng mga variable na X at Y. Ang expression para sa r ay "symmetrical" - pagpapalit ng X at Y, nakukuha namin ang parehong halaga. Ang koepisyent ng ugnayan ay tumatagal ng mga halaga mula -1 hanggang +1. Kung mas malapit ang relasyon, mas malaki ang ganap na halaga ng koepisyent ng ugnayan. Ang palatandaan ay nagpapakita ng direksyon ng koneksyon. Para sa r > 0, nagsasalita tayo ng direktang ugnayan (na may pagtaas sa isang variable, tumataas din ang isa), para sa r Kunin natin ang halimbawa sa 10 Martians, na napag-isipan na natin mula sa punto ng view ng regression analysis. Kalkulahin natin ang koepisyent ng ugnayan. Ang paunang data at mga intermediate na resulta ng mga kalkulasyon ay ibinibigay sa Talahanayan. 8.3. Laki ng sample n = 10, average na taas

X = £ X/n = 369/10 = 36.9 at timbang Y = £ Y/n = 103.8/10 = 10.38.

Nakita namin ang Shch-X)(Y-Y) = 99.9, Shch-X)2 = 224.8, £(Y - Y)2 = 51.9.

Palitan natin ang nakuha na mga halaga sa formula para sa koepisyent ng ugnayan:

224.8 x 51.9'"

Ang halaga ng r ay malapit sa 1, na nagpapahiwatig ng malapit na kaugnayan sa pagitan ng taas at timbang. Upang makakuha ng isang mas mahusay na ideya kung aling correlation coefficient ang dapat ituring na malaki at kung alin ang dapat ituring na hindi gaanong mahalaga, tingnan ang

Talahanayan 8.3. Pagkalkula ng koepisyent ng ugnayan
X Y X-X Y-Y (X-X)(Y-Y) (X-X)2 (Y-Y)2
31 7,8 -5,9 -2,6 15,3 34,8 6,8
32 8,3 -4,9 -2,1 10,3 24,0 4,4
33 7,6 -3,9 -2,8 10,9 15,2 7,8
34 9,1 -2,9 -1,3 3,8 8,4 1,7
35 9,6 -1,9 -0,8 1,5 3,6 0,6
35 9,8 -1,9 -0,6 1,1 3,6 0,4
40 11,8 3,1 1,4 4,3 9,6 2,0
41 12,1 4,1 1,7 7,0 16,8 2,9
42 14,7 5,1 4,3 22,0 26,0 18,5
46 13,0 9,1 2,6 23,7 82,8 6,8
369 103,8 0,0 0,2 99,9 224,8 51,9


ang mga nasa mesa. 8.4 - ipinapakita nito ang mga coefficient ng ugnayan para sa mga halimbawa na sinuri namin kanina.

Relasyon sa pagitan ng regression at correlation

Una naming ginamit ang lahat ng mga halimbawa ng mga coefficient ng ugnayan (Talahanayan 8.4) upang bumuo ng mga linya ng regression. Sa katunayan, mayroong malapit na kaugnayan sa pagitan ng koepisyent ng ugnayan at mga parameter ng pagsusuri ng regression, na ipapakita natin ngayon. Ang iba't ibang paraan ng pagpapakita ng koepisyent ng ugnayan, na makukuha natin sa kasong ito, ay magbibigay-daan sa amin upang mas maunawaan ang kahulugan ng tagapagpahiwatig na ito.

Alalahanin na ang equation ng regression ay ginawa sa paraang mabawasan ang kabuuan ng mga squared deviations mula sa linya ng regression.


Tinutukoy namin ang pinakamababang kabuuan ng mga parisukat sa pamamagitan ng S (ang halagang ito ay tinatawag na natitirang kabuuan ng mga parisukat). Ang kabuuan ng mga squared deviations ng mga halaga ng dependent variable Y mula sa mean Y nito ay ide-denote ng S^. Pagkatapos:

Ang halaga ng r2 ay tinatawag na coefficient of determination - ito ay simpleng parisukat ng correlation coefficient. Ang koepisyent ng pagpapasiya ay nagpapakita ng lakas ng koneksyon, ngunit hindi ang direksyon nito.

Mula sa formula sa itaas makikita na kung ang mga halaga ng dependent variable ay nakasalalay sa direktang regression, pagkatapos ay S = 0, at sa gayon ay r = +1 o r = -1, iyon ay, mayroong isang linear na relasyon sa pagitan ang dependent at independent variable. Anumang halaga ng independent variable ay maaaring tumpak na mahulaan ang halaga ng dependent variable. Sa kabaligtaran, kung ang mga variable ay hindi magkakaugnay, kung gayon ang Soci = SofSisi Pagkatapos r = 0.

Makikita rin na ang koepisyent ng determinasyon ay katumbas ng bahaging iyon ng kabuuang pagkakaiba S^, na sanhi o, gaya ng sinasabi nila, ipinaliwanag sa pamamagitan ng linear regression.

Ang natitirang kabuuan ng mga parisukat S ay nauugnay sa natitirang variance s2y\x ng ugnayang Socj = (n - 2) s^, at ang kabuuang kabuuan ng mga parisukat S^ sa variance s2 ng kaugnayan S^ = (n - 1 )s2 . Sa kasong ito

r2 = 1 _ n _ 2 sy\x n _1 sy

Ginagawang posible ng formula na ito na hatulan ang dependence ng correlation coefficient sa bahagi ng natitirang variance sa kabuuang variance

anim/s2y Kung mas maliit ang proporsyon na ito, mas malaki (sa ganap na halaga) ang koepisyent ng ugnayan, at kabaliktaran.

Nakita natin na ang koepisyent ng ugnayan ay sumasalamin sa higpit ng linear na relasyon ng mga variable. Gayunpaman, pagdating sa paghula ng halaga ng isang variable mula sa halaga ng isa pa,
ang koepisyent ng ugnayan ay hindi dapat masyadong umasa. Halimbawa, ang data sa Fig. Ang 8.7 ay tumutugma sa isang napakataas na koepisyent ng ugnayan (r = 0.92), ngunit ang lapad ng rehiyon ng kumpiyansa ay nagpapakita na ang kawalan ng katiyakan ng hula ay medyo makabuluhan. Samakatuwid, kahit na may malaking koepisyent ng ugnayan, siguraduhing kalkulahin ang hanay ng kumpiyansa.


At sa huli, binibigyan namin ang ratio ng koepisyent ng ugnayan at ang koepisyent ng slope ng direktang regression b:

kung saan ang b ay ang slope ng linya ng regression, ang sx at sY ay ang standard deviations ng mga variable.

Kung hindi natin isasaalang-alang ang case sx = 0, kung gayon ang correlation coefficient ay katumbas ng zero kung at kung b = 0 lamang. Gagamitin natin ngayon ang katotohanang ito upang matantya ang statistical significance ng correlation.

Istatistikong Kahalagahan ng Kaugnayan

Dahil ang b = 0 ay nagpapahiwatig ng r = 0, ang hypothesis ng walang ugnayan ay katumbas ng hypothesis ng zero slope ng direktang regression. Samakatuwid, upang masuri ang istatistikal na kahalagahan ng ugnayan, maaari nating gamitin ang kilalang formula para sa pagtatasa ng istatistikal na kahalagahan ng pagkakaiba sa pagitan ng b at zero:

Narito ang bilang ng mga antas ng kalayaan ay v = n - 2. Gayunpaman, kung ang koepisyent ng ugnayan ay nakalkula na, mas maginhawang gamitin ang formula:

Ang bilang ng mga antas ng kalayaan dito ay v = n - 2 din.

Sa panlabas na pagkakaiba-iba ng dalawang formula para sa t, sila ay magkapareho. Sa katunayan, mula sa kung ano


r 2 _ 1 - n_ 2 Sy]x_

Ang pagpapalit ng halaga ng sy^x sa formula para sa karaniwang error

Taba ng hayop at kanser sa suso

Sa mga eksperimento sa mga hayop sa laboratoryo, ipinakita na ang mataas na nilalaman ng taba ng hayop sa diyeta ay nagdaragdag ng panganib ng kanser sa suso. Ang pag-asa ba na ito ay sinusunod sa mga tao? Kinolekta ni K. Carroll ang data sa pagkonsumo ng mga taba ng hayop at dami ng namamatay mula sa kanser sa suso sa 39 na bansa. Ang resulta ay ipinapakita sa fig. 8.12A. Ang koepisyent ng ugnayan sa pagitan ng pagkonsumo ng mga taba ng hayop at dami ng namamatay mula sa kanser sa suso ay natagpuan na 0.90. Tantyahin natin ang istatistikal na kahalagahan ng ugnayan.

0,90 1 - 0,902 39 - 2

Ang kritikal na halaga ng t para sa bilang ng mga antas ng kalayaan v = 39 - 2 = 37 ay 3.574, na mas mababa kaysa sa nakuha namin. Kaya, sa antas ng kabuluhan na 0.001, maaari itong mapagtatalunan na mayroong ugnayan sa pagitan ng paggamit ng taba ng hayop at dami ng namamatay mula sa kanser sa suso.

Ngayon suriin natin kung ang dami ng namamatay ay nauugnay sa pagkonsumo ng mga taba ng gulay? Ang kaukulang data ay ipinapakita sa fig. 8.12B. Ang koepisyent ng ugnayan ay 0.15. Pagkatapos

1 - 0,152 39 - 2

Kahit na sa antas ng kahalagahan na 0.10, ang kinakalkula na halaga ng t ay mas mababa kaysa sa kritikal na halaga. Ang ugnayan ay hindi makabuluhan sa istatistika.


malapit na