Ang terminong "sample" ay may dobleng kahulugan. Ito ay parehong pamamaraan para sa pagpili ng mga elemento ng bagay na pinag-aaralan, at ang kabuuan ng mga elemento ng bagay na pinili para sa direktang pagsusuri.

Ang kabuuan ng lahat ng elemento ng object ng sociological research ay tinatawag na pangkalahatang populasyon. Ang bahagi ng populasyon na pinili para sa direktang pag-aaral ay tinukoy bilang sample na populasyon, na kung minsan ay tinatawag na sample. Ang sample ay magiging kinatawan (kinatawan) kung ito ay sumasalamin sa istraktura, mahahalagang katangian at katangian ng pangkalahatang populasyon, i.e. kumakatawan sa pinababang modelo nito.

Depende sa mga paraan ng pagpili ng mga yunit ng sample na populasyon, ang sample ay maaaring random o hindi random. Ang mga uri ng random na pagpili ay simpleng random o mechanical sampling, nested at stratified.

Ang batayan ng isang simpleng random (mekanikal) na sample ay isang listahan ng lahat ng potensyal na tumutugon na bumubuo sa pangkalahatang populasyon. Ang bawat isa sa kanila ay itinalaga ng isang serial number, na inilipat sa isang hiwalay na card, pagkatapos ay mula sa kabuuang bilang ng mga card na ito na may mga numero nang random, tulad ng sa isang lottery, ang kinakailangang numero ay pinili, na bubuo sa sample.

Kasama ng mga ipinahiwatig na paraan ng pagbuo ng sample na populasyon, ang sistematikong pagpili ay ginagamit din sa ganitong uri ng sample. Sa kasong ito, ang pagpili ng mga respondent ay ginawa sa pamamagitan ng isang tiyak na hakbang, na tinutukoy sa pamamagitan ng paghahati sa laki ng buong pangkalahatang populasyon sa laki ng sample na populasyon. Halimbawa, ang pangkalahatang populasyon ay 2 libong tao, at ang sample ay 200. Samakatuwid, ang hakbang sa pagpili ng mga respondente ay magiging 10. Ibig sabihin, bawat ikasampu ng pangkalahatang populasyon ay isasama sa sample. Kung ang pangkalahatang populasyon ay mas malaki pa, pagkatapos ay isang talahanayan ng mga random na numero ang ginagamit upang matukoy ang sample na populasyon.

Sa pagsasagawa ng sosyolohikal na pananaliksik, ang paraan ng nested na pagpili ay medyo karaniwan, na kinabibilangan ng pagpili bilang mga yunit ng pananaliksik hindi ng mga indibidwal na sumasagot, ngunit ng mga grupo ng mga tao (mga kolektibo ng trabaho, mga brigada), na sinusundan ng isang kumpletong survey sa kanila. Ang pagiging kinatawan ng nested sample ay sinisiguro ng pinakamataas na pagkakapareho ng komposisyon ng mga grupo.

Sa isang stratified sample, ang mga strata (mga layer) ay nakikilala sa pangkalahatang populasyon, na nailalarawan sa pamamagitan ng pinakamalaking homogeneity.

Sa loob ng bawat stratum, isinasagawa ang simpleng random (mechanical) sampling.

Ang non-random sampling ay batay sa isang malay at may layuning pagpili ng mga sample unit. Ito ay kinakatawan ng mga kusang pagpili at quota, pati na rin ang "basic array method".

Ang kusang pagpili ay ginagamit pangunahin sa mga pag-aaral ng piloto at kinabibilangan ng pagpili ng "first comer". Ang isang paglalarawan ng pamamaraang ito ay maaaring mga survey sa koreo ng mga mambabasa ng mga peryodiko o mga survey ng mga mamimili na bumili ng isang partikular na uri ng produkto. Dahil sa kasong ito ay mahirap masuri ang pagiging kinatawan ng sample, ang mga konklusyon ng pag-aaral ay nalalapat lamang sa populasyon na sinuri.

Ang pamamaraang "snowball" ay nabibilang din sa kusang pagpili, kapag ang paghahanap para sa ilang mga sumasagot ay isinasagawa sa prompt ng iba. Halimbawa, kinakailangang makapanayam ang 200 tao sa isang partikular na problema, ngunit sampung tao lamang ang mga address ng alam, sa prompt kung saan ang paghahanap para sa iba pang mga respondent ay nagpapatuloy hanggang sa maabot ang kinakailangang laki ng sample.

Para sa pagpapatupad ng pagpili ng quota, kailangan ang impormasyon sa ilang mga katangian ng pangkalahatang populasyon. Para sa bawat isa sa kanila, ang mga quota (bahagi, bahagi) ay pinagsama-sama, na sumasalamin sa isang tiyak na proporsyon ng lahat ng mga katangian ng pangkalahatang populasyon. Ang ganitong pagpili, halimbawa, ay isinasaalang-alang ang porsyento ng representasyon ng mga lalaki, ang kanilang edad, edukasyon, trabaho, katayuan sa pag-aasawa, etnisidad o kinabibilangang teritoryo, atbp.

Ang sample ng quota ay sadyang binuo ng mga tagapanayam bilang pagsunod sa mga parameter ng quota. Kapag lumilikha ng mga quota, ang pangunahing gawain para sa tagapanayam ay tiyakin na ang mga kundisyon para sa random na pagpili ay natutugunan, kung saan ang bawat elemento ng pangkalahatang populasyon ay magkakaroon ng pantay na pagkakataong mapabilang sa sample.

Ang pangunahing paraan ng array ay maginhawa sa mga pag-aaral ng piloto upang linawin ang anuman Katanungang Panseguridad. Kapag ginagamit ang paraang ito, ang laki ng sample ay 60-70% ng laki ng sample.

Sa mga pormasyon ng sample na populasyon mahalagang papel gumaganap ng kahulugan ng volume o numero nito. Ang laki ng sample ay tinutukoy ng antas ng homogeneity o heterogeneity ng pangkalahatang populasyon, ang bilang ng mga tampok na nagpapakilala dito. Kung mas homogenous ang komposisyon ng populasyon, mas maliit ang kinakailangang sukat ng sample.

Idinidikta ng uri ng sample ang mga detalye ng pagkalkula .. ng laki ng sample para sa bawat uri nito ayon sa ilang partikular na formula. Bilang isang tuntunin, ang laki ng sample, depende sa lalim ng pag-aaral, mga layunin at layunin nito, ay 5-10% ng pangkalahatang populasyon.

mga layunin sa pag-aaral

Malinaw na makilala ang mga konsepto ng census (kwalipikasyon) at sampling.
Alamin ang kakanyahan at pagkakasunud-sunod ng anim na yugto na ipinatupad ng mga mananaliksik upang makakuha ng sample na populasyon.
Tukuyin ang konsepto ng "sampling frame".
Ipaliwanag ang pagkakaiba sa pagitan ng probabilistic at deterministic sampling.
Tukuyin ang pagkakaiba sa pagitan ng fixed size sampling at multistage (consecutive) sampling.
Ipaliwanag kung ano ang sinasadyang sampling at ilarawan ang parehong mga kalakasan at kahinaan nito.
Tukuyin ang konsepto ng quota sampling.
Ipaliwanag kung ano ang isang parameter sa isang pamamaraan ng pagpili.
Ipaliwanag kung ano ang derived set.
Ipaliwanag kung bakit ang konsepto ng sampling distribution ay ang pinakamahalagang konsepto ng statistics.

Kaya, tiyak na tinukoy ng mananaliksik ang problema at sinigurado ang naaangkop na disenyo ng pananaliksik at mga tool sa pangongolekta ng data para sa paglutas nito. Ang susunod na hakbang sa proseso ng pananaliksik ay dapat na ang pagpili ng mga elementong iyon na susuriin. Posibleng suriin ang bawat elemento ng isang naibigay na populasyon sa pamamagitan ng paggawa ng kumpletong census ng populasyon na ito. Ang isang kumpletong survey ng populasyon ay tinatawag na census (kwalipikasyon). May isa pang posibilidad. Ang isang tiyak na bahagi ng populasyon, isang sample ng mga elemento ng isang malaking grupo, ay sumasailalim sa pagsusuri sa istatistika, at ayon sa data na nakuha sa subset na ito, ang ilang mga konklusyon ay iginuhit tungkol sa buong pangkat. Ang kakayahang gawing pangkalahatan ang mga resulta na nakuha mula sa sample na data sa isang malaking grupo ay depende sa paraan kung saan kinuha ang sample. Karamihan sa kabanatang ito ay ilalaan sa kung paano dapat iguhit ang sample at bakit.

Census (kwalipikasyon)
Kumpletuhin ang census ng populasyon (populasyon).
Sample
Isang koleksyon ng mga elemento ng isang subset ng mas malaking pangkat ng mga bagay.

Ang konsepto ng "populasyon" o "koleksiyon" ay maaaring tumukoy hindi lamang sa mga tao, kundi pati na rin sa mga kumpanyang nagpapatakbo sa industriya ng pagmamanupaktura, sa mga retailer o mamamakyaw, o maging sa ganap na walang buhay na mga bagay, tulad ng mga bahaging ginawa ng negosyo; ang konseptong ito ay tinukoy bilang ang buong hanay ng mga elemento na nakakatugon sa ilang partikular na kondisyon. Katangi-tanging tinutukoy ng mga kundisyong ito ang mga elementong kabilang sa target na pangkat at ang mga elementong dapat hindi isama sa pagsasaalang-alang.

Ang isang pag-aaral na naglalayong tukuyin ang demograpikong profile ng mga consumer ng frozen na pizza ay dapat magsimula sa pamamagitan ng pagtukoy kung sino ang dapat at hindi dapat iuri bilang ganoon. Kasama ba sa kategoryang ito ang mga taong nakasubok ng gayong pizza kahit isang beses? Mga indibidwal na bumibili ng hindi bababa sa isang pizza bawat buwan? Sa Linggo? Mga indibidwal na kumakain ng higit sa isang tiyak na minimum na halaga ng pizza sa isang buwan? Ang mananaliksik ay dapat maging tumpak sa pagtukoy ng target na grupo. Dapat ding mag-ingat upang matiyak na ang sample ay nakuha mula sa target na populasyon at hindi mula sa "ilang" populasyon, na kung saan ay ang kaso kapag ang sampling frame ay hindi sapat o hindi kumpleto. Ang huli ay isang listahan ng mga elemento kung saan bubuo ang isang tunay na sample.

Ang isang mananaliksik ay maaaring mas gusto ang isang sampling na diskarte sa isang survey ng buong populasyon para sa ilang mga kadahilanan. Una, ang isang kumpletong pagsusuri ng isang populasyon, kahit na medyo maliit ang sukat, ay nangangailangan ng napakalaking materyal at mga gastos sa oras. Kadalasan, sa oras na makumpleto ang census at maproseso ang data, luma na ang impormasyon. Sa ilang mga kaso, ang kwalipikasyon ay imposible lamang. Sabihin nating ang mga mananaliksik ay nagtakda upang suriin ang pagsunod sa aktwal na buhay ng serbisyo ng mga electric incandescent lamp sa kinakalkula, kung saan kailangan nilang panatilihin ang mga ito hanggang sa mabigo ang mga ito. Kung susuriin mo ang buong supply ng mga lamp sa ganitong paraan, ang maaasahang data ay makukuha, ngunit walang maipagbibili.

Sa wakas, sa labis na pagkamangha ng mga nagsisimula, maaaring mas gusto ng mananaliksik ang sampling kaysa census, na nagsusumikap para sa katumpakan ng mga resulta. Ang mga census ay nangangailangan ng pakikilahok malaking estado mga empleyado, na nagreresulta sa pagtaas ng posibilidad ng mga sistematikong (non-sampling) na mga error. Ang sitwasyong ito ay isa sa mga dahilan kung bakit gumagamit ang US Census Bureau ng mga sample na survey upang subukan ang katumpakan ng iba't ibang uri ng censuses. Tama ang nabasa mo: maaaring magsagawa ng mga sample na survey upang subukan ang katumpakan ng data ng kwalipikasyon.

Mga halimbawang hakbang sa disenyo

Sa fig. Ang Figure 15.1 ay nagpapakita ng anim na hakbang na pagkakasunud-sunod na maaaring sundin ng isang mananaliksik kapag nagdidisenyo ng isang sample. Una sa lahat, kailangang matukoy ang target na populasyon o hanay ng mga elemento kung saan may gustong malaman ang mananaliksik.

Halimbawa, kapag pinag-aaralan ang mga kagustuhan ng mga bata, kailangang magpasya ang mga mananaliksik kung ang target na populasyon ay bubuo ng mga bata lamang, mga magulang lamang, o pareho.

Pinagsama-sama (populasyon)
Isang hanay ng mga elemento na nakakatugon sa ilang partikular na kundisyon.
Sampling frame (base)
Ang listahan ng mga elemento kung saan gagawin ang pagpili; maaaring binubuo ng mga yunit ng teritoryo, organisasyon, tao at iba pang elemento.

Sinubukan ng isang partikular na kumpanya ang mga "karera" ng kuryente nito sa mga bata lamang. Ang mga bata ay lubos na nabighani. Iba ang reaksyon ng mga magulang sa bago. Hindi nagustuhan ng mga nanay ang katotohanan na ang pagsakay ay hindi nagtuturo sa mga bata na maging magiliw sa kotse, at ang mga ama ay hindi nagustuhan ang katotohanan na ang produkto ay ginawang parang laruan.
Posible rin ang baligtad na sitwasyon. Ang isang kumpanya ay naglunsad ng isang bagong produkto ng pagkain at naglunsad ng isang kampanya sa advertising sa buong bansa na nakatutok sa maagang umunlad na bata. Sinubukan lamang ng kompanya ang bisa ng mga patalastas sa mga ina na kinikilig. Ang mga bata, sa kabilang banda, ay natagpuan ang "pagpabilis" na ito, at kasama nito ang ina-advertise na produkto mismo, kasuklam-suklam. Natapos ang produkto 1 .

Dapat magpasya ang mananaliksik kung sino o kung ano ang bubuuin ng nauugnay na populasyon: mga indibidwal, pamilya, kumpanya, iba pang organisasyon, mga transaksyon sa credit card, atbp. Sa paggawa ng mga naturang desisyon, kinakailangan upang matukoy ang mga elemento na dapat ibukod sa mga populasyon. Ang parehong temporal at heograpikong sanggunian ng mga elemento ay dapat gawin, na sa ilang mga kaso ay maaaring sumailalim sa mga karagdagang kundisyon o paghihigpit. Halimbawa, kung pinag-uusapan natin ang tungkol sa mga indibidwal, ang gustong populasyon ay maaaring binubuo lamang ng mga taong higit sa 18 taong gulang, o ng mga babae lamang, o ng mga taong may hindi bababa sa sekondaryang edukasyon.

Ang gawain ng pagtukoy ng mga heograpikal na hangganan para sa target na populasyon sa internasyonal na pananaliksik sa marketing ay maaaring maging isang partikular na problema, dahil pinapataas nito ang heterogeneity ng system na isinasaalang-alang. Halimbawa, ang relatibong ratio ng mga urban at rural na lugar ay maaaring mag-iba nang malaki sa bawat bansa. Ang aspeto ng teritoryo ay may malubhang epekto sa komposisyon ng populasyon at sa loob ng parehong bansa. Halimbawa, sa hilaga ng Chile, ang populasyong nakararami sa mga Indian ay naninirahan nang maayos, habang sa katimugang mga rehiyon ng bansa, karamihan sa mga inapo ng mga Europeo ay naninirahan.

Saklaw (insidente)
Ang porsyento ng mga miyembro ng isang populasyon o grupo na nakakatugon sa mga kundisyon para sa pagsasama sa sample.

Sa pangkalahatan, mas simple ang tinukoy na target na populasyon, mas mataas ang saklaw nito (incidence) at mas madali at mas mura ang pamamaraan ng sampling. Saklaw (insidente) tumutugma sa proporsyon ng mga elemento ng isang populasyon o grupo, na ipinahayag bilang isang porsyento, na nakakatugon sa mga kondisyon para sa pagsasama sa sample. Ang saklaw ay direktang nakakaapekto sa oras at materyal na mga gastos na kinakailangan upang magsagawa ng isang survey. Kung malaki ang saklaw (i.e. karamihan ng ang mga elemento ng populasyon ay nakakatugon sa isa o higit pang simpleng pamantayan na ginamit upang matukoy ang mga potensyal na tumugon), ang oras at materyal na gastos na kinakailangan para sa pangongolekta ng data ay pinaliit. Sa kabaligtaran, sa pagtaas ng bilang ng mga pamantayan na dapat matugunan ng mga potensyal na respondente, parehong tumataas ang mga gastos sa materyal at oras.

Sa fig. Ipinapakita ng 15.2 ang proporsyon ng populasyon ng nasa hustong gulang na kasangkot sa ilang mga sports. Ang data sa figure ay nagpapahiwatig na mas mahirap at mahal na suriin ang mga taong sumasakay para sa pagmo-motorsiklo (3.6% lamang ng kabuuang bilang ng mga nasa hustong gulang) kaysa suriin ang mga taong regular na naglalakad sa libangan (27.4% ng kabuuang bilang ng mga matatanda). Ang pangunahing bagay ay ang mananaliksik ay maging tumpak sa pagtukoy kung aling mga elemento ang dapat isama sa populasyon ng pag-aaral at kung aling mga elemento ang dapat na hindi kasama dito. Ang isang malinaw na pahayag ng layunin ng pag-aaral ay lubos na nagpapadali sa solusyon ng problemang ito. Ang ikalawang hakbang sa proseso ng sampling ay upang matukoy ang sampling frame, na, tulad ng alam mo na, ay ang listahan ng mga elemento kung saan ang sample ay iguguhit. Hayaang ang target na populasyon ng isang partikular na pag-aaral ay ang lahat ng pamilyang naninirahan sa lugar ng Dallas. Sa unang tingin, ang direktoryo ng telepono ng Dallas ay maaaring isang mahusay at madaling ma-access na sampling frame. Gayunpaman, sa mas malapit na pagsusuri, nagiging malinaw na ang listahan ng mga pamilya na nakapaloob sa direktoryo ay hindi ganap na tama, dahil ang mga bilang ng ilang mga pamilya ay tinanggal dito (siyempre, hindi kasama ang mga pamilya na walang mga telepono), habang ilang pamilya ay may ilang numero ng telepono. Ang mga taong kamakailan ay nagbago ng kanilang lugar ng paninirahan at, nang naaayon, ang kanilang numero ng telepono, ay wala rin sa direktoryo.

Ang mga nakaranasang mananaliksik ay dumating sa konklusyon na ang eksaktong tugma sa pagitan ng sampling frame at ang target na populasyon ng interes ay napakabihirang. Ang isa sa mga pinakamalikhaing hakbang sa disenyo ng sampling ay ang pagtukoy ng naaangkop na sampling frame sa mga kaso kung saan mahirap ilista ang mga miyembro ng populasyon. Maaaring mangailangan ito ng sampling mula sa mga bloke ng trabaho at prefix kapag, halimbawa, ang random na pagdayal ay ginagamit dahil sa mga pagkukulang sa mga direktoryo ng telepono. Gayunpaman, ang makabuluhang pagtaas sa mga yunit ng trabaho sa nakalipas na 10 taon ay nagpahirap sa gawaing ito. Ang mga katulad na sitwasyon ay maaari ding lumitaw sa panahon ng pumipili na pagmamasid sa mga teritoryal na sona o mga organisasyon na may kasunod na subsampling, kapag, sabihin nating, mga indibidwal ang target na populasyon, ngunit walang eksaktong napapanahon na listahan ng mga ito.

Pinagmulan: batay sa data na nilalaman sa SSI- LITe TM: L ow Pangyayari T naka-target S ampling" (Fairfield, Conn.: Survey Sampling, Inc., 1994).

Ang ikatlong hakbang sa pamamaraan ng sampling ay malapit na nauugnay sa pagpapasiya ng sampling frame. Ang pagpili ng paraan o pamamaraan ng sampling ay higit na nakasalalay sa sampling frame na pinagtibay ng mananaliksik. Ang iba't ibang uri ng sample ay nangangailangan ng iba't ibang uri ng sampling frame. Ito at ang susunod na kabanata ay magbibigay ng pangkalahatang-ideya ng mga pangunahing uri ng mga sample na ginamit sa pananaliksik sa marketing. Kapag inilalarawan ang mga ito, ang koneksyon sa pagitan ng sampling frame at ang paraan ng pagbuo nito ay dapat na maging malinaw.

Ang ikaapat na hakbang sa pamamaraan ng sampling ay upang matukoy ang laki ng sample. Ang problemang ito ay tinalakay sa Chap. 17. Sa ikalimang yugto, kailangan talagang piliin ng mananaliksik ang mga elementong isasailalim sa sarbey. Ang paraan na ginamit para dito ay tinutukoy ng uri ng sample na napili; kapag tinatalakay ang mga pamamaraan ng sampling, pag-uusapan din natin ang pagpili ng mga elemento nito. At panghuli, kailangan talagang suriin ng mananaliksik ang mga natukoy na respondente. Sa yugtong ito, may mataas na posibilidad na makagawa ng maraming pagkakamali.
Ang mga problemang ito at ilang pamamaraan para sa kanilang paglutas ay tinalakay sa Chap. labing-walo.

Mga uri ng sampling plan (sampling)

Ang lahat ng paraan ng sampling ay maaaring hatiin sa dalawang kategorya: obserbasyon ng probability sample at obserbasyon ng deterministic sample. Sa isang probabilistikong sample, ang bawat miyembro ng populasyon ay maaaring isama sa isang tiyak na hindi zero na posibilidad. Maaaring iba ang posibilidad na maisama ang ilang partikular na miyembro ng populasyon sa sample, ngunit alam ang posibilidad na maisama ang bawat elemento dito. Ang posibilidad na ito ay tinutukoy ng isang espesyal na mekanikal na pamamaraan na ginamit upang piliin ang mga miyembro ng sample.

Para sa mga deterministikong sample, nagiging imposible ang pagtantya sa posibilidad ng pagsasama ng anumang elemento sa sample. Hindi matitiyak ang pagiging kinatawan ng naturang sample. Halimbawa, Allstate Corporation ay bumubuo ng isang sistema upang iproseso ang data ng mga claim ng 14 milyong kabahayan (mga kliyente nito). Plano ng kumpanya na gamitin ang data na ito upang matukoy ang mga pattern na hinihiling para sa mga serbisyo nito, tulad ng posibilidad na ang isang sambahayan na nagmamay-ari ng Mercedes Benz ay magkakaroon din ng bahay bakasyunan (na mangangailangan ng insurance). Kahit na ang database ay napakalaki, ang kumpanya ay walang paraan upang matantya ang posibilidad na ang anumang partikular na customer ay gagawa ng isang paghahabol. Ang kumpanya sa gayon ay hindi makatitiyak na ang data ng customer na gumagawa ng paghahabol ay kinatawan ng lahat ng mga customer ng kumpanya; at sa isang mas maliit na lawak - may kaugnayan sa mga potensyal na customer.

Ang lahat ng mga deterministikong sample ay nakabatay sa personal na posisyon, paghatol, o kagustuhan ng mananaliksik, sa halip na sa isang mekanikal na pamamaraan sa pagpili para sa mga sample na miyembro. Ang ganitong mga kagustuhan ay minsan ay maaaring magbigay ng mahusay na mga pagtatantya ng mga katangian ng populasyon, ngunit walang paraan upang talaga matukoy ang pagiging angkop ng sample para sa gawain. Ang isang pagtatasa ng katumpakan ng mga resulta ng sample ay maaari lamang gawin kung ang mga probabilidad ng pagpili ng ilang mga elemento ay alam. Para sa kadahilanang ito, ang pagtatrabaho sa probability sampling ay karaniwang itinuturing na isang mas mahusay na paraan para sa pagtantya ng magnitude ng sampling error. Ang mga sample ay maaari ding hatiin sa mga fixed-size na sample at sequential sample. Kapag nagtatrabaho sa mga nakapirming laki ng mga sample, ang laki ng sample ay tinutukoy bago ang simula ng survey, at ang pagsusuri ng mga resulta ay nauuna sa pagkolekta ng lahat ng kinakailangang data. Pangunahing magiging interesado kami sa mga sample na nakapirming laki, dahil ang ganitong uri ay karaniwang ginagamit sa pananaliksik sa marketing.

Probability sampling
Isang sample kung saan ang bawat elemento ng populasyon ay maaaring isama sa ilang kilalang non-zero na posibilidad.
Deterministic sampling
Pagsa-sample batay sa ilang partikular na kagustuhan o paghatol na tumutukoy sa pagpili ng ilang partikular na elemento; kasabay nito, nagiging imposibleng tantiyahin ang posibilidad na maisama ang isang arbitraryong elemento ng populasyon sa sample.

Gayunpaman, hindi dapat kalimutan na mayroon ding mga sequential sample na maaaring gamitin sa bawat isa sa mga pangunahing disenyo ng sampling na tinalakay sa ibaba.

Sa isang sequential sample, ang bilang ng mga napiling elemento ay hindi alam nang maaga, ito ay tinutukoy batay sa isang serye ng mga sequential na desisyon. Kung ang isang survey ng isang maliit na sample ay hindi humantong sa isang maaasahang resulta, ang hanay ng mga elemento na susuriin ay pinalawak. Kung ang resulta ay nananatiling walang katiyakan pagkatapos nito, ang laki ng sample ay tataas muli. Sa bawat yugto, isang desisyon ang gagawin kung isasaalang-alang ang resultang nakuha na sapat na kapani-paniwala o kung ipagpapatuloy ang pagkolekta ng data. Ang pagtatrabaho sa sequential sampling ay ginagawang posible na masuri ang trend (trend of change) ng data habang kinokolekta ang mga ito, na nagpapababa sa mga gastos na nauugnay sa mga karagdagang obserbasyon sa mga kaso kung saan ang kanilang kapakinabangan ay nauuwi sa wala.

Ang parehong probabilistic at deterministic sampling plan ay nabibilang sa ilang uri. Halimbawa, ang mga deterministikong sample ay maaaring hindi kinatawan (maginhawa), sinadya o quota; ang mga probabilistikong sample ay nahahati sa simpleng random, stratified o grupo (cluster), sila naman, ay maaaring hatiin sa mga subtype. Sa fig. Ipinapakita ng Figure 15.3 ang mga uri ng sample na tatalakayin dito at sa susunod na kabanata.

Fixed Sample (Fixed Sample)
Isang sample na ang laki ay tinutukoy ng isang priori; ang kinakailangang impormasyon ay tinutukoy ng mga napiling elemento.
Sequential sampling
Isang sample na nabuo batay sa isang serye ng mga sunud-sunod na desisyon. Kung, pagkatapos isaalang-alang ang isang maliit na sample, ang resulta ay hindi tiyak, ang isang mas malaking sample ay isinasaalang-alang; kung ang hakbang na ito ay hindi humantong sa isang resulta, ang laki ng sample ay tataas muli, atbp. Kaya, sa bawat yugto, ang isang desisyon ay ginawa kung ang resulta na nakuha ay maituturing na sapat na kapani-paniwala.

Dapat tandaan na ang mga pangunahing uri ng mga sample ay maaaring pagsamahin upang makabuo ng mas kumplikadong mga sampling plan. Kung matutunan mo ang kanilang mga pangunahing uri ng paunang uri, magiging mas madali para sa iyo na harapin ang mas kumplikadong mga kumbinasyon.

Mga deterministikong pagpili

Gaya ng nabanggit na, kapag pumipili ng mga elemento ng isang tiyak na sample, ang mga pribadong pagtatantya o desisyon ay gumaganap ng isang mapagpasyang papel. Minsan ang mga pagtatasa na ito ay nagmumula sa mananaliksik, habang sa ibang mga kaso ang pagpili ng mga elemento ng populasyon ay ibinibigay sa field staff. Dahil ang mga elemento ay hindi pinili nang mekanikal, nagiging imposibleng matukoy ang posibilidad ng pagsasama ng isang di-makatwirang elemento sa sample at, nang naaayon, ang sampling error. Ang kamangmangan sa error dahil sa napiling pamamaraan ng sampling ay humahadlang sa mga mananaliksik na masuri ang katumpakan ng kanilang mga pagtatantya.

Mga sample na hindi kinatawan (convenience).

Mga sample na hindi kinatawan (convenience). minsan ay tinutukoy bilang random, dahil ang pagpili ng mga sample na elemento ay isinasagawa sa isang "random" na paraan - ang mga elementong iyon na o mukhang pinaka-accessible sa panahon ng pagpili ay pinili.

Ang aming araw-araw na buhay puno ng mga halimbawa ng naturang mga seleksyon. Nakikipag-usap kami sa mga kaibigan at, batay sa kanilang mga reaksyon at posisyon, gumagawa kami ng mga konklusyon tungkol sa mga pampulitikang predilections na namamayani sa lipunan; hinihikayat ng isang lokal na istasyon ng radyo ang mga tao na ipahayag ang kanilang opinyon sa ilang kontrobersyal na isyu, ang kanilang opinyon ay binibigyang kahulugan bilang namamayani; nananawagan kami para sa kooperasyon ng mga boluntaryo at makipagtulungan sa mga boluntaryong tumulong sa amin. Ang problema sa mga sample ng kaginhawahan ay kitang-kita—hindi namin matiyak na ang mga sample ng ganitong uri ay aktwal na kumakatawan sa target na populasyon. Maaari pa rin nating pagdudahan na ang mga opinyon ng ating mga kaibigan ay wastong sumasalamin sa mga pampulitikang pananaw na namamayani sa lipunan, ngunit madalas nating gustong maniwala na ang mas malalaking sample, na pinili sa ganitong paraan, ay kinatawan. Ipakita natin ang kamalian ng gayong palagay na may isang halimbawa.
Ilang taon na ang nakalilipas, ang isa sa mga lokal na istasyon ng telebisyon sa lungsod kung saan nakatira ang may-akda ng aklat na ito ay nagsagawa ng pang-araw-araw na pampublikong opinyon poll sa mga paksang interesado sa lokal na komunidad. Ang mga botohan, na tinatawag na "The Madison Pulse", ay isinagawa bilang mga sumusunod. Tuwing gabi sa alas-sais na balita, ang istasyon ay nagtanong sa mga manonood ng isang katanungan tungkol sa isang partikular na kontrobersyal na isyu, kung saan kinakailangang magbigay ng positibo o negatibong sagot.

Sa kaso ng isang positibong sagot, kinakailangan na tumawag sa isa, sa kaso ng isang negatibong sagot - sa isa pang numero ng telepono. Ang bilang ng mga boto "para sa" at "laban" ay awtomatikong binibilang. Iniulat ng newscast ng alas-diyes ang mga resulta ng survey sa telepono. Tuwing gabi sa pagitan ng 500 at 1000 mga tao ang tumawag sa studio upang ipahayag ang kanilang posisyon sa ito o sa isyu na iyon; binigyang-kahulugan ng komentarista sa telebisyon ang mga resulta ng botohan bilang ang nangingibabaw na opinyon sa lipunan.

Sampol na hindi kinatawan (convenience).
Minsan ay tinatawag na random, dahil ang pagpili ng mga sample na elemento ay isinasagawa sa isang "random" na paraan - ang mga elementong iyon na o mukhang pinaka-naa-access sa panahon ng pagpili ay pinili.

Sa isa sa anim na oras na episode, tinanong ang mga manonood ng sumusunod na tanong: "Hindi mo ba naisip na ang edad ng pag-inom sa Madison ay dapat ibaba sa 18?" Ang umiiral na legal na kwalipikasyon ay tumutugma sa 21 taon. Ang madla ay tumugon sa tanong na ito nang may pambihirang aktibidad - halos 4,000 katao ang tumawag sa studio nang gabing iyon, kung saan 78% ay pabor na ibaba ang limitasyon sa edad. Tila malinaw na ang isang sample ng 4,000 "ay dapat maging kinatawan" ng isang komunidad ng 180,000. Walang ganoon. Tulad ng maaaring nahulaan mo, ang ilang mga pangkat ng edad ay mas interesado sa isang kilalang resulta kaysa sa iba. Alinsunod dito, hindi nakakagulat na sa isang talakayan ng isyung ito makalipas ang ilang linggo, lumabas na sa oras na inilaan para sa survey, ang mga mag-aaral ay kumilos sa konsiyerto. Sabay-sabay silang tumawag sa telebisyon, bawat isa ay ilang beses. Kaya, ang laki ng sample o ang porsyento ng mga tagapagtaguyod para sa liberalisasyon ng batas ay hindi nakakagulat. Ang sample ay hindi kinatawan.

Ang pagdaragdag lamang ng laki ng sample ay hindi ginagawang kinatawan ito. Ang pagiging kinatawan ng sample ay tinitiyak hindi sa laki, ngunit sa tamang pamamaraan para sa pagpili ng mga elemento. Kapag ang mga kalahok sa survey ay boluntaryong pinili o ang mga sample na item ay pinili batay sa kanilang kakayahang magamit, hindi ginagarantiyahan ng sampling plan ang pagiging kinatawan ng sample. Ang empirical na ebidensya ay nagmumungkahi na ang mga sample na pinili para sa kaginhawahan ay bihirang kinatawan (anuman ang kanilang laki). Ang mga botohan sa telepono, na isinasaalang-alang ang 800-900 na boto, ay ang pinakakaraniwang anyo ng malalaki ngunit hindi kinatawan ng mga sample.

Intentional sampling
Deterministic (targeted) sampling, ang mga elemento nito ay manu-manong pinili; ang mga elementong iyon ay pinili na, sa palagay ng mananaliksik, ay nakakatugon sa mga layunin ng sarbey.
Intentional sampling, depende sa kakayahan ng mananaliksik na itakda ang paunang set ng mga respondente na may nais na katangian; pagkatapos ang mga respondent na ito ay ginagamit bilang mga impormante na tumutukoy sa karagdagang pagpili ng mga indibidwal.

Sa kasamaang palad, maraming tao ang tinatrato ang mga resulta ng naturang mga survey nang may kumpiyansa. Ang isa sa mga pinakakaraniwang halimbawa ng paggamit ng mga sample na hindi kinatawan sa internasyonal na pananaliksik sa marketing ay ang survey ng ilang mga bansa batay sa isang sample na binubuo ng mga dayuhang kasalukuyang naninirahan sa teritoryo ng bansa na nagpasimula ng survey (halimbawa, mga Scandinavian na naninirahan sa ang USA). Bagama't ang mga sample na ito ay maaaring magbigay ng kaunting liwanag sa ilang aspeto ng populasyon na isinasaalang-alang, dapat tandaan na ang mga indibidwal na ito ay karaniwang kumakatawan sa isang "Americanized" na piling tao, na ang koneksyon sa kanilang sariling bansa ay maaaring arbitrary. Ang paggamit ng mga sample na hindi kinatawan ay hindi inirerekomenda para sa mga survey na naglalarawan o sanhi. Ang mga ito ay pinahihintulutan lamang sa pagsaliksik na pananaliksik na naglalayong subukan ang ilang mga ideya o ideya, ngunit kahit na sa kasong ito ay mas mainam na gumamit ng sinasadyang mga sample.

Mga sinadyang pagpili

Ang mga sinadyang sample ay minsang tinutukoy bilang hindi nakatutok; ang kanilang mga elemento, na, sa opinyon ng mananaliksik, ay nakakatugon sa mga layunin ng pag-aaral, ay pinili nang manu-mano. Procter & Gamble ginamit ang paraang ito kapag nagpapakita ng mga ad sa mga taong may edad na 13 hanggang 17 na nakatira malapit sa punong-tanggapan nito sa Cincinnati. Kinuha ng dibisyon ng pagkain at inumin ng kumpanya ang grupong ito ng mga tinedyer upang magsilbi bilang isang uri ng sample ng consumer. Nagtatrabaho ng 10 oras sa isang linggo kapalit ng $1,000 at pagpunta sa isang konsiyerto, nanood sila ng telebisyon mga patalastas, bumisita sa mga supermarket kasama ang mga tagapamahala ng kumpanya upang siyasatin ang paglalantad ng mga kalakal, sinubukan ang mga bagong produkto, tinalakay ang gawi sa pagbili. Sa pamamagitan ng pagpili ng mga kinatawan para sa sample sa pamamagitan ng proseso ng "pag-hire" sa halip na random, maaaring tumuon ang isang kumpanya sa mga katangiang itinuturing nitong kapaki-pakinabang, tulad ng kakayahan ng isang tinedyer na malinaw na ipahayag ang kanilang sarili, sa panganib na ang kanilang mga pananaw ay maaaring hindi kumakatawan sa kanilang edad pangkat.

Tulad ng nabanggit na, ang natatanging tampok ng sinasadyang sampling ay ang direksyong pagpili ng mga elemento nito. Sa ilang mga kaso, ang mga sample na item ay pinili hindi dahil ang mga ito ay kinatawan, ngunit dahil maaari silang magbigay ng mga mananaliksik ng impormasyon na interesado sa kanila. Kapag ang hukuman ay ginagabayan ng patotoo ng isang dalubhasa, ito, sa isang tiyak na kahulugan, ay gumagamit ng isang sadyang pagpili. Ang isang katulad na posisyon ay maaaring mangibabaw sa pag-unlad proyekto sa pananaliksik. Sa panahon ng paunang pag-aaral ng isyu, ang mananaliksik ay pangunahing interesado sa pagtukoy ng mga prospect para sa pag-aaral, na tumutukoy sa pagpili ng mga sample na elemento.

Pag-sample ng snowball ay isa sa mga uri ng sinasadyang sampling na ginagamit kapag nagtatrabaho sa mga espesyal na uri populasyon. Ang sample na ito ay nakasalalay sa kakayahan ng mananaliksik na tukuyin ang isang paunang hanay ng mga respondente na may mga gustong katangian. Ang mga respondent na ito ay gagamitin bilang mga impormante upang matukoy ang karagdagang pagpili ng mga indibidwal.

Isipin, halimbawa, na gustong suriin ng isang kumpanya ang pangangailangan para sa isang produkto na magpapahintulot sa mga bingi na makipag-usap sa telepono. Maaaring simulan ng mga mananaliksik ang pagbuo ng problemang ito sa pamamagitan ng pagtukoy sa mga pangunahing tauhan sa komunidad ng mga bingi; maaaring pangalanan ng huli ang iba pang miyembro ng grupo na papayag na makilahok sa survey. Sa taktika na ito, lumalaki ang sample na parang snowball.

Habang ang mananaliksik ay nasa mga unang yugto ng paglutas ng problema, kapag ang mga prospect at posibleng mga limitasyon ng nakaplanong survey ay tinutukoy, ang paggamit ng intentional sampling ay maaaring maging napaka-epektibo. Ngunit sa anumang kaso ay hindi natin dapat kalimutan mga kahinaan mga sample ng ganitong uri, dahil maaari rin itong gamitin ng mananaliksik sa mga deskriptibo o sanhi ng pag-aaral, na hindi magiging mabagal na makakaapekto sa kalidad ng kanilang mga resulta. Ang isang klasikong halimbawa ng pagkalimot na ito ay ang consumer price index ("CPI"). Tulad ng itinuturo ni Südman ( Sudman): “Ang CPI ay tinutukoy lamang para sa 56 na lungsod at metropolitan na lugar, ang pagpili nito ay naiimpluwensyahan din ng politikal na salik. Sa katunayan, ang mga lungsod na ito ay maaari lamang kumatawan sa kanilang sarili, habang ang index ay tinatawag index ng presyo ng consumer para sa mga naninirahan sa lungsod na kumikita ng oras-oras na sahod*, at mga empleyado at lumilitaw sa karamihan ng mga tao bilang isang index na sumasalamin sa antas ng presyo sa anumang lugar ng Estados Unidos. Ang pagpili ng mga retail outlet ay hindi rin ginawa nang random, bilang isang resulta nito nagiging imposible ang pagtatantya ng posibleng error sa sampling» (aming italics) 2 .

* Ibig sabihin, mga manggagawa. — Tandaan. bawat.

Mga sample ng quota

Ang ikatlong uri ng deterministic sampling − mga sample ng quota; ang kilalang pagiging kinatawan nito ay nakakamit sa pamamagitan ng pagsasama dito ng parehong proporsyon ng mga elemento na may ilang partikular na katangian tulad ng sa populasyon na pinag-aaralan (tingnan ang " window ng pananaliksik 15.1"). Bilang halimbawa, isaalang-alang ang pagsubok na lumikha ng isang kinatawan na sample ng mga mag-aaral na nakatira sa campus. Kung walang kahit isang senior na estudyante sa isang partikular na sample ng 500 indibidwal, magkakaroon kami ng karapatang pagdudahan ang pagiging kinatawan nito at ang bisa ng paglalapat ng mga resultang nakuha sa sample na ito sa populasyon na pinag-aaralan. Kapag nagtatrabaho sa proportional sampling, matitiyak ng mananaliksik na ang proporsyon ng mga undergraduate sa sample ay tumutugma sa kanilang proporsyon sa kabuuang bilang ng mga mag-aaral.

Ipagpalagay na ang isang mananaliksik ay nagsasagawa ng isang piling pag-aaral ng mga mag-aaral sa unibersidad, habang siya ay interesado sa katotohanan na ang sample ay sumasalamin hindi lamang sa kanilang pag-aari sa isa o ibang kasarian, kundi pati na rin sa kanilang pamamahagi ayon sa mga kurso. Hayaang ang kabuuang bilang ng mga mag-aaral ay 10,000: 3,200 freshmen, 2,600 sophomores, 2,200 third-year students, at 2,000 fourth-year students; kung saan 7,000 lalaki at 3,000 babae. Para sa sample ng 1,000 tao, ang proportional sampling plan ay nangangailangan ng 320 freshmen, 260 sophomores, 220 third-years at 200 graduates, 700 lalaki at 300 babae. Maaaring ipatupad ng mananaliksik ang planong ito sa pamamagitan ng pagbibigay sa bawat tagapanayam ng isang tiyak na quota, na tutukuyin kung sinong mga mag-aaral ang dapat niyang kontakin.

Pagsa-sample ng quota Isang deterministikong sample na pinili sa paraang ang proporsyon ng mga sample na elemento na may ilang partikular na katangian ay tinatayang tumutugma sa proporsyon ng parehong mga elemento sa populasyon na pinag-aaralan; ang bawat field worker ay binibigyan ng quota na tumutukoy sa mga katangian ng populasyon kung saan siya dapat makipag-ugnayan.

Ang isang tagapanayam na magsasagawa ng 20 panayam ay maaaring turuan na magtanong:

anim na mag-aaral sa unang taon - limang lalaki at isang babae;
anim na sophomores - apat na lalaki at dalawang babae;
apat na mag-aaral sa ikatlong taon - tatlong lalaki at isang babae;
apat na mag-aaral sa ikaapat na taon - dalawang lalaki at dalawang babae.

Tandaan na ang pagpili ng mga partikular na sample na elemento ay hindi tinutukoy ng plano ng pananaliksik, ngunit sa pamamagitan ng pagpili ng tagapanayam, na tinatawag na sumunod lamang sa mga kundisyon na itinakda ng quota: pakikipanayam sa limang freshmen, isang freshman, atbp.

Tandaan din na ang quota na ito ay tumpak na sumasalamin sa distribusyon ng kasarian ng populasyon ng mag-aaral, ngunit medyo binabaluktot ang pamamahagi ng mga mag-aaral sa mga kurso; 70% (14 sa 20) mga panayam ay sa mga lalaki, ngunit 30% lamang (6 sa 20) sa mga mag-aaral sa unang taon, habang sila ay bumubuo ng 32% ng kabuuang bilang ng mga mag-aaral. Ang quota na inilaan sa bawat indibidwal na tagapanayam ay maaaring hindi, at kadalasan ay hindi, nagpapakita ng distribusyon ng mga katangian ng kontrol sa populasyon—ang huling sample lamang ang dapat na proporsyonal.

Dapat tandaan na ang proporsyonal na sampling ay higit na nakasalalay sa personal, subjective na mga saloobin o paghuhusga kaysa sa isang layunin na pamamaraan ng sampling. Bukod dito, sa kaibahan sa sinasadyang sampling, ang personal na paghuhusga dito ay hindi pag-aari ng developer ng proyekto, ngunit sa tagapanayam. Lumilitaw ang tanong kung ang mga proporsyonal na sample ay maaaring ituring na kinatawan, kahit na i-reproduce nila ang ratio ng mga sangkap na likas sa populasyon na may ilang mga katangian ng kontrol. Kaugnay nito, tatlong pangungusap ang kailangang gawin.

Una, ang sample ay maaaring kapansin-pansing naiiba sa populasyon sa ilang iba pang mahahalagang katangian, na maaaring magkaroon ng malubhang epekto sa resulta. Halimbawa, kung ang pag-aaral ay nakatuon sa problema ng racial prejudice sa mga mag-aaral, maaaring hindi ito walang malasakit na pangyayari kung saan nanggaling ang mga respondente: mula sa lungsod o mula sa kanayunan. Dahil ang quota para sa katangiang "mula sa lungsod/rural" ay hindi itinalaga, ang isang tumpak na representasyon ng katangiang ito ay nagiging malabong. Siyempre, mayroong isang alternatibo: upang tukuyin ang mga quota para sa lahat ng potensyal na makabuluhang katangian. Gayunpaman, ang pagtaas sa bilang ng mga katangian ng kontrol ay humahantong sa isang komplikasyon ng detalye. Ito, sa turn, ay nagpapalubha - at kung minsan ay ginagawang imposible - ang pagpili ng mga elemento ng sample at, sa anumang kaso, ay humahantong sa pagtaas ng presyo nito. Kung, halimbawa, ang urban o rural affiliation at socioeconomic status ay may kaugnayan din sa pag-aaral, kung gayon ang tagapanayam ay maaaring maghanap ng isang mag-aaral sa unang taon na nasa lunsod at nakatataas o gitnang uri. Sumasang-ayon ako na ang paghahanap ng isang lalaking freshman ay mas madali.

Pangalawa, napakahirap tiyakin na ang sample na ito ay talagang kinatawan. Siyempre, maaari mong suriin ang sample upang makita kung ang pamamahagi ng mga katangian na hindi kasama sa kontrol, ang kanilang pamamahagi sa populasyon. Gayunpaman, ang gayong pagsubok ay maaari lamang humantong sa mga negatibong konklusyon. Posibleng ihayag lamang ang pagkakaiba-iba ng mga distribusyon. Kung ang mga distribusyon ng sample at ang populasyon para sa bawat isa sa mga katangiang ito ay paulit-ulit sa isa't isa, may posibilidad na ang sample ay naiiba sa populasyon sa iba pang tampok, na hindi tahasang tinukoy.

At sa wakas, pangatlo. Ang mga tagapanayam, na iniiwan sa kanilang sariling mga aparato, ay madaling kapitan ng ilang mga aksyon. Sila ay madalas na nagtatanong sa kanilang mga kaibigan. Dahil madalas silang maging katulad ng mga tagapanayam mismo, may panganib ng pagkakamali. Iminumungkahi ng ebidensya mula sa England na ang mga sample ng quota ay may posibilidad na:

pagmamalabis sa papel ng mga pinaka-naa-access na elemento;
minamaliit ang tungkulin ng maliliit na pamilya;
pagmamalabis sa tungkulin ng mga pamilyang may mga anak;
binabawasan ang papel ng mga manggagawang pang-industriya;
binabawasan ang papel ng mga may pinakamataas at pinakamababang kita;
minamaliit ang tungkulin ng mga mamamayang mahina ang pinag-aralan;
minamaliit ang papel ng mga taong may mababang posisyon sa lipunan.

Ang mga tagapanayam na pumipili ng mga paunang natukoy na quota sa pamamagitan ng paghinto ng mga random na dumadaan ay malamang na tumutok sa mga lugar na may malaking bilang ng mga potensyal na tumugon, tulad ng mga shopping mall, istasyon ng tren at paliparan, mga pasukan sa malalaking supermarket, at iba pa. Ang kasanayang ito ay humahantong sa isang labis na representasyon ng mga grupo ng mga tao na madalas na bumibisita sa mga lugar na ito. Kapag ang mga pagbisita sa bahay ay kinakailangan, ang mga tagapanayam ay madalas na hinihimok ng kaginhawahan.
Halimbawa, maaari silang magsagawa ng mga survey sa araw lamang, na humahantong sa pagmamaliit ng opinyon ng mga manggagawa. Sa iba pang mga bagay, hindi sila pumapasok sa mga sira-sirang gusali at, bilang panuntunan, ay hindi umaakyat sa itaas na palapag ng mga gusali na walang mga elevator.

Depende sa mga detalye ng problemang pinag-aaralan, ang mga tendensiyang ito ay maaaring humantong sa iba't ibang uri ng mga pagkakamali, ngunit ang pagwawasto sa mga ito sa yugto ng pagsusuri ng data ay tila napakahirap. Sa kabilang banda, na may layuning pagpili ng mga sample na elemento, ang mga mananaliksik ay may ilang mga tool na ginagawang posible upang pasimplehin ang pamamaraan para sa pagtatasa ng pagiging kinatawan ng isang ibinigay na sample. Kapag pinag-aaralan ang problema ng pagiging kinatawan ng mga naturang sample, hindi isinasaalang-alang ng mananaliksik ang komposisyon ng sample bilang pamamaraan para sa pagpili ng mga elemento nito.

Pananaliksik Window: Brilliant! Ngunit sino ang magbabasa nito?

Bawat taon, gumagastos ang mga advertiser ng milyun-milyong dolyar sa mga ad na lumalabas sa mga pahina ng hindi mabilang na mga publikasyon mula sa Advertising Age hanggang sa Yankee. Ang isang tiyak na pagtatasa ng teksto at imahe ay maaaring gawin bago ang paglalathala nito, tulad ng sinasabi nila, sa bahay, sa isang ahensya ng advertising; hindi talaga ito sinusubok at hinuhusgahan hanggang sa matapos mailathala ang ad, napapaligiran ng dose-dosenang mga patalastas na parehong maingat na ginawang nag-aagawan para sa atensyon ng mambabasa.

kumpanya Roper Starch sa buong mundo sinusuri ang pagiging madaling mabasa ng mga advertisement na inilagay sa consumer, negosyo, kalakalan at propesyonal na mga magasin at pahayagan. Ang mga resulta ng pananaliksik ay dinadala sa atensyon ng mga advertiser at ahensya - siyempre, para sa isang naaangkop na bayad. Dahil nagsusumikap ang mga advertiser araw-araw upang maihatid ang kanilang mga ad sa consumer, ang kumpanya almirol nagpasya na lumikha ng isang sample na magbibigay sa mga subscriber ng napapanahon at tumpak na impormasyon tungkol sa pagiging epektibo ng advertising. Taun-taon ang kumpanya almirol nakapanayam ng higit sa 50,000 mga tao, habang isinasaalang-alang ang tungkol sa 20,000 mga patalastas. Mga 500 indibidwal na publikasyon ang pinag-aralan taun-taon.

Gumamit ang starch ng proportional sampling, na may minimum na 100 mambabasa ng isang kasarian at 100 mambabasa ng kabilang kasarian. Napagpasyahan ng starch na sa laki ng sample na ito, ang mga pangunahing paglihis sa antas ng pagiging madaling mabasa ay nagpapatatag. Ang mga mambabasa na higit sa edad na 18 ay personal na nainterbyu, at lahat ng mga publikasyon ay isinasaalang-alang, maliban sa mga inilaan para sa mga espesyal na populasyon (sabihin, ang mga batang babae sa naaangkop na edad ay kapanayamin upang suriin ang mga publikasyon mula sa Seventeen magazine).

Kapag nagsasagawa ng mga survey, ang lugar ng pamamahagi ng isang partikular na publikasyon ay isinasaalang-alang. Sabihin nating ang pag-aaral ng magasin sa Los Angeles ay tumingin sa mga mambabasa na naninirahan sa timog California. Ang "Oras" ay pinag-aralan sa buong bansa. Ang survey ay nakatuon sa mga indibidwal na isyu ng magazine at isinagawa sa 20-30 lungsod sa parehong oras.

Ang bawat tagapanayam ay binigyan ng maliit na quota ng mga panayam, na nagsilbi sa layunin ng pagliit ng pagkakaiba-iba ng mga resulta ng survey. Ang mga talatanungan ay ipinamahagi sa mga taong may iba't ibang propesyon at edad na may iba't ibang kita. Ang bawat pag-aaral na ito ay naging posible upang ipakita ang mga posisyon sa isang medyo malawak na mambabasa. Kapag isinasaalang-alang ang isang bilang ng mga publikasyong propesyonal, negosyo at industriya, ang mga detalye ng kanilang subscription at pamamahagi ay isinasaalang-alang din. Ang mga listahan ng subscription na nakatuon sa mga publikasyong may medyo makitid na sirkulasyon ay naging posible upang pumili ng mga katanggap-tanggap na respondent.

Sa bawat survey, hiniling ng mga tagapanayam ang mga respondent na mag-browse sa publikasyon at tinanong kung may napansin silang anumang ad. Kung ang sagot ay oo, nagtanong ang registrar ng isang serye ng mga tanong upang masuri ang antas ng pagtanggap ng advertisement.

Ang pagtatasa na ito ay maaaring tatlong beses:

Bigyang-pansin: ang mga nagbigay ng pansin sa mismong katotohanan ng paglitaw ng naturang anunsyo.
Nakilala: ang mga nakaalala sa anumang bahagi ng ad, na tumatalakay sa na-advertise na trademark o advertiser.
Basahin: mga taong nagbabasa ng hindi bababa sa kalahati ng advertisement.

Matapos suriin ang lahat ng mga ad, naitala ng mga tagapanayam ang pangunahing impormasyon sa pag-uuri: kasarian, edad, trabaho, katayuan sa pag-aasawa, nasyonalidad, kita, laki ng pamilya, at komposisyon ng pamilya, na nagbigay-daan para sa cross-tabulation ng antas ng interes ng mambabasa.

Kapag ginamit nang maayos, ang data ng kumpanya almirol payagan ang mga advertiser at ahensya na tukuyin ang parehong hindi matagumpay at matagumpay na mga uri ng mga scheme ng advertising na umaakit at humahawak sa atensyon ng mambabasa. Ang impormasyon ng ganitong uri ay lubhang mahalaga para sa mga advertiser na pangunahing interesado sa pagiging epektibo ng kanilang kampanya sa advertising.

Pinagmulan: Roper Starch Worldwide, Mamaronek, NY 10543.

Mga sample ng posibilidad

Maaaring matukoy ng mananaliksik ang posibilidad na maisama ang anumang elemento ng populasyon sa probability sample, dahil ang pagpili ng mga elemento nito ay isinasagawa batay sa ilang layunin na proseso at hindi nakasalalay sa mga kapritso at predilections ng mananaliksik o field worker. Dahil layunin ang pamamaraan ng pagpili ng elemento, masusuri ng mananaliksik ang pagiging maaasahan ng mga resultang nakuha, na imposible sa kaso ng mga deterministikong sample, gaano man kaingat ang pagpili ng mga elemento ng huli.

Hindi dapat isipin na ang mga probabilistikong sample ay palaging mas kinatawan kaysa sa mga deterministiko. Sa katunayan, ang isang deterministikong sample ay maaari ding maging mas kinatawan. Ang bentahe ng mga sample ng probabilidad ay pinapayagan nila ang isang pagtatantya ng potensyal na error sa sampling. Kung ang mananaliksik ay gumagawa ng isang deterministikong sample, wala siyang layunin na pamamaraan para sa pagtatasa ng kasapatan nito sa mga layunin ng pag-aaral.

Simpleng random sampling

Karamihan sa mga tao ay nakakatagpo ng mga simpleng random na sample sa isang paraan o iba pa, alinman bilang bahagi ng kursong istatistika sa institute, o sa pamamagitan ng pagbabasa tungkol sa mga resulta ng mga nauugnay na pag-aaral sa mga pahayagan o magasin. Sa isang simpleng random na sample, ang bawat elementong kasama sa sample ay may parehong ibinigay na posibilidad na mapabilang sa mga elementong pinag-aaralan, at anumang kumbinasyon ng mga elemento sa orihinal na populasyon ay maaaring maging sample. Halimbawa, kung gusto naming gumuhit ng isang simpleng random na sample ng lahat ng mga mag-aaral na naka-enroll sa isang partikular na kolehiyo, kailangan lang naming gumawa ng isang listahan ng lahat ng mga mag-aaral, magtalaga ng isang numero sa bawat pangalan sa loob nito, at gumamit ng isang computer upang random na pumili ng isang ibinigay bilang ng mga elemento.

Populasyon

Populasyon
Isang hanay ng mga elemento na nakakatugon sa ilang partikular na kundisyon; tinatawag ding pag-aaral (target) na populasyon.
Parameter
Isang tiyak na katangian o tagapagpahiwatig ng pangkalahatan o pinag-aralan na populasyon.

Pangkalahatan, o pinag-aralan, set ay ang koleksyon kung saan ginawa ang pagpili. Ang populasyon (populasyon) na ito ay maaaring ilarawan ng isang bilang ng mga tiyak na parameter na mga katangian ng pangkalahatang populasyon, na ang bawat isa ay isang tiyak na tagapagpahiwatig ng dami na nagpapakilala sa isang populasyon mula sa isa pa.

Isipin na ang populasyon na pinag-aaralan ay ang buong populasyon ng nasa hustong gulang ng Cincinnati. Ang ilang mga parameter ay maaaring gamitin upang ilarawan ang populasyong ito: median na edad, proporsyon ng populasyon na may isang tersiyaryong edukasyon, antas ng kita, atbp. Tandaan na ang lahat ng mga tagapagpahiwatig na ito ay may isang tiyak na nakapirming halaga. Siyempre, maaari nating kalkulahin ang mga ito sa pamamagitan ng pagsasagawa ng kumpletong census ng populasyon na pinag-aaralan. Karaniwan, gayunpaman, hindi kami umaasa sa kwalipikasyon, ngunit sa sample na pinili namin at ginagamit ang mga halaga na nakuha sa panahon ng pumipili na pagmamasid upang matukoy ang mga kinakailangang parameter ng populasyon.

Inilalarawan namin kung ano ang sinabi na ibinigay sa Talahanayan. 15.1 isang halimbawa ng hypothetical na populasyon na 20 katao. Ang pagtatrabaho sa isang maliit na hypothetical na populasyon tulad nito ay may ilang mga pakinabang. Una, ang maliit na sukat ng sample ay nagpapadali sa pagkalkula ng mga parameter ng populasyon na maaaring magamit upang ilarawan ito. Pangalawa, binibigyang-daan ka ng volume na ito na maunawaan kung ano ang maaaring mangyari kapag pinagtibay ang isang partikular na sampling plan. Ang parehong mga tampok na ito ay ginagawang madali upang ihambing ang mga sample na resulta sa "totoo" at sa kasong ito ay kilala ang halaga ng populasyon, na hindi ang kaso para sa karaniwang sitwasyon kung saan ang aktwal na halaga ng populasyon ay hindi alam. Ang paghahambing ng pagtatasa sa "tunay" na halaga sa kasong ito ay nakakakuha ng espesyal na kalinawan.

Ipagpalagay na gusto nating tantyahin, mula sa dalawang random na napiling mga item, ang average na kita ng mga indibidwal sa orihinal na populasyon. Ang average na kita ang magiging parameter nito. Upang matantya ang average na halaga na ito, na itinalaga namin bilang μ, dapat nating hatiin ang kabuuan ng lahat ng mga halaga sa kanilang numero:

Ang ibig sabihin ng populasyon μ = Kabuuan ng mga elemento ng populasyon / Bilang ng mga elemento.

Sa aming kaso, ang mga kalkulasyon ay nagbibigay ng:

Nagmula sa populasyon

Nagmula sa populasyon ay binubuo ng lahat ng posibleng sample na maaaring mapili mula sa pangkalahatang populasyon ayon sa isang ibinigay na sampling plan (sampling plan). Mga istatistika ay isang katangian, o tagapagpahiwatig, ng sample. Ang sample na halaga ng istatistika ay ginagamit upang tantyahin ang isang partikular na parameter ng populasyon. Nagbibigay ang iba't ibang sample ng iba't ibang istatistika o pagtatantya para sa parehong parameter ng populasyon.

Nagmula sa populasyon
Ang hanay ng lahat ng posibleng matukoy na sample na maaaring mapili mula sa pangkalahatang populasyon ayon sa isang ibinigay na sampling plan. Statistics Isang katangian o sukat ng isang sample.

Isaalang-alang ang nagmula na hanay ng lahat ng posibleng sample na maaaring mapili mula sa aming hypothetical na populasyon ng 20 indibidwal sa pamamagitan ng isang sampling plan na ipinapalagay na ang laki ng sample ay n=2 maaaring makuha sa pamamagitan ng random na hindi paulit-ulit na pagpili.

Ipagpalagay na ang data para sa bawat yunit ng populasyon - sa aming kaso, ang pangalan at kita ng isang indibidwal - ay nakasulat sa mga bilog, pagkatapos nito ay ibinaba sa isang pitsel at pinaghalo. Ang mananaliksik ay nag-alis ng isang bilog mula sa pitsel, nagsusulat ng impormasyon mula dito at itabi ito. Ganoon din ang ginagawa niya sa pangalawang mug na kinuha sa pitsel. Pagkatapos ay ibinalik ng mananaliksik ang parehong mga mug sa pitsel, pinaghalo ang mga nilalaman nito at inuulit ang parehong pagkakasunud-sunod ng mga aksyon. Sa mesa. Ipinapakita ng 15.2 ang mga posibleng resulta ng pinangalanang pamamaraan. Para sa 20 lupon, 190 ganoong kumbinasyon ng pares ang posible.

Para sa bawat kumbinasyon, maaari mong kalkulahin ang average na kita. Sabihin natin para sa sampling AB (k= 1)

k-e Sample Mean = Kabuuan ng Mga Sample / Bilang ng Mga Sample =

Sa fig. Ipinapakita ng 15.4 ang pagtatantya ng average na kita para sa buong populasyon at ang halaga ng error para sa bawat pagtatantya para sa mga sample k = 25, 62,108,147 at 189 .

Bago magpatuloy upang isaalang-alang ang kaugnayan sa pagitan ng sample na mean na kita (mga istatistika) at ang ibig sabihin ng kita ng populasyon (isang parameter na kailangang tantyahin), sabihin natin ang ilang mga salita tungkol sa nagmula na populasyon. Una, sa pagsasagawa, hindi kami nag-iipon ng mga pinagsama-samang ganitong uri. Mangangailangan ito ng masyadong maraming oras at pagsisikap. Ang practitioner ay limitado sa pag-compile lamang ng isang sample ng kinakailangang laki. Ginagamit ng mananaliksik konsepto nagmula na populasyon at ang nauugnay na konsepto ng sampling distribution kapag bumubuo ng mga huling konklusyon.

Paano ipapakita sa ibaba. Pangalawa, dapat tandaan na ang isang nagmula na populasyon ay tinukoy bilang ang kabuuan ng lahat ng posibleng iba't ibang mga sample na maaaring mapili mula sa pangkalahatang populasyon ayon sa isang ibinigay na sampling plan. Kapag binago ang alinmang bahagi ng sampling plan, nagbabago rin ang hinangong populasyon. Kaya, kung, kapag pumipili ng mga lupon, ibinalik ng mananaliksik ang una sa mga tinanggal na disk sa pitsel bago alisin ang pangalawa, ang nagmula na hanay ay isasama.

mga sample na AA, BB, atbp. Kung ang bilang ng mga hindi paulit-ulit na sample ay 3 sa halip na 2, magkakaroon ng mga sample ng uri ng ABC, at magkakaroon ng 1140 sa kanila, hindi 190, gaya ng nangyari sa nakaraang kaso. Kapag ang simpleng random na pagpili ay binago sa anumang iba pang paraan ng pagtukoy sa mga elemento ng sample, nagbabago rin ang nagmula na populasyon.

Dapat ding tandaan na ang pagpili ng isang sample ng isang ibinigay na laki mula sa pangkalahatang populasyon ay katumbas ng pagpili ng isang elemento (1 sa 190) mula sa nagmula na populasyon. Ang katotohanang ito ay nagpapahintulot sa amin na gumuhit ng maraming istatistikal na konklusyon.

Halimbawang ibig sabihin at pangkalahatang ibig sabihin

Maaari ba nating itumbas ang sample mean sa totoong populasyon? Sa anumang kaso, nagpapatuloy kami mula sa katotohanan na sila ay magkakaugnay. Gayunpaman, naniniwala din kami na magkakaroon ng pagkakamali. Halimbawa, maaaring ipagpalagay na ang impormasyong natanggap mula sa mga gumagamit ng Internet ay mag-iiba nang malaki mula sa mga resulta ng isang survey ng "ordinaryong" populasyon. Sa ibang mga kaso, maaari naming ipagpalagay ang isang medyo tumpak na tugma, kung hindi, hindi namin magagamit ang sample na halaga upang tantyahin ang halaga ng pangkalahatan. Ngunit gaano kalaki ang pagkakamaling nagawa natin sa paggawa nito?

Pagsamahin natin ang lahat ng sample na paraan na nakapaloob sa Talahanayan. 15.2, at hatiin ang nagresultang kabuuan sa bilang ng mga sample, ibig sabihin, i-average natin ang mga average.
Makukuha namin ang sumusunod na resulta:

Kasabay nito ang average na halaga ng pangkalahatang populasyon. Sinasabi nila na sa kasong ito ay kinakaharap natin walang pinapanigan na istatistika.

Ang isang istatistika ay tinatawag na walang kinikilingan kung ang average nito sa lahat ng posibleng mga sample ay katumbas ng tinantyang parameter ng populasyon. Tandaan na hindi namin pinag-uusapan ang isang partikular na halaga dito. Ang bahagyang pagtatantya ay maaaring napakalayo mula sa tunay na halaga - kunin, halimbawa, ang mga sample ng AB o ST. Sa ilang mga kaso, ang tunay na halaga ng populasyon ay maaaring hindi matamo kapag isinasaalang-alang ang anumang posibleng sample, kahit na ang mga istatistika ay walang kinikilingan. Sa aming kaso, hindi ito ang kaso: ang isang bilang ng mga posibleng sample - halimbawa, AT - ay nagbibigay ng sample mean na katumbas ng tunay na ibig sabihin ng populasyon.

Makatuwirang isaalang-alang ang pamamahagi ng mga sample na pagtatantya na ito, at lalo na ang kaugnayan sa pagitan ng dispersion na ito ng mga pagtatantya at ang pagkakaiba-iba sa antas ng kita sa populasyon. Ang pagkakaiba-iba ng pangkalahatang populasyon ay ginagamit bilang isang sukatan ng pagkakaiba-iba. Upang matukoy ang pagkakaiba-iba ng pangkalahatang populasyon, dapat nating kalkulahin ang paglihis ng bawat halaga mula sa mean, idagdag ang mga parisukat ng lahat ng mga paglihis at hatiin ang nagresultang kabuuan sa bilang ng mga termino. Tukuyin sa pamamagitan ng a^ ang pagkakaiba ng pangkalahatang populasyon. Pagkatapos:

Variance ng populasyon σ 2 = Kabuuan ng mga squared differences ng bawat elemento
populasyon at average ng populasyon / Bilang ng mga elemento ng populasyon =

Pagpapakalat ibig sabihin ng halaga ang antas ng kita ay maaaring tukuyin sa parehong paraan. Iyon ay, mahahanap natin ito sa pamamagitan ng pagtukoy ng mga paglihis ng bawat mean mula sa kanilang kabuuang mean, pagbubuod ng mga parisukat ng mga paglihis, at paghahati ng nagresultang kabuuan sa bilang ng mga termino.

Maaari din nating tukuyin ang pagkakaiba-iba ng average na antas ng kita sa ibang paraan, gamit ang pagkakaiba-iba ng mga antas ng kita sa pangkalahatang populasyon, dahil mayroong direktang ugnayan sa pagitan ng dalawang dami na ito. Upang maging tumpak, sa mga kaso kung saan ang sample ay kumakatawan lamang sa isang maliit na bahagi ng populasyon, ang pagkakaiba-iba ng sample mean ay katumbas ng pagkakaiba-iba ng populasyon na hinati sa laki ng sample:

kung saan ang σ x 2 ay ang pagkakaiba ng average na sample na halaga ng antas ng kita, ang σ 2 ay ang pagkakaiba ng antas ng kita sa pangkalahatang populasyon, n— laki ng sample.

Ngayon ihambing natin ang pamamahagi ng mga resulta sa pamamahagi ng isang quantitative trait sa pangkalahatang populasyon. Ipinapakita ng Figure 15.5 na ang distribusyon ng katangian ng populasyon na ipinapakita sa kahon A ay multi-vertex (bawat isa sa 20 mga halaga ay lumilitaw nang isang beses) at simetriko tungkol sa totoong populasyon na mean na 9400.

Sampling distribution
Ang pamamahagi ng mga halaga ng isang partikular na istatistika na kinakalkula para sa lahat ng posibleng matukoy na mga sample na maaaring makuha mula sa populasyon sa ilalim ng isang ibinigay na sampling plan.

Ang distribusyon ng mga marka na ipinapakita sa field B ay batay sa datos sa Talahanayan. 15.3, na, naman, ay pinagsama-sama sa pamamagitan ng pagtatalaga ng mga halaga mula sa Talahanayan. 15.2 sa isa o ibang grupo, depende sa kanilang laki, na may kasunod na pagkalkula ng kanilang numero sa grupo. Ang Field B ay isang tradisyunal na histogram, na isinasaalang-alang sa pinakadulo simula ng pag-aaral ng kursong istatistika, na kumakatawan sampling distribution mga istatistika. Pansinin namin sa pagpasa ng mga sumusunod: ang konsepto ng sampling distribution ay ang pinakamahalagang konsepto ng mga istatistika, ito ang pundasyon ng pagbuo ng mga statistical inferences. Ayon sa kilalang pamamahagi ng sample ng mga pinag-aralan na istatistika, maaari nating tapusin ang tungkol sa kaukulang parameter ng pangkalahatang populasyon. Kung, sa kabilang banda, alam lang na nagbabago ang sample na pagtatantya mula sa sample patungo sa sample, ngunit hindi alam ang katangian ng pagbabagong ito, magiging imposibleng matukoy ang error sa sampling na nauugnay sa pagtatantyang ito. Dahil inilalarawan ng distribusyon ng sampling ng isang pagtatantya kung paano ito nagbabago mula sa sample patungo sa sample, nagbibigay ito ng batayan para sa pagtukoy ng bisa ng isang sample na pagtatantya. Ito ay para sa kadahilanang ito na ang isang probability sampling na disenyo ay napakahalaga para sa statistical inference.

Dahil sa alam na mga probabilidad ng pagsasama ng bawat miyembro ng populasyon sa sample, mahahanap ng mga tagapanayam ang sample distribution ng iba't ibang istatistika. Ang mga distribusyon na ito ang umaasa sa mga mananaliksik—kung ito man ay ang sample mean, ang proporsyon ng sample, ang sample na pagkakaiba, o ilang iba pang istatistika—kapag pinalawak ang resulta ng isang sample na obserbasyon sa pangkalahatang populasyon. Tandaan din na para sa mga sample ng laki 2, ang distribusyon ng sample na paraan ay unimodal at simetriko tungkol sa tunay na mean.

Kaya ipinakita namin na:

Ang ibig sabihin ng lahat ng posibleng paraan ng sample ay katumbas ng pangkalahatang mean.
Ang pagkakaiba ng sample na paraan ay nauugnay sa ilang paraan sa pangkalahatang pagkakaiba.
Ang pamamahagi ng sample na paraan ay unimodal, habang ang pamamahagi ng mga halaga ng isang quantitative attribute sa pangkalahatang populasyon ay multi-modal.

Central limit theorem

Isang theorem na nagsasabi na para sa mga simpleng random na sample ng laki n, na nakahiwalay sa pangkalahatang populasyon na may pangkalahatang average na μ at pagkakaiba-iba σ 2 , sa pangkalahatan n ang distribusyon ng sample mean x ay lumalapit sa normal na may sentrong katumbas ng μ at isang variance σ 2 . Ang katumpakan ng pagtatantya na ito ay tumataas sa pagtaas n.

Central limit theorem. Ang unimodal na pamamahagi ng mga pagtatantya ay maaaring ituring bilang isang manipestasyon ng gitnang teorama ng limitasyon, na nagsasaad na para sa mga simpleng random na sample ng volume n, pinili mula sa pangkalahatang populasyon na may totoong mean μ at variance σ 2 , para sa malaki n ang distribusyon ng sample ay lumalapit sa normal na may sentrong katumbas ng tunay na mean at isang variance na katumbas ng ratio ng pagkakaiba-iba ng populasyon sa laki ng sample, ibig sabihin::

Ang pagtatantya na ito ay nagiging mas at mas tumpak bilang n. Alalahanin mo ito. Anuman ang uri ng populasyon, ang distribusyon ng sample na paraan ay magiging normal para sa mga sample na may sapat na laki. Ano ang ibig sabihin ng sapat na malaking volume? Kung ang pamamahagi ng mga halaga ng isang quantitative na katangian ng pangkalahatang populasyon ay normal, kung gayon ang pamamahagi ng sample ay nangangahulugan para sa mga sample na may dami ng n=1. Kung ang distribusyon ng variable (quantitative attribute) sa populasyon ay simetriko ngunit hindi normal, ang mga sample ng napakaliit na sukat ay magbibigay ng normal na distribusyon ng sample na paraan. Kung ang distribusyon ng isang quantitative attribute ng pangkalahatang populasyon ay may binibigkas na kawalaan ng simetrya, may pangangailangan para sa mas malalaking sample. Gayunpaman, ang pamamahagi ng sample mean ay maaari lamang kunin bilang normal kung tayo ay nakikitungo sa isang sample na may sapat na laki.

Upang makagawa ng mga konklusyon gamit ang isang normal na curve, hindi kinakailangan na magpatuloy mula sa kondisyon ng normalidad ng pamamahagi ng mga halaga ng isang quantitative na katangian ng pangkalahatang populasyon. Sa halip, umaasa kami sa central limit theorem at, depende sa distribusyon ng populasyon, tinutukoy ang ganoong laki ng sample na magpapahintulot sa amin na magtrabaho sa isang normal na curve. Sa kabutihang palad, ang normal na pamamahagi ng mga istatistika ay ibinibigay ng mga sample ng medyo maliit na sukat - Fig. Malinaw na ipinapakita ng 15.6 ang sitwasyong ito. Mga pagtatantya ng agwat ng kumpiyansa. Matutulungan ba tayo ng nasa itaas sa paggawa ng ilang konklusyon tungkol sa pangkalahatang average? Sa katunayan, sa pagsasagawa, pumili lamang kami ng isa, at hindi lahat ng posibleng mga sample ng isang naibigay na laki, at sa batayan ng data na nakuha, gumuhit kami ng ilang mga konklusyon tungkol sa target na grupo.

Paano ito nangyayari? Tulad ng alam mo, sa isang normal na distribusyon, ang isang tiyak na porsyento ng lahat ng mga obserbasyon ay may isang tiyak na karaniwang paglihis; sabihin nating 95% ng mga obserbasyon ay magkasya sa loob ng ±1.96 karaniwang paglihis ng mean. Ang normal na distribusyon ng sample na paraan, kung saan maaaring ilapat ang central limit theorem, ay walang pagbubukod sa ganitong kahulugan. Ang ibig sabihin ng naturang sample distribution ay katumbas ng general mean μ, at ang standard deviation nito ay tinatawag na standard error ng mean:

Lumalabas na:

68.26% ng sample ay nangangahulugang lumihis mula sa pangkalahatang mean nang hindi hihigit sa ± σ x ;
95.45% ng sample ay nangangahulugang lumihis mula sa pangkalahatang mean nang hindi hihigit sa ±σ x ;
99.73% ng sample ay nangangahulugang lumihis mula sa pangkalahatang ibig sabihin ng hindi hihigit sa ± σ x ,

i.e. isang tiyak na proporsyon ng sample na ibig sabihin depende sa napiling halaga z ay ipapaloob sa pagitan na tinutukoy ng halaga z. Ang expression na ito ay maaaring muling isulat bilang isang hindi pagkakapantay-pantay:

Pangkalahatang average - z < Среднее по выборке < Генеральное среднее + z(Pamantayang error ng mean)

kaya, ang sample mean na may tiyak na posibilidad ay nasa pagitan, ang mga hangganan nito ay ang kabuuan at pagkakaiba ng mean value ng distribution at isang tiyak na bilang ng mga standard deviations. Ang hindi pagkakapantay-pantay na ito ay maaaring ma-convert sa anyo:

Halimbawang ibig sabihin - z(Pamantayang error ng mean)< Генеральное среднее < Среднее по выборке + z(Pamantayang error ng mean)

Kung ang ratio na 15.1 ay sinusunod, halimbawa, sa 95% ng mga kaso ( z= 1.96), pagkatapos ay sa 95% ng mga kaso ang ratio na 15.2 ay sinusunod din. Sa mga kaso kung saan ang konklusyon ay batay sa isang solong sample mean, ginagamit namin ang expression 15.2.

Mahalagang tandaan ang ekspresyong iyon 15.2 ay hindi nangangahulugan na ang agwat na naaayon sa isang ibinigay na sample ay kinakailangang kasama ang pangkalahatang mean. Ang pagitan ay may higit na kinalaman sa pamamaraan ng pagpili. Ang agwat na binuo sa paligid ng ibig sabihin nito ay maaaring o hindi kasama ang tunay na ibig sabihin ng populasyon. Ang aming kumpiyansa sa kawastuhan ng mga ginawang konklusyon ay nakabatay sa katotohanan na 95% ng lahat ng mga agwat na ginawa ayon sa napiling sampling plan ay maglalaman ng totoong mean. Naniniwala kami na ang aming sample ay kabilang sa 95%.

Upang ilarawan ang mahalagang puntong ito, isipin sandali na ang pamamahagi ng sample ay nangangahulugan para sa mga sample na may sukat n= 2 sa aming hypothetical na halimbawa ay normal. Ang talahanayan 15.4 ay graphic na naglalarawan ng kinalabasan para sa unang 10 ng posibleng 190 sample na maaaring mapili ayon sa ibinigay na disenyo. Tandaan na 7 lamang sa 10 agwat ang may kasamang pangkalahatan o totoong mean. Ang pagtitiwala sa kawastuhan ng konklusyon ay dahil hindi sa ilang pribadong pagtatasa, ngunit tiyak pamamaraan mga pagtatantya. Ang pamamaraang ito ay para sa 100 sample kung saan ang sample mean at confidence interval ay kakalkulahin, sa 95 na mga kaso ang agwat na ito ay isasama ang tunay na pangkalahatang halaga. Ang katumpakan ng sample na ito ay tinutukoy ng pamamaraan kung saan nabuo ang sample. Ang isang kinatawan na disenyo ng sampling ay hindi ginagarantiyahan ang pagiging kinatawan ng lahat ng mga sample. Ang mga pamamaraan ng inference ng istatistika ay batay sa pagiging kinatawan ng sampling plan, kaya naman napakahalaga ng pamamaraang ito para sa mga probability sample.

Ang probabilistic sampling ay nagbibigay-daan sa amin na suriin ang katumpakan ng mga resulta bilang ang kalapitan ng mga pagtatantya na ginawa sa tunay na halaga. Kung mas malaki ang karaniwang error ng mga istatistika, mas mataas ang antas ng scatter ng mga pagtatantya at mas mababa ang katumpakan ng pamamaraan.

Ang ilan ay maaaring malito sa katotohanan na ang antas ng kumpiyansa ay nauugnay sa pamamaraan, at hindi sa isang partikular na halaga ng sample, gayunpaman, dapat itong alalahanin na ang halaga ng antas ng kumpiyansa ng pagtatantya ng pangkalahatang halaga ay maaaring iakma ng mananaliksik. Kung ayaw mong makipagsapalaran at natatakot kang baka makatagpo ka ng isa sa limang sample na agwat na hindi kasama ang ibig sabihin ng populasyon, maaari kang pumili ng 99% na agwat ng kumpiyansa kung saan isa lamang sa daang sample na pagitan ang hindi kasama ibig sabihin ng populasyon. Dagdag pa, kung maaari mong dagdagan ang laki ng sample, tataas mo ang antas ng kumpiyansa sa resulta, na nagbibigay ng nais na katumpakan ng pagtatantya ng halaga ng populasyon. Pag-uusapan natin ito nang mas detalyado sa Chap. 17.

Ang pamamaraan na inilalarawan namin ay may isa pang bahagi, na maaaring magdulot ng isang tiyak na kahihiyan. Kapag tinatantya ang pagitan ng kumpiyansa, tatlong dami ang ginagamit: x , z at σ x . Ang sample mean x ay kinakalkula mula sa sample na data, z ay pinili batay sa nais na antas ng kumpiyansa. Ngunit ano ang tungkol sa root mean square error ng mean σ x ? Ito ay katumbas ng:

at samakatuwid, upang matukoy ito, kailangan nating tanungin ang standard deviation ng quantitative attribute ng pangkalahatang populasyon, i.e. 5. Ano ang gagawin sa mga kaso kung saan ang standard deviation s hindi kilala? Ang problemang ito ay hindi bumangon sa dalawang kadahilanan. Una, kadalasan para sa karamihan ng mga quantitative na katangian na ginagamit sa pananaliksik sa marketing, ang variation ay nagbabago nang mas mabagal kaysa sa antas ng karamihan sa mga variable ng interes sa marketer. Alinsunod dito, kung ang pag-aaral ay paulit-ulit, maaari nating gamitin ang nauna, dati nang nakuhang halaga ng s sa mga kalkulasyon. Pangalawa, kapag ang sample ay napili at ang data ay nakuha, maaari nating tantyahin ang pagkakaiba-iba ng populasyon sa pamamagitan ng pagtukoy ng sample na pagkakaiba-iba. Ang walang pinapanigan na pagkakaiba-iba ng sample ay tinukoy bilang:

Sample na pagkakaiba ŝ 2 = Kabuuan ng mga squared deviation mula sa sample mean / (bilang ng mga na-sample na item -1). Upang matukoy ang sample variance, kailangan muna nating hanapin ang sample mean. Pagkatapos ang mga pagkakaiba sa pagitan ng bawat isa sa mga sample na halaga at ang sample mean ay matatagpuan; ang mga pagkakaibang ito ay naka-squad, summed, at hinati sa isang numero na katumbas ng bilang ng mga sample na obserbasyon na binawasan ng isa. Ang sample na pagkakaiba-iba ay hindi lamang nagbibigay ng isang pagtatantya ng kabuuang pagkakaiba, ngunit maaari ding gamitin upang tantiyahin ang karaniwang error ng mean. Kapag ang pangkalahatang pagkakaiba-iba σ 2 ay kilala, ang root mean square error σ x ay kilala rin, dahil:

Kapag hindi alam ang pangkalahatang pagkakaiba, ang karaniwang error ng mean ay maaari lamang matantya. Ang pagtatantya na ito ay ibinigay ŝ x , na katumbas ng standard deviation ng sample na hinati sa square root ng sample size, i.e. Ang pagtatantya ay tinutukoy sa parehong paraan tulad ng pagtatantya ng tunay na halaga ay natukoy, ngunit sa halip na ang pangkalahatang karaniwang paglihis, ang karaniwang paglihis ng sample ay pinapalitan sa formula ng pagkalkula. Kaya, sabihin natin para sa sample AB na may sample mean na 5800:

Alinsunod dito, ŝ = 283, at

at 95% spacing na ngayon

na mas mababa sa dating halaga.

Sa mesa. 15.5 ay nagbubuod ng mga pormula ng pagkalkula para sa iba't ibang mga average at dispersion, na tinalakay sa kabanatang ito. Pagbuo ng isang simpleng random na sample. Sa aming halimbawa, ang pagpili ng mga sample na elemento ay isinagawa gamit ang isang pitsel, na naglalaman ng lahat ng mga elemento ng orihinal na populasyon. Ito ay nagbigay-daan sa amin na mailarawan ang mga konsepto ng nagmula na populasyon at distribusyon ng sampling. Hindi namin inirerekumenda ang paggamit ng gayong pamamaraan sa pagsasanay, dahil pinatataas nito ang posibilidad ng pagkakamali. Maaaring magkaiba ang mga mug sa parehong laki at texture, na sa ilang partikular na kaso ay maaaring humantong sa kagustuhan para sa isa kaysa sa isa. Ang pagpili ng mga kalahok sa kampanyang Vietnamese, na isinagawa sa pamamagitan ng loterya, ay maaaring magsilbi bilang isang halimbawa ng isang pagkakamali ng ganitong uri.

Ang pagpili ay isinagawa sa pamamagitan ng paghila ng mga disc na may mga petsa ng kapanganakan mula sa malaking drum. Ini-broadcast ng telebisyon ang pamamaraang ito sa buong bansa. Sa kasamaang palad, ang mga disc ay na-load sa drum sa isang sistematikong paraan, na may mga petsa ng Enero na mauna at huling mga petsa ng Disyembre. Kahit na ang drum ay sumailalim sa matinding pag-ikot, ang mga petsa ng Disyembre ay nahulog nang mas madalas kaysa sa Enero. Kasunod nito, ang pamamaraang ito ay binago sa paraang ang posibilidad ng naturang mga sistematikong pagkakamali ay makabuluhang nabawasan. Ang ginustong pamamaraan para sa pagbuo ng isang simpleng random na sample ay batay sa paggamit ng isang talahanayan ng mga random na numero.

Ang paggamit ng naturang talahanayan ay kinabibilangan ng sumusunod na pagkakasunud-sunod ng mga hakbang. Una, ang mga elemento ng populasyon ay dapat magtalaga ng magkakasunod na numero mula 1 hanggang N; sa ating hypothetical na populasyon sa elemento PERO ang numero 1 ay itatalaga sa elemento B- numero 2, atbp. Pangalawa, ang bilang ng mga digit sa talahanayan ng mga random na numero ay dapat na kapareho ng bilang ng numero N. Para sa N= 20 dalawang-digit na numero ang gagamitin; para sa N sa pagitan ng 100 at 999 - tatlong-digit na mga numero, atbp. Pangatlo, ang panimulang posisyon ay dapat na matukoy nang random. Maaari naming buksan ang kaukulang talahanayan ng mga random na numero at, isara ang aming mga mata, tulad ng sinasabi nila, sundutin ito ng isang daliri. Dahil ang mga numero sa random na talahanayan ng numero ay nasa random na pagkakasunud-sunod, ang panimulang posisyon ay hindi mahalaga.

At sa wakas, maaari tayong lumipat sa anumang direksyon na arbitraryong pinili - pataas, pababa o sa kabila, pinipili ang mga elementong iyon na ang mga numero ay tumutugma sa mga random na numero mula sa talahanayan. Upang mailarawan kung ano ang sinabi, isaalang-alang ang pinaikling talahanayan ng mga random na numero (Talahanayan 15.6). Dahil ang N= 20, dapat lang tayong magtrabaho sa mga double digit na numero. Sa ganitong kahulugan, Tab. Ang 15.6 ay ganap na nababagay sa amin. Ipagpalagay na napagpasyahan namin nang maaga na lumipat pababa sa hanay, ang paunang posisyon ay nasa intersection ng ikalabing-isang hanay at ang ikaapat na hanay, kung saan matatagpuan ang numero 77. Ang numerong ito ay masyadong malaki, at samakatuwid ay dapat na itapon. Itatapon din ang susunod na dalawang numero, habang ang pang-apat na value na 02 ay gagamitin dahil 2 ang element number AT.

Ang susunod na limang numero ay itatapon din bilang masyadong malaki, habang ang numero 05 ay magsasaad ng elemento E. Kaya ang mga elemento AT at E ay magiging aming sample ng dalawang elemento, kung saan hahatulan namin ang antas ng kita ng populasyon na ito. Posible rin ang isang alternatibong diskarte, kung saan ang isang computer program na bumubuo ng mga random na numero ay gagamitin bilang batayan para sa pagpili. Ipinahihiwatig ng mga kamakailang publikasyon na ang mga numerong nabuo ng naturang mga programa ay hindi ganap na random, na maaaring magpakita mismo sa isang tiyak na paraan kapag gumagawa ng mga kumplikadong modelo ng matematika, ngunit magagamit ang mga ito para sa karamihan ng inilapat na pananaliksik sa marketing. Tandaan muli na ang isang simpleng random na sample ay nangangailangan ng compilation ng isang sequential na may bilang na listahan ng mga elemento ng pangkalahatang populasyon.

Sa madaling salita, dapat kilalanin ang bawat miyembro ng orihinal na populasyon. Para sa ilang populasyon, hindi ito mahirap gawin, halimbawa, sa isang pag-aaral ng 500 pinakamalaking korporasyong Amerikano, isang listahan kung saan ay ibinigay sa Fortune magazine. Ang listahang ito ay naipon na, kaya ang pagbuo ng isang simpleng random na sample sa kasong ito ay hindi magiging mahirap. Para sa iba pang mga paunang populasyon (halimbawa, para sa lahat ng pamilyang naninirahan sa isang partikular na lungsod), ang pag-compile ng isang pangkalahatang listahan ay napakahirap, na pumipilit sa mga mananaliksik na gumamit ng iba pang mga sample na pamamaraan ng survey.

Buod

Layunin ng pagkatuto 1
Malinaw na matukoy ang pagkakaiba sa pagitan ng mga konsepto ng census (kwalipikasyon) at sampling

Ang isang kumpletong sensus ng populasyon (populasyon) ay tinatawag kwalipikadong. Sample set, nabuo mula sa mga napiling elemento.

Layunin ng pagkatuto 2
Alamin ang kakanyahan at pagkakasunud-sunod ng anim na yugto na ipinatupad ng mga mananaliksik upang makakuha ng sample na populasyon

Ang proseso ng sampling ay nahahati sa anim na hakbang:

pagtatalaga ng populasyon;
pagpapasiya ng sampling frame;
pagpili ng pamamaraan ng pagpili;
pagpapasiya ng laki ng sample;
pagpili ng mga sample na elemento;
pagsusuri sa mga napiling elemento.

Layunin ng pagkatuto 3
Tukuyin ang konsepto ng "sampling frame"

Ang sampling frame ay ang listahan ng mga item kung saan kukunin ang sample.

Layunin ng pagkatuto 4
Ipaliwanag ang pagkakaiba sa pagitan ng probabilistic at deterministic sampling

Sa isang probabilistikong sample, ang bawat miyembro ng populasyon ay maaaring isama sa isang tiyak binigay na hindi zero probabilidad. Ang mga probabilidad ng pagsasama ng ilang miyembro ng populasyon sa sample ay maaaring magkaiba sa isa't isa, ngunit alam ang posibilidad na maisama ang bawat elemento dito. Para sa mga deterministikong sample, nagiging imposible ang pagtantya sa posibilidad ng pagsasama ng anumang elemento sa sample. Hindi matitiyak ang pagiging kinatawan ng naturang sample. Ang lahat ng deterministikong pagpili ay nakabatay, sa halip, sa isang personal na posisyon, paghatol, o kagustuhan. Ang ganitong mga kagustuhan ay minsan ay maaaring magbigay ng mahusay na mga pagtatantya ng mga katangian ng populasyon, ngunit walang paraan upang talaga matukoy ang pagiging angkop ng sample para sa gawain.

Layunin ng pagkatuto 5
Tukuyin ang pagkakaiba sa pagitan ng fixed size sampling at multi-stage (sunod-sunod) sampling

Kapag nagtatrabaho sa mga nakapirming laki ng mga sample, ang laki ng sample ay tinutukoy bago ang simula ng survey at ang pagsusuri ng mga resulta ay nauuna sa pagkolekta ng lahat ng kinakailangang data. Sa isang sequential sample, ang bilang ng mga napiling elemento ay hindi alam nang maaga, ito ay tinutukoy batay sa isang serye ng mga sequential na desisyon.

Layunin ng pagkatuto 6
Ipaliwanag kung ano ang sinasadyang sampling at ilarawan ang parehong mga kalakasan at kahinaan nito

Ang mga intentional sampling aytem ay pinili at iniharap sa mananaliksik kung naaangkop para sa mga layunin ng survey. Ipinapalagay na ang mga napiling elemento ay makapagbibigay ng kumpletong larawan ng pinag-aralan na populasyon. Hangga't ang mananaliksik ay nasa maagang yugto ng paglutas ng problema, kapag ang mga prospect at posibleng limitasyon ng nakaplanong survey ay natutukoy, ang paggamit ng intentional sampling ay maaaring maging napakaepektibo. Ngunit sa anumang kaso ay hindi natin dapat kalimutan ang tungkol sa mga kahinaan ng ganitong uri ng sample, dahil maaari rin itong gamitin ng mananaliksik sa mga deskriptibo o sanhi ng pag-aaral, na hindi magiging mabagal na makakaapekto sa kalidad ng kanilang mga resulta.

Layunin ng pagkatuto 7
Tukuyin ang konsepto ng quota sampling

Ang proportional sampling ay pinili sa paraang ang proporsyon ng mga sample na elemento na may ilang partikular na katangian ay humigit-kumulang tumutugma sa proporsyon ng parehong mga elemento sa populasyon na pinag-aaralan; para magawa ito, ang bawat counter ay bibigyan ng quota na tumutukoy sa mga katangian ng populasyon kung saan dapat itong makipag-ugnayan.

Layunin ng pagkatuto 8
Ipaliwanag kung ano ang isang parameter sa isang pamamaraan ng pagpili

Parameter - isang tiyak na katangian o tagapagpahiwatig ng pangkalahatan o pinag-aralan na populasyon; isang tiyak na tagapagpahiwatig ng dami na nagpapakilala sa isang hanay mula sa isa pa.

Layunin ng pagkatuto 9
Ipaliwanag kung ano ang derived set

Ang nagmula na populasyon ay binubuo ng lahat ng posibleng mga sample na maaaring mapili mula sa pangkalahatang populasyon ayon sa isang ibinigay na sampling plan.

Layunin ng pagkatuto 10
Ipaliwanag kung bakit ang konsepto ng sampling distribution ay ang pinakamahalagang konsepto ng statistics.

Ang konsepto ng sampling distribution ay ang pundasyon ng statistical inference. Ayon sa kilalang pamamahagi ng sample ng mga pinag-aralan na istatistika, maaari nating tapusin ang tungkol sa kaukulang parameter ng pangkalahatang populasyon. Kung, sa kabilang banda, alam lang na nagbabago ang sample na pagtatantya mula sa sample patungo sa sample, ngunit hindi alam ang katangian ng pagbabagong ito, magiging imposibleng matukoy ang error sa sampling na nauugnay sa pagtatantyang ito. Dahil inilalarawan ng distribusyon ng sampling ng isang pagtatantya kung paano ito nagbabago mula sa sample patungo sa sample, nagbibigay ito ng batayan para sa pagtukoy ng bisa ng isang sample na pagtatantya.

Sample - ito ay:

1) ang kabuuan ng mga elementong iyon ng object ng pag-aaral, na direktang pag-aaralan;

2) mga pamamaraan at pamamaraan para sa pagpili ng mga elemento ng bagay ng pag-aaral.

Populasyon - isang kumpletong hanay ng mga bagay na may kaugnayan sa problemang pinag-aaralan. Sa sosyolohikal na pag-aaral bilang G.S. kadalasan, ang mga pinagsama-samang indibidwal ay kumikilos - ang populasyon (lungsod, bansa, atbp.), isang grupong panlipunan (kabataan, walang trabaho, negosyante, atbp.), ang madla ng mass media (MSK), atbp. Gayunpaman, sa marami kaso, G.S. maaaring binubuo ng mas malalaking elemento (mga bagay) - mga pamilya (mga sambahayan), mga grupong pang-akademiko, mga negosyo, mga komunidad ng relihiyon, mga indibidwal na pamayanan o estado, atbp.

Sampol na populasyon - bahagi ng mga bagay mula sa pangkalahatang populasyon na pinili para sa pag-aaral upang makagawa ng konklusyon tungkol sa buong populasyon.

Upang ang konklusyon na nakuha sa pamamagitan ng pag-aaral ng sample ay mapalawak sa buong populasyon, ang sample ay dapat magkaroon ng pag-aari ng pagiging kinatawan.

pagiging kinatawan ay ang kakayahan ng sample na kumatawan sa populasyon na pinag-aaralan. Kung mas tumpak na kinakatawan ng komposisyon ng sample ang populasyon sa mga isyung pinag-aaralan, mas mataas ang pagiging kinatawan nito.

HALIMBAWA: Ang pagiging representatibo ay maaaring ilarawan ng sumusunod na halimbawa. Ipagpalagay na ang populasyon ay lahat ng mga mag-aaral ng paaralan (600 tao mula sa 20 klase, 30 tao sa bawat klase). Ang paksa ng pag-aaral ay ang saloobin sa paninigarilyo. Ang isang sample ng 60 high school na mag-aaral ay kumakatawan sa populasyon na mas masahol pa kaysa sa isang sample ng parehong 60 tao, na magsasama ng 3 mag-aaral mula sa bawat klase. Ang pangunahing dahilan nito ay ang hindi pantay na pamamahagi ng edad sa mga klase. Samakatuwid, sa unang kaso, ang pagiging kinatawan ng sample ay mababa, at sa pangalawang kaso, ang pagiging kinatawan ay mataas (ceteris paribus).

Mga uri ng sample

1. Random sampling.

1.1 Simpleng random na pagpili.

1.2 Ang paraan ng sistematikong (o mekanikal) sampling.

1.3 Serial (nested o cluster) sampling.

1.4 Stratified sampling.

2. Non-random sampling (non-probability).

2.2. random na pagpili.

2.3. Multi-stage at single-stage sampling.

1. Random sampling.

Ang isang tampok ng random sampling ay ang lahat ng mga yunit ng pangkalahatang populasyon ay may pantay na posibilidad na mapabilang sa sample. Para sa random sampling, prinsipyo ng pagkakataon. Ang batayan ng sample ay maaaring mga listahan ng mga empleyado ng negosyo, mga direktoryo ng telepono, mga listahan ng pagpaparehistro ng mga may-ari ng kotse, mga listahan ng mga botante sa mga istasyon ng botohan, mga libro sa bahay, pati na rin ang iba't ibang mga listahan na pinagsama-sama ng sosyologo mismo depende sa mga layunin ng pag-aaral. (isang listahan ng mga kalye kung saan isinasagawa ang pagpili ng mga respondent).

Karaniwang ginagamit ang random sampling sa mga poll ng opinyon ng publiko bago ang halalan, mga referendum at iba pang pampublikong kaganapan.

plus ng pamamaraang ito ay ang kumpletong pagtalima ng prinsipyo ng randomness at, bilang isang resulta, ang pag-iwas sa mga sistematikong pagkakamali.

Mga disadvantages ng pamamaraang ito:

– Ang pangangailangan para sa isang listahan ng mga elemento ng populasyon.

- Kahirapan sa pagsasagawa ng survey.

– Medyo malaki ang sample size.

Sample o sampling set - isang set ng mga kaso (mga paksa, bagay, kaganapan, sample), gamit ang isang tiyak na pamamaraan, pinili mula sa pangkalahatang populasyon para sa pakikilahok sa pag-aaral.

Mga halimbawang katangian:

Mga katangian ng husay ng sample - kung sino ang eksaktong pipiliin namin at kung anong mga paraan ng pagbuo ng sample ang ginagamit namin para dito.
Ang quantitative na katangian ng sample ay kung gaano karaming mga kaso ang pipiliin natin, sa madaling salita, ang laki ng sample.

Kailangan ng sampling

Ang layunin ng pag-aaral ay napakalawak. Halimbawa, ang mga mamimili ng mga produkto ng isang pandaigdigang kumpanya ay isang malaking bilang ng mga merkado na nakakalat sa heograpiya.
May pangangailangang mangolekta ng pangunahing impormasyon.

Dependent at independiyenteng mga sample

Kapag naghahambing ng dalawa (o higit pang) sample mahalagang parameter ay ang kanilang pagtitiwala. Kung posible na magtatag ng isang homomorphic na pares (iyon ay, kapag ang isang kaso mula sa sample X ay tumutugma sa isa at isang kaso lamang mula sa sample Y at vice versa) para sa bawat kaso sa dalawang sample (at ang batayan ng relasyon na ito ay mahalaga para sa katangian sinusukat sa mga sample), ang mga naturang sample ay tinatawag na dependent. Mga halimbawa ng mga dependent na seleksyon:

pares ng kambal
dalawang sukat ng anumang tampok bago at pagkatapos ng eksperimentong pagkakalantad,
mag-asawa

Kung walang ganoong ugnayan sa pagitan ng mga sample, ang mga sample na ito ay itinuturing na independyente, halimbawa:

lalaki at babae,
mga psychologist at mathematician.

Alinsunod dito, ang mga dependent na sample ay palaging may parehong laki, habang ang laki ng mga independent sample ay maaaring magkaiba.

Ang konsepto ng "sample" sa mga istatistika, sosyolohiya, marketing ay isinasaalang-alang sa dalawang kahulugan. Una, ito ay isang hanay ng mga elemento ng pangkalahatang populasyon na pag-aaralan, i.e. set ng sampling. Pangalawa, ang sampling ay ang proseso ng pagbuo ng sample na populasyon kapag kinakailangang kondisyon tiyakin ang pagiging kinatawan. Maglaan iba't ibang uri mga sample (pagpili) at mga uri ng sample.

Tulad ng para sa mga uri ng mga sample, sa prinsipyo mayroong tatlo sa kanila. Ito ay tungkol tungkol sa mismong mga prinsipyo ng diskarte sa pagpili ng mga sampling unit mula sa pangkalahatang populasyon. Maaaring ang mga ito ay ang mga sumusunod:

kusang pagpili, ibig sabihin. pagpili batay sa prinsipyo ng pagiging kusang-loob at pagiging naa-access ng pagsasama ng mga yunit ng pangkalahatang populasyon sa sample. Ito ay madalas na ginagamit, sa partikular, sa mail at press survey. Ang pangunahing kawalan ng naturang pagpili ay ang imposibilidad ng isang husay na representasyon ng pangkalahatang populasyon;

probabilistiko(random) pagpili- isa sa mga pangunahing ginagamit sa sosyolohikal na pananaliksik. Ang pangunahing prinsipyo ng naturang pagpili ay upang matiyak na ang bawat yunit ng pangkalahatang populasyon ay maaaring makapasok sa sample. Para sa layuning ito, ang mga talahanayan ng mga random na numero, pagpili ng lottery, pagpili ng mekanikal ay ginagamit;

stratified selection, na batay sa pagbuo ng isang modelo ng husay ng pangkalahatang populasyon, pagkatapos - ang pagpili ng mga yunit ng pagmamasid sa sample na populasyon, batay sa umiiral na modelo.

[At Mga Pinagmulan: Wikipedia, Poltorak V.A. Pananaliksik sa Marketing: Mga Paraan at Teknolohiya]

Gawain bilang 3

Tanong: Palawakin ang nilalaman ng konsepto ng pagbabago sa lipunan.

Ang konsepto ng pagbabago sa lipunan. Ang konsepto ng "pagbabagong panlipunan" ay tumutukoy sa iba't ibang pagbabagong nagaganap sa paglipas ng panahon sa mga panlipunang komunidad, grupo, institusyon, organisasyon at lipunan, sa kanilang relasyon sa isa't isa, gayundin sa mga indibidwal. Ang ganitong mga pagbabago ay maaaring isagawa: sa antas interpersonal na relasyon(halimbawa, mga pagbabago sa istraktura at mga tungkulin ng pamilya); sa antas ng mga organisasyon at institusyon (edukasyon, agham ay patuloy na napapailalim sa mga pagbabago kapwa sa mga tuntunin ng kanilang nilalaman at sa mga tuntunin ng kanilang organisasyon), sa antas ng maliit at malalaking grupo ng lipunan (sa Russia, lalo na, ang komposisyon ng uring manggagawa, ang magsasaka ay nagbabago na, bago mga pangkat panlipunan- mga negosyante), sa societal at pandaigdigang antas (mga proseso ng paglipat, pang-ekonomiya at teknolohikal na pag-unlad ng ilang mga bansa at pagwawalang-kilos at krisis sa iba, banta sa kapaligiran at militar sa pagkakaroon ng sangkatauhan, atbp.).

Seksyon II. MATH STATISTICS

Paksa 6. Selective method. Serye ng pagkakaiba-iba

At ang mga katangian nito

Ang mga istatistika ng matematika ay nababahala sa pag-aaral ng mga pattern na namamahala sa mass phenomena, batay sa mga resulta ng mga obserbasyon.

Layunin ng MS: paglikha ng mga pamamaraan para sa pagkolekta at pagproseso ng istatistikal na data upang makakuha ng siyentipiko at praktikal na mga konklusyon.

Paraan mga istatistika ng matematika kailangan upang malutas ang dalawa mga gawain:

1) isang indikasyon ng mga pamamaraan para sa pagkolekta at pagpapangkat ng istatistikal na impormasyon na nakuha bilang resulta ng mga eksperimento o obserbasyon;

2) pagbuo ng mga pamamaraan ng pagtatasa ng istatistika ng data (pagsusuri ng mga function at parameter ng pamamahagi; pagsubok ng mga istatistikal na hypotheses; pagsusuri ng mga dependency sa pagitan ng mga random na variable).

Ang konsepto ng selective observation at ang teoretikal na katangian nito.

Sa pagsasagawa ng mga istatistikal na obserbasyon, dalawang uri ng mga obserbasyon ay nakikilala:

Patuloy, kapag pinag-aralan ang lahat ng bagay ng populasyon (census ng populasyon);

Selective, kapag ang isang bahagi ng random na piniling mga bagay ay pinag-aralan (sociological studies na sumasaklaw sa isang bahagi ng populasyon).

Ang teorya ng selective observation ay nakabatay sa statistical regularities na nabuo at matatagpuan sa mass phenomena at mga proseso.

Ang mga pattern na nauugnay sa pagkakataon at tanging sa iba't ibang mga phenomena na nagpapakita ng kanilang sarili bilang isang batas ay tinatawag istatistika. Ang pag-aari na ito ng mga pattern ay konektado sa batas ng malalaking numero. Ang mathematical na batayan ng batas ng malalaking numero, at ng istatistikal na agham sa pangkalahatan, ay ang teorya ng probabilidad, na nag-aaral ng mga random na phenomena (mga pangyayari) na may matatag na partikularidad, at, dahil dito, probabilidad, na tumutulong upang makilala ang mga pattern sa masa. pag-uulit ng mga phenomena.

Pangkalahatang populasyon at sample. Mga uri ng sample.

Pangkalahatang populasyon ay ang set ng lahat ng bagay na pag-aaralan, kung saan ginawa ang isang sample.

set ng sampling, o, sampling, ay isang hanay ng mga bagay na random na pinili mula sa pangkalahatang populasyon, na napapailalim sa direktang pag-aaral.

Laki ng populasyon ay ang bilang ng mga bagay nito. Ang pangkalahatang populasyon ay maaaring magkaroon ng parehong may hangganan at walang katapusang laki (N), habang ang sample ay maaari lamang magkaroon ng isang may hangganang laki (n).

Halimbawa. Sa 2000 na produkto, 100 produkto ang napili para sa survey, pagkatapos ay ang dami ng pangkalahatang populasyon ay , at ang sample size ay .

Paraan ng sampling- Ito ay isang paraan ng pananaliksik kung saan ang mga katangian ng pangkalahatang populasyon ay sinusuri gamit ang isang sample. Kasabay nito, ang mga konklusyon na nakuha sa pag-aaral ng bahaging ito ay ipinamamahagi sa buong hanay ng mga bagay.

Mga uri ng sample

Simpleng random sampling, na nabuo sa pamamagitan ng random na pagpili ng mga elemento nang hindi hinahati ang pangkalahatang populasyon sa mga bahagi.

Mechanical sampling, kung saan ang mga elemento mula sa pangkalahatang populasyon ay pinili sa isang tiyak na pagitan. Kaya, kung ang laki ng sample ay dapat na 10% ng pangkalahatan, ang bawat ika-10 elemento ay pipiliin.

Karaniwang sample, kung saan ang mga elemento ay random na pinili mula sa mga tipikal na grupo, kung saan ang pangkalahatang populasyon ay hinati ayon sa ilang pamantayan. Halimbawa, ang pagpili ng mga bahagi mula sa produksyon ng bawat makina, at hindi mula sa kabuuan.

serial sampling, kung saan hindi mga indibidwal na elemento ang random na pinili, ngunit ang mga buong grupo ng populasyon (serye).

Paulit-ulit tinatawag na sample kung saan ang napiling bagay pagkatapos ng pag-aaral ay ibinalik sa pangkalahatang populasyon at maaari itong muling piliin.

Hindi nauulit tinatawag na sample kung saan ang napiling bagay sa sample ay hindi ibinalik sa pangkalahatang populasyon.

kinatawan(kinatawan) ay isang sample kung saan maaari nating hatulan ang katangian ng interes sa atin sa buong pangkalahatang populasyon. Mga halimbawang kondisyon ng pagiging kinatawan:

1) ang mga bahagi ng sample ay dapat na proporsyonal sa mga bahagi ng pangkalahatang populasyon;

2) dapat na malinaw na ipakita ng sample ang lahat ng katangian ng katangiang pinag-aaralan;

3) ang sample ay dapat sapat na malaki;

4) random sampling.

Mga uri ng sample at ang kanilang aplikasyon. Paksa ng seminar: Sampling sa sosyolohikal na pananaliksik Ang mga pangunahing konsepto ay tinatawag na Sampling

Mga halimbawang hakbang sa disenyo

Mga uri ng sampling plan (sampling)

Mga deterministikong pagpili

Mga sample na hindi kinatawan (convenience).

Mga sinadyang pagpili

Mga sample ng quota

Pananaliksik Window: Brilliant! Ngunit sino ang magbabasa nito?

Mga sample ng posibilidad

Simpleng random sampling

Populasyon

Nagmula sa populasyon

Halimbawang ibig sabihin at pangkalahatang ibig sabihin

Central limit theorem

Buod

Layunin ng pagkatuto 1
Malinaw na matukoy ang pagkakaiba sa pagitan ng mga konsepto ng census (kwalipikasyon) at sampling

Layunin ng pagkatuto 2
Alamin ang kakanyahan at pagkakasunud-sunod ng anim na yugto na ipinatupad ng mga mananaliksik upang makakuha ng sample na populasyon

Layunin ng pagkatuto 3
Tukuyin ang konsepto ng "sampling frame"

Layunin ng pagkatuto 4
Ipaliwanag ang pagkakaiba sa pagitan ng probabilistic at deterministic sampling

Layunin ng pagkatuto 5
Tukuyin ang pagkakaiba sa pagitan ng fixed size sampling at multi-stage (sunod-sunod) sampling

Layunin ng pagkatuto 6
Ipaliwanag kung ano ang sinasadyang sampling at ilarawan ang parehong mga kalakasan at kahinaan nito

Layunin ng pagkatuto 7
Tukuyin ang konsepto ng quota sampling

Layunin ng pagkatuto 8
Ipaliwanag kung ano ang isang parameter sa isang pamamaraan ng pagpili

Layunin ng pagkatuto 9
Ipaliwanag kung ano ang derived set

Layunin ng pagkatuto 10
Ipaliwanag kung bakit ang konsepto ng sampling distribution ay ang pinakamahalagang konsepto ng statistics.

Mga uri ng sample

1. Random sampling.

Mga panitikan at makasaysayang tala ng isang batang technician Ano ang kailangan mong malaman

Mga pagbabago sa pagsusulit sa pisika

Pangkalahatang sangguniang libro para sa pagsusulit sa kasaysayan

Ang pagkamatay ng estado ng Assyrian (sa madaling sabi) salamat nang maaga!

Ang pag-uusig ni Darwin Tinalikuran ba ni Darwin ang kanyang teorya ng ebolusyon

Mga uri ng sample at ang kanilang aplikasyon. Paksa ng seminar: Sampling sa sosyolohikal na pananaliksik Ang mga pangunahing konsepto ay tinatawag na Sampling

Mga halimbawang hakbang sa disenyo

Mga uri ng sampling plan (sampling)

Mga deterministikong pagpili

Mga sample na hindi kinatawan (convenience).

Mga sinadyang pagpili

Mga sample ng quota

Pananaliksik Window: Brilliant! Ngunit sino ang magbabasa nito?

Mga sample ng posibilidad

Simpleng random sampling

Populasyon

Nagmula sa populasyon

Halimbawang ibig sabihin at pangkalahatang ibig sabihin

Central limit theorem

Buod

Layunin ng pagkatuto 1 Malinaw na matukoy ang pagkakaiba sa pagitan ng mga konsepto ng census (kwalipikasyon) at sampling

Layunin ng pagkatuto 2 Alamin ang kakanyahan at pagkakasunud-sunod ng anim na yugto na ipinatupad ng mga mananaliksik upang makakuha ng sample na populasyon

Layunin ng pagkatuto 3 Tukuyin ang konsepto ng "sampling frame"

Layunin ng pagkatuto 4 Ipaliwanag ang pagkakaiba sa pagitan ng probabilistic at deterministic sampling

Layunin ng pagkatuto 5 Tukuyin ang pagkakaiba sa pagitan ng fixed size sampling at multi-stage (sunod-sunod) sampling

Layunin ng pagkatuto 6 Ipaliwanag kung ano ang sinasadyang sampling at ilarawan ang parehong mga kalakasan at kahinaan nito

Layunin ng pagkatuto 7 Tukuyin ang konsepto ng quota sampling

Layunin ng pagkatuto 8 Ipaliwanag kung ano ang isang parameter sa isang pamamaraan ng pagpili

Layunin ng pagkatuto 9 Ipaliwanag kung ano ang derived set

Layunin ng pagkatuto 10 Ipaliwanag kung bakit ang konsepto ng sampling distribution ay ang pinakamahalagang konsepto ng statistics.

Mga uri ng sample

1. Random sampling.

Mga katulad na artikulo

Layunin ng pagkatuto 1
Malinaw na matukoy ang pagkakaiba sa pagitan ng mga konsepto ng census (kwalipikasyon) at sampling

Layunin ng pagkatuto 2
Alamin ang kakanyahan at pagkakasunud-sunod ng anim na yugto na ipinatupad ng mga mananaliksik upang makakuha ng sample na populasyon

Layunin ng pagkatuto 3
Tukuyin ang konsepto ng "sampling frame"

Layunin ng pagkatuto 4
Ipaliwanag ang pagkakaiba sa pagitan ng probabilistic at deterministic sampling

Layunin ng pagkatuto 5
Tukuyin ang pagkakaiba sa pagitan ng fixed size sampling at multi-stage (sunod-sunod) sampling

Layunin ng pagkatuto 6
Ipaliwanag kung ano ang sinasadyang sampling at ilarawan ang parehong mga kalakasan at kahinaan nito

Layunin ng pagkatuto 7
Tukuyin ang konsepto ng quota sampling

Layunin ng pagkatuto 8
Ipaliwanag kung ano ang isang parameter sa isang pamamaraan ng pagpili

Layunin ng pagkatuto 9
Ipaliwanag kung ano ang derived set

Layunin ng pagkatuto 10
Ipaliwanag kung bakit ang konsepto ng sampling distribution ay ang pinakamahalagang konsepto ng statistics.