Termin „próbka” ma podwójne znaczenie. Jest to zarówno procedura doboru elementów badanego obiektu, jak i ogółu elementów obiektu wybranych do bezpośredniego badania.

Całość wszystkich elementów przedmiotu badań socjologicznych nazywamy populacją ogólną. Część populacji wybrana do badania bezpośredniego jest definiowana jako populacja próbna, którą czasami nazywa się próbą. Próba będzie reprezentatywna (reprezentatywna), jeśli odzwierciedla strukturę, podstawowe właściwości i cechy populacji ogólnej, tj. reprezentuje jego zredukowany model.

W zależności od metod doboru jednostek z populacji próby próba może być losowa lub nielosowa. Odmiany doboru losowego to proste losowe lub mechaniczne próbkowanie, zagnieżdżone i stratyfikowane.

Podstawą prostej próby losowej (mechanicznej) jest lista wszystkich potencjalnych respondentów składających się na populację ogólną. Każdej z nich przypisywany jest numer seryjny, który przenoszony jest na osobną kartę, a następnie z ogólnej liczby tych kart z numerami losowo, jak w loterii, wybiera się wymaganą liczbę, która będzie stanowić próbkę.

Wraz ze wskazanymi metodami tworzenia populacji próbnej w tego typu próbie stosowana jest również systematyczna selekcja. W tym przypadku dobór respondentów odbywa się w pewnym kroku, który określa się dzieląc liczebność całej populacji ogólnej przez liczebność populacji próby. Na przykład populacja ogólna to 2 tys. osób, a próba to 200. Dlatego krok doboru respondentów będzie wynosił 10. Oznacza to, że do próby zostanie uwzględniona co dziesiąta populacja ogólna. Jeśli populacja ogólna jest jeszcze większa, do określenia populacji próby używana jest tabela liczb losowych.

W praktyce badań socjologicznych dość powszechna jest metoda selekcji zagnieżdżonej, która polega na selekcji do jednostek badawczych nie pojedynczych respondentów, ale grup ludzi (zbiorów pracy, brygad), a następnie ich pełnego badania. Reprezentatywność zagnieżdżonej próby zapewnia maksymalne podobieństwo składu grup.

Przy próbie warstwowej w populacji ogólnej wyróżnia się warstwy (warstwy), które charakteryzują się największą jednorodnością.

W każdej warstwie wykonywane jest proste losowe (mechaniczne) pobieranie próbek.

Próbkowanie nielosowe opiera się na świadomym i celowym doborze jednostek próby. Jest on reprezentowany przez selekcje spontaniczne i kwotowe, a także przez „podstawową metodę tablicową”.

Selekcja spontaniczna jest stosowana głównie w badaniach pilotażowych i polega na selekcji „pierwszego przybysza”. Ilustracją tej metody mogą być ankiety pocztowe czytelników czasopism lub ankiety kupujących określony rodzaj produktu. Ponieważ w tym przypadku trudno jest ocenić reprezentatywność próby, wnioski z badania dotyczą tylko badanej populacji.

Do selekcji spontanicznej należy również metoda „kuli śnieżnej”, kiedy poszukiwanie jednych respondentów odbywa się pod wpływem innych. Na przykład konieczne jest przeprowadzenie wywiadu z 200 osobami na pewien problem, ale znane są tylko adresy dziesięciu osób, po czym wyszukiwanie innych respondentów trwa aż do osiągnięcia wymaganej wielkości próby.

Do realizacji wyboru kwot potrzebne są informacje dotyczące szeregu cech populacji ogólnej. Dla każdego z nich zestawiane są kwoty (część, udział), odzwierciedlające w określonej proporcji wszystkie cechy populacji ogólnej. Taki dobór uwzględnia np. procentową reprezentację mężczyzn, ich wiek, wykształcenie, zawód, stan cywilny, przynależność etniczną lub terytorialną itp.

Próba kwotowa jest celowo tworzona przez ankieterów zgodnie z parametrami kwotowymi. Przy tworzeniu kwot głównym zadaniem ankietera jest zapewnienie spełnienia warunków doboru losowego, przy którym każdy element populacji ogólnej miałby równe szanse na znalezienie się w próbie.

Metoda macierzy głównej jest wygodna w badaniach pilotażowych w celu wyjaśnienia wszelkich kwestii kontrolnych. W przypadku korzystania z tej metody wielkość próby wynosi 60-70% wielkości próby.

W tworzeniu populacji próbnej ważną rolę odgrywa określenie jej objętości lub liczebności. O wielkości próby decyduje stopień jednorodności lub niejednorodności populacji ogólnej, liczba cech ją charakteryzujących. Im bardziej jednorodny skład populacji, tym mniejsza jest wymagana wielkość próby.

Rodzaj próbki dyktuje specyfikę obliczania wielkości próbki dla każdego z jej rodzajów według określonych wzorów. Z reguły wielkość próby, w zależności od głębokości badania, jego celów i zadań, wynosi 5-10% populacji ogólnej.

cele nauki

  1. Wyraźnie można rozróżnić pojęcia spisu (kwalifikacja) i pobierania próbek.
  2. Poznaj istotę i kolejność sześciu etapów realizowanych przez badaczy w celu uzyskania populacji próbki.
  3. Zdefiniuj pojęcie „ramki próbkowania”.
  4. Wyjaśnij różnicę między próbkowaniem probabilistycznym a deterministycznym.
  5. Rozróżnij próbkowanie o stałej wielkości i próbkowanie wieloetapowe (kolejne).
  6. Wyjaśnij, czym jest celowe pobieranie próbek i opisz zarówno jego mocne, jak i słabe strony.
  7. Zdefiniuj pojęcie próbkowania kwotowego.
  8. Wyjaśnij, czym jest parametr w procedurze wyboru.
  9. Wyjaśnij, czym jest zbiór pochodny.
  10. Wyjaśnij, dlaczego pojęcie rozkładu próbkowania jest najważniejszym pojęciem statystyki.

W ten sposób badacz precyzyjnie zdefiniował problem i zapewnił odpowiednie narzędzia do projektowania badań i zbierania danych do jego rozwiązania. Kolejnym krokiem w procesie badawczym powinien być wybór elementów do zbadania. Możliwe jest zbadanie każdego elementu danej populacji poprzez wykonanie pełnego spisu tej populacji. Pełne badanie populacji nazywa się spisem (kwalifikacja). Jest jeszcze inna możliwość. Pewna część populacji, próbka elementów dużej grupy, poddawana jest badaniom statystycznym i na podstawie danych uzyskanych na tym podzbiorze wyciągane są pewne wnioski dotyczące całej grupy. Możliwość uogólnienia wyników uzyskanych z danych próbki na dużą grupę zależy od metody pobrania próbki. Znaczna część tego rozdziału zostanie poświęcona temu, jak należy pobrać próbkę i dlaczego.

Spis (kwalifikacja)
Pełny spis ludności (populacji).
Próbka
Zbiór elementów podzbioru większej grupy obiektów.

Pojęcie „populacja” czy „zbiór” może odnosić się nie tylko do ludzi, ale także do firm działających w przemyśle wytwórczym, do detalistów czy hurtowników, a nawet do przedmiotów zupełnie nieożywionych, takich jak części produkowane przez przedsiębiorstwo; pojęcie to definiuje się jako cały zestaw elementów, które spełniają określone warunki. Warunki te jednoznacznie definiują zarówno elementy należące do grupy docelowej, jak i elementy, które należy wykluczyć z rozważania.

Badanie, które ma na celu określenie profilu demograficznego konsumentów mrożonej pizzy, powinno rozpocząć się od ustalenia, kto powinien, a kto nie powinien być zaklasyfikowany jako taki. Czy osoby, które choć raz próbowały takiej pizzy, należą do tej kategorii? Osoby, które kupują co najmniej jedną pizzę miesięcznie? W tygodniu? Osoby, które zjadają więcej niż określoną minimalną ilość pizzy w ciągu miesiąca? Badacz musi być bardzo precyzyjny w określeniu grupy docelowej. Należy również zadbać o to, aby próba pochodziła z populacji docelowej, a nie z „jakiejś” populacji, co ma miejsce, gdy operat losowania jest nieodpowiedni lub niekompletny. Ta ostatnia to lista elementów, z których powstanie prawdziwa próbka.

Badacz może preferować podejście doboru próby od badania całej populacji z kilku powodów. Po pierwsze, pełne badanie populacji, nawet o stosunkowo niewielkich rozmiarach, wymaga bardzo dużych nakładów materiałowych i czasowych. Często do czasu zakończenia spisu i przetworzenia danych informacje są już nieaktualne. W niektórych przypadkach kwalifikacja jest po prostu niemożliwa. Załóżmy, że badacze postanowili sprawdzić zgodność rzeczywistej żywotności żarówek elektrycznych z obliczoną, do której muszą je trzymać, dopóki nie ulegną awarii. Jeśli zbadasz w ten sposób całą dostawę lamp, uzyskasz wiarygodne dane, ale nie będzie czym handlować.

Wreszcie, ku wielkiemu zdumieniu początkujących, badacz może preferować pobieranie próbek od spisu, dążąc do dokładności wyników. Spisy wymagają dużej liczby pracowników, co zwiększa prawdopodobieństwo błędów stronniczości (niepróbkowania). Ta okoliczność jest jednym z powodów, dla których US Census Bureau wykorzystuje badania wyrywkowe w celu sprawdzenia dokładności różnych rodzajów spisów. Dobrze przeczytałeś: można przeprowadzić przykładowe ankiety, aby sprawdzić dokładność danych kwalifikacyjnych.

Przykładowe kroki projektowe

Na ryc. Rysunek 15.1 przedstawia sześcioetapową sekwencję, którą badacz może wykonać podczas projektowania próbki. Przede wszystkim należy określić populację docelową lub zbiór elementów, o których badacz chce coś wiedzieć.

Na przykład, badając preferencje dzieci, badacze muszą zdecydować, czy populacja docelowa będzie składać się z samych dzieci, tylko rodziców, czy też obu.

Agregat (populacja)
Zestaw elementów, które spełniają określone warunki.
Ramka do pobierania próbek (podstawa)
Lista elementów, z których zostanie dokonany wybór; może składać się z jednostek terytorialnych, organizacji, osób i innych elementów.

Pewna firma testowała swoje elektryczne „wyścigi” tylko na dzieciach. Dzieci były całkowicie zachwycone. Rodzice różnie zareagowali na nowość. Mamom nie podobał się fakt, że jazda nie uczyła dzieci przyjazności dla samochodu, a ojcom nie podobał się fakt, że produkt był zrobiony jak zabawka.
Możliwa jest również sytuacja odwrotna. Firma wprowadziła na rynek nowy produkt spożywczy i rozpoczęła ogólnopolską kampanię reklamową skierowaną do dziecka w wieku przedwcześnie rozwiniętym.Firma testowała skuteczność reklam tylko na zachwyconych matkach. Dzieci natomiast uznały to „przyspieszenie”, a wraz z nim sam reklamowany produkt za obrzydliwe. Produkt zakończony 1 .

Badacz musi zdecydować, z kogo lub z czego będzie się składać dana populacja: jednostki, rodziny, firmy, inne organizacje, transakcje kartami kredytowymi itp. Przy podejmowaniu takich decyzji konieczne jest określenie elementów, które powinny być wyłączone z populacji. Należy dokonać odniesienia zarówno czasowego, jak i geograficznego elementów, co w niektórych przypadkach może podlegać dodatkowym warunkom lub ograniczeniom. Na przykład, jeśli mówimy o jednostkach, pożądana populacja może składać się tylko z osób powyżej 18 roku życia lub tylko kobiet, lub tylko osób z wykształceniem co najmniej średnim.

Zadanie określenia granic geograficznych dla populacji docelowej w międzynarodowych badaniach marketingowych może stanowić szczególny problem, ponieważ zwiększa to niejednorodność rozważanego systemu. Na przykład względny stosunek obszarów miejskich i wiejskich może się znacznie różnić w zależności od kraju. Aspekt terytorialny ma poważny wpływ na skład ludności iw obrębie samego kraju. Na przykład na północy Chile zwarta jest populacja głównie indyjska, podczas gdy w południowych regionach kraju żyją głównie potomkowie Europejczyków.

Pokrycie (incydent)
Odsetek członków populacji lub grupy, którzy spełniają warunki włączenia do próby.

Ogólnie rzecz biorąc, im prostsza jest zdefiniowana populacja docelowa, tym większy jest jej zasięg (zapadalność) oraz łatwiejsza i tańsza procedura doboru próby. Pokrycie (incydent) odpowiada proporcji elementów populacji lub grupy, wyrażonej w procentach, które spełniają warunki włączenia do próby. Pokrycie bezpośrednio wpływa na czas i koszty materiałowe wymagane do przeprowadzenia ankiety. Jeśli zasięg jest duży (tj. większość elementów populacji spełnia jedno lub więcej prostych kryteriów stosowanych do identyfikacji potencjalnych respondentów), czas i koszty materiałowe wymagane do zebrania danych są zminimalizowane. I odwrotnie, wraz ze wzrostem liczby kryteriów, jakie muszą spełnić potencjalni respondenci, rosną zarówno koszty materiałowe, jak i czasowe.

Na ryc. 15,2 pokazuje odsetek dorosłej populacji zaangażowanych w określone sporty. Z danych przedstawionych na rysunku wynika, że ​​badanie osób jeżdżących na motocyklu jest znacznie trudniejsze i bardziej kosztowne (tylko 3,6% ogólnej liczby dorosłych) niż osób chodzących regularnie na spacery rekreacyjne (27,4% ogólnej liczby osób). dorośli ludzie). Najważniejsze jest to, aby badacz precyzyjnie określił, które elementy należy uwzględnić w badanej populacji, a które z niej wykluczyć. Jasne określenie celu badania znacznie ułatwia rozwiązanie tego problemu. Drugim krokiem w procesie losowania jest wyznaczenie operatu losowania, który jak już wiesz jest listą elementów, z których zostanie wylosowana próbka. Niech populacją docelową określonego badania będą wszystkie rodziny mieszkające w rejonie Dallas. Na pierwszy rzut oka książka telefoniczna w Dallas może być dobrym i łatwo dostępnym operatem losowania. Niemniej jednak po bliższym przyjrzeniu się staje się oczywiste, że wykaz rodzin zawarty w spisie nie jest do końca poprawny, ponieważ pominięto w nim numery niektórych rodzin (oczywiście nie obejmuje to rodzin, które nie mają telefonów), natomiast niektóre rodziny mają kilka numerów telefonów. W spisie nie ma również osób, które w ostatnim czasie zmieniły miejsce zamieszkania, a tym samym numer telefonu.

Doświadczeni badacze dochodzą do wniosku, że dokładne dopasowanie operatu losowania do badanej populacji docelowej jest bardzo rzadkie. Jednym z najbardziej kreatywnych kroków w projektowaniu losowania jest określenie odpowiedniego operatu losowania w przypadkach, gdy trudno jest wymienić członków populacji. Może to wymagać próbkowania z bloków roboczych i prefiksów, gdy na przykład używane jest wybieranie losowe ze względu na braki w książkach telefonicznych. Jednak znaczny wzrost jednostek pracy w ciągu ostatnich 10 lat utrudnił to zadanie. Podobne sytuacje mogą wystąpić również podczas selektywnej obserwacji stref terytorialnych lub organizacji z późniejszym doborem podpróbek, gdy np. osobniki stanowią populację docelową, ale nie ma ich dokładnej, aktualnej listy.

Źródło: na podstawie danych zawartych w PIS- LITE TM: L ow incydent T ukierunkowany S ampling” (Fairfield, Connecticut: Survey Sampling, Inc., 1994).

Trzeci krok w procedurze losowania jest ściśle związany z określeniem operatu losowania. Wybór metody lub procedury losowania zależy w dużej mierze od przyjętego przez badacza operatu losowania. Różne rodzaje próbek wymagają różnych rodzajów operatów losowania. W tym i następnym rozdziale przedstawimy przegląd głównych typów próbek wykorzystywanych w badaniach marketingowych. Opisując je, związek między operatem a sposobem jego tworzenia powinien stać się oczywisty.

Czwartym krokiem w procedurze pobierania próbek jest określenie wielkości próbki. Problem ten omówiono w rozdz. 17. Na piątym etapie badacz musi dokonać faktycznego wyboru elementów, które zostaną poddane badaniu. Stosowana do tego metoda zależy od wybranego rodzaju próbki; omawiając metody doboru próby, porozmawiamy również o doborze jego elementów. I na koniec badacz musi faktycznie zbadać zidentyfikowanych respondentów. Na tym etapie istnieje duże prawdopodobieństwo popełnienia szeregu błędów.
Problemy te i niektóre metody ich rozwiązywania omówiono w Rozdz. osiemnaście.

Rodzaje planów pobierania próbek (pobieranie próbek)

Wszystkie metody próbkowania można podzielić na dwie kategorie: obserwacja prób probabilistycznych i obserwacja prób deterministycznych. W próbie probabilistycznej każdy członek populacji może być uwzględniony z pewnym określonym niezerowym prawdopodobieństwem. Prawdopodobieństwo włączenia niektórych członków populacji do próby może być różne, ale prawdopodobieństwo włączenia do niej każdego elementu jest znane. Prawdopodobieństwo to jest określane przez specjalną mechaniczną procedurę stosowaną do wyboru elementów próbki.

W przypadku próbek deterministycznych oszacowanie prawdopodobieństwa włączenia dowolnego elementu do próbki staje się niemożliwe. Nie można zagwarantować reprezentatywności takiej próbki. Na przykład, Allstate Corporation rozwijał system do przetwarzania danych szkodowych 14 mln gospodarstw domowych (swoich klientów). Firma planuje wykorzystać te dane do określenia wzorców popytu na jej usługi, takich jak prawdopodobieństwo, że gospodarstwo domowe posiadające Mercedesa będzie również właścicielem domu wakacyjnego (co będzie wymagało ubezpieczenia). Chociaż baza danych jest bardzo obszerna, firma nie ma możliwości oszacowania prawdopodobieństwa zgłoszenia roszczenia przez konkretnego klienta. W związku z tym firma nie może być pewna, że ​​dane klienta będące przedmiotem roszczenia są reprezentatywne dla wszystkich klientów firmy; aw jeszcze mniejszym stopniu - w stosunku do potencjalnych klientów.

Wszystkie próby deterministyczne są oparte na osobistej pozycji, ocenie lub preferencjach badacza, a nie na mechanicznej procedurze selekcji członków próby. Takie preferencje mogą czasami dać dobre oszacowanie cech populacji, ale nie ma sposobu, aby obiektywnie określić przydatność próby do zadania. Ocenę dokładności wyników próby można dokonać tylko wtedy, gdy znane były prawdopodobieństwa doboru określonych elementów. Z tego powodu praca z próbkowaniem prawdopodobieństwa jest ogólnie uważana za lepszą metodę szacowania wielkości błędu próbkowania. Próbki można również podzielić na próbki o stałej wielkości i próbki sekwencyjne. Podczas pracy z próbami o stałej wielkości wielkość próby określa się przed rozpoczęciem badania, a analizę wyników poprzedza zebranie wszystkich niezbędnych danych. Interesują nas głównie próbki o stałej wielkości, ponieważ ten typ jest zwykle wykorzystywany w badaniach marketingowych.

Próbkowanie prawdopodobieństwa
Próbka, w której każdy element populacji może być uwzględniony z pewnym znanym niezerowym prawdopodobieństwem.
Próbkowanie deterministyczne
Próbkowanie oparte na pewnych szczególnych preferencjach lub osądach, które determinują wybór pewnych elementów; jednocześnie niemożliwe staje się oszacowanie prawdopodobieństwa włączenia do próby dowolnego elementu populacji.

Nie należy jednak zapominać, że istnieją również próbki sekwencyjne, które można wykorzystać z każdym z podstawowych schematów pobierania próbek omówionych poniżej.

W próbie sekwencyjnej liczba wybranych elementów nie jest z góry znana, jest określana na podstawie szeregu decyzji sekwencyjnych. Jeżeli badanie na małej próbie nie daje wiarygodnych wyników, zakres badanych elementów zostaje rozszerzony. Jeśli wynik nie będzie jednoznaczny po tym, wielkość próbki zostanie ponownie zwiększona. Na każdym etapie podejmowana jest decyzja, czy otrzymany wynik uznać za wystarczająco przekonujący, czy też kontynuować zbieranie danych. Praca z próbkowaniem sekwencyjnym pozwala na ocenę trendu (tendencji zmian) danych w miarę ich gromadzenia, co zmniejsza koszty związane z dodatkowymi obserwacjami w przypadkach, gdy ich celowość się nie sprawdza.

Zarówno probabilistyczne, jak i deterministyczne plany pobierania próbek dzielą się na kilka typów. Na przykład próby deterministyczne mogą być niereprezentatywne (wygodne), celowe lub kwotowe, próby probabilistyczne dzielą się na proste losowe, warstwowe lub grupowe (skupienie), a te z kolei można podzielić na podtypy. Na ryc. Rysunek 15.3 przedstawia rodzaje próbek, które zostaną omówione w tym i następnym rozdziale.

Próbka stała (próbka stała)
Próbka, której wielkość jest określona a priori; wymagane informacje są określone przez wybrane elementy.
Próbkowanie sekwencyjne
Próba utworzona na podstawie serii kolejnych decyzji. Jeżeli po rozważeniu małej próbki wynik jest niejednoznaczny, rozważana jest większa próba; jeśli ten krok nie prowadzi do wyniku, wielkość próby ponownie się zwiększa itd. W ten sposób na każdym etapie podejmowana jest decyzja, czy uzyskany wynik można uznać za wystarczająco przekonujący.

Należy pamiętać, że podstawowe rodzaje próbek można łączyć, tworząc bardziej złożone plany pobierania próbek. Jeśli nauczysz się ich podstawowych typów początkowych, łatwiej będzie ci radzić sobie z bardziej złożonymi kombinacjami.

Selekcje deterministyczne

Jak już wspomniano, przy doborze elementów próby deterministycznej decydującą rolę odgrywają prywatne szacunki lub decyzje. Czasami oceny te pochodzą od badacza, w innych przypadkach doboru elementów populacji powierza się personelowi terenowemu. Ponieważ elementy nie są dobierane mechanicznie, niemożliwe staje się określenie prawdopodobieństwa włączenia dowolnego elementu do próbki i odpowiednio błędu próbkowania. Nieznajomość błędu z powodu wybranej procedury pobierania próbek uniemożliwia badaczom ocenę dokładności ich szacunków.

Niereprezentatywne (wygodne) próbki

Niereprezentatywne (wygodne) próbki czasami określane jako losowe, ponieważ dobór elementów próby odbywa się w sposób „losowy” – wybierane są te elementy, które są lub wydają się być najbardziej dostępne w okresie doboru.

Nasze codzienne życie pełne jest przykładów takich wyborów. Rozmawiamy z przyjaciółmi i na podstawie ich reakcji i stanowisk wyciągamy wnioski na temat upodobań politycznych panujących w społeczeństwie; lokalna stacja radiowa zachęca do wyrażenia swojej opinii w jakiejś kontrowersyjnej sprawie, ich zdanie jest interpretowane jako przeważające; wzywamy do współpracy wolontariuszy i współpracujemy z tymi, którzy chcą nam pomóc. Problem z próbkami wygodnymi jest oczywisty – nie możemy być pewni, czy próbki tego rodzaju faktycznie reprezentują populację docelową. Wciąż możemy wątpić, że opinie naszych przyjaciół prawidłowo odzwierciedlają poglądy polityczne panujące w społeczeństwie, ale często chcemy wierzyć, że tak dobrane większe próbki są reprezentatywne. Pokażmy na przykładzie błąd takiego założenia.
Kilka lat temu jedna z lokalnych stacji telewizyjnych w mieście, w którym mieszka autorka tej książki, prowadziła codzienny sondaż opinii publicznej na tematy interesujące lokalną społeczność. Sondaże, nazwane „The Madison Pulse”, zostały przeprowadzone w następujący sposób. Każdego wieczoru podczas wiadomości o szóstej stacja zadawała widzom pytanie dotyczące konkretnej kontrowersyjnej kwestii, na którą trzeba było udzielić pozytywnej lub negatywnej odpowiedzi.

W przypadku odpowiedzi pozytywnej należało zadzwonić pod jeden, w przypadku odpowiedzi negatywnej - na inny numer telefonu. Liczba głosów „za” i „przeciw” została naliczona automatycznie. W wiadomościach o dziesiątej poinformowano o wynikach ankiety telefonicznej. Każdego wieczoru do studia dzwoniło od 500 do 1000 osób, aby wyrazić swoje stanowisko w tej czy innej sprawie; komentator telewizyjny zinterpretował wyniki sondażu jako dominującą opinię w społeczeństwie.

Niereprezentatywna (wygodna) próbka
Czasami nazywany losowym, ponieważ dobór elementów próby odbywa się w sposób „losowy” – wybierane są te elementy, które są lub wydają się być najbardziej dostępne w okresie doboru.

W jednym z sześciogodzinnych odcinków widzom zadano następujące pytanie: „Czy nie uważasz, że wiek picia w Madison powinien zostać obniżony do 18 lat?” Istniejące kwalifikacje prawne odpowiadały 21 latom. Publiczność zareagowała na to pytanie niezwykłą aktywnością – tego wieczoru do studia zadzwoniło prawie 4000 osób, z czego 78% opowiedziało się za obniżeniem granicy wieku. Wydaje się jasne, że próbka 4000 „powinna być reprezentatywna” dla społeczności 180 000. Nic takiego. Jak można się domyślić, niektóre grupy wiekowe były bardziej zainteresowane znanym wynikiem niż inne. Nic więc dziwnego, że w dyskusji na ten temat, która odbyła się kilka tygodni później, okazało się, że w czasie przeznaczonym na ankietę studenci działali wspólnie. Dzwonili po kolei do telewizora, za każdym razem kilka razy. Ani wielkość próby, ani odsetek zwolenników liberalizacji prawa nie były więc niczym zaskakującym. Próba nie była reprezentatywna.

Samo zwiększenie wielkości próby nie czyni jej reprezentatywną. Reprezentatywność próby zapewnia nie wielkość, ale odpowiednia procedura doboru elementów. W przypadku dobrowolnego doboru uczestników badania lub doboru elementów próby na podstawie ich dostępności, plan doboru próby nie gwarantuje reprezentatywności próby. Dowody empiryczne sugerują, że próbki wybrane dla wygody rzadko są reprezentatywne (bez względu na ich wielkość). Sondaże telefoniczne, które uwzględniają 800-900 głosów, są najczęstszą formą dużych, ale niereprezentatywnych próbek.

Celowe pobieranie próbek
Próbkowanie deterministyczne (ukierunkowane), którego elementy wybiera się ręcznie; dobierane są te elementy, które w opinii badacza spełniają cele ankiety.
Dobór celowy, w zależności od zdolności badacza do ustalenia początkowego zbioru respondentów o pożądanych cechach; następnie ci respondenci są wykorzystywani jako informatorzy, którzy determinują dalszą selekcję jednostek.

Niestety, wiele osób ufnie traktuje wyniki takich ankiet. Jednym z najbardziej typowych przykładów wykorzystania niereprezentatywnych prób w międzynarodowych badaniach marketingowych jest badanie niektórych krajów na próbie składającej się z obcokrajowców mieszkających obecnie na terytorium kraju, który zainicjował badanie (np. Skandynawowie mieszkający w USA). Chociaż takie próbki mogą rzucić nieco światła na pewne aspekty rozpatrywanej populacji, należy pamiętać, że osoby te reprezentują zazwyczaj „zamerykanizowaną” elitę, której związek z własnym krajem może być dość arbitralny. Nie zaleca się stosowania niereprezentatywnych prób w badaniach opisowych lub przyczynowych. Są one dopuszczalne tylko w badaniach eksploracyjnych mających na celu przetestowanie pewnych pomysłów lub pomysłów, ale nawet w tym przypadku lepiej jest używać przemyślanych próbek.

Celowe selekcje

Próbki celowe są czasami określane jako nieskoncentrowany; ich elementy, które w opinii badacza spełniają cele badania, dobierane są ręcznie. Procter & Gamble zastosował tę metodę, wyświetlając reklamy osobom w wieku od 13 do 17 lat mieszkającym w pobliżu swojej siedziby w Cincinnati. Dział żywności i napojów firmy zatrudnił tę grupę nastolatków jako swego rodzaju próbkę konsumencką. Pracując 10 godzin tygodniowo w zamian za 1000 dolarów i chodząc na koncert, oglądali reklamy telewizyjne, odwiedzali supermarkety z menedżerami firm, aby obejrzeć ekspozycje produktów, testować nowe produkty i dyskutować o zachowaniach zakupowych. Wybierając przedstawicieli do próby poprzez proces „zatrudniania”, a nie losowo, firma może skupić się na cechach, które uważa za przydatne, takich jak zdolność nastolatka do jasnego wyrażania się, ryzykując, że ich poglądy mogą nie być reprezentatywne dla ich grupy wiekowej .

Jak już wspomniano, wyróżnikiem próbkowania celowego jest kierunkowy dobór jego elementów. W niektórych przypadkach próbki są wybierane nie dlatego, że są reprezentatywne, ale dlatego, że mogą dostarczyć badaczom interesujących ich informacji. Kiedy sąd kieruje się zeznaniami biegłego, poniekąd ucieka się do celowej selekcji. Podobna pozycja może zapanować w rozwoju projektów badawczych. We wstępnym badaniu zagadnienia badacza interesuje przede wszystkim określenie perspektyw badania, co determinuje dobór elementów próby.

Pobieranie próbek śnieżki to rodzaj celowego pobierania próbek stosowany w przypadku określonych typów populacji. Próba ta zależy od zdolności badacza do określenia początkowej grupy respondentów o pożądanych cechach. Respondenci ci są następnie wykorzystywani jako informatorzy w celu ustalenia dalszego doboru osób.

Wyobraź sobie na przykład, że firma chce ocenić zapotrzebowanie na produkt, który umożliwiłby osobom niesłyszącym komunikowanie się przez telefon. Badacze mogą zacząć rozwijać ten problem, identyfikując kluczowe postaci w społeczności osób niesłyszących; ci ostatni mogli wskazać innych członków grupy, którzy zgodzą się wziąć udział w badaniu. Dzięki tej taktyce próbka rośnie jak śnieżka.

Podczas gdy badacz znajduje się na początkowych etapach rozwiązywania problemu, kiedy określane są perspektywy i ewentualne ograniczenia planowanego badania, zastosowanie celowego doboru próby może być bardzo skuteczne. Ale w żadnym wypadku nie powinniśmy zapominać o słabościach tego typu próby, ponieważ może ona być również wykorzystana przez badacza w badaniach opisowych lub przyczynowych, co nie będzie powolne, aby wpłynąć na jakość ich wyników. Klasycznym przykładem tego zapomnienia jest wskaźnik cen konsumpcyjnych („CPI”). Jak wskazuje Südman ( Sudman): „CPI ustalane jest tylko dla 56 miast i obszarów metropolitalnych, na których wybór wpływa również czynnik polityczny. W rzeczywistości te miasta mogą reprezentować tylko siebie, podczas gdy indeks nazywa się wskaźnik cen towarów i usług konsumpcyjnych dla mieszkańców miast, którzy zarabiają na stawce godzinowej*, oraz pracowników i wydaje się większości ludzi jako wskaźnik odzwierciedlający poziom cen w dowolnym obszarze Stanów Zjednoczonych. Wybór punktów sprzedaży odbywa się również w sposób nielosowy, w efekcie czego oszacowanie ewentualnego błędu próbkowania staje się niemożliwe» (nasza kursywa) 2 .

* Czyli pracownicy. - Notatka. za.

Próbki kwot

Trzeci rodzaj próbkowania deterministycznego − próbki kwot; jego znaną reprezentatywność uzyskuje się poprzez uwzględnienie w nim takiej samej proporcji elementów, które mają określone cechy, jak w badanej populacji (patrz „Okno badawcze 15.1”). Jako przykład rozważ próbę stworzenia reprezentatywnej próby uczniów mieszkających na terenie kampusu. Jeżeli w określonej próbie 500 osób nie ma ani jednego starszego studenta, będziemy mieli prawo wątpić w jego reprezentatywność i zasadność zastosowania wyników uzyskanych na tej próbie do badanej populacji. Pracując z doborem proporcjonalnym, badacz może zapewnić, że odsetek studentów w próbie odpowiada ich udziałowi w ogólnej liczbie studentów.

Załóżmy, że badacz prowadzi wybiórcze badanie studentów wyższych uczelni, a interesuje go to, aby próba odzwierciedlała nie tylko ich przynależność do tej czy innej płci, ale także ich rozkład według kursów. Niech łączna liczba studentów wyniesie 10 000: 3200 studentów pierwszego roku, 2600 studentów drugiego roku, 2200 studentów trzeciego roku i 2000 studentów czwartego roku; z czego 7000 chłopców i 3000 dziewcząt. W przypadku próby 1000, proporcjonalny plan pobierania próbek wymaga 320 studentów pierwszego roku, 260 studentów drugiego roku, 220 trzeciego roku i 200 absolwentów, 700 chłopców i 300 dziewcząt. Badacz może zrealizować ten plan, przydzielając każdemu ankieterowi określoną kwotę, która określi, z którymi studentami powinien się skontaktować.

Próbkowanie kwot Próba deterministyczna dobrana w taki sposób, że proporcja elementów próby o określonych cechach w przybliżeniu odpowiada proporcji tych samych elementów w badanej populacji; każdemu pracownikowi terenowemu przypisuje się kontyngent określający charakterystykę populacji, z którą musi się kontaktować.

Ankieterowi, który ma przeprowadzić 20 wywiadów, można polecić, aby zapytał:

            • sześciu studentów pierwszego roku - pięciu chłopców i jedna dziewczyna;
            • sześciu studentów drugiego roku - czterech chłopców i dwie dziewczynki;
            • czworo studentów III roku - trzech chłopców i jedna dziewczynka;
            • czworo studentów IV roku - dwóch chłopców i dwie dziewczynki.

Należy zwrócić uwagę, że o doborze poszczególnych elementów próby nie decyduje plan badań, ale wybór ankietera, który jest proszony o spełnienie wyłącznie warunków określonych przez limit: przesłuchanie pięciu studentów pierwszego roku, jednego pierwszego itd.

Należy również zauważyć, że ten limit dokładnie odzwierciedla rozkład populacji studentów pod względem płci, ale nieco zniekształca rozkład studentów na kursach; 70% (14 z 20) wywiadów dotyczy chłopców, ale tylko 30% (6 z 20) studentów pierwszego roku, podczas gdy stanowią oni 32% ogólnej liczby studentów. Kwota przydzielona każdemu indywidualnemu ankieterowi może nie odzwierciedlać i zwykle nie odzwierciedla rozkładu cech kontrolnych w populacji – jedynie ostateczna próba powinna być proporcjonalna.

Należy pamiętać, że dobór proporcjonalny zależy bardziej od osobistych, subiektywnych postaw lub ocen niż od obiektywnej procedury doboru próby. Co więcej, w przeciwieństwie do celowego próbkowania, osobista ocena nie należy tutaj do twórcy projektu, ale do ankietera. Powstaje pytanie, czy próbki proporcjonalne można uznać za reprezentatywne, nawet jeśli odtwarzają proporcję składników właściwych dla populacji, które mają pewne cechy kontrolne. W związku z tym należy poczynić trzy uwagi.

Po pierwsze, próba może uderzająco różnić się od populacji innymi ważnymi cechami, co może mieć poważny wpływ na wynik. Na przykład, jeśli badanie poświęcone jest problemowi uprzedzeń rasowych wśród studentów, nie może być obojętna okoliczność, skąd pochodzili respondenci: z miasta czy ze wsi. Ponieważ limit dla cechy „z miasta/wieś” nie został wyznaczony, dokładna reprezentacja tej cechy staje się mało prawdopodobna. Oczywiście istnieje taka alternatywa: określenie limitów dla wszystkich potencjalnie istotnych cech. Jednak wzrost liczby charakterystyk kontrolnych prowadzi do komplikacji specyfikacji. To z kolei komplikuje – a czasem wręcz uniemożliwia – dobór elementów próbki, a w każdym razie prowadzi do wzrostu jej ceny. Jeśli na przykład przynależność miejska lub wiejska oraz status społeczno-ekonomiczny są również istotne dla badania, osoba przeprowadzająca wywiad może być zmuszona do poszukiwania studenta pierwszego roku, który pochodzi z miasta i klasy średniej lub wyższej. Zgadzam się, że znalezienie tylko pierwszego mężczyzny jest znacznie łatwiejsze.

Po drugie, bardzo trudno jest upewnić się, że ta próbka jest naprawdę reprezentatywna. Oczywiście można sprawdzić na próbie, czy rozkład cech nie objętych kontrolą, to ich rozkład w populacji. Jednak taki test może prowadzić tylko do negatywnych wniosków. Ujawnić można tylko rozbieżność rozkładów. Jeżeli rozkłady próby i populacji dla każdej z tych cech powtarzają się, istnieje możliwość, że próba różni się od populacji inną, nie sprecyzowaną wprost cechą.

I wreszcie po trzecie. Ankieterzy, pozostawieni samym sobie, mają skłonność do pewnych działań. Zbyt często uciekają się do przesłuchiwania swoich kumpli. Ponieważ często okazują się, jak sami przeprowadzający wywiad, istnieje niebezpieczeństwo błędu. Dowody z Anglii sugerują, że próbki kwot mają tendencję do:

  1. wyolbrzymienie roli najbardziej dostępnych elementów;
  2. bagatelizowanie roli małych rodzin;
  3. wyolbrzymienie roli rodzin z dziećmi;
  4. bagatelizowanie roli robotników przemysłowych;
  5. bagatelizowanie roli osób o najwyższych i najniższych dochodach;
  6. bagatelizowanie roli słabo wykształconych obywateli;
  7. bagatelizowanie roli osób zajmujących niską pozycję społeczną.
Ankieterzy, którzy wybierają z góry ustalone limity, zatrzymując przypadkowych przechodniów, prawdopodobnie skupią się na obszarach o dużej liczbie potencjalnych respondentów, takich jak centra handlowe, dworce kolejowe i lotniska, wejścia do dużych supermarketów i tym podobne. Praktyka ta prowadzi do nadreprezentacji tych grup osób, które najczęściej odwiedzają takie miejsca. Kiedy wymagane są wizyty domowe, ankieterzy często kierują się wygodą.
Na przykład mogą przeprowadzać ankiety tylko w ciągu dnia, co prowadzi do niedoszacowania opinii pracowników. Między innymi nie wchodzą do zrujnowanych budynków i z reguły nie wjeżdżają na wyższe piętra budynków, które nie mają wind.

W zależności od specyfiki badanego problemu tendencje te mogą prowadzić do różnego rodzaju błędów, ale ich poprawianie na etapie analizy danych wydaje się bardzo, bardzo trudne. Z drugiej strony, przy obiektywnym doborze elementów próby, badacze mają do dyspozycji pewne narzędzia, które pozwalają uprościć procedurę oceny reprezentatywności danej próby. Analizując problem reprezentatywności takich próbek, badacz bierze pod uwagę nie tyle skład próbki, ile procedurę doboru jej elementów.

Okno badań: Genialne! Ale kto to przeczyta?

Każdego roku reklamodawcy wydają miliony dolarów na reklamy, które pojawiają się na stronach niezliczonych publikacji od czasów reklamy po Yankee. Pewnej oceny tekstu i obrazu można dokonać przed jego publikacją, jak to mówią w domu, w agencji reklamowej; tak naprawdę nie jest testowany i oceniany, dopóki reklama nie zostanie opublikowana, otoczona dziesiątkami równie starannie przygotowanych reklam walczących o uwagę czytelnika.

Spółka Skrobia Roper na całym świecie ocenia czytelność reklam zamieszczanych w czasopismach i gazetach konsumenckich, biznesowych, branżowych i branżowych. Wyniki badań są przedstawiane reklamodawcom i agencjom - oczywiście za odpowiednią opłatą. Ponieważ reklamodawcy każdego dnia dokładają wszelkich starań, aby ich reklamy dotarły do ​​konsumentów, firma Skrobia postanowił stworzyć próbkę, która dawałaby subskrybentom aktualne i dokładne informacje o skuteczności reklamy. Każdego roku firma Skrobia przeprowadził wywiady z ponad 50 000 osób, rozważając około 20 000 ogłoszeń. Rocznie badano około 500 pojedynczych publikacji.

Starch stosowała dobór proporcjonalny, z minimum 100 czytelnikami jednej płci i 100 czytelnikami drugiej płci. Starch stwierdził, że przy tej wielkości próby główne odchylenia w poziomie czytelności ustabilizowały się. Czytelnicy w wieku powyżej 18 lat byli przesłuchiwani osobiście, a wszystkie publikacje zostały wzięte pod uwagę, z wyjątkiem tych przeznaczonych dla specjalnych grup (powiedzmy, że przeprowadzono wywiady z dziewczętami w odpowiednim wieku, aby ocenić publikacje z magazynu Seventeen).

Podczas przeprowadzania ankiet brano pod uwagę obszar dystrybucji danej publikacji. Powiedzmy, że badanie magazynu Los Angeles dotyczyło czytelników mieszkających w południowej Kalifornii. „Czas” był badany w całym kraju. Ankieta poświęcona była poszczególnym numerom pisma i była prowadzona jednocześnie w 20-30 miastach.

Każdemu ankieterowi przydzielono niewielką liczbę wywiadów, co służyło zminimalizowaniu wariancji wyników ankiety. Kwestionariusze zostały rozesłane do osób o różnych zawodach iw różnym wieku o różnych dochodach. Każde takie badanie umożliwiało zaprezentowanie stanowisk dość szerokiemu gronu czytelników. Rozpatrując szereg publikacji branżowych, biznesowych i branżowych uwzględniono również specyfikę ich prenumeraty i dystrybucji. Listy prenumeraty dedykowane publikacjom o dość wąskim nakładzie umożliwiły wyselekcjonowanie akceptowalnych respondentów.

W każdej ankiecie ankieterzy prosili respondentów o przejrzenie publikacji i pytali, czy zauważyli jakąkolwiek reklamę. W przypadku odpowiedzi twierdzącej rejestrator zadawał szereg pytań, aby ocenić stopień akceptacji ogłoszenia.

Ta ocena może być trojaka:

  • Zwróćcie uwagę: ci, którzy już zwrócili uwagę na sam fakt pojawienia się takiego ogłoszenia.
  • Zaznajomieni: Ci, którzy pamiętali jakąkolwiek część reklamy, która dotyczyła reklamowanego znaku towarowego lub reklamodawcy.
  • Czytaj: osoby, które przeczytały przynajmniej połowę ogłoszenia.

Po zbadaniu wszystkich ogłoszeń ankieterzy zapisywali kluczowe informacje klasyfikacyjne: płeć, wiek, zawód, stan cywilny, narodowość, dochód, wielkość rodziny i skład rodziny, co pozwoliło na zestawienie krzyżowe stopnia zainteresowania czytelników.

Przy prawidłowym wykorzystaniu dane firmy Skrobia pozwalają reklamodawcom i agencjom identyfikować zarówno nieudane, jak i skuteczne rodzaje schematów reklamowych, które przyciągają i zatrzymują uwagę czytelnika. Tego typu informacje są niezwykle cenne dla reklamodawców, których interesuje przede wszystkim skuteczność prowadzonej przez nich kampanii reklamowej.

Źródło: Roper Starch Worldwide, Mamaronek, NY 10543.

Próbki prawdopodobieństwa

Badacz może określić prawdopodobieństwo włączenia dowolnego elementu populacji do próby probabilistycznej, ponieważ dobór jej elementów odbywa się na podstawie jakiegoś obiektywnego procesu i nie zależy od kaprysów i upodobań badacza czy pracownika terenowego. Ponieważ procedura doboru pierwiastków jest obiektywna, badacz może ocenić wiarygodność uzyskanych wyników, co było niemożliwe w przypadku prób deterministycznych, niezależnie od staranności doboru pierwiastków tych ostatnich.

Nie należy sądzić, że próbki probabilistyczne są zawsze bardziej reprezentatywne niż deterministyczne. W rzeczywistości próbka deterministyczna może być również bardziej reprezentatywna. Zaletą próbek probabilistycznych jest to, że umożliwiają oszacowanie potencjalnego błędu próbkowania. Jeżeli badacz pracuje z próbą deterministyczną, nie dysponuje obiektywną metodą oceny jej adekwatności do celów badania.

Proste losowe pobieranie próbek

Większość ludzi spotyka się z prostymi przypadkowymi próbkami w taki czy inny sposób, albo w ramach kursu statystyki w instytucie, albo czytając o wynikach odpowiednich badań w gazetach lub czasopismach. W prostej próbie losowej każdy element zawarty w próbie ma takie samo prawdopodobieństwo znalezienia się wśród badanych elementów, a każda kombinacja elementów w pierwotnej populacji może potencjalnie stać się próbą. Na przykład, jeśli chcemy zrobić prostą losową próbę wszystkich studentów zapisanych na konkretną uczelnię, wystarczy, że sporządzimy listę wszystkich studentów, każdemu z nazwisk przypiszemy numer i za pomocą komputera losowo wybierzesz dane. liczba elementów.

Populacja

Populacja
Zestaw elementów, które spełniają określone warunki; zwany także populacją badaną (docelową).
Parametr
Pewna cecha lub wskaźnik ogólnej lub badanej populacji.

Ogólny lub studiowany zestaw to kolekcja, z której dokonywany jest wybór. Tę populację (populację) można opisać szeregiem określonych parametrów, które są cechami populacji ogólnej, z których każdy jest pewnym wskaźnikiem ilościowym, odróżniającym jedną populację od drugiej.

Wyobraź sobie, że badana populacja to cała dorosła populacja Cincinnati. Do opisu tej populacji można zastosować szereg parametrów: mediana wieku, odsetek populacji z wyższym wykształceniem, poziom dochodów itp. Należy zauważyć, że wszystkie te wskaźniki mają pewną stałą wartość. Oczywiście możemy je obliczyć, przeprowadzając pełny spis badanej populacji. Zwykle jednak nie opieramy się na kwalifikacji, ale na próbie dobieramy i wykorzystujemy wartości uzyskane podczas selektywnej obserwacji do określenia wymaganych parametrów populacji.

Zilustrujemy to, co zostało powiedziane w tabeli. 15.1 przykład hipotetycznej populacji 20 osób. Praca z małą hipotetyczną populacją, jak ta, ma wiele zalet. Po pierwsze, niewielka wielkość próby ułatwia obliczenie parametrów populacji, które można wykorzystać do jej opisu. Po drugie, ten tom pozwala zrozumieć, co może się stać, gdy zostanie przyjęty konkretny plan pobierania próbek. Obie te cechy ułatwiają porównanie wyników próby z „prawdziwą” iw tym przypadku znaną wartością populacji, co nie ma miejsca w typowej sytuacji, w której rzeczywista wartość populacji jest nieznana. Porównanie oceny z wartością „prawdziwą” nabiera w tym przypadku szczególnej jasności.

Załóżmy, że chcemy oszacować, z dwóch losowo wybranych pozycji, średni dochód jednostek w pierwotnej populacji. Jego parametrem będzie średni dochód. Aby oszacować tę średnią wartość, którą oznaczamy jako μ, musimy podzielić sumę wszystkich wartości przez ich liczbę:

Średnia populacji μ = Suma elementów populacji / Liczba elementów.

W naszym przypadku obliczenia dają:

Populacja pochodna

Populacja pochodna składa się ze wszystkich możliwych próbek, które można wybrać z populacji ogólnej zgodnie z danym planem pobierania próbek (planem pobierania próbek). Statystyka jest cechą lub wskaźnikiem próbki. Przykładowa wartość statystyczna służy do oszacowania konkretnego parametru populacji. Różne próbki zapewniają różne statystyki lub szacunki dla tego samego parametru populacji.

Populacja pochodna
Zbiór wszystkich możliwych do odróżnienia próbek, które można wybrać z populacji ogólnej zgodnie z danym planem pobierania próbek. Statystyka Charakterystyka lub miara próbki.

Rozważ pochodny zestaw wszystkich możliwych próbek, które można wybrać z naszej hipotetycznej populacji 20 osób według planu pobierania próbek, który zakłada, że ​​wielkość próby jest n=2 można uzyskać przez losowy, nie powtarzający się wybór.

Załóżmy na chwilę, że dane dla każdej jednostki populacji - w naszym przypadku nazwisko i dochód jednostki - są napisane w kółeczkach, po czym są one opuszczane do dzbanka i mieszane. Badacz wyjmuje z dzbanka jedno kółko, wypisuje z niego informacje i odkłada je na bok. To samo robi z drugim kubkiem wyjętym z dzbanka. Następnie badacz zwraca oba kubki do dzbanka, miesza jego zawartość i powtarza tę samą sekwencję czynności. W tabeli. 15.2 przedstawia możliwe wyniki wskazanej procedury. Dla 20 kręgów możliwe jest 190 takich kombinacji par.

Dla każdej kombinacji możesz obliczyć średni dochód. Powiedzmy do pobierania próbek AB (k= 1)

k-e Średnia próbki = Suma próbek / Liczba próbek =

Na ryc. 15.4 przedstawia oszacowanie średniego dochodu dla całej populacji i wielkość błędu dla każdego oszacowania dla próbek k = 25, 62 108 147 oraz 189 .

Zanim przejdziemy do rozważenia zależności między dochodem średnim próbki (statystyka) a dochodem średnim populacji (parametr, który należy oszacować), powiedzmy kilka słów o populacji pochodnej. Po pierwsze, w praktyce nie tworzymy agregatów tego rodzaju. Wymagałoby to zbyt wiele czasu i wysiłku. Praktyk ogranicza się do zestawienia tylko jednej próbki o wymaganej wielkości. Badacz używa pojęcie populację pochodną i związaną z nią koncepcję rozkładu próbkowania przy formułowaniu wniosków końcowych.

Jak zostanie pokazane poniżej. Po drugie, należy pamiętać, że populację pochodną definiuje się jako całość wszystkich możliwych różnych próbek, które można wybrać z populacji ogólnej zgodnie z danym planem pobierania próbek. Kiedy jakakolwiek część planu pobierania próbek zostanie zmieniona, zmieni się również populacja pochodna. Jeśli więc przy wyborze kółek badacz zwróci do dzbanka pierwszy z usuniętych krążków przed wyjęciem drugiego, zestaw otrzymany będzie zawierał.

próbki AA, BB itd. Jeżeli liczba niepowtarzalnych próbek wynosi 3 zamiast 2, to będą próbki typu ABC i będzie ich 1140, a nie 190, jak to miało miejsce w poprzednim przypadku. Gdy prosty dobór losowy zostanie zmieniony na dowolną inną metodę określania elementów próby, zmieni się również populacja pochodna.

Należy również pamiętać, że dobór próby o danej liczebności z populacji ogólnej jest równoznaczny z doborem jednego elementu (1 ze 190) z populacji pochodnej. Fakt ten pozwala nam na wyciągnięcie wielu wniosków statystycznych.

Średnia próbki i średnia ogólna

Czy możemy zrównać średnią próbki z rzeczywistą średnią populacji? W każdym razie wychodzimy z tego, że są ze sobą połączone. Wierzymy jednak również, że wystąpi błąd. Na przykład można założyć, że informacje otrzymane od internautów będą znacząco różnić się od wyników badania „zwykłej” populacji. W innych przypadkach możemy założyć dość dokładne dopasowanie, w przeciwnym razie nie moglibyśmy użyć wartości próbki do oszacowania wartości ogólnej. Ale jak duży może być błąd, który popełniamy, robiąc to?

Zsumujmy wszystkie średnie z próby zawarte w tabeli. 15.2 i podziel otrzymaną sumę przez liczbę próbek, tj. Uśrednijmy średnie.
Otrzymamy następujący wynik:

Zbiega się ze średnią wartością populacji ogólnej. Mówią, że w tym przypadku mamy do czynienia bezstronne statystyki.

Statystyka nazywana jest bezstronną, jeśli jej średnia ze wszystkich możliwych próbek jest równa oszacowanemu parametrowi populacji. Zauważ, że nie mówimy tutaj o konkretnej wartości. Oszacowanie częściowe może być bardzo dalekie od prawdziwej wartości - weź na przykład próbki AB lub ST. W niektórych przypadkach prawdziwa wartość populacji może nie być osiągalna, biorąc pod uwagę jakąkolwiek możliwą próbkę, nawet jeśli statystyki są obiektywne. W naszym przypadku tak nie jest: liczba możliwych próbek - na przykład AT - daje średnią próbki równą rzeczywistej średniej populacji.

Sensowne jest rozważenie rozkładu tych szacunków próby, aw szczególności związku między tym rozrzutem szacunków a zmiennością poziomu dochodów w populacji. Jako miarę zmienności stosuje się wariancję populacji ogólnej. Aby określić wariancję populacji ogólnej, musimy obliczyć odchylenie każdej wartości od średniej, dodać kwadraty wszystkich odchyleń i podzielić otrzymaną sumę przez liczbę wyrazów. Oznaczmy przez a^ wariancję populacji ogólnej. Następnie:

Wariancja populacji σ 2 = Suma kwadratów różnic każdego elementu
populacja i średnia populacja / Liczba elementów populacji =

Dyspersja Średnia wartość poziom dochodów można zdefiniować w ten sam sposób. Oznacza to, że możemy ją znaleźć, określając odchylenia każdej średniej od ich całkowitej średniej, sumując kwadraty odchyleń i dzieląc otrzymaną sumę przez liczbę wyrazów.

Możemy również zdefiniować wariancję średniego poziomu dochodów w inny sposób, wykorzystując wariancję poziomów dochodów w populacji ogólnej, ponieważ istnieje bezpośredni związek między tymi dwiema wielkościami. Mówiąc dokładniej, w przypadkach, gdy próba reprezentuje tylko niewielką część populacji, wariancja średniej próby jest równa wariancji populacji podzielonej przez wielkość próby:

gdzie σ x 2 jest wariancją średniej wartości próby poziomu dochodów, σ 2 jest wariancją poziomu dochodów w populacji ogólnej, n- wielkość próbki.

Porównajmy teraz rozkład wyników z rozkładem cechy ilościowej w populacji ogólnej. Rysunek 15.5 pokazuje, że rozkład cechy populacji pokazanej w ramce A jest wielowierzchołkowy (każda z 20 wartości pojawia się tylko raz) i jest symetryczny względem prawdziwej średniej populacji wynoszącej 9400.

Dystrybucja próbek
Rozkład wartości danej statystyki obliczonej dla wszystkich możliwych do wyróżnienia próbek, które można wyekstrahować z populacji w ramach danego planu losowania.

Rozkład ocen przedstawiony w polu B opiera się na danych w tabeli. 15.3, który z kolei został skompilowany poprzez przypisanie wartości z tabeli. 15,2 do jednej lub drugiej grupy, w zależności od ich liczebności, z późniejszym obliczeniem ich liczebności w grupie. Pole B to tradycyjny histogram, rozważany na samym początku studiów statystycznych, który reprezentuje: dystrybucja próbek Statystyka. Na marginesie zauważamy, że pojęcie rozkładu próbkowania jest najważniejszym pojęciem statystyki, jest podstawą konstrukcji wnioskowań statystycznych. Zgodnie ze znanym rozkładem próby badanych statystyk, możemy wnioskować o odpowiednim parametrze populacji ogólnej. Z drugiej strony, jeśli wiadomo tylko, że oszacowanie próbki zmienia się w zależności od próbki, ale natura tej zmiany jest nieznana, określenie błędu próbkowania związanego z tym oszacowaniem staje się niemożliwe. Ponieważ rozkład próbkowania oszacowania opisuje, w jaki sposób zmienia się z próbki na próbkę, stanowi podstawę do określenia ważności oszacowania próbki. Z tego powodu projekt próbkowania prawdopodobieństwa jest tak ważny dla wnioskowania statystycznego.

Biorąc pod uwagę znane prawdopodobieństwa włączenia każdego członka populacji do próby, ankieterzy mogą znaleźć rozkład próby różnych statystyk. To na tych rozkładach opierają się badacze — czy to na średniej z próby, proporcji próby, wariancji próby, czy na jakiejś innej statystyce — przy rozszerzaniu wyniku obserwacji próby na populację ogólną. Należy również zauważyć, że w przypadku próbek o rozmiarze 2 rozkład średnich z próby jest jednomodalny i symetryczny względem rzeczywistej średniej.

Pokazaliśmy więc, że:

  1. Średnia wszystkich możliwych średnich próbek jest równa średniej ogólnej.
  2. Wariancja średnich z próby jest w pewien sposób powiązana z ogólną wariancją.
  3. Rozkład średnich z próby jest unimodalny, natomiast rozkład wartości atrybutu ilościowego w populacji ogólnej jest multimodalny.

Centralne twierdzenie graniczne

Twierdzenie mówiące, że dla prostych losowych próbek o wielkości n, wyizolowany z populacji ogólnej o średniej ogólnej μ i wariancji σ 2 , ogólnie n rozkład średniej próbki x zbliża się do normalnego ze środkiem równym μ i wariancją σ 2 . Dokładność tego przybliżenia wzrasta wraz ze wzrostem n.

Centralne twierdzenie graniczne. Rozkład jednomodalny oszacowań można uznać za przejaw centralnego twierdzenia granicznego, które mówi, że dla prostych losowych próbek o objętości n, wybrany z populacji ogólnej z rzeczywistą średnią μ i wariancją σ 2 , dla dużej n rozkład średnich z próby zbliża się do normalnego ze środkiem równym prawdziwej średniej i wariancją równą stosunkowi wariancji populacji do wielkości próby, tj.:

To przybliżenie staje się coraz dokładniejsze, gdy n. Pamiętaj to. Niezależnie od typu populacji rozkład średnich próby będzie normalny dla prób o wystarczająco dużej liczebności. Co oznacza wystarczająco duża objętość? Jeżeli rozkład wartości atrybutu ilościowego populacji ogólnej jest normalny, to rozkład średnich próbek dla próbek o objętości n=1. Jeśli rozkład zmiennej (atrybutu ilościowego) w populacji jest symetryczny, ale nie normalny, próbki o bardzo małej wielkości dadzą normalny rozkład średnich próby. Jeśli rozkład cechy ilościowej populacji ogólnej ma wyraźną asymetrię, istnieje potrzeba większych próbek. A jednak rozkład średniej próbki można uznać za normalny tylko wtedy, gdy mamy do czynienia z próbą o wystarczającej wielkości.

Aby wyciągnąć wnioski za pomocą krzywej normalnej, wcale nie jest konieczne wychodzenie z warunku normalności rozkładu wartości atrybutu ilościowego populacji ogólnej. Raczej opieramy się na centralnym twierdzeniu granicznym i, w zależności od rozkładu populacji, określamy taką wielkość próby, która pozwoliłaby nam pracować z krzywą normalną. Na szczęście normalny rozkład statystyk zapewniają próbki o stosunkowo niewielkich rozmiarach - ryc. 15.6 wyraźnie pokazuje tę okoliczność. Szacunki przedziałów ufności. Czy powyższe może nam pomóc w wyciągnięciu pewnych wniosków na temat średniej ogólnej? Rzeczywiście, w praktyce wybieramy tylko jedną, a nie wszystkie możliwe próby danej wielkości i na podstawie uzyskanych danych wyciągamy pewne wnioski dotyczące grupy docelowej.

Jak to się stało? Jak wiecie, przy rozkładzie normalnym pewien procent wszystkich obserwacji ma pewne odchylenie standardowe; powiedzmy, że 95% obserwacji mieści się w zakresie ±1,96 odchylenia standardowego średniej. Normalny rozkład średnich z próby, do którego można zastosować centralne twierdzenie graniczne, nie jest w tym sensie wyjątkiem. Średnia takiego rozkładu próbki jest równa średniej ogólnej μ, a jej odchylenie standardowe nazywamy błędem standardowym średniej:

Okazało się, że:

  • 68,26% średnich próbek odbiega od średniej ogólnej o nie więcej niż ± σ x ;
  • 95,45% średniej próbki odbiega od średniej ogólnej o nie więcej niż ± σ x ;
  • 99,73% średnich z próbki odbiega od średniej ogólnej o nie więcej niż ± σ x ,

czyli pewna proporcja średnich próbek w zależności od wybranej wartości z zostanie uwzględniony w przedziale określonym przez wartość z. To wyrażenie można przepisać jako nierówność:

Średnia ogólna - z < Среднее по выборке < Генеральное среднее + z(Błąd standardowy średniej)

zatem średnia próbki z pewnym prawdopodobieństwem znajduje się w przedziale, którego granicami są suma i różnica wartości średniej rozkładu oraz pewna liczba odchyleń standardowych. Nierówność tę można przeliczyć na postać:

Średnia próbki - z(Błąd standardowy średniej)< Генеральное среднее < Среднее по выборке + z(Błąd standardowy średniej)

Jeśli stosunek 15,1 jest obserwowany na przykład w 95% przypadków ( z= 1,96), to w 95% przypadków obserwuje się również stosunek 15,2. W przypadkach, gdy wniosek opiera się na pojedynczej średniej próbki, używamy wyrażenia 15.2.

Należy pamiętać, że wyrażenie 15.2 nie oznacza, że ​​przedział odpowiadający danej próbie musi koniecznie zawierać średnią ogólną. Interwał ma więcej wspólnego z procedurą selekcji. Przedział zbudowany wokół tej średniej może, ale nie musi obejmować rzeczywistą średnią populacji. Nasza wiara w słuszność wyciągniętych wniosków opiera się na fakcie, że 95% wszystkich przedziałów skonstruowanych zgodnie z wybranym planem próbkowania będzie zawierać rzeczywistą średnią. Wierzymy, że nasza próbka należy do tych 95%.

Aby zilustrować ten ważny punkt, wyobraźmy sobie przez chwilę, że rozkład średnich próby dla prób liczebności n= 2 w naszym hipotetycznym przykładzie jest normalne. Tabela 15.4 przedstawia graficznie wyniki dla pierwszych 10 z możliwych 190 próbek, które można wybrać zgodnie z danym projektem. Zauważ, że tylko 7 z 10 przedziałów zawiera średnią ogólną lub rzeczywistą. Zaufanie do słuszności wniosku wynika nie z jakiejś prywatnej oceny, ale właśnie procedura szacunki. Procedura ta jest taka, że ​​dla 100 próbek, dla których zostanie obliczona średnia próbki i przedział ufności, w 95 przypadkach przedział ten będzie zawierał prawdziwą wartość ogólną. Dokładność tej próbki jest określona przez procedurę, według której próbka została utworzona. Reprezentatywny projekt pobierania próbek nie gwarantuje reprezentatywności wszystkich próbek. Procedury wnioskowania statystycznego opierają się na reprezentatywności planu pobierania próbek, dlatego procedura ta jest tak istotna dla próbek probabilistycznych.

Próbkowanie probabilistyczne pozwala nam ocenić dokładność wyników jako bliskość otrzymanych szacunków do wartości prawdziwej. Im większy błąd standardowy statystyki, tym wyższy stopień rozrzutu oszacowań i mniejsza dokładność procedury.

Niektórych może mylić fakt, że poziom ufności jest związany z procedurą, a nie z konkretną wartością próbki, należy jednak pamiętać, że wartość poziomu ufności oszacowania wartości ogólnej można skorygować badacz. Jeśli nie chcesz podejmować ryzyka i obawiasz się, że możesz natknąć się na jeden z pięciu wybranych przedziałów próby, który nie zawiera średniej populacji, możesz wybrać 99% przedział ufności, w którym tylko jeden ze stu przedziałów próby nie uwzględnij średnią populacji. Ponadto, jeśli możesz zwiększyć wielkość próby, zwiększysz stopień ufności wyniku, zapewniając pożądaną dokładność oszacowania wartości populacji. Omówimy to bardziej szczegółowo w rozdz. 17.

Opisywana przez nas procedura ma jeszcze jeden składnik, który może wywołać pewne zakłopotanie. Przy szacowaniu przedziału ufności wykorzystuje się trzy wielkości: x , z i σx . Średnia próbki x jest obliczana z danych próbki, z jest wybierany na podstawie pożądanego poziomu ufności. Ale co z pierwiastkiem błędu średniokwadratowego średniej σ x ? Jest równy:

a zatem, aby to ustalić, musimy zadać odchylenie standardowe atrybutu ilościowego populacji ogólnej, tj. 5. Co zrobić w przypadkach, gdy odchylenie standardowe s nieznany? Ten problem nie pojawia się z dwóch powodów. Po pierwsze, zwykle w przypadku większości cech ilościowych wykorzystywanych w badaniach marketingowych zmienność zmienia się znacznie wolniej niż poziom większości zmiennych interesujących marketera. W związku z tym, jeśli badanie zostanie powtórzone, możemy wykorzystać w obliczeniach poprzednią, wcześniej uzyskaną wartość s. Po drugie, po wybraniu próbki i uzyskaniu danych możemy oszacować wariancję populacji, określając wariancję próbki. Nieobciążoną wariancję próbki definiuje się jako:

Wariancja próbki ŝ 2 = Suma kwadratów odchyleń od średniej z próby / (liczba próbkowanych pozycji -1). Aby określić wariancję próbki, najpierw musimy znaleźć średnią próbki. Następnie znajdują się różnice między każdą z wartości próbki a średnią próbki; różnice te są podnoszone do kwadratu, sumowane i dzielone przez liczbę równą liczbie obserwacji próbki minus jeden. Wariancja próbki nie tylko zapewnia oszacowanie całkowitej wariancji, ale może być również wykorzystana do oszacowania błędu standardowego średniej. Gdy znana jest ogólna wariancja σ 2, znany jest również pierwiastek błędu średniokwadratowego σ x, ponieważ:

Gdy ogólna wariancja jest nieznana, błąd standardowy średniej można jedynie oszacować. To oszacowanie jest podane ŝ x , który jest równy odchyleniu standardowemu próby podzielonemu przez pierwiastek kwadratowy wielkości próby, tj. . Oszacowanie jest określane w taki sam sposób, jak określono oszacowanie wartości prawdziwej, ale zamiast ogólnego odchylenia standardowego do wzoru obliczeniowego podstawia się odchylenie standardowe próbki. Powiedzmy, że dla próbki AB ze średnią próbki 5800:

W związku z tym ŝ = 283, a

i 95% odstępów jest teraz

co jest mniejsze niż poprzednia wartość.

W tabeli. 15.5 podsumowuje wzory obliczeniowe dla różnych średnich i rozrzutów, które zostały omówione w tym rozdziale. Tworzenie prostej próby losowej. W naszym przykładzie dobór elementów próby przeprowadzono za pomocą dzbanka, który zawierał wszystkie elementy pierwotnej populacji. To pozwoliło nam zwizualizować koncepcje populacji pochodnej i dystrybucji próbek. Nie zalecamy stosowania takiej metody w praktyce, ponieważ zwiększa to prawdopodobieństwo błędu. Kubki mogą różnić się zarówno rozmiarem, jak i fakturą, co w niektórych przypadkach może prowadzić do preferowania jednego z nich. Przykładem tego rodzaju błędu może być selekcja uczestników kampanii wietnamskiej, przeprowadzona za pomocą loterii.

Selekcji dokonano wyciągając z wielkiego bębna krążki z datami urodzenia. Telewizja transmituje tę procedurę na terenie całego kraju. Niestety, krążki ładowane były do ​​bębna w sposób systematyczny, przy czym pierwsze były daty styczniowe, a ostatnie grudniowe. Choć bęben był poddawany intensywnemu wirowaniu, daty grudniowe wypadały znacznie częściej niż styczniowe. Następnie procedura ta została zrewidowana w taki sposób, że prawdopodobieństwo wystąpienia takich systematycznych błędów zostało znacznie zmniejszone. Preferowana metoda generowania prostej próby losowej opiera się na wykorzystaniu tabeli liczb losowych.

Korzystanie z takiej tabeli obejmuje następującą sekwencję kroków. Najpierw elementom populacji należy przypisać kolejne liczby od 1 do n; w naszej hipotetycznej populacji do żywiołu A numer 1 zostanie przypisany do elementu b- liczba 2 itd. Po drugie, liczba cyfr w tabeli liczb losowych musi być taka sama jak liczby n. Do n= zostanie użytych 20 liczb dwucyfrowych; dla n od 100 do 999 - liczby trzycyfrowe itp. Po trzecie, pozycję startową należy ustalić losowo. Możemy otworzyć odpowiednią tabelę liczb losowych i zamykając oczy, jak to mówią, szturchać ją palcem. Ponieważ liczby w tabeli liczb losowych są w kolejności losowej, pozycja początkowa tak naprawdę nie ma znaczenia.

I wreszcie możemy poruszać się w dowolnie wybranym kierunku – w górę, w dół lub w poprzek, wybierając te elementy, których numery będą odpowiadać liczbom losowym z tabeli. Aby zilustrować to, co zostało powiedziane, rozważ skróconą tabelę liczb losowych (Tabela 15.6). O ile n= 20, powinniśmy pracować tylko z liczbami dwucyfrowymi. W tym sensie tab. 15,6 idealnie nam odpowiada. Załóżmy, że zdecydowaliśmy się wcześniej przejść w dół kolumny, początkowa pozycja znajduje się na przecięciu jedenastego rzędu i czwartej kolumny, gdzie znajduje się liczba 77. Ta liczba jest zbyt duża i dlatego należy ją odrzucić. Kolejne dwie liczby również zostaną odrzucone, a czwarta wartość 02 zostanie użyta, ponieważ 2 to numer elementu V.

Kolejne pięć liczb również zostanie odrzuconych jako zbyt duże, natomiast liczba 05 wskaże element mi. Więc elementy V oraz mi stanie się naszą dwuelementową próbą, za pomocą której będziemy oceniać poziom dochodów tej populacji. Możliwa jest również strategia alternatywna, w której jako podstawę selekcji posłuży program komputerowy generujący liczby losowe. Ostatnie publikacje wskazują, że liczby generowane przez takie programy nie są całkowicie losowe, co może się w pewien sposób objawiać przy budowaniu złożonych modeli matematycznych, ale można je wykorzystać w większości stosowanych badań marketingowych. Zwróć uwagę, że prosta próba losowa wymaga zestawienia sekwencyjnie numerowanej listy elementów populacji ogólnej.

Innymi słowy, należy zidentyfikować każdego członka pierwotnej populacji. Dla niektórych populacji nie jest to trudne, na przykład w badaniu 500 największych amerykańskich korporacji, których lista znajduje się w magazynie Fortune. Ta lista została już skompilowana, więc stworzenie prostej próby losowej w tym przypadku nie będzie trudne. W przypadku innych populacji początkowych (na przykład dla wszystkich rodzin mieszkających w określonym mieście) sporządzenie ogólnej listy jest niezwykle trudne, co zmusza badaczy do uciekania się do innych schematów badań próbnych.

Streszczenie

Cel nauczania 1
Wyraźnie rozróżnij pojęcia spisu (kwalifikacja) i pobierania próbek

Pełny spis ludności (populacji) nazywa się wykwalifikowany. Próbka zestaw, utworzony z wybranych elementów.

Cel nauczania 2
Poznaj istotę i kolejność sześciu etapów realizowanych przez badaczy w celu uzyskania populacji próbki

Proces pobierania próbek dzieli się na sześć etapów:

  1. przydział populacji;
  2. ustalenie operatu losowania;
  3. wybór procedury selekcji;
  4. określenie wielkości próbki;
  5. dobór elementów próbki;
  6. badanie wybranych elementów.

Cel nauczania 3
Zdefiniuj pojęcie „ramki próbkowania”

Operat losowania to lista pozycji, z których zostanie pobrana próbka.

Cel nauczania 4
Wyjaśnij różnicę między próbkowaniem probabilistycznym a deterministycznym

W próbie probabilistycznej każdy członek populacji może być objęty pewnym podane niezerowe prawdopodobieństwo. Prawdopodobieństwo włączenia niektórych członków populacji do próby może się od siebie różnić, ale prawdopodobieństwo włączenia do niej każdego elementu jest znane. W przypadku próbek deterministycznych oszacowanie prawdopodobieństwa włączenia dowolnego elementu do próbki staje się niemożliwe. Nie można zagwarantować reprezentatywności takiej próbki. Wszystkie deterministyczne wybory opierają się raczej na osobistej pozycji, osądzie lub preferencjach. Takie preferencje mogą czasami dać dobre oszacowanie cech populacji, ale nie ma sposobu, aby obiektywnie określić przydatność próby do zadania.

Cel nauczania 5
Rozróżnij próbkowanie o stałej wielkości i próbkowanie wieloetapowe (kolejne)

W przypadku pracy z próbami o stałej wielkości, wielkość próby określa się przed rozpoczęciem badania, a analizę wyników poprzedza zebranie wszystkich wymaganych danych. W próbie sekwencyjnej liczba wybranych elementów nie jest z góry znana, jest określana na podstawie szeregu decyzji sekwencyjnych.

Cel nauczania 6
Wyjaśnij, czym jest celowe pobieranie próbek i opisz zarówno jego mocne, jak i słabe strony

Pozycje celowego pobierania próbek są wybierane ręcznie i przedstawiane badaczowi zgodnie z potrzebami badania. Zakłada się, że wybrane elementy mogą dać pełny obraz badanej populacji. Dopóki badacz znajduje się na wczesnym etapie rozwiązywania problemu, kiedy określane są perspektywy i ewentualne ograniczenia planowanego badania, zastosowanie doboru celowego może być bardzo skuteczne. Ale w żadnym wypadku nie powinniśmy zapominać o słabościach tego typu próby, ponieważ może ona być również wykorzystana przez badacza w badaniach opisowych lub przyczynowych, co nie będzie powolne, aby wpłynąć na jakość ich wyników.

Cel nauczania 7
Zdefiniuj pojęcie próbkowania kwotowego

Dobór proporcjonalny dobierany jest w taki sposób, aby proporcja elementów próby o określonych cechach w przybliżeniu odpowiadała proporcji tych samych elementów w badanej populacji; w tym celu każdemu licznikowi przypisywany jest limit określający charakterystykę populacji, z którą musi się kontaktować.

Cel nauczania 8
Wyjaśnij, czym jest parametr w procedurze wyboru

Parametr - pewna cecha lub wskaźnik populacji ogólnej lub badanej; pewien wskaźnik ilościowy, który odróżnia jeden zestaw od drugiego.

Cel nauki 9
Wyjaśnij, czym jest zbiór pochodny

Populacja pochodna składa się ze wszystkich możliwych próbek, które można wybrać z populacji ogólnej zgodnie z danym planem pobierania próbek.

Cel nauczania 10
Wyjaśnij, dlaczego pojęcie rozkładu próbkowania jest najważniejszym pojęciem statystyki.

Pojęcie rozkładu próbkowania jest podstawą wnioskowania statystycznego. Zgodnie ze znanym rozkładem próby badanych statystyk, możemy wnioskować o odpowiednim parametrze populacji ogólnej. Z drugiej strony, jeśli wiadomo tylko, że oszacowanie próbki zmienia się w zależności od próbki, ale natura tej zmiany jest nieznana, określenie błędu próbkowania związanego z tym oszacowaniem staje się niemożliwe. Ponieważ rozkład próbkowania oszacowania opisuje, w jaki sposób zmienia się z próbki na próbkę, stanowi podstawę do określenia ważności oszacowania próbki.

Próbka - to:

1) całość tych elementów przedmiotu badań, które będą bezpośrednio badane;

2) metody i procedury doboru elementów przedmiotu badań.

Populacja - komplet obiektów związanych z badanym problemem. W badaniach socjologicznych jako G.S. najczęściej działają agregaty jednostek – ludność (miasta, kraje itp.), grupa społeczna (młodzież, bezrobotni, biznesmeni itp.), odbiorcy środków masowego przekazu (MSK) itp. Jednak w wielu walizki, GS . może składać się z większych elementów (obiektów) - rodzin (gospodarstw domowych), kół naukowych, przedsiębiorstw, wspólnot wyznaniowych, pojedynczych osiedli lub stanów itp.

Populacja próbki - część obiektów z populacji ogólnej wybranych do badań w celu wyciągnięcia wniosków dotyczących całej populacji.

Aby wniosek uzyskany z badania próby można było rozszerzyć na całą populację, próba musi mieć właściwość reprezentatywności.

Reprezentatywność to zdolność próby do reprezentowania badanej populacji. Im dokładniej skład próby reprezentuje populację na badanych zagadnieniach, tym wyższa jest jej reprezentatywność.

PRZYKŁAD: Reprezentatywność można zilustrować następującym przykładem. Załóżmy, że populacja to wszyscy uczniowie szkoły (600 osób z 20 klas, po 30 osób w każdej klasie). Przedmiotem badań jest stosunek do palenia. Próba 60 uczniów szkół średnich reprezentuje populację znacznie gorszą niż próba tych samych 60 osób, która będzie obejmować 3 uczniów z każdej klasy. Główną tego przyczyną jest nierówny rozkład wieku w klasach. Dlatego w pierwszym przypadku reprezentatywność próby jest niska, aw drugim reprezentatywność wysoka (ceteris paribus).

Typy próbek

1. Próbkowanie losowe.

1.1 Prosty losowy wybór.

1.2 Metoda systematycznego (lub mechanicznego) pobierania próbek.

1.3 Próbkowanie szeregowe (zagnieżdżone lub klastrowe).

1.4 Próbkowanie warstwowe.

2. Próbkowanie nielosowe (brak prawdopodobieństwa).

2.2. losowy wybór.

2.3. Próbkowanie wieloetapowe i jednoetapowe.

1. Próbkowanie losowe.

Cechą losowego doboru próby jest to, że wszystkie jednostki z populacji ogólnej mają równe prawdopodobieństwo włączenia do próby. W przypadku losowego pobierania próbek, zasada przypadku. Podstawą próby mogą być spisy pracowników przedsiębiorstwa, książki telefoniczne, spisy rejestrowe właścicieli samochodów, spisy wyborców w lokalach wyborczych, księgi domowe, a także różne spisy opracowywane przez samego socjologa w zależności od celów badanie (lista ulic, na których następnie przeprowadzana jest selekcja respondentów).

Dobór losowy jest zwykle stosowany w sondażach opinii publicznej przed wyborami, referendami i innymi wydarzeniami publicznymi.

plus tej metody jest całkowite przestrzeganie zasady losowości, a co za tym idzie unikanie błędów systematycznych.

Wady tej metody:

– Potrzeba wykazu elementów populacji.

- Trudności w przeprowadzeniu ankiety.

– Relatywnie duża wielkość próbki.

Próbka lub zbiór prób – zbiór przypadków (obiektów, obiektów, zdarzeń, prób), za pomocą określonej procedury, wybranych z populacji ogólnej do udziału w badaniu.

Przykładowe cechy:

  • Cechy jakościowe próbki - kogo dokładnie wybieramy i jakich metod budowy próbki używamy do tego.
  • Cechą ilościową próby jest to, ile przypadków wybieramy, innymi słowy wielkość próby.

Potrzeba pobierania próbek

  • Przedmiot badań jest bardzo szeroki. Na przykład konsumenci produktów globalnej firmy to ogromna liczba rozproszonych geograficznie rynków.
  • Istnieje potrzeba zebrania podstawowych informacji.

Próbki zależne i niezależne

Przy porównywaniu dwóch (lub więcej) próbek ich zależność jest ważnym parametrem. Jeśli możliwe jest ustalenie pary homomorficznej (tj. gdy jeden przypadek z próby X odpowiada jednemu i tylko jednemu przypadkowi z próby Y i odwrotnie) dla każdego przypadku w dwóch próbach (a ta podstawa związku jest ważna dla cechy mierzone w próbkach), takie próbki nazywane są zależnymi. Przykłady selekcji zależnych:

  • para bliźniaków
  • dwa pomiary dowolnej cechy przed i po ekspozycji eksperymentalnej,
  • mężowie i żony

Jeżeli nie ma takiej zależności między próbkami, to próbki te uważa się za niezależne, na przykład:

  • mężczyźni i kobiety,
  • psycholodzy i matematycy.

W związku z tym próbki zależne mają zawsze tę samą wielkość, podczas gdy wielkość próbek niezależnych może się różnić.

Pojęcie „próbki” w statystyce, socjologii, marketingu rozpatruje się w dwóch znaczeniach. Po pierwsze, jest to zbiór elementów badanej populacji ogólnej, tj. zestaw do pobierania próbek. Po drugie, pobieranie próbek to proces tworzenia populacji próby pod warunkiem zapewnienia reprezentatywności. Przydziel różne rodzaje pobierania próbek (selekcji) i rodzaje próbek.

Jeśli chodzi o rodzaje próbek, to w zasadzie są trzy. Mówimy o samych zasadach podejścia do doboru jednostek losowania z populacji ogólnej. Mogą to być:

spontaniczna selekcja, tj. dobór oparty na zasadzie dobrowolności i dostępności włączenia do próby jednostek z populacji ogólnej. Stosuje się go dość często, w szczególności w ankietach pocztowych i prasowych. Główną wadą takiego wyboru jest niemożność jakościowej reprezentacji populacji ogólnej;

probabilistyczny(losowy) wybór- jeden z głównych wykorzystywanych w badaniach socjologicznych. Główną zasadą takiego doboru jest zapewnienie, aby każda jednostka z populacji ogólnej mogła dostać się do próby. W tym celu wykorzystuje się tabele liczb losowych, losowanie na loterii, dobór mechaniczny;

wybór warstwowy, który opiera się na konstrukcji modelu jakościowego populacji ogólnej, następnie - dobór jednostek obserwacji w populacji próbnej na podstawie istniejącego modelu.

[ORAZŹródła: Wikipedia, Poltorak V.A. Badania marketingowe: metody i technologie]


Zadanie numer 3

Pytanie: Rozwiń treść pojęcia zmiany społecznej.

Pojęcie zmiany społecznej. Pojęcie „zmiany społecznej” odnosi się do różnych zmian zachodzących w czasie w społecznościach, grupach, instytucjach, organizacjach i społeczeństwach, w ich relacjach między sobą, a także z jednostkami. Takie zmiany można przeprowadzić: na poziomie relacji międzyludzkich (np. zmiany w strukturze i funkcjach rodziny); na poziomie organizacji i instytucji (oświata, nauka podlega ciągłym zmianom zarówno merytorycznym, jak i organizacyjnym), na poziomie małych i dużych grup społecznych (w Rosji w szczególności skład klasa robotnicza, chłopstwo się zmienia, nowe grupy społeczne - przedsiębiorcy), na poziomie społecznym i globalnym (procesy migracyjne, rozwój gospodarczy i technologiczny jednych krajów oraz stagnacja i kryzysy w innych, środowiskowe i militarne zagrożenia dla istnienia ludzkości, itp.).

Sekcja II. STATYSTYKI MATEMATYCZNE

Temat 6. Metoda selektywna. Seria wariacji

I jego cechy

Statystyka matematyczna zajmuje się badaniem wzorców rządzących zjawiskami masowymi w oparciu o wyniki obserwacji.

Cel MS: tworzenie metod gromadzenia i przetwarzania danych statystycznych w celu uzyskania naukowych i praktycznych wniosków.

Aby rozwiązać dwa, potrzebne są metody statystyki matematycznej zadania:

1) wskazanie metod zbierania i grupowania informacji statystycznych uzyskanych w wyniku eksperymentów lub obserwacji;

2) rozwój metod statystycznej analizy danych (ocena funkcji i parametrów rozkładu; testowanie hipotez statystycznych; ocena zależności między zmiennymi losowymi).

Pojęcie obserwacji selektywnej i jej właściwości teoretyczne.

W praktyce obserwacji statystycznych rozróżnia się dwa rodzaje obserwacji:

Ciągły, gdy badane są wszystkie obiekty populacji (spis ludności);

Selektywne, gdy badana jest część losowo wybranych obiektów (badania socjologiczne obejmujące część populacji).

Teoria obserwacji wybiórczej opiera się na prawidłowościach statystycznych, które tworzą się i znajdują w zjawiskach i procesach masowych.

Nazywa się wzorce związane z przypadkiem i tylko w różnych zjawiskach przejawiających się jako prawo statystyczny. Ta właściwość wzorców jest związana z prawem wielkich liczb. Matematyczną podstawą prawa wielkich liczb i ogólnie nauk statystycznych jest teoria prawdopodobieństwa, która bada losowe zjawiska (zdarzenia) o stałej szczególności, a w konsekwencji prawdopodobieństwo, które pomaga zidentyfikować wzorce w masie powtarzanie się zjawisk.

Populacja ogólna i próba. Typy próbek.

Ogólna populacja to zbiór wszystkich obiektów do zbadania, z których wykonana jest próbka.

zestaw do pobierania próbek, lub, próbowanie, to zbiór obiektów losowo wybranych z populacji ogólnej, podlegających bezpośredniemu badaniu.

Wielkość populacji to liczba jego obiektów. Ogólna populacja może mieć zarówno skończony, jak i nieskończony rozmiar (N), podczas gdy próbka może mieć tylko skończony rozmiar (n).

Przykład. Spośród 2000 produktów do badania wybrano 100 produktów, następnie wielkość populacji ogólnej wynosi , a wielkość próby wynosi .

Metoda próbkowania- To metoda badawcza, w której na próbie bada się właściwości populacji ogólnej. Jednocześnie wnioski uzyskane w badaniu tej części rozkładają się na cały zestaw obiektów.

Typy próbek

Proste losowe pobieranie próbek, utworzony przez losowy wybór elementów bez dzielenia ogólnej populacji na części.

Próbkowanie mechaniczne, w którym elementy z populacji ogólnej są wybierane w określonym przedziale. Tak więc, jeśli wielkość próbki powinna wynosić 10% ogólnej, wybierany jest co dziesiąty element.

Typowa próbka, na które losowo wybierane są elementy z typowych grup, na które podzielona jest populacja ogólna według jakiegoś kryterium. Na przykład dobór części z produkcji każdej maszyny, a nie całości.

seryjne pobieranie próbek, w której losowo wybierane są nie poszczególne elementy, ale całe grupy populacji (serie).

Powtarzający się nazywamy próbą, w której wybrany obiekt po badaniu jest zwracany do populacji ogólnej i można go ponownie wybrać.

Nie powtarzające się nazywana próbą, w której wybrany obiekt w próbie nie jest zwracany do populacji ogólnej.

przedstawiciel(reprezentatywna) to próbka, za pomocą której możemy ocenić interesującą nas cechę w całej populacji ogólnej. Przykładowe warunki reprezentatywności:

1) części próby powinny być proporcjonalne do części populacji ogólnej;

2) próba powinna jasno wykazywać wszystkie cechy badanej cechy;

3) próbka musi być wystarczająco duża;

4) losowe pobieranie próbek.


blisko