სტატისტიკური ტერმინების ლექსიკონი

ზოგადი სტატისტიკის კითხვები

რა არის სამედიცინო სტატისტიკა?

სტატისტიკა არის მოვლენების, ფენომენების, ობიექტების რაოდენობრივი აღწერა და გაზომვა. იგულისხმება, როგორც პრაქტიკული საქმიანობის (მასობრივი ფენომენების მონაცემების შეგროვება, დამუშავება და ანალიზი), როგორც ცოდნის განშტოება, ე.ი. სპეციალური სამეცნიერო დისციპლინა და, როგორც შემაჯამებელი, საბოლოო ციფრული ინდიკატორები შეგროვებული სოციალური ფენომენების ნებისმიერი სფეროს დასახასიათებლად.

სტატისტიკა არის მეცნიერება, რომელიც სწავლობს მასობრივი ფენომენების ნიმუშებს ინდიკატორების განზოგადების მეთოდის გამოყენებით.

სამედიცინო სტატისტიკა არის დამოუკიდებელი სოციალური მეცნიერება, რომელიც სწავლობს მასობრივი სოციალური ფენომენების რაოდენობრივი მხარეგანუყოფლად არის დაკავშირებული მათ ხარისხობრივ მხარესთან, რაც საშუალებას იძლევა ინდიკატორების განზოგადების მეთოდიამ ფენომენების ნიმუშების შესწავლა, საზოგადოების ეკონომიკური და სოციალური ცხოვრების უმნიშვნელოვანესი პროცესები, მისი ჯანმრთელობა და მოსახლეობის სამედიცინო დახმარების ორგანიზების სისტემა.

სტატისტიკური მეთოდები არის მასობრივი დაკვირვების მასალების დამუშავების ტექნიკის ერთობლიობა, რომელიც მოიცავს: დაჯგუფებას, შეჯამებას, ინდიკატორების მოპოვებას, მათ სტატისტიკურ ანალიზს და ა.შ.

მედიცინაში სტატისტიკური მეთოდები გამოიყენება:

  1. მოსახლეობის მთლიანი და მისი ძირითადი ჯგუფების საზოგადოებრივი ჯანმრთელობის მდგომარეობის შესწავლა მოსახლეობის რაოდენობისა და შემადგენლობის, მისი გამრავლების, ფიზიკური განვითარების, სხვადასხვა დაავადების გავრცელებისა და ხანგრძლივობის შესახებ სტატისტიკური მონაცემების შეგროვებით და ანალიზით;
  2. იდენტიფიცირება და კავშირის დადგენა ავადობისა და სიკვდილიანობის ზოგად დონეს შორის ნებისმიერი ინდივიდუალური დაავადებისგან სხვადასხვა გარემო ფაქტორებთან;
  3. სამედიცინო დაწესებულებების ქსელის, მათი საქმიანობისა და ჯანდაცვის საქმიანობის დაგეგმვის პერსონალის რიცხვითი მონაცემების შეგროვება და შესწავლა, ქსელისა და ჯანდაცვის დაწესებულებების განვითარების გეგმების შესრულების მონიტორინგი და ცალკეული სამედიცინო დაწესებულებების მუშაობის ხარისხის შეფასება;
  4. დაავადებების პრევენციისა და მკურნალობის ღონისძიებების ეფექტურობის შეფასება;
  5. კვლევის შედეგების სტატისტიკური მნიშვნელობის განსაზღვრა კლინიკაში და ექსპერიმენტში.

სამედიცინო სტატისტიკის სექციები:

  • სტატისტიკის ზოგადი თეორიული და მეთოდოლოგიური საფუძვლები,
  • მოსახლეობის ჯანმრთელობის სტატისტიკა,
  • ჯანმრთელობის სტატისტიკა.

მონაცემთა ბაზის შექმნა MS EXCEL-ში

იმისათვის, რომ მონაცემთა ბაზა მოსახერხებელი იყოს შემდგომი დამუშავებისთვის, უნდა დაიცვან მარტივი პრინციპები:

1) მონაცემთა ბაზის შესაქმნელად ოპტიმალური პროგრამაა MS Excel. Excel-ის მონაცემები შემდგომში ადვილად გადაიცემა სხვა სპეციალიზებულ სტატისტიკურ პაკეტებში, როგორიცაა Statistica, SPSS და ა.შ. უფრო რთული მანიპულაციებისთვის. თუმცა, გამოთვლების 80-90%-მდე შეიძლება მოხერხებულად შესრულდეს თავად Excel-ში მონაცემთა ანალიზის დანამატის გამოყენებით.

2) ცხრილის ზედა ხაზი მონაცემთა ბაზასთან ერთად შექმნილია სათაურის სახით, სადაც შეყვანილია იმ ინდიკატორების სახელები, რომლებიც გათვალისწინებულია ამ სვეტში. არასასურველია უჯრედების შერწყმის გამოყენება (ეს მოთხოვნა ზოგადად ვრცელდება მთელ მონაცემთა ბაზაზე), რადგან ეს ბევრ ოპერაციას გაუქმდება. ასევე, არ უნდა შექმნათ „ორსართულიანი“ სათაური, რომელშიც ზედა ხაზი მიუთითებს ერთგვაროვანი ინდიკატორების ჯგუფის სახელს, ხოლო ქვედა ხაზი მიუთითებს კონკრეტულ ინდიკატორებზე. ერთგვაროვანი ინდიკატორების დასაჯგუფებლად უმჯობესია მონიშნოთ ისინი ერთი ფერის შევსებით ან მათ სახელში ჩართოთ დაჯგუფების ფუნქცია ფრჩხილებში.

Მაგალითად, არა ამ გზით:

სისხლის ზოგადი ანალიზი
ER LEU TR
ER(UAC) LEU (UAC) TR(UAC)

ამ უკანასკნელ ვერსიაში უზრუნველყოფილია როგორც „ერთსართულიანი“ სათაური და მონაცემთა ვიზუალური ჰომოგენურობა (ყველა მათგანი ეხება UAC ინდიკატორებს).

3) პირველი სვეტი უნდა შეიცავდეს პაციენტის სერიულ ნომერს ამ მონაცემთა ბაზაში, არცერთ შესწავლილ ინდიკატორთან დაკავშირების გარეშე. ეს საშუალებას მოგცემთ შემდგომში უზრუნველყოთ პაციენტთა თავდაპირველ შეკვეთაზე მარტივი დაბრუნება ნებისმიერ ეტაპზე, სიის მრავალი დახარისხების შემდეგაც კი.

4) მეორე სვეტი ჩვეულებრივ ივსება პაციენტების გვარებით (ან სრული სახელებით).

5) რაოდენობრივი მაჩვენებლები (ის, რომელიც იზომება რიცხვებში, მაგალითად - სიმაღლე, წონა, არტერიული წნევა, გულისცემა და ა.შ.) შეტანილია ცხრილში რიცხვითი ფორმატით. როგორც ჩანს, ეს უკვე გასაგებია, მაგრამ უნდა გახსოვდეთ, რომ Excel-ში, 2007 წლის ვერსიიდან დაწყებული, წილადი მნიშვნელობები აღინიშნება წერტილით: 4.5. თუ დაწერთ რიცხვს, რომელიც გამოყოფილია მძიმით, ის აღიქმება როგორც ტექსტი და ეს სვეტები უნდა გადაიწეროს.

6) ეს უფრო რთულია ხარისხობრივი მაჩვენებლებით. ის, ვისაც აქვს ორი შესაძლო მნიშვნელობა (ე.წ. ორობითი მნიშვნელობები: დიახ-არა, აწმყო-არყოფნის, მამრობითი-ქალი) საუკეთესოდ გარდაიქმნება ორობით სისტემაში: 0 და 1. მნიშვნელობა 1 ჩვეულებრივ ენიჭება დადებით მნიშვნელობას. (დიახ, აწმყო) , 0 - უარყოფითი (არა, არ არსებობს).

7) ხარისხობრივი მაჩვენებლები, რომლებსაც აქვთ რამდენიმე მნიშვნელობა, განსხვავებული სიმძიმით, ფენომენის დონით (სუსტი-საშუალო-ძლიერი; ცივი-თბილი-ცხელი) შეიძლება დაინიშნოს და, შესაბამისად, ასევე ითარგმნოს რიცხვებად. ფენომენის ყველაზე დაბალ დონეს ენიჭება ყველაზე დაბალი წოდება - 0 ან 1, შემდეგი ხარისხები მითითებულია რიგის მნიშვნელობებით. მაგალითად: დაავადება არ არის - 0, მსუბუქი ხარისხი - 1, საშუალო ხარისხი - 2, მძიმე ხარისხი - 3.

8) ზოგჯერ რამდენიმე მნიშვნელობა შეესაბამება ერთი ხარისხის მაჩვენებელს. მაგალითად, სვეტში „თანმხლები დიაგნოზი“, თუ არსებობს რამდენიმე დაავადება, გვინდა მივუთითოთ ისინი გამოყოფილი მძიმეებით. ეს არ უნდა გაკეთდეს, რადგან ასეთი მონაცემების დამუშავება ძალიან რთულია და მისი ავტომატიზაცია შეუძლებელია. ამიტომ სჯობს რამდენიმე სვეტის გაკეთება დაავადების სპეციფიკურ ჯგუფებთან („გულ-სისხლძარღვთა სისტემის დაავადებები“, „კუჭ-ნაწლავის ტრაქტის დაავადებები“ და ა.შ.) ან გარკვეული ნოზოლოგია („ქრონიკული გასტრიტი“, „IHD“ და ა.შ.) , რომელშიც შევიყვანთ მონაცემებს ბინარულ, ორობით ფორმაში: 1 (რაც ნიშნავს „ეს დაავადება არსებობს“) - 0 („ეს დაავადება არ არსებობს“).

9) ინდიკატორების ცალკეული ჯგუფების განსასხვავებლად, შეგიძლიათ აქტიურად გამოიყენოთ ფერი: მაგალითად, სვეტები UAC ინდიკატორებით მონიშნულია წითლად, OAM მონაცემები ყვითლად და ა.შ.

10) თითოეული პაციენტი უნდა შეესაბამებოდეს ცხრილის ერთ რიგს.

მონაცემთა ბაზის ასეთი დიზაინი საშუალებას იძლევა არა მხოლოდ მნიშვნელოვნად გაამარტივოს მისი სტატისტიკური დამუშავების პროცესი, არამედ ხელი შეუწყოს მის დასრულებას მასალის შეგროვების ეტაპზე.

რომელი მეთოდი ავირჩიოთ სტატისტიკური ანალიზისთვის?

ყველა მონაცემის შეგროვების შემდეგ, თითოეული მკვლევარი დგება საკითხის არჩევის შესახებ სტატისტიკური დამუშავების ყველაზე შესაფერისი მეთოდის შესახებ. და ეს გასაკვირი არ არის: თანამედროვე სტატისტიკა აერთიანებს უამრავ სხვადასხვა კრიტერიუმსა და მეთოდს. მათ ყველას აქვს საკუთარი მახასიათებლები და შეიძლება იყოს ან არ იყოს შესაფერისი ორი ერთი შეხედვით მსგავსი სიტუაციისთვის. ამ სტატიაში შევეცდებით სტატისტიკური ანალიზის ყველა ძირითადი, ყველაზე გავრცელებული მეთოდის სისტემატიზაციას მათი დანიშნულების მიხედვით.

თუმცა, პირველ რიგში, რამდენიმე სიტყვა იმის შესახებ, თუ რა სახის სტატისტიკური მონაცემები არსებობს, რადგან სწორედ ეს განსაზღვრავს ანალიზის ყველაზე შესაფერისი მეთოდის არჩევას.

საზომი მასშტაბი

კვლევის დროს, თითოეული დაკვირვების ერთეულისთვის განისაზღვრება სხვადასხვა მახასიათებლების მნიშვნელობები. მასშტაბიდან გამომდინარე, რომლითაც ისინი იზომება, ყველა ნიშანი იყოფა რაოდენობრივიდა ხარისხიანი. კვლევებში თვისებრივი მაჩვენებლები ნაწილდება ე.წ ნომინალურიმასშტაბი. გარდა ამისა, ინდიკატორები შეიძლება წარმოდგენილი იყოს შესაბამისად წოდებამასშტაბი.

მაგალითად, შედარება ხდება გულის მუშაობაზე სპორტსმენებში და მჯდომარე ცხოვრების წესზე.

ამ შემთხვევაში სუბიექტებში განისაზღვრა შემდეგი ნიშნები:

  • იატაკი- არის ნომინალურიმაჩვენებელი, რომელიც იღებს ორ მნიშვნელობას - მამაკაცი ან ქალი.
  • ასაკი - რაოდენობრივიინდექსი,
  • სპორტი - ნომინალურიინდიკატორი, რომელსაც აქვს ორი მნიშვნელობა: ჩართული ან არ ჩართული,
  • პულსი - რაოდენობრივიინდექსი,
  • სისტოლური არტერიული წნევა - რაოდენობრივიინდექსი,
  • გულმკერდის ტკივილის ჩივილების არსებობა- არის მაღალი ხარისხიინდიკატორი, რომლის მნიშვნელობების დადგენა შესაძლებელია როგორც ნომინალური(საჩივრები არის - ჩივილები არ არის), და შესაბამისად წოდებამასშტაბი დამოკიდებულია სიხშირეზე (მაგალითად, თუ ტკივილი ხდება დღეში რამდენჯერმე - ინდიკატორს ენიჭება 3 წოდება, თვეში რამდენჯერმე - 2, წელიწადში რამდენჯერმე - რანგი 1, თუ გულმკერდის ტკივილის ჩივილი არ არის - რანგი 0 ) .

შედარებული პოპულაციების რაოდენობა

შემდეგი საკითხი, რომელიც გასათვალისწინებელია სტატისტიკური მეთოდის არჩევისას, არის კვლევის ფარგლებში შესადარებელი პოპულაციების რაოდენობა.

  • უმეტეს შემთხვევაში, კლინიკურ კვლევებში საქმე გვაქვს პაციენტების ორ ჯგუფთან - ძირითადიდა კონტროლი. ძირითადი, ან გამოცდილი, ზოგადად განიხილება ის ჯგუფი, რომელშიც გამოყენებული იყო დიაგნოსტიკის ან მკურნალობის შესწავლის მეთოდი, ან რომელშიც პაციენტები განიცდიან დაავადებებს, რომელიც არის ამ კვლევის საგანი. ტესტიჯგუფი, პირიქით, შედგება პაციენტებისგან, რომლებიც იღებენ ჩვეულებრივ მკურნალობას, პლაცებოს, ან მათ, ვისაც არ აქვს შესწავლილი დაავადება. ასეთ პოპულაციებს, რომლებიც წარმოდგენილია სხვადასხვა პაციენტებით, ე.წ დაუკავშირებელი.
    ჯერ კიდევ არსებობს დაკავშირებული, ან ორმაგდება, აგრეგატები, როდესაც ვსაუბრობთ ერთსა და იმავე ადამიანებზე, მაგრამ მიღებული ზოგიერთი მახასიათებლის მნიშვნელობები შედარებულია ადრე და შემდეგკვლევა. შედარებული პოპულაციების რაოდენობა ასევე უდრის 2-ს, მაგრამ მათზე სხვადასხვა ტექნიკაა გამოყენებული, ვიდრე დაუკავშირებელზე.
  • კიდევ ერთი ვარიანტია აღწერა ერთიმთლიანობა, რომელიც, უნდა ვაღიაროთ, ზოგადად საფუძვლად უდევს ნებისმიერ კვლევას. მაშინაც კი, თუ ნაწარმოების მთავარი მიზანი ორი ან მეტი ჯგუფის შედარებაა, ჯერ თითოეული მათგანი უნდა დახასიათდეს. ამისთვის გამოყენებული მეთოდები აღწერითი სტატისტიკა. გარდა ამისა, ერთი პოპულაციისთვის შეიძლება გამოყენებულ იქნას მეთოდები კორელაციის ანალიზი, გამოიყენება ორ ან მეტ შესწავლილ მახასიათებელს შორის კავშირის მოსაძებნად (მაგალითად, სიმაღლის დამოკიდებულება სხეულის წონაზე ან გულისცემის დამოკიდებულება სხეულის ტემპერატურაზე).
  • და ბოლოს, შეიძლება იყოს რამდენიმე პოპულაციის შედარება. ეს ძალიან ხშირია სამედიცინო კვლევებში. პაციენტები შეიძლება დაჯგუფდეს სხვადასხვა მედიკამენტების გამოყენების მიხედვით (მაგალითად, ანტიჰიპერტენზიული საშუალებების ეფექტურობის შედარებისას: ჯგუფი 1 - აგფ ინჰიბიტორები, 2 - ბეტა-ბლოკატორები, 3 - ცენტრალური მოქმედების პრეპარატები), დაავადების სიმძიმის მიხედვით ( ჯგუფი 1 - მსუბუქი, 2 - საშუალო, 3 - მძიმე) და ა.შ.

ასევე მნიშვნელოვანია კითხვა განაწილების ნორმალურობაშესწავლილი პოპულაციები. ეს განსაზღვრავს, შესაძლებელია თუ არა მეთოდების გამოყენება პარამეტრული ანალიზიან უბრალოდ არაპარამეტრული. პირობები, რომლებიც უნდა აკმაყოფილებდეს ნორმალურად განაწილებულ პოპულაციებში არის:

  1. არითმეტიკული საშუალო, რეჟიმი და მედიანას მნიშვნელობების მაქსიმალური სიახლოვე ან თანასწორობა;
  2. „სამი სიგმის“ წესის დაცვა (მინიმუმ 68,3% ვარიანტი არის M±1σ ინტერვალში, არანაკლებ 95,5% ვარიანტი არის M±2σ ინტერვალში, არანაკლებ 99,7% ვარიანტი არის M±3σ ინტერვალში;
  3. ინდიკატორები იზომება რაოდენობრივი მასშტაბით;
  4. განაწილების ნორმალურობის ტესტის დადებითი შედეგები სპეციალური კრიტერიუმების გამოყენებით - კოლმოგოროვი-სმირნოვი ან შაპირო-ვილკი.

შესწავლილი პოპულაციებისთვის ჩვენ მიერ მითითებული ყველა მახასიათებლის დადგენის შემდეგ, გთავაზობთ შემდეგი ცხრილის გამოყენებას სტატისტიკური ანალიზის ყველაზე ოპტიმალური მეთოდის შესარჩევად.

მეთოდი ინდიკატორის საზომი სკალა შედარებული პოპულაციების რაოდენობა დამუშავების მიზანი მონაცემთა განაწილება
სტუდენტის t-ტესტი რაოდენობრივი 2 ნორმალური
სტუდენტის t-ტესტი ბონფერონის კორექტირებით რაოდენობრივი 3 ან მეტი დაუკავშირებელი პოპულაციების შედარება ნორმალური
დაწყვილებული სტუდენტის t-ტესტი რაოდენობრივი 2 ნორმალური
ცალმხრივი ვარიაციის ანალიზი (ANOVA) რაოდენობრივი 3 ან მეტი დაუკავშირებელი პოპულაციების შედარება ნორმალური
ცალმხრივი დისპერსიული ანალიზი (ANOVA) განმეორებითი ზომებით რაოდენობრივი 3 ან მეტი დაკავშირებული პოპულაციების შედარება ნორმალური
Mann-Whitney U ტესტი რაოდენობრივი, რეიტინგული 2 დაუკავშირებელი პოპულაციების შედარება ნებისმიერი
როზენბაუმის Q ტესტი რაოდენობრივი, რეიტინგული 2 დაუკავშირებელი პოპულაციების შედარება ნებისმიერი
კრუსკალ-ვალისის ტესტი რაოდენობრივი 3 ან მეტი დაუკავშირებელი პოპულაციების შედარება ნებისმიერი
ვილკოქსონის ტესტი რაოდენობრივი, რეიტინგული 2 დაკავშირებული პოპულაციების შედარება ნებისმიერი
G ნიშნის ტესტი რაოდენობრივი, რეიტინგული 2 დაკავშირებული პოპულაციების შედარება ნებისმიერი
ფრიდმენის კრიტერიუმი რაოდენობრივი, რეიტინგული 3 ან მეტი დაკავშირებული პოპულაციების შედარება ნებისმიერი
პირსონის χ2 ტესტი ნომინალური 2 ან მეტი დაუკავშირებელი პოპულაციების შედარება ნებისმიერი
ფიშერის ზუსტი ტესტი ნომინალური 2 დაუკავშირებელი პოპულაციების შედარება ნებისმიერი
მაკნემარის ტესტი ნომინალური 2 დაკავშირებული პოპულაციების შედარება ნებისმიერი
კოკრანის Q ტესტი ნომინალური 3 ან მეტი დაკავშირებული პოპულაციების შედარება ნებისმიერი
ფარდობითი რისკი (რისკის თანაფარდობა, RR) ნომინალური 2 დაუკავშირებელი პოპულაციების შედარება კოჰორტულ კვლევებში ნებისმიერი
შანსების კოეფიციენტი (OR) ნომინალური 2 დაუკავშირებელი პოპულაციების შედარება შემთხვევის საკონტროლო კვლევებში ნებისმიერი
პირსონის კორელაციის კოეფიციენტი რაოდენობრივი გაზომვის 2 რიგი ნორმალური
სპირმენის წოდების კორელაციის კოეფიციენტი რაოდენობრივი, რეიტინგული გაზომვის 2 რიგი ნიშნებს შორის კავშირების იდენტიფიცირება ნებისმიერი
კენდალის კორელაციის კოეფიციენტი რაოდენობრივი, რეიტინგული გაზომვის 2 რიგი ნიშნებს შორის კავშირების იდენტიფიცირება ნებისმიერი
კენდალის შესაბამისობის კოეფიციენტი რაოდენობრივი, რეიტინგული გაზომვების 3 ან მეტი რიგი ნიშნებს შორის კავშირების იდენტიფიცირება ნებისმიერი
საშუალო მნიშვნელობების (M) და საშუალო შეცდომების (მ) გაანგარიშება რაოდენობრივი 1 აღწერითი სტატისტიკა ნებისმიერი
მედიანების (Me) და პროცენტულის (კვარტილების) გამოთვლა წოდება 1 აღწერითი სტატისტიკა ნებისმიერი
ფარდობითი მნიშვნელობების (P) და საშუალო შეცდომების (მ) გაანგარიშება ნომინალური 1 აღწერითი სტატისტიკა ნებისმიერი
შაპირო-უილკის ტესტი რაოდენობრივი 1 განაწილების ანალიზი ნებისმიერი
კოლმოგოროვი-სმირნოვის კრიტერიუმი რაოდენობრივი 1 განაწილების ანალიზი ნებისმიერი
სმირნოვი-კრამერ-ფონ მიზესის კრიტერიუმი ω 2 რაოდენობრივი 1 განაწილების ანალიზი ნებისმიერი
კაპლან-მეიერის მეთოდი ნებისმიერი 1 გადარჩენის ანალიზი ნებისმიერი
კოქსის პროპორციული საშიშროების მოდელი ნებისმიერი 1 გადარჩენის ანალიზი ნებისმიერი

დიდი სტატისტიკოსები

კარლ პირსონი (27 მარტი, 1857 – 27 აპრილი, 1936 წ.)

კარლ პირსონი, დიდი ინგლისელი მათემატიკოსი, სტატისტიკოსი, ბიოლოგი და ფილოსოფოსი, დაიბადა 1857 წლის 27 მარტს; მათემატიკური სტატისტიკის ფუძემდებელი, ბიომეტრიის ერთ-ერთი ფუძემდებელი.

27 წლის ასაკში, ლონდონის საუნივერსიტეტო კოლეჯში, გამოყენებითი მათემატიკის პროფესორის თანამდებობის მიღების შემდეგ, კარლ პირსონმა დაიწყო სტატისტიკის შესწავლა, რომელიც მან აღიქვამდა, როგორც ზოგად სამეცნიერო ინსტრუმენტს, რომელიც შეესაბამებოდა მის სულაც არ ჩვეულებრივ აზრებს სტუდენტების მიწოდების აუცილებლობის შესახებ. ფართო პერსპექტივა.

პირსონის მთავარი მიღწევები სტატისტიკის დარგში მოიცავს მახასიათებლების კორელაციისა და შემთხვევითობის თეორიის საფუძვლების შემუშავებას, ემპირიული განაწილების აღსაწერად „პირსონის მრუდების“ დანერგვას და უაღრესად მნიშვნელოვან ჩი-კვადრატის კრიტერიუმს, ასევე შედგენას. სტატისტიკური ცხრილების დიდი რაოდენობა. პირსონმა გამოიყენა სტატისტიკური მეთოდი და განსაკუთრებით კორელაციის თეორია მეცნიერების ბევრ დარგში.

აქ არის მისი ერთ-ერთი განცხადება: "თანამედროვე სტატისტიკური მეთოდების პირველ სამოყვარულო დანერგვას დამკვიდრებულ მეცნიერებაში ტიპიური ზიზღი ეწინააღმდეგება. მაგრამ მე ვიცხოვრე იმ დროისთვის, როცა ბევრმა მათგანმა ფარულად დაიწყო სწორედ იმ მეთოდების გამოყენება, რომლებსაც თავდაპირველად გმობდნენ."

და უკვე 1920 წელს, პირსონმა დაწერა შენიშვნა, რომელშიც მან განაცხადა, რომ ბიომეტრიული სკოლის მიზანი იყო ”სტატისტიკის გადაქცევა გამოყენებითი მათემატიკის ფილიალში, განზოგადება, გაუქმება ან გამართლება პოლიტიკური და სოციალური სტატისტიკოსების ძველი სკოლის მწირი მეთოდების შესახებ. და ზოგადად, სტატისტიკის სათამაშო მოედნიდან მოყვარულებად და დებატებად გადაქცევა მეცნიერების სერიოზულ დარგად. საჭირო იყო არასრულყოფილი და ხშირად მცდარი მეთოდების კრიტიკა მედიცინაში, ანთროპოლოგიაში, კრანიომეტრიაში, ფსიქოლოგიაში, კრიმინოლოგიაში, ბიოლოგიაში, სოციოლოგიაში. რათა ეს მეცნიერებები მიეწოდებინათ ახალი და უფრო მძლავრი საშუალებებით. ბრძოლა თითქმის ოცი წელი გაგრძელდა, მაგრამ მრავალი ნიშანი გამოჩნდა, რომ ძველი საომარი მოქმედებები უკან დარჩა და ახალი მეთოდები საყოველთაოდ იყო მიღებული“.

კარლ პირსონს ჰქონდა ძალიან მრავალფეროვანი ინტერესები: ის სწავლობდა ფიზიკას ჰაიდელბერგში, დაინტერესებული იყო რელიგიის სოციალური და ეკონომიკური როლით და გერმანიის ისტორიასა და ლიტერატურაზეც კი კითხულობდა ლექციებს კემბრიჯსა და ლონდონში.

ნაკლებად ცნობილი ფაქტია, რომ 28 წლის ასაკში კარლ პირსონმა კითხულობდა ლექციებს „ქალთა საკითხზე“ და დააარსა მამაკაცთა და ქალთა კლუბიც, რომელიც არსებობდა 1889 წლამდე, რომელშიც იყო ყველაფერი, რაც ქალებთან იყო დაკავშირებული, მათ შორის სქესებს შორის ურთიერთობა. თავისუფლად და შეუზღუდავად განიხილება.

კლუბი შედგებოდა თანაბარი რაოდენობის მამაკაცებისა და ქალებისგან, ძირითადად საშუალო დონის ლიბერალებისგან, სოციალისტებისა და ფემინისტებისაგან.

კლუბის განხილვის საგანი იყო საკითხების ფართო სპექტრი: სექსუალური ურთიერთობებიდან ძველ ბერძნულ ათენში ბუდისტი მონაზვნების მდგომარეობამდე, ქორწინებისადმი დამოკიდებულებიდან დაწყებული პროსტიტუციის პრობლემებამდე. არსებითად, მამაკაცთა და ქალთა კლუბი დაუპირისპირდა ქალისა და მამაკაცის ურთიერთქმედების დიდი ხნის განმავლობაში დამკვიდრებულ ნორმებს, ისევე როგორც იდეებს „სწორი“ სექსუალობის შესახებ. ვიქტორიანულ ინგლისში, სადაც სექსუალობა ბევრის მიერ განიხილებოდა, როგორც „ძირითადი“ და „ცხოველური“ და ფართოდ იყო გავრცელებული იგნორირება სექსუალური განათლების შესახებ, ასეთი საკითხების განხილვა მართლაც რადიკალური იყო.

1898 წელს სამეფო საზოგადოებამ პირსონს მიენიჭა დარვინის მედალი, რაზეც მან უარი თქვა, რადგან თვლიდა, რომ ჯილდოები „ახალგაზრდებს უნდა გადაეცათ მათი წახალისებისთვის“.

Florence Nightingale (1820 წლის 12 მაისი - 1910 წლის 13 აგვისტო)

ფლორენს ნაიტინგეილი (1820-1910) - მედდა და საზოგადო მოღვაწე დიდ ბრიტანეთში, რომლის დაბადების დღესაც დღეს ვზეიმობთ მედდების საერთაშორისო დღეს.

იგი დაიბადა ფლორენციაში, მდიდარ არისტოკრატულ ოჯახში, მიიღო შესანიშნავი განათლება და იცოდა ექვსი ენა. პატარაობიდანვე ოცნებობდა გამხდარიყო მოწყალების და, 1853 წელს მან მიიღო საექთნო განათლება კაიზერვერტში პასტორ ფლენდერის დების საზოგადოებაში და გახდა ლონდონის პატარა კერძო საავადმყოფოს მენეჯერი.

1854 წლის ოქტომბერში, ყირიმის ომის დროს, ფლორენცია 38 ასისტენტთან ერთად წავიდა ყირიმის საველე საავადმყოფოებში. დაჭრილების მოვლის ორგანიზებისას იგი თანმიმდევრულად იცავდა სანიტარული და ჰიგიენის პრინციპებს. შედეგად, ექვს თვეზე ნაკლებ დროში საავადმყოფოებში სიკვდილიანობა 42-დან 2,2%-მდე შემცირდა!

არმიაში სამედიცინო სამსახურის რეფორმირების დასახვით, ბულბულმა უზრუნველყო, რომ საავადმყოფოები აღიჭურვა სავენტილაციო და საკანალიზაციო სისტემებით; საავადმყოფოს პერსონალს მოეთხოვებოდა საჭირო ტრენინგის გავლა. მოეწყო სამხედრო სამედიცინო სკოლა, ჩატარდა ახსნა-განმარტებები ჯარისკაცებსა და ოფიცრებს შორის დაავადების პრევენციის მნიშვნელობის შესახებ.

Florence Nightingale-ის დიდი წვლილი სამედიცინო სტატისტიკაში!

  • მისი 800-გვერდიანი წიგნი „შენიშვნები ბრიტანული არმიის ჰოსპიტალების ჯანმრთელობაზე, ეფექტურობასა და მართვაზე მოქმედი ფაქტორების შესახებ შენიშვნები“ (1858) შეიცავდა მთელ განყოფილებას, რომელიც ეძღვნებოდა სტატისტიკას და ილუსტრირებული იყო დიაგრამებით.
  • Nightingale იყო ნოვატორი სტატისტიკაში გრაფიკული გამოსახულების გამოყენებაში. მან გამოიგონა ტორტების სქემები, რომლებსაც უწოდა "მამლის სავარცხელი" და გამოიყენა სიკვდილიანობის სტრუქტურის აღსაწერად. მისი მრავალი სქემა შეტანილი იყო ჯარში ჯანმრთელობის პრობლემების შესახებ კომისიის ანგარიშში, რამაც გამოიწვია არმიის მედიცინის რეფორმირების გადაწყვეტილება.
  • მან შეიმუშავა საავადმყოფოებში სტატისტიკის შეგროვების პირველი ფორმა, რომელიც წარმოადგენს საავადმყოფოების საქმიანობის თანამედროვე ანგარიშგების ფორმების წინამორბედს.

1859 წელს იგი აირჩიეს სამეფო სტატისტიკური საზოგადოების წევრად და შემდგომში გახდა ამერიკის სტატისტიკური ასოციაციის საპატიო წევრი.

იოჰან კარლ ფრიდრიხ გაუსი (30 აპრილი, 1777 – 23 თებერვალი, 1855 წ.)

1777 წლის 30 აპრილს ქალაქ ბრაუნშვაიგში დაიბადა დიდი გერმანელი მათემატიკოსი, მექანიკოსი, ფიზიკოსი, ასტრონომი, ამზომველი და სტატისტიკოსი იოჰან კარლ ფრიდრიხ გაუსი.

იგი ითვლება ყველა დროის ერთ-ერთ უდიდეს მათემატიკოსად, „მათემატიკოსთა მეფედ“. კოპლის მედლის ლაურეატი (1838), შვედეთის (1821) და რუსეთის (1824) მეცნიერებათა აკადემიებისა და ინგლისის სამეფო საზოგადოების უცხოელი წევრი.

უკვე სამი წლის ასაკში კარლს შეეძლო წერა-კითხვა, მამის გამოთვლის შეცდომებსაც კი ასწორებდა. ლეგენდის თანახმად, სკოლის მათემატიკის მასწავლებელმა, ბავშვების დიდი ხნით დაკავების მიზნით, სთხოვა დაეთვალათ რიცხვების ჯამი 1-დან 100-მდე. ახალგაზრდა გაუსმა შენიშნა, რომ საპირისპირო ბოლოებიდან წყვილი ჯამები ერთნაირია: 1+100= 101, 2+99=101 და ა.შ. და ა.შ. და მყისიერად მივიღე შედეგი: 50×101=5050. სიბერემდე მიჩვეული იყო გამოთვლების უმეტესი ნაწილი თავის თავში აკეთოს.

კარლ გაუსის მთავარი სამეცნიერო მიღწევები სტატისტიკაში არის უმცირესი კვადრატების მეთოდის შექმნა, რომელიც საფუძვლად უდევს რეგრესიულ ანალიზს.

მან ასევე დეტალურად შეისწავლა ბუნებაში გავრცელებული ნორმალური განაწილების კანონი, რომლის გრაფიკს მას შემდეგ ხშირად უწოდებენ გაუსიანს. "სამი სიგმის" წესი (გაუსის წესი), რომელიც აღწერს ნორმალურ განაწილებას, ფართოდ გახდა ცნობილი.

ლევ სემიონოვიჩ კამინსკი (1889 - 1962)

დიდ სამამულო ომში გამარჯვების 75 წლისთავზე მინდა გავიხსენო და ვისაუბრო მშვენიერ მეცნიერზე, სსრკ-ში სამხედრო სამედიცინო და სანიტარიული სტატისტიკის ერთ-ერთ ფუძემდებელზე - ლევ სემენოვიჩ კამინსკიზე (1889-1962).

დაიბადა 1889 წლის 27 მაისს კიევში. 1918 წელს პეტროგრადის უნივერსიტეტის მედიცინის ფაკულტეტის წარჩინებით დამთავრების შემდეგ კამინსკი იყო წითელი არმიის რიგებში, 1919 წლის აპრილიდან 1920 წლის ბოლომდე ეკავა სამხრეთის 136-ე კონსოლიდირებული ევაკუაციის საავადმყოფოს მთავარი ექიმის თანამდებობა. აღმოსავლეთის ფრონტი.

1922 წლიდან ლევ სემიონოვიჩი ხელმძღვანელობდა ჩრდილო-დასავლეთის რკინიგზის სამედიცინო და სანიტარული სამსახურის სანიტარულ და ეპიდემიოლოგიურ განყოფილებას. ამ წლებში კამინსკის სამეცნიერო მოღვაწეობა დაიწყო პროფ. S.A. ნოვოსელსკი. მათ ერთობლივ ფუნდამენტურ ნაშრომში, "ზარალი წარსულ ომებში", გაანალიზებული იყო სტატისტიკური მასალა 1756 წლიდან 1918 წლამდე მსოფლიოს სხვადასხვა არმიის ომებში ადამიანთა დანაკარგებზე. შემდგომ ნაშრომებში კამინსკიმ შეიმუშავა და დაასაბუთა სამხედროების ახალი, უფრო ზუსტი კლასიფიკაცია. დანაკარგები.

მონოგრაფიაში „ეროვნული კვება და საზოგადოებრივი ჯანმრთელობა“ (1929) დეტალურად იქნა განხილული ომების გავლენის სანიტარიული და ჰიგიენური ასპექტები საზოგადოებრივ ჯანმრთელობაზე, აგრეთვე ომის დროს მოსახლეობისა და ჯარის სამედიცინო დახმარების ორგანიზების საკითხები.

1935 წლიდან 1943 წლამდე ლევ სემენოვიჩი ხელმძღვანელობდა სსრკ ჯანდაცვის სახალხო კომისარიატის სანიტარული (1942 წლიდან - სამედიცინო) სტატისტიკის განყოფილებას. 1943 წლის ოქტომბერში პროფესორი კამინსკი გახდა სამხედრო სამედიცინო სტატისტიკის განყოფილების ხელმძღვანელი, სახელობის სამხედრო სამედიცინო აკადემიაში. ს.მ.კიროვი, ხოლო 1956 წლიდან ეკავა პროფესორის თანამდებობა ლენინგრადის სახელმწიფო უნივერსიტეტის სტატისტიკისა და აღრიცხვის განყოფილებაში.

ლევ სემიონოვიჩი მხარს უჭერდა რაოდენობრივი მეთოდების ფართოდ დანერგვას სანიტარული და სამედიცინო სტატისტიკის პრაქტიკაში. 1959 წელს მისი ავტორობით გამოიცა სახელმძღვანელო "ლაბორატორიული და კლინიკური მონაცემების სტატისტიკური დამუშავება: სტატისტიკის გამოყენება ექიმის სამეცნიერო და პრაქტიკულ მუშაობაში", რომელიც მრავალი წლის განმავლობაში გახდა სამედიცინო სტატისტიკის ერთ-ერთი საუკეთესო შიდა სახელმძღვანელო. წინასიტყვაობაში L.S. კამინსკი აღნიშნავს:
„... როგორც ჩანს, მნიშვნელოვანია, რომ მკურნალმა ექიმებმა იცოდნენ, როგორ შეუდგნენ საქმეს და იცოდნენ, როგორ შეაგროვონ და დაამუშავონ სწორი რიცხვები, რომლებიც შესაფერისია შედარებისა და შედარებისთვის“.

კრიტერიუმები და მეთოდები

სტუდენტური t-კრიტერიუმი დამოუკიდებელი მოსახლეობისთვის

Student's t-ტესტი არის ზოგადი სახელწოდება მეთოდის კლასისთვის ჰიპოთეზების სტატისტიკური ტესტირებისთვის (სტატისტიკური ტესტები) დაფუძნებული Student განაწილებაზე. t-ტესტის ყველაზე გავრცელებული გამოყენება გულისხმობს საშუალოების ტოლობის ტესტირებას ორ ნიმუშში.

ეს კრიტერიუმი შემუშავდა უილიამ სილი გოსეტი

2. რისთვის გამოიყენება Student-ის t-ტესტი?

საშუალოდ განსხვავებათა სტატისტიკური მნიშვნელოვნების დასადგენად გამოიყენება სტუდენტის t ტესტი. მისი გამოყენება შესაძლებელია როგორც დამოუკიდებელი ნიმუშების შედარების შემთხვევაში (მაგალითად, დიაბეტით დაავადებულთა ჯგუფი და ჯანსაღი ადამიანების ჯგუფი), ასევე დაკავშირებული პოპულაციების შედარებისას (მაგალითად, გულისცემის საშუალო მაჩვენებელი იმავე პაციენტებში მიღებამდე და მის შემდეგ. ანტიარითმული პრეპარატი). ამ უკანასკნელ შემთხვევაში გამოითვლება დაწყვილებული Student t-ტესტი

3. რა შემთხვევაში შეიძლება გამოვიყენოთ Student-ის t-ტესტი?

სტუდენტის t-ტესტის გამოსაყენებლად აუცილებელია, რომ ორიგინალურ მონაცემებს ჰქონდეს ნორმალური განაწილება. ასევე მნიშვნელოვანია შედარებული ჯგუფების დისპერსიების (განაწილების) თანასწორობა (ჰომოსკედასტიურობა). არათანაბარი დისპერსიებისთვის გამოიყენება t-ტესტი, რომელიც შეცვლილია Welch-ის მიერ (Welch's t).

შედარებული ნიმუშების ნორმალური განაწილების არარსებობის შემთხვევაში, Student-ის t-ტესტის ნაცვლად გამოიყენება არაპარამეტრული სტატისტიკის მსგავსი მეთოდები, რომელთა შორის ყველაზე ცნობილია Mann-Whitney U ტესტი.

4. როგორ გამოვთვალოთ სტუდენტის t-ტესტი?

საშუალო მნიშვნელობების შესადარებლად, სტუდენტის t-ტესტი გამოითვლება შემდეგი ფორმულის გამოყენებით:

სად M 1- პირველი შედარებული პოპულაციის (ჯგუფის) საშუალო არითმეტიკული, M 2- მეორე შედარებული პოპულაციის (ჯგუფის) საშუალო არითმეტიკული, მ 1- პირველი არითმეტიკული საშუალოს საშუალო შეცდომა, მ 2- მეორე არითმეტიკული საშუალოს საშუალო ცდომილება.

მიღებული Student-ის t-ტესტის მნიშვნელობა სწორად უნდა იყოს ინტერპრეტირებული. ამისათვის ჩვენ უნდა ვიცოდეთ საგნების რაოდენობა თითოეულ ჯგუფში (n 1 და n 2). თავისუფლების ხარისხების რაოდენობის პოვნა შემდეგი ფორმულის მიხედვით:

F = (n 1 + n 2) - 2

ამის შემდეგ, ჩვენ განვსაზღვრავთ სტუდენტის t-ტესტის კრიტიკულ მნიშვნელობას მნიშვნელოვნების საჭირო დონისთვის (მაგალითად, p = 0.05) და თავისუფლების ხარისხების მოცემული რაოდენობისთვის. ცხრილის მიხედვით (იხ. ქვემოთ).

  • თუ სტუდენტის t-ტესტის გამოთვლილი მნიშვნელობა უდრის ან აღემატება ცხრილიდან აღმოჩენილ კრიტიკულ მნიშვნელობას, დავასკვნით, რომ განსხვავებები შედარებულ მნიშვნელობებს შორის არის სტატისტიკურად მნიშვნელოვანი.
  • თუ გამოთვლილი Student-ის t-ტესტის მნიშვნელობა ცხრილის მნიშვნელობაზე ნაკლებია, მაშინ შედარებულ მნიშვნელობებს შორის განსხვავებები არ არის სტატისტიკურად მნიშვნელოვანი.

ახალი რკინის პრეპარატის ეფექტურობის შესასწავლად შეირჩა ანემიით დაავადებულთა ორი ჯგუფი. პირველ ჯგუფში პაციენტები ორი კვირის განმავლობაში იღებდნენ ახალ პრეპარატს, მეორე ჯგუფში კი პლაცებოს. ამის შემდეგ გაზომეს ჰემოგლობინის დონე პერიფერიულ სისხლში. პირველ ჯგუფში ჰემოგლობინის საშუალო დონე იყო 115,4±1,2 გ/ლ, ხოლო მეორე ჯგუფში - 103,7±2,3 გ/ლ (მონაცემები წარმოდგენილია M±m ფორმატში), შედარებულ პოპულაციებს აქვთ ნორმალური განაწილება. პირველი ჯგუფის რაოდენობა იყო 34, ხოლო მეორე - 40 პაციენტი. საჭიროა დასკვნის გაკეთება მიღებული სხვაობების სტატისტიკური მნიშვნელობისა და ახალი რკინის პრეპარატის ეფექტურობის შესახებ.

გამოსავალი:განსხვავებების მნიშვნელოვნების შესაფასებლად ვიყენებთ Student-ის t-ტესტს, რომელიც გამოითვლება, როგორც განსხვავება საშუალო მნიშვნელობებში, გაყოფილი კვადრატული შეცდომების ჯამზე:

გამოთვლების შესრულების შემდეგ t-ტესტის მნიშვნელობა აღმოჩნდა 4,51. ჩვენ ვპოულობთ თავისუფლების ხარისხების რაოდენობას, როგორც (34 + 40) - 2 = 72. ჩვენ შევადარებთ მიღებული Student-ის t-ტესტის მნიშვნელობას 4.51 კრიტიკულ მნიშვნელობას p = 0.05-ზე, რომელიც მითითებულია ცხრილში: 1.993. ვინაიდან კრიტერიუმის გამოთვლილი მნიშვნელობა კრიტიკულ მნიშვნელობაზე მეტია, დავასკვნათ, რომ დაკვირვებული განსხვავებები სტატისტიკურად მნიშვნელოვანია (მნიშვნელოვნების დონე p<0,05).


დაწყვილებული სტუდენტური t-ტესტი

დაწყვილებული Student-ის t-ტესტი სტუდენტის მეთოდის ერთ-ერთი მოდიფიკაციაა, რომელიც გამოიყენება დაწყვილებულ (განმეორებით) გაზომვებში განსხვავებების სტატისტიკური მნიშვნელობის დასადგენად.

1. t-ტესტის განვითარების ისტორია

შემუშავდა t-ტესტი უილიამ გოსეტიგინესის კომპანიაში ლუდის ხარისხის შესაფასებლად. კომპანიის წინაშე მოვალეობების გამო სავაჭრო საიდუმლოების არ გამჟღავნებასთან დაკავშირებით, გოსეტის სტატია გამოქვეყნდა 1908 წელს ჟურნალში Biometrics ფსევდონიმით „სტუდენტი“.

2. რისთვის გამოიყენება დაწყვილებული სტუდენტის t-ტესტი?

დაწყვილებული Student-ის t-ტესტი გამოიყენება ორი დამოკიდებული (დაწყვილებული) ნიმუშის შესადარებლად. დამოკიდებული გაზომვები არის ერთსა და იმავე პაციენტებში, მაგრამ სხვადასხვა დროს, მაგალითად, არტერიული წნევა ჰიპერტენზიულ პაციენტებში ანტიჰიპერტენზიული პრეპარატის მიღებამდე და მის შემდეგ. ნულოვანი ჰიპოთეზა აცხადებს, რომ შედარებულ ნიმუშებს შორის განსხვავება არ არის, ალტერნატიული ჰიპოთეზა აცხადებს, რომ არსებობს სტატისტიკურად მნიშვნელოვანი განსხვავებები.

3. რა შემთხვევაში შეიძლება გამოიყენო დაწყვილებული სტუდენტის t-ტესტი?

მთავარი პირობაა ნიმუშების დამოკიდებულება, ანუ შედარებული მნიშვნელობები უნდა იქნას მიღებული იმავე პაციენტებში ერთი პარამეტრის განმეორებითი გაზომვებით.

როგორც დამოუკიდებელი ნიმუშების შედარების შემთხვევაში, დაწყვილებული t-ტესტის გამოსაყენებლად, ორიგინალური მონაცემები ნორმალურად უნდა განაწილდეს. თუ ეს პირობა არ არის დაკმაყოფილებული, არაპარამეტრული სტატისტიკური მეთოდები უნდა იქნას გამოყენებული ნიმუშის საშუალო საშუალებების შესადარებლად, როგორიცაა G ნიშნის ტესტიან Wilcoxon T-ტესტი.

დაწყვილებული t ტესტის გამოყენება შესაძლებელია მხოლოდ ორი ნიმუშის შედარებისას. თუ საჭიროა სამი ან მეტი განმეორებითი გაზომვის შედარება, უნდა გამოიყენოთ ცალმხრივი დისპერსიული ანალიზი (ANOVA) განმეორებითი ზომებისთვის.

4. როგორ გამოვთვალოთ დაწყვილებული სტუდენტის t-ტესტი?

დაწყვილებული სტუდენტის t-ტესტი გამოითვლება შემდეგი ფორმულის გამოყენებით:

სად მ დ- მანამდე და შემდეგ გაზომილ ინდიკატორებს შორის განსხვავებების არითმეტიკული საშუალო, σ დ- ინდიკატორების განსხვავებების სტანდარტული გადახრა, - შესწავლილი საგნების რაოდენობა.

5. როგორ განვმარტოთ სტუდენტის t-ტესტის მნიშვნელობა?

მიღებული დაწყვილებული Student-ის t-ტესტის მნიშვნელობის ინტერპრეტაცია არ განსხვავდება t-ტესტის შეფასებისგან დაუკავშირებელი პოპულაციებისთვის. უპირველეს ყოვლისა, თქვენ უნდა იპოვოთ თავისუფლების ხარისხების რაოდენობა შემდეგი ფორმულის მიხედვით:

F = n - 1

ამის შემდეგ, ჩვენ განვსაზღვრავთ სტუდენტის t-ტესტის კრიტიკულ მნიშვნელობას მნიშვნელოვნების საჭირო დონისთვის (მაგალითად, p<0,05) и при данном числе степеней свободы ცხრილის მიხედვით (იხ. ქვემოთ).

ჩვენ ვადარებთ კრიტერიუმის კრიტიკულ და გამოთვლილ მნიშვნელობებს:

  • თუ დაწყვილებული სტუდენტური t-ტესტის გამოთვლილი მნიშვნელობა უდრის ან აღემატება ცხრილიდან აღმოჩენილ კრიტიკულ მნიშვნელობას, დავასკვნით, რომ განსხვავებები შედარებულ მნიშვნელობებს შორის არის სტატისტიკურად მნიშვნელოვანი.
  • თუ გამოთვლილი დაწყვილებული Student-ის t-ტესტის მნიშვნელობა ცხრილის მნიშვნელობაზე ნაკლებია, მაშინ შედარებულ მნიშვნელობებს შორის განსხვავებები არ არის სტატისტიკურად მნიშვნელოვანი.

6. სტუდენტის t-ტესტის გამოთვლის მაგალითი

ახალი ჰიპოგლიკემიური აგენტის ეფექტურობის შესაფასებლად, შაქრიანი დიაბეტის მქონე პაციენტებში გაზომეს სისხლში გლუკოზის დონე პრეპარატის მიღებამდე და მის შემდეგ. შედეგად მიღებული იქნა შემდეგი მონაცემები:

გამოსავალი:

1. გამოთვალეთ მნიშვნელობების თითოეული წყვილის სხვაობა (d):

პაციენტი ნ სისხლში გლუკოზის დონე, მმოლ/ლ განსხვავება (დ)
პრეპარატის მიღებამდე პრეპარატის მიღების შემდეგ
1 9.6 5.7 3.9
2 8.1 5.4 2.7
3 8.8 6.4 2.4
4 7.9 5.5 2.4
5 9.2 5.3 3.9
6 8.0 5.2 2.8
7 8.4 5.1 3.3
8 10.1 6.9 3.2
9 7.8 7.5 2.3
10 8.1 5.0 3.1

2. იპოვეთ განსხვავებათა საშუალო არითმეტიკული ფორმულის გამოყენებით:

3. იპოვეთ განსხვავებების სტანდარტული გადახრა საშუალოდან ფორმულის გამოყენებით:

4. გამოთვალეთ დაწყვილებული სტუდენტის t-ტესტი:

5. შევადაროთ სტუდენტის t-ტესტის 8.6 მიღებული მნიშვნელობა ცხრილის მნიშვნელობას, რომელიც თავისუფლების გრადუსების რაოდენობით f ტოლია 10 - 1 = 9 და მნიშვნელოვნების დონე p = 0.05 არის 2.262. ვინაიდან მიღებული მნიშვნელობა კრიტიკულ მნიშვნელობაზე მეტია, დავასკვნით, რომ არის სტატისტიკურად მნიშვნელოვანი განსხვავებები სისხლში გლუკოზის დონეში ახალი პრეპარატის მიღებამდე და მის შემდეგ.

აჩვენეთ სტუდენტის t-ტესტის კრიტიკული მნიშვნელობების ცხრილი

MANN-WHITNEY U-კრიტერიუმი

Mann-Whitney U ტესტი არის არაპარამეტრული სტატისტიკური ტესტი, რომელიც გამოიყენება ორი დამოუკიდებელი ნიმუშის შესადარებლად რაოდენობრივად გაზომილი მახასიათებლის დონის მიხედვით. მეთოდი ემყარება იმის დადგენას, არის თუ არა საკმარისად მცირე მნიშვნელობების გადაკვეთის ზონა ორ ვარიაციულ სერიას შორის (პარამეტრების მნიშვნელობების რანჟირებული სერია პირველ ნიმუშში და იგივე მეორე ნიმუშში). რაც უფრო დაბალია კრიტერიუმის მნიშვნელობა, მით უფრო სავარაუდოა, რომ ნიმუშებში პარამეტრის მნიშვნელობებს შორის განსხვავებები საიმედოა.

1. U- კრიტერიუმის განვითარების ისტორია

ნიმუშებს შორის განსხვავებების იდენტიფიცირების ეს მეთოდი შემოთავაზებული იყო 1945 წელს ამერიკელმა ქიმიკოსმა და სტატისტიკოსმა. ფრენკ ვილკოქსონი.
1947 წელს მათემატიკოსებმა საგრძნობლად გადახედეს და გააფართოვეს ჰ.ბ. მანი(H.B. Mann) და დ.რ. უიტნი(D.R. Whitney), რომლის სახელებითაც დღეს მას ჩვეულებრივ უწოდებენ.

2. რისთვის გამოიყენება Mann-Whitney U ტესტი?

Mann-Whitney U ტესტი გამოიყენება ორ დამოუკიდებელ ნიმუშს შორის განსხვავებების შესაფასებლად ნებისმიერი რაოდენობრივი მახასიათებლის დონის მიხედვით.

3. რა შემთხვევაში შეიძლება გამოვიყენოთ Mann-Whitney U ტესტი?

Mann-Whitney U ტესტი არაპარამეტრული ტესტია, შესაბამისად, განსხვავებით სტუდენტის t-ტესტი

U-ტესტი შესაფერისია მცირე ნიმუშების შესადარებლად: თითოეულ ნიმუშს უნდა ჰქონდეს მინიმუმ 3 დამახასიათებელი მნიშვნელობა. დასაშვებია, რომ ერთ ნიმუშში იყოს 2 მნიშვნელობა, მაგრამ შემდეგ მეორეს უნდა ჰქონდეს მინიმუმ ხუთი.

Mann-Whitney U ტესტის გამოყენების პირობაა შედარებულ ჯგუფებში შესატყვისი ატრიბუტების მნიშვნელობების არარსებობა (ყველა რიცხვი განსხვავებულია) ან ასეთი შესატყვისების ძალიან მცირე რაოდენობა.

Mann-Whitney U ტესტის ანალოგი სამი ან მეტი ჯგუფის შესადარებლად არის კრუსკალ-ვალისის ტესტი.

4. როგორ გამოვთვალოთ Mann-Whitney U ტესტი?

პირველი, ორივე შედარებული ნიმუშიდან, ა ერთი რეიტინგული სერია, დაკვირვების ერთეულების მოწყობა ატრიბუტის გაზრდის ხარისხის მიხედვით და უფრო მცირე მნიშვნელობისთვის ქვედა რანგის მინიჭებით. რამდენიმე ერთეულის მახასიათებლის თანაბარი მნიშვნელობების შემთხვევაში, თითოეულ მათგანს ენიჭება თანმიმდევრული რანგის მნიშვნელობების საშუალო არითმეტიკული.

მაგალითად, ორ ერთეულს, რომლებიც იკავებს მე-2 და მე-3 ადგილს (რანგის) ერთ დასახელებულ რიგში, აქვს იგივე მნიშვნელობები. ამიტომ, თითოეულ მათგანს ენიჭება წოდება (3 + 2) / 2 = 2.5.

შედგენილ ერთ რეიტინგულ სერიაში წოდებების საერთო რაოდენობა ტოლი იქნება:

N = n 1 + n 2

სადაც n 1 არის ელემენტების რაოდენობა პირველ ნიმუშში და n 2 არის ელემენტების რაოდენობა მეორე ნიმუშში.

შემდეგი, ჩვენ კვლავ ვყოფთ ერთ რანჟირებულ სერიას ორად, რომლებიც შედგებიან შესაბამისად პირველი და მეორე ნიმუშების ერთეულებისგან, ამასთან ერთად ვიხსენებთ თითოეული ერთეულის რანგის მნიშვნელობებს. ჩვენ ცალ-ცალკე ვიანგარიშებთ რანგების ჯამს, რომელიც მოდის პირველი ნიმუშის ელემენტების წილზე და ცალ-ცალკე - მეორე ნიმუშის ელემენტების წილზე. ჩვენ განვსაზღვრავთ უფრო დიდს ორი რანგის ჯამიდან (T x), რომელიც შეესაბამება n x ელემენტის მქონე ნიმუშს.

საბოლოოდ, ჩვენ ვიპოვით Mann-Whitney U ტესტის მნიშვნელობას ფორმულის გამოყენებით:

5. როგორ განვსაზღვროთ Mann-Whitney U ტესტის მნიშვნელობა?

ჩვენ შევადარებთ U-ტესტის მიღებულ მნიშვნელობას ცხრილის გამოყენებით შერჩეული სტატისტიკური მნიშვნელობის დონისთვის (p=0.05 ან p=0.01) U-ის კრიტიკულ მნიშვნელობას შედარებული ნიმუშების მოცემული რაოდენობისთვის:

  • თუ მიღებული მნიშვნელობა U ნაკლებიცხრილი ან უდრისმას, მაშინ აღიარებულია განხილულ ნიმუშებში ნიშან-თვისების დონეებს შორის განსხვავებების სტატისტიკური მნიშვნელობა (მიღებულია ალტერნატიული ჰიპოთეზა). რაც უფრო მცირეა U მნიშვნელობა, მით უფრო მაღალია განსხვავებების სანდოობა.
  • თუ მიღებული მნიშვნელობა U მეტიცხრილის სახით მიღებულია ნულოვანი ჰიპოთეზა.
Mann-Whitney U ტესტის კრიტიკული მნიშვნელობების ცხრილის ჩვენება p=0.05-ზე

WILCOxon-ის კრიტერიუმი

უილკოქსონის ტესტი დაკავშირებული ნიმუშებისთვის (ასევე უწოდებენ Wilcoxon T ტესტი, Wilcoxon test, Wilcoxon signed rank test, Wilcoxon rank sum test) არის არაპარამეტრული სტატისტიკური ტესტი, რომელიც გამოიყენება ორი დაკავშირებული (დაწყვილებული) ნიმუშის შესადარებლად ზოგიერთი რაოდენობრივი მახასიათებლის დონის მიხედვით. იზომება უწყვეტი ან რიგითი მასშტაბით.

მეთოდის არსი იმაში მდგომარეობს, რომ შედარებულია ამა თუ იმ მიმართულებით გადაადგილების სიმძიმის აბსოლუტური მნიშვნელობები. ამისათვის ჯერ ცვლის ყველა აბსოლუტური მნიშვნელობების რანჟირება, შემდეგ კი რიგების შეჯამება. თუ გადაადგილებები ამა თუ იმ მიმართულებით ხდება შემთხვევით, მაშინ მათი რიგების ჯამები დაახლოებით ტოლი იქნება. თუ ერთი მიმართულებით ძვრების ინტენსივობა უფრო დიდია, მაშინ საპირისპირო მიმართულებით ცვლათა აბსოლუტური მნიშვნელობების რიგების ჯამი მნიშვნელოვნად დაბალი იქნება, ვიდრე ეს შეიძლება იყოს შემთხვევითი ცვლილებებით.

1. დაკავშირებული ნიმუშებისთვის ვილკოქსონის ტესტის განვითარების ისტორია

ტესტი პირველად 1945 წელს შემოგვთავაზა ამერიკელმა სტატისტიკოსმა და ქიმიკოსმა ფრენკ ვილკოქსონმა (1892-1965). ამავე სამეცნიერო ნაშრომში ავტორმა აღწერა კიდევ ერთი კრიტერიუმი, რომელიც გამოიყენება დამოუკიდებელი ნიმუშების შედარების შემთხვევაში.

2. რისთვის გამოიყენება ვილკოქსონის ტესტი?

Wilcoxon T ტესტი გამოიყენება განსხვავებების შესაფასებლად გაზომვების ორ კომპლექტს შორის, რომლებიც მიიღება იმავე პოპულაციაზე, მაგრამ სხვადასხვა პირობებში ან სხვადასხვა დროს. ამ ტესტს შეუძლია გამოავლინოს ცვლილებების მიმართულება და სიმძიმე - ანუ არის თუ არა ინდიკატორები უფრო გადაადგილებული ერთი მიმართულებით, ვიდრე მეორეში.

სიტუაციის კლასიკური მაგალითი, რომელშიც შეიძლება გამოყენებულ იქნას Wilcoxon T-ტესტი მონათესავე პოპულაციებისთვის, არის ადრე და შემდეგ კვლევა, რომელიც ადარებს ქულებს მკურნალობამდე და მის შემდეგ. მაგალითად, ანტიჰიპერტენზიული პრეპარატის ეფექტურობის შესწავლისას, არტერიული წნევა შედარება ხდება პრეპარატის მიღებამდე და მის შემდეგ.

3. Wilcoxon T-ტესტის გამოყენების პირობები და შეზღუდვები

  1. Wilcoxon ტესტი არაპარამეტრული ტესტია, შესაბამისად, განსხვავებით დაწყვილებული სტუდენტის t-ტესტი, არ საჭიროებს შედარებული პოპულაციების ნორმალურ განაწილებას.
  2. ვილკოქსონის T-ტესტის გამოყენებისას სუბიექტების რაოდენობა უნდა იყოს მინიმუმ 5.
  3. შესწავლილი ნიშან-თვისება შეიძლება გაიზომოს როგორც რაოდენობრივი უწყვეტი სკალით (არტერიული წნევა, გულისცემა, ლეიკოციტების შემცველობა 1 მლ სისხლში), ასევე რიგითი სკალით (ქულების რაოდენობა, დაავადების სიმძიმე, მიკროორგანიზმებით დაბინძურების ხარისხი).
  4. ეს კრიტერიუმი გამოიყენება მხოლოდ გაზომვების ორი სერიის შედარებისას. Wilcoxon T-ტესტის ანალოგი სამი ან მეტი მონათესავე პოპულაციის შესადარებლად არის ფრიდმენის კრიტერიუმი.

4. როგორ გამოვთვალოთ Wilcoxon T-ტესტი დაკავშირებული ნიმუშებისთვის?

  1. გამოთვალეთ განსხვავება დაწყვილებული გაზომვების მნიშვნელობებს შორის თითოეული საგნისთვის. ნულოვანი ძვრები შემდგომში არ არის გათვალისწინებული.
  2. დაადგინეთ, რომელი განსხვავებაა ტიპიური, ანუ შეესაბამება ინდიკატორის ცვლილების მიმართულებას, რომელიც დომინანტურია სიხშირით.
  3. დაალაგეთ წყვილთა განსხვავებები მათი აბსოლუტური მნიშვნელობების მიხედვით (ანუ ნიშნის გათვალისწინების გარეშე), აღმავალი თანმიმდევრობით. სხვაობის უფრო მცირე აბსოლუტურ მნიშვნელობას ენიჭება ქვედა წოდება.
  4. გამოთვალეთ წოდებების ჯამი, რომლებიც შეესაბამება ატიპიურ ცვლებს.

ამრიგად, Wilcoxon T-ტესტი დაკავშირებული ნიმუშებისთვის გამოითვლება შემდეგი ფორმულის გამოყენებით:

სადაც ΣRr არის მაჩვენებლის ატიპიური ცვლილებების შესაბამისი რიგების ჯამი.

5. როგორ განვსაზღვროთ Wilcoxon ტესტის მნიშვნელობა?

Wilcoxon T-ტესტის შედეგად მიღებული მნიშვნელობა შედარებულია კრიტიკულ მნიშვნელობასთან, ცხრილის მიხედვით, სტატისტიკური მნიშვნელობის შერჩეული დონისთვის ( p=0.05ან p=0.01) შედარებული ნიმუშების მოცემული რაოდენობისთვის n:

  • თუ გამოთვლილი (ემპირიული) მნიშვნელობა T em. ჩამოთვლილ T კრ.-ზე ნაკლები. ან მისი ტოლი, მაშინ აღიარებულია ინდიკატორის ცვლილებების სტატისტიკური მნიშვნელობა ტიპიური მიმართულებით (მიღებულია ალტერნატიული ჰიპოთეზა). რაც უფრო დაბალია T მნიშვნელობა, მით უფრო მაღალია განსხვავებების საიმედოობა.
  • თუ T ემპ. მეტი T კრ. მიღებულია ნულოვანი ჰიპოთეზა ინდიკატორში ცვლილებების სტატისტიკური მნიშვნელობის არარსებობის შესახებ.

ვილკოქსონის ტესტის გაანგარიშების მაგალითი დაკავშირებული ნიმუშებისთვის

ფარმაცევტული კომპანია იკვლევს ახალ პრეპარატს არასტეროიდული ანთების საწინააღმდეგო პრეპარატების ჯგუფიდან. ამ მიზნით შეირჩა 10 მოხალისე ჯგუფი, რომლებსაც აწუხებდათ ARVI ჰიპერთერმიით. მათი სხეულის ტემპერატურა გაზომეს ახალი წამლის მიღებამდე და 30 წუთის შემდეგ. აუცილებელია დასკვნის გაკეთება პრეპარატის მიღების შედეგად სხეულის ტემპერატურის დაქვეითების მნიშვნელობის შესახებ.

  1. წყაროს მონაცემები წარმოდგენილია შემდეგ ცხრილში:
  2. Wilcoxon T-ტესტის გამოსათვლელად, ჩვენ ვიანგარიშებთ განსხვავებებს დაწყვილებულ ინდიკატორებს შორის და ვაფასებთ მათ აბსოლუტურ მნიშვნელობებს. ამ შემთხვევაში, ჩვენ წითლად გამოვყოფთ ატიპიურ რიგებს:
    გვარი სხეულის t პრეპარატის მიღებამდე ტ ორგანიზმი პრეპარატის მიღების შემდეგ ინდიკატორთა სხვაობა, დ |დ| წოდება
    1. ივანოვი 39.0 37.6 -1.4 1.4 7
    2. პეტროვი 39.5 38.7 -0.8 0.8 5
    3. სიდოროვი 38.6 38.7 0.1 0.1 1.5
    4. პოპოვი 39.1 38.5 -0.6 0.6 4
    5. ნიკოლაევი 40.1 38.6 -1.5 1.5 8
    6. კოზლოვი 39.3 37.5 -1.8 1.8 9
    7. იგნატიევი 38.9 38.8 -0.1 0.1 1.5
    8. სემენოვი 39.2 38.0 -1.2 1.2 6
    9. ეგოროვი 39.8 39.8 0
    10. ალექსეევი 38.8 39.3 0.5 0.5 3
    როგორც ვხედავთ, ტიპიური ცვლაინდიკატორი არის მისი შემცირება, დაფიქსირდა 10-დან 7 შემთხვევაში. ერთ შემთხვევაში (პაციენტ ეგოროვში) ტემპერატურა არ შეცვლილა პრეპარატის მიღების შემდეგ და ამიტომ ეს შემთხვევა არ იქნა გამოყენებული შემდგომი ანალიზისთვის. ორ შემთხვევაში (პაციენტებში სიდოროვი და ალექსეევი) აღინიშნა ატიპიური ცვლატემპერატურა მაღლა. ატიპიური ცვლის შესაბამისი წოდებებია 1.5 და 3.
  3. გამოვთვალოთ Wilcoxon T-ტესტი, რომელიც უდრის რანჟირების ჯამს, რომელიც შეესაბამება ინდიკატორის ატიპიურ ცვლას:

    T = ΣRr = 3 + 1.5 = 4.5

  4. შევადაროთ T emp. თ კრ. , რომელიც მნიშვნელოვნების დონეზე p=0.05 და n=9 უდრის 8-ს. ამიტომ T emp.
  5. ჩვენ ვასკვნით: ARVI-ის მქონე პაციენტებში სხეულის ტემპერატურის დაქვეითება ახალი წამლის მიღების შედეგად არის სტატისტიკურად მნიშვნელოვანი (გვ.<0.05).
აჩვენეთ Wilcoxon T-ტესტის კრიტიკული მნიშვნელობების ცხრილი

PEARSON CHI-SQUARE კრიტერიუმი

პირსონის χ 2 ტესტი არის არაპარამეტრული მეთოდი, რომელიც საშუალებას გვაძლევს შევაფასოთ განსხვავებათა მნიშვნელოვნება შედეგების რეალურ (გამოვლენილ) რაოდენობას ან ხარისხობრივ მახასიათებლებს შორის, რომლებიც მიეკუთვნება თითოეულ კატეგორიას და თეორიულ რიცხვს, რომელიც მოსალოდნელია შესწავლილ ჯგუფებში, თუ ნულოვანი ჰიპოთეზა მართალია. მარტივად რომ ვთქვათ, მეთოდი საშუალებას გაძლევთ შეაფასოთ განსხვავებების სტატისტიკური მნიშვნელობა ორ ან მეტ ფარდობით ინდიკატორს შორის (სიხშირეები, პროპორციები).

1. χ 2 კრიტერიუმის განვითარების ისტორია

ჩი-კვადრატის ტესტი შემთხვევითი ცხრილების გასაანალიზებლად შეიქმნა და შემოთავაზებული იყო 1900 წელს ინგლისელმა მათემატიკოსმა, სტატისტიკოსმა, ბიოლოგმა და ფილოსოფოსმა, მათემატიკური სტატისტიკის ფუძემდებელმა და ბიომეტრიის ერთ-ერთმა ფუძემდებელმა. კარლ პირსონი(1857-1936).

2. რატომ გამოიყენება პირსონის χ 2 ტესტი?

ანალიზში შეიძლება გამოყენებულ იქნას chi-square ტესტი საგანგებო ცხრილებიშეიცავს ინფორმაციას შედეგების სიხშირის შესახებ, რაც დამოკიდებულია რისკის ფაქტორის არსებობაზე. მაგალითად, ოთხი ველის საგანგებო ცხრილი ასე გამოიყურება:

არის შედეგი (1) შედეგი არ არის (0) სულ
არსებობს რისკის ფაქტორი (1) A+B
არ არის რისკის ფაქტორი (0) C C+D
სულ A+C B+D A+B+C+D

როგორ შეავსოთ ასეთი საგანგებო ცხრილი? მოდით შევხედოთ პატარა მაგალითს.

ტარდება კვლევა არტერიული ჰიპერტენზიის განვითარების რისკზე მოწევის ეფექტზე. ამ მიზნით შეირჩა სუბიექტების ორი ჯგუფი - პირველი მოიცავდა 70 ადამიანს, რომლებიც ყოველდღიურად ეწევიან მინიმუმ 1 კოლოფ სიგარეტს, მეორეში შედიოდა იმავე ასაკის 80 არამწეველი. პირველ ჯგუფში 40 ადამიანს ჰქონდა მაღალი წნევა. მეორეში არტერიული ჰიპერტენზია დაფიქსირდა 32 ადამიანში. შესაბამისად, ნორმალური არტერიული წნევა მწეველთა ჯგუფში იყო 30 ადამიანში (70 - 40 = 30), ხოლო არამწეველთა ჯგუფში - 48-ში (80 - 32 = 48).

ჩვენ ვავსებთ ოთხ ველს შემთხვევითობის ცხრილს საწყისი მონაცემებით:

შედეგად მიღებული საგანგებო ცხრილში, თითოეული ხაზი შეესაბამება საგნების კონკრეტულ ჯგუფს. სვეტები აჩვენებს არტერიული ჰიპერტენზიის ან ნორმალური არტერიული წნევის მქონე ადამიანების რაოდენობას.

ამოცანა, რომელიც მკვლევარს აკისრია: არის თუ არა სტატისტიკურად მნიშვნელოვანი განსხვავებები არტერიული წნევის მქონე ადამიანების სიხშირეს შორის მწეველებსა და არამწეველებს შორის? ამ კითხვაზე პასუხის გაცემა შესაძლებელია Pearson chi-square ტესტის გამოთვლით და მიღებული მნიშვნელობის კრიტიკულთან შედარებით.

  1. შესადარებელი ინდიკატორები უნდა გაიზომოს ნომინალურ შკალაზე (მაგალითად, პაციენტის სქესი არის მამრობითი ან მდედრობითი სქესი) ან რიგითი სკალით (მაგალითად, არტერიული ჰიპერტენზიის ხარისხი, 0-დან 3-მდე).
  2. ეს მეთოდი საშუალებას გაძლევთ გაანალიზოთ არა მხოლოდ ოთხი ველის ცხრილები, როდესაც ორივე ფაქტორი და შედეგი არის ორობითი ცვლადი, ანუ მათ აქვთ მხოლოდ ორი შესაძლო მნიშვნელობა (მაგალითად, მამრობითი ან მდედრობითი სქესი, არსებობა ან არარსებობა. გარკვეული დაავადება ანამნეზში...). Pearson chi-square ტესტი ასევე შეიძლება გამოყენებულ იქნას მრავალველიანი ცხრილების ანალიზის შემთხვევაში, როდესაც ფაქტორი და (ან) შედეგი იღებს სამ ან მეტ მნიშვნელობას.
  3. შედარებული ჯგუფები უნდა იყოს დამოუკიდებელი, ანუ ჩი-კვადრატის ტესტი არ უნდა იქნას გამოყენებული დაკვირვების წინ და შემდეგ შედარებისას. მაკნემარის ტესტი(ორი მონათესავე პოპულაციის შედარებისას) ან გამოთვლილი კოკრანის Q ტესტი(სამი ან მეტი ჯგუფის შედარების შემთხვევაში).
  4. ოთხველიანი ცხრილების ანალიზისას მოსალოდნელი ღირებულებებითითოეულ უჯრედში უნდა იყოს მინიმუმ 10. თუ მინიმუმ ერთ უჯრედში მოსალოდნელი ფენომენი იღებს მნიშვნელობას 5-დან 9-მდე, უნდა გამოითვალოს chi-კვადრატის ტესტი. იიტსის შესწორებით. თუ მინიმუმ ერთ უჯრედში მოსალოდნელი ფენომენი 5-ზე ნაკლებია, მაშინ ანალიზი უნდა იქნას გამოყენებული ფიშერის ზუსტი ტესტი.
  5. მულტიველური ცხრილების ანალიზისას დაკვირვების მოსალოდნელი რაოდენობა არ უნდა იყოს 5-ზე ნაკლები უჯრედების 20%-ზე მეტში.

4. როგორ გამოვთვალოთ პირსონის ჩი-კვადრატის ტესტი?

chi-კვადრატის ტესტის გამოსათვლელად გჭირდებათ:

ეს ალგორითმი გამოიყენება როგორც ოთხველიანი, ასევე მრავალ ველის ცხრილებისთვის.

5. როგორ განვსაზღვროთ პირსონის ჩი-კვადრატის ტესტის მნიშვნელობა?

თუ χ 2 კრიტერიუმის მიღებული მნიშვნელობა კრიტიკულ მნიშვნელობაზე მეტია, დავასკვნით, რომ არსებობს სტატისტიკური კავშირი შესწავლილ რისკფაქტორსა და შედეგს შორის მნიშვნელობის შესაბამის დონეზე.

6. პირსონის ჩი-კვადრატის ტესტის გამოთვლის მაგალითი

მოდით განვსაზღვროთ მოწევის ფაქტორის გავლენის სტატისტიკური მნიშვნელობა არტერიული ჰიპერტენზიის სიხშირეზე ზემოთ განხილული ცხრილის გამოყენებით:

  1. ჩვენ ვიანგარიშებთ მოსალოდნელ მნიშვნელობებს თითოეული უჯრედისთვის:
  2. იპოვეთ პირსონის ჩი-კვადრატის ტესტის მნიშვნელობა:

    χ 2 = (40-33.6) 2 /33.6 + (30-36.4) 2 /36.4 + (32-38.4) 2 /38.4 + (48-41.6) 2 /41.6 = 4.396.

  3. თავისუფლების გრადუსების რაოდენობა f = (2-1)*(2-1) = 1. ცხრილის გამოყენებით ვპოულობთ პირსონის ჩი-კვადრატის ტესტის კრიტიკულ მნიშვნელობას, რომელიც მნიშვნელოვნების დონეზე p=0.05 და რიცხვს. თავისუფლების ხარისხი 1 არის 3.841.
  4. ჩვენ ვადარებთ chi-square ტესტის მიღებულ მნიშვნელობას კრიტიკულს: 4,396 > 3,841, შესაბამისად, არტერიული ჰიპერტენზიის სიხშირის დამოკიდებულება მოწევის არსებობაზე სტატისტიკურად მნიშვნელოვანია. ამ ურთიერთობის მნიშვნელოვნების დონე შეესაბამება პ<0.05.
აჩვენეთ პირსონის ჩი-კვადრატის ტესტის კრიტიკული მნიშვნელობების ცხრილი

ფიშერის ზუსტი კრიტერიუმი

ფიშერის ზუსტი ტესტი არის ტესტი, რომელიც გამოიყენება ორი შედარებითი ინდიკატორის შესადარებლად, რომლებიც ახასიათებენ კონკრეტული მახასიათებლის სიხშირეს, რომელსაც აქვს ორი მნიშვნელობა. ფიშერის ზუსტი ტესტის გამოსათვლელად თავდაპირველი მონაცემები, როგორც წესი, ჯგუფდება ოთხი ველის ცხრილის სახით.

1. კრიტერიუმის განვითარების ისტორია

კრიტერიუმი პირველად იქნა შემოთავაზებული რონალდ ფიშერითავის წიგნში ექსპერიმენტების დიზაინი. ეს მოხდა 1935 წელს. თავად ფიშერი ამტკიცებდა, რომ მურიელ ბრისტოლმა მას ამ იდეისკენ უბიძგა. 1920-იანი წლების დასაწყისში, რონალდი, მურიელი და უილიამ როუჩი განლაგდნენ ინგლისში სოფლის მეურნეობის ექსპერიმენტულ სადგურზე. მურიელი ამტკიცებდა, რომ მას შეეძლო დაედგინა თასში ჩაის და რძის ჩასხმის თანმიმდევრობა. იმ დროს მისი განცხადების სისწორის გადამოწმება ვერ მოხერხდა.

ამან წარმოშვა ფიშერის იდეა "ნულის ჰიპოთეზის" შესახებ. მიზანი არ იყო იმის დამტკიცება, რომ მურიელს შეეძლო გაერჩია განსხვავებულად მომზადებული ჩაის ფინჯნები. გადაწყდა, რომ უარყოთ ჰიპოთეზა, რომ ქალი არჩევანს შემთხვევით აკეთებს. დადგინდა, რომ ნულოვანი ჰიპოთეზა ვერც დადასტურდა და ვერც გამართლდა. მაგრამ მისი უარყოფა შესაძლებელია ექსპერიმენტების დროს.

მომზადდა 8 ჭიქა. პირველი ოთხი ჯერ რძით ივსება, დანარჩენი ოთხი ჩაით. ჭიქები აირია. ბრისტოლმა შესთავაზა ჩაის გასინჯვა და ჭიქების დაყოფა ჩაის მომზადების მეთოდის მიხედვით. შედეგი ორი ჯგუფი უნდა ყოფილიყო. ისტორია ამბობს, რომ ექსპერიმენტი წარმატებული იყო.

ფიშერის ტესტის წყალობით, ბრისტოლის ინტუიციურად მოქმედების ალბათობა შემცირდა 0,01428-მდე. ანუ 70-დან ერთ შემთხვევაში იყო შესაძლებელი თასის სწორად ამოცნობა. მაგრამ მაინც არ შეიძლება ნულამდე დავაკლოთ ის შანსები, რომლებსაც მადამ შემთხვევით განსაზღვრავს. თუნდაც გაზარდოთ ჭიქების რაოდენობა.

ამ ამბავმა ბიძგი მისცა "ნულის ჰიპოთეზის" განვითარებას. ამავდროულად, შემოთავაზებული იქნა ფიშერის ზუსტი კრიტერიუმი, რომლის არსი არის დამოკიდებული და დამოუკიდებელი ცვლადების ყველა შესაძლო კომბინაციის ჩამოთვლა.

2. რისთვის გამოიყენება ფიშერის ზუსტი ტესტი?

ფიშერის ზუსტი ტესტი ძირითადად გამოიყენება მცირე ნიმუშების შესადარებლად. ამის ორი კარგი მიზეზი არსებობს. ჯერ ერთი, კრიტერიუმის გაანგარიშება საკმაოდ რთულია და შეიძლება დიდი დრო დასჭირდეს ან მძლავრი გამოთვლითი რესურსები მოითხოვოს. მეორეც, კრიტერიუმი საკმაოდ ზუსტია (რაც მის სახელშიც კი აისახება), რაც საშუალებას იძლევა გამოიყენოს ის კვლევებში მცირე რაოდენობის დაკვირვებით.

განსაკუთრებული ადგილი ეთმობა ფიშერის ზუსტ ტესტს მედიცინაში. ეს არის მნიშვნელოვანი მეთოდი სამედიცინო მონაცემების დასამუშავებლად და იპოვა მისი გამოყენება მრავალ სამეცნიერო კვლევაში. მისი წყალობით შესაძლებელია გარკვეული ფაქტორებისა და შედეგების ურთიერთკავშირის შესწავლა, პათოლოგიური მდგომარეობის სიხშირის შედარება სუბიექტთა ორ ჯგუფს შორის და ა.შ.

3. რა შემთხვევაში შეიძლება გამოვიყენოთ ფიშერის ზუსტი ტესტი?

  1. შედარებული ცვლადები უნდა გაიზომოს ნომინალურ შკალაზე და ჰქონდეს მხოლოდ ორი მნიშვნელობა, მაგალითად, არტერიული წნევა ნორმალურია ან მომატებული, შედეგი ხელსაყრელი ან არასახარბიელო, არის პოსტოპერაციული გართულებები თუ არა.
  2. ფიშერის ზუსტი ტესტი შექმნილია ორი დამოუკიდებელი ჯგუფის შედარებისთვის, რომლებიც იყოფა ფაქტორით. შესაბამისად, ფაქტორსაც უნდა ჰქონდეს მხოლოდ ორი შესაძლო მნიშვნელობა.
  3. კრიტერიუმი შესაფერისია ძალიან მცირე ნიმუშების შესადარებლად: ფიშერის ზუსტი ტესტი შეიძლება გამოყენებულ იქნას ოთხსრული ცხრილის გასაანალიზებლად, მოსალოდნელი ფენომენის 5-ზე ნაკლები მნიშვნელობების შემთხვევაში, რაც გამოყენების შეზღუდვაა. პირსონის ჩი-კვადრატის ტესტი, თუნდაც იიტსის შესწორების გათვალისწინებით.
  4. ფიშერის ზუსტი ტესტი შეიძლება იყოს ცალმხრივი ან ორმხრივი. ცალმხრივი ვარიანტით, ზუსტად არის ცნობილი, სად გადაიხრება ერთ-ერთი მაჩვენებელი. მაგალითად, კვლევა ადარებს რამდენი პაციენტი გამოჯანმრთელდა საკონტროლო ჯგუფთან შედარებით. ვარაუდობენ, რომ თერაპია არ შეიძლება გააუარესოს პაციენტების მდგომარეობას, არამედ მხოლოდ განკურნება ან არა.
    ორმხრივი ტესტი აფასებს სიხშირის განსხვავებებს ორი მიმართულებით. ანუ ფასდება ფენომენის როგორც უფრო მაღალი, ისე დაბალი სიხშირის ალბათობა ექსპერიმენტულ ჯგუფში საკონტროლო ჯგუფთან შედარებით.

ფიშერის ზუსტი ტესტის ანალოგია პირსონის ჩი-კვადრატის ტესტი, მაშინ როცა ფიშერის ზუსტ ტესტს უფრო მაღალი სიმძლავრე აქვს, განსაკუთრებით მცირე ნიმუშების შედარებისას და ამიტომ აქვს უპირატესობა ამ შემთხვევაში.

4. როგორ გამოვთვალოთ ფიშერის ზუსტი ტესტი?

ვთქვათ, ჩვენ ვსწავლობთ თანდაყოლილი მანკით დაავადებული ბავშვების დაბადების სიხშირის დამოკიდებულებას ორსულობის დროს დედის მოწევაზე. ამისთვის შეირჩა ორსულთა ორი ჯგუფი, რომელთაგან ერთი იყო ექსპერიმენტული ჯგუფი, რომელიც შედგებოდა 80 ქალისგან, რომლებიც ეწეოდნენ ორსულობის პირველ ტრიმესტრში, ხოლო მეორე იყო შედარების ჯგუფი, მათ შორის 90 ქალი, რომელიც მთელი ორსულობის განმავლობაში ჯანსაღი ცხოვრების წესს უტარებდა. ექსპერიმენტულ ჯგუფში ნაყოფის თანდაყოლილი მანკის შემთხვევები იყო 10, შედარების ჯგუფში - 2.

პირველ რიგში, ჩვენ ვქმნით ოთხ ველს საგანგებო ცხრილს:

ფიშერის ზუსტი ტესტი გამოითვლება შემდეგი ფორმულით:

სადაც N არის საგნების საერთო რაოდენობა ორ ჯგუფში; ! - ფაქტორიალი, რომელიც არის რიცხვისა და რიცხვების მიმდევრობის ნამრავლი, რომელთაგან თითოეული წინაზე ნაკლებია 1-ით (მაგალითად, 4! = 4 3 2 1)

გამოთვლების შედეგად ვხვდებით, რომ P = 0.0137.

5. როგორ განვსაზღვროთ ფიშერის ზუსტი ტესტის მნიშვნელობა?

მეთოდის უპირატესობა ის არის, რომ მიღებული კრიტერიუმი შეესაბამება მნიშვნელოვნების დონის ზუსტ მნიშვნელობას p. ანუ ჩვენს მაგალითში მიღებული მნიშვნელობა 0,0137 არის ნაყოფის თანდაყოლილი მანკების განვითარების სიხშირეში შედარებულ ჯგუფებს შორის განსხვავებების მნიშვნელობის დონე. საჭიროა მხოლოდ ამ რიცხვის შედარება მნიშვნელოვნების კრიტიკულ დონესთან, რომელიც ჩვეულებრივ სამედიცინო კვლევებში 0,05-ია.

  • თუ ფიშერის ზუსტი ტესტის მნიშვნელობა კრიტიკულ მნიშვნელობაზე მეტია, მიიღება ნულოვანი ჰიპოთეზა და კეთდება დასკვნა, რომ არ არსებობს სტატისტიკურად მნიშვნელოვანი განსხვავებები შედეგის სიხშირეში, რაც დამოკიდებულია რისკის ფაქტორის არსებობაზე.
  • თუ ფიშერის ზუსტი ტესტის მნიშვნელობა კრიტიკულ მნიშვნელობაზე ნაკლებია, ალტერნატიული ჰიპოთეზა მიიღება და კეთდება დასკვნა, რომ არსებობს სტატისტიკურად მნიშვნელოვანი განსხვავებები შედეგის სიხშირეში, რაც დამოკიდებულია რისკის ფაქტორზე ზემოქმედებაზე.

ჩვენს მაგალითში პ< 0,05, в связи с чем делаем вывод о наличии прямой взаимосвязи курения и вероятности развития ВПР плода. Частота возникновения врожденной патологии у детей курящих женщин статистически значимо выше, чем у некурящих.


შანსების კოეფიციენტი

შანსების კოეფიციენტი არის სტატისტიკური ინდიკატორი (რუსულად მისი სახელი, როგორც წესი, შემოკლებით არის OR, ხოლო ინგლისურად - OR "შანსების თანაფარდობიდან"), ერთ-ერთი მთავარი გზაა რიცხვით აღწეროთ, თუ რამდენად არის გარკვეული შედეგის არარსებობა ან არსებობა. დაკავშირებულია კონკრეტულ სტატისტიკურ ჯგუფში გარკვეული ფაქტორის არსებობასთან ან არარსებობასთან.

1. შანსების კოეფიციენტის ინდიკატორის განვითარების ისტორია

ტერმინი "შანსი" მომდინარეობს აზარტული თამაშების თეორიიდან, სადაც ეს კონცეფცია გამოიყენებოდა მოგების და წაგებული პოზიციების თანაფარდობის აღსანიშნავად. სამეცნიერო სამედიცინო ლიტერატურაში შანსების თანაფარდობის მაჩვენებელი პირველად 1951 წელს იყო ნახსენები ჯ.კორნფილდის ნაშრომში. შემდგომში, ამ მკვლევარმა გამოაქვეყნა ნაშრომები, რომლებშიც აღინიშნა შანსების თანაფარდობის 95%-იანი ნდობის ინტერვალის გამოთვლა. (Cornfield, J. A Method for Estimating Comparative Rates from Clinical Data. Applications to Cancer of Lung, Breast, and Cervix // Journal of the National Cancer Institute, 1951. - N.11. - P.1269–1275.)

2. რისთვის გამოიყენება შანსების კოეფიციენტი?

შანსების კოეფიციენტი აფასებს კავშირს კონკრეტულ შედეგსა და რისკის ფაქტორს შორის.

შანსების კოეფიციენტი საშუალებას გაძლევთ შეადაროთ საკვლევი ჯგუფები გარკვეული რისკის ფაქტორის გამოვლენის სიხშირის მიხედვით. მნიშვნელოვანია, რომ შანსების კოეფიციენტის გამოყენების შედეგი იყოს არა მხოლოდ ფაქტორსა და შედეგს შორის კავშირის სტატისტიკური მნიშვნელობის განსაზღვრა, არამედ მისი რაოდენობრივი შეფასება.

3. შანსების კოეფიციენტების გამოყენების პირობები და შეზღუდვები

  1. შედეგისა და ფაქტორების ინდიკატორები უნდა გაიზომოს ნომინალური მასშტაბით. მაგალითად, ეფექტური ნიშანია ნაყოფში თანდაყოლილი მანკის არსებობა ან არარსებობა, შესწავლილი ფაქტორია დედის მოწევა (ეწევა ან არ ეწევა).
  2. ეს მეთოდი იძლევა მხოლოდ ოთხი ველის ცხრილების ანალიზს, როდესაც ფაქტორიც და შედეგიც არის ბინარული ცვლადები, ანუ მათ აქვთ მხოლოდ ორი შესაძლო მნიშვნელობა (მაგალითად, სქესი - მამრობითი ან ქალი, არტერიული ჰიპერტენზია - ყოფნა ან არარსებობა, დაავადების შედეგი - გაუმჯობესებით ან მის გარეშე ...).
  3. შედარებული ჯგუფები უნდა იყოს დამოუკიდებელი, ანუ შანსების კოეფიციენტი არ არის შესაფერისი შედარებისთვის ადრე-შემდეგ.
  4. შანსების თანაფარდობის ინდიკატორი გამოიყენება შემთხვევის კონტროლის კვლევებში (მაგალითად, პირველი ჯგუფი არის ჰიპერტენზიის მქონე პაციენტები, მეორე - შედარებით ჯანმრთელი ადამიანები). პერსპექტიული კვლევებისთვის, როდესაც ჯგუფები იქმნება რისკის ფაქტორის არსებობის ან არარსებობის საფუძველზე (მაგალითად, პირველი ჯგუფი არის მწეველები, მეორე ჯგუფი არის არამწეველები), ასევე შეიძლება გამოითვალოს ფარდობითი რისკი.

4. როგორ გამოვთვალოთ შანსების კოეფიციენტი?

შანსების კოეფიციენტი არის წილადის მნიშვნელობა, რომელშიც მრიცხველი შეიცავს გარკვეული მოვლენის შანსებს პირველი ჯგუფისთვის, ხოლო მნიშვნელი შეიცავს იმავე მოვლენის შანსებს მეორე ჯგუფისთვის.

Შანსიარის იმ საგნების რაოდენობის შეფარდება, რომლებსაც აქვთ გარკვეული მახასიათებელი (შედეგი ან ფაქტორი) იმ სუბიექტების რაოდენობასთან, რომლებსაც ეს მახასიათებელი არ გააჩნიათ.

მაგალითად, შეირჩა პანკრეასის ნეკროზის ოპერაციაზე ჩატარებული პაციენტების ჯგუფი, რომელთა რაოდენობამ 100 ადამიანი შეადგინა. 5 წლის შემდეგ 80 მათგანი ჯერ კიდევ ცოცხალი იყო. შესაბამისად, გადარჩენის შანსი იყო 80-დან 20-მდე, ანუ 4-მდე.

მოსახერხებელი გზაა შანსების თანაფარდობის გამოთვლა მონაცემების შეჯამებით 2x2 ცხრილში:

არის შედეგი (1) შედეგი არ არის (0) სულ
არსებობს რისკის ფაქტორი (1) A+B
არ არის რისკის ფაქტორი (0) C C+D
სულ A+C B+D A+B+C+D

ამ ცხრილისთვის, შანსების კოეფიციენტი გამოითვლება შემდეგი ფორმულის გამოყენებით:

ძალზე მნიშვნელოვანია გამოვლენილი კავშირის სტატისტიკური მნიშვნელობის შეფასება შედეგსა და რისკ-ფაქტორს შორის. ეს იმის გამო ხდება, რომ შანსების კოეფიციენტის დაბალი მნიშვნელობებითაც კი, ერთიანობასთან ახლოს, ურთიერთობა, მიუხედავად ამისა, შეიძლება მნიშვნელოვანი აღმოჩნდეს და გასათვალისწინებელია სტატისტიკურ დასკვნებში. პირიქით, დიდი OR მნიშვნელობებით, ინდიკატორი აღმოჩნდება სტატისტიკურად უმნიშვნელო და, შესაბამისად, იდენტიფიცირებული ურთიერთობა შეიძლება უგულებელყო.

შანსების კოეფიციენტის მნიშვნელოვნების შესაფასებლად გამოითვლება 95% ნდობის ინტერვალის საზღვრები (გამოიყენება აბრევიატურა 95% CI ან 95% CI ინგლისურიდან "ნდობის ინტერვალი"). 95% CI-ის ზედა ზღვრული მნიშვნელობის პოვნის ფორმულა:

95% CI ქვედა ლიმიტის მნიშვნელობის პოვნის ფორმულა:

5. როგორ განვსაზღვროთ შანსების კოეფიციენტის მნიშვნელობა?

  • თუ შანსების კოეფიციენტი 1-ზე მეტია, ეს ნიშნავს, რომ რისკის ფაქტორის პოვნის შანსები მეტია იმ ჯგუფში, რომელსაც აქვს შედეგი. იმათ. ფაქტორს პირდაპირი კავშირი აქვს შედეგის დადგომის ალბათობასთან.
  • 1-ზე ნაკლები შანსების კოეფიციენტი მიუთითებს იმაზე, რომ რისკის ფაქტორის გამოვლენის შანსი მეორე ჯგუფში მეტია. იმათ. ფაქტორს საპირისპირო კავშირი აქვს შედეგის დადგომის ალბათობასთან.
  • ერთის ტოლი შანსების თანაფარდობით, შედარებულ ჯგუფებში რისკის ფაქტორის გამოვლენის შანსი იგივეა. შესაბამისად, ფაქტორს არანაირი გავლენა არ აქვს შედეგის ალბათობაზე.

გარდა ამისა, თითოეულ შემთხვევაში, შანსების თანაფარდობის სტატისტიკური მნიშვნელოვნება აუცილებლად ფასდება 95% ნდობის ინტერვალის მნიშვნელობების საფუძველზე.

  • თუ ნდობის ინტერვალი არ შეიცავს 1-ს, ე.ი. საზღვრების ორივე მნიშვნელობა არის 1-ზე მაღალი ან დაბალი, გამოტანილია დასკვნა ფაქტორსა და შედეგს შორის გამოვლენილი კავშირის სტატისტიკური მნიშვნელობის შესახებ მნიშვნელოვნების დონეზე p.<0,05.
  • თუ ნდობის ინტერვალი მოიცავს 1-ს, ე.ი. მისი ზედა ზღვარი 1-ზე მეტია, ხოლო ქვედა ზღვარი 1-ზე ნაკლები, დაასკვნეს, რომ არ არსებობს ფაქტორსა და შედეგს შორის კავშირის სტატისტიკური მნიშვნელობა p>0.05 მნიშვნელოვნების დონეზე.
  • ნდობის ინტერვალის ზომა უკუპროპორციულია ფაქტორსა და შედეგს შორის ურთიერთობის მნიშვნელოვნების დონის, ე.ი. რაც უფრო მცირეა 95% CI, მით უფრო მნიშვნელოვანია იდენტიფიცირებული ურთიერთობა.

6. შანსების კოეფიციენტის გამოთვლის მაგალითი

წარმოვიდგინოთ ორი ჯგუფი: პირველი შედგებოდა 200 ქალისგან, რომლებსაც დაუდგინდათ ნაყოფის თანდაყოლილი მანკი (Exodus+). აქედან 50 ადამიანი ეწეოდა ორსულობის დროს (ფაქტორი+) (A), იყვნენ არამწეველები (ფაქტორ-) - 150 ადამიანი (ერთად).

მეორე ჯგუფში შედიოდა 100 ქალი ნაყოფის თანდაყოლილი მანკის ნიშნების გარეშე (შედეგი -), რომელთა შორის 10 ადამიანი ეწეოდა ორსულობის დროს (ფაქტორი+) (B), არ ეწეოდა (ფაქტორ-) - 90 კაცი (D).

1. მოდით შევქმნათ ოთხველიანი საგანგებო ცხრილი:

2. გამოთვალეთ შანსების კოეფიციენტის მნიშვნელობა:

ან = (A * D) / (B * C) = (50 * 90) / (150 * 10) = 3.

3. იპოვეთ 95% CI-ის საზღვრები. ზემოაღნიშნული ფორმულით გამოთვლილი ქვედა ლიმიტის მნიშვნელობა იყო 1.45, ხოლო ზედა ზღვარი იყო 6.21.

ამრიგად, კვლევამ აჩვენა, რომ ნაყოფის თანდაყოლილი მანკით დაავადებულ პაციენტებში მწეველ ქალთან შეხვედრის შანსი 3-ჯერ მეტია, ვიდრე ქალებში ნაყოფის თანდაყოლილი მანკის ნიშნების გარეშე. დაკვირვებული დამოკიდებულება სტატისტიკურად მნიშვნელოვანია, რადგან 95% CI არ შეიცავს 1-ს, მისი ქვედა და ზედა ზღვრების მნიშვნელობები 1-ზე მეტია.


შედარებითი რისკი

რისკი არის კონკრეტული შედეგის ალბათობა, როგორიცაა ავადმყოფობა ან ტრავმა. რისკმა შეიძლება მიიღოს მნიშვნელობები 0-დან (შედეგის დადგომის ალბათობა არ არსებობს) 1-მდე (არასახარბიელო შედეგი მოსალოდნელია ყველა შემთხვევაში). სამედიცინო სტატისტიკაში, როგორც წესი, შედეგის რისკის ცვლილებები შესწავლილია გარკვეული ფაქტორიდან გამომდინარე. პაციენტები პირობითად იყოფა 2 ჯგუფად, რომელთაგან ერთზე მოქმედებს ფაქტორი, მეორეზე არა.

ფარდობითი რისკი არის შედეგების სიხშირის თანაფარდობა სუბიექტებს შორის, რომლებზეც გავლენას ახდენდა შესწავლილი ფაქტორი და შედეგების სიხშირეს სუბიექტებს შორის, რომლებსაც ეს ფაქტორი არ ახდენდა გავლენას. სამეცნიერო ლიტერატურაში ხშირად გამოიყენება ინდიკატორის შემოკლებული სახელი - RR ან RR (ინგლისური "ნათესავი რისკიდან").

1. ფარდობითი რისკის ინდიკატორის განვითარების ისტორია

ფარდობითი რისკის გაანგარიშება ნასესხებია სამედიცინო სტატისტიკით ეკონომიკიდან. პროდუქტზე ან სერვისზე მოთხოვნაზე პოლიტიკური, ეკონომიკური და სოციალური ფაქტორების გავლენის სწორად შეფასებამ შეიძლება გამოიწვიოს წარმატება, ხოლო ამ ფაქტორების არასრულფასოვნებამ შეიძლება გამოიწვიოს ფინანსური უკმარისობა და საწარმოს გაკოტრება.

2. რისთვის გამოიყენება ფარდობითი რისკი?

ფარდობითი რისკი გამოიყენება შედეგის ალბათობის შესადარებლად რისკის ფაქტორის არსებობის მიხედვით. მაგალითად, ჰიპერტენზიის სიხშირეზე მოწევის გავლენის შეფასებისას, ორალური კონტრაცეპტივების გამოყენებაზე სარძევე ჯირკვლის კიბოს სიხშირის დამოკიდებულების შესწავლისას და ა.შ. ფარდობითი რისკი ყველაზე მნიშვნელოვანი მაჩვენებელია მკურნალობის გარკვეული მეთოდების დანიშვნაში ან კვლევების ჩატარებისას. შესაძლო გვერდითი მოვლენები.

3. ფარდობითი რისკის გამოყენების პირობები და შეზღუდვები

  1. ფაქტორებისა და შედეგის ინდიკატორები უნდა გაიზომოს ნომინალური სკალით (მაგალითად, პაციენტის სქესი - მამრობითი ან მდედრობითი, არტერიული ჰიპერტენზია - არსებობს თუ არა).
  2. ეს მეთოდი საშუალებას იძლევა გაანალიზდეს მხოლოდ ოთხი ველის ცხრილები, როდესაც ორივე ფაქტორი და შედეგი არის არაორდინარული ცვლადები, ანუ მათ აქვთ მხოლოდ ორი შესაძლო მნიშვნელობა (მაგალითად, ასაკი 50 წელზე უმცროსი ან უფროსი, არსებობა ან ანამნეზში გარკვეული დაავადების არარსებობა).
  3. ფარდობითი რისკი გამოიყენება პერსპექტიულ კვლევებში, როდესაც საკვლევი ჯგუფები იქმნება რისკის ფაქტორის არსებობის ან არარსებობის საფუძველზე. შემთხვევის კონტროლის კვლევებში, ფარდობითი რისკის ნაცვლად უნდა იქნას გამოყენებული შანსების კოეფიციენტები.

4. როგორ გამოვთვალოთ ფარდობითი რისკი?

ფარდობითი რისკის გამოსათვლელად საჭიროა:

5. როგორ განიმარტოს ფარდობითი რისკის ღირებულება?

ფარდობითი რისკის ინდიკატორი შედარებულია 1-თან, რათა დადგინდეს ფაქტორსა და შედეგს შორის ურთიერთობის ბუნება:

  • თუ RR უდრის 1-ს, შეგვიძლია დავასკვნათ, რომ შესწავლილი ფაქტორი გავლენას არ ახდენს შედეგის ალბათობაზე (ფაქტორსა და შედეგს შორის კავშირი არ არის).
  • 1-ზე მეტი მნიშვნელობებისთვის, დასკვნა ხდება, რომ ფაქტორი ზრდის შედეგების სიხშირეს (პირდაპირი ურთიერთობა).
  • 1-ზე ნაკლები მნიშვნელობებისთვის, ეს მიუთითებს შედეგის ალბათობის შემცირებაზე ფაქტორზე ზემოქმედებისას (უკუკავშირი).

ასევე აუცილებლად შეფასებულია 95% ნდობის ინტერვალის საზღვრების მნიშვნელობები. თუ ორივე მნიშვნელობა - ქვედა და ზედა ზღვარი - არის 1-ის ერთსა და იმავე მხარეს, ან, სხვა სიტყვებით რომ ვთქვათ, ნდობის ინტერვალი არ მოიცავს 1-ს, მაშინ გამოტანილია დასკვნა გამოვლენილი ურთიერთობის სტატისტიკური მნიშვნელობის შესახებ. ფაქტორი და შედეგი ცდომილების ალბათობით პ<0,05.

თუ 95% CI-ის ქვედა ზღვარი 1-ზე ნაკლებია, ხოლო ზედა ზღვარი მეტია, მაშინ გამოდის დასკვნა, რომ არ არსებობს ფაქტორის გავლენის სტატისტიკური მნიშვნელობა შედეგის სიხშირეზე, მიუხედავად მნიშვნელობისა. RR (p>0.05).

6. ფარდობითი რისკის ინდიკატორის გამოთვლის მაგალითი

1999 წელს ოკლაჰომაში ჩატარდა კვლევა მამაკაცებში კუჭის წყლულების სიხშირის შესახებ. გავლენის ფაქტორად აირჩიეს სწრაფი კვების რეგულარული მოხმარება. პირველ ჯგუფში იყო 500 მამაკაცი, რომლებიც მუდმივად ჭამდნენ ფასტფუდს, რომელთა შორის კუჭის წყლული 96 ადამიანს დაუდგინდა. მეორე ჯგუფში შედიოდა ჯანსაღი დიეტის 500 მომხრე, რომელთა შორის კუჭის წყლული 31 შემთხვევაში დაუდგინდა. მიღებული მონაცემების საფუძველზე შედგენილია შემდეგი საგანგებო ცხრილი:


პირსონის კორელაციის კრიტერიუმი

პირსონის კორელაციის ტესტი არის პარამეტრული სტატისტიკის მეთოდი, რომელიც საშუალებას გაძლევთ განსაზღვროთ ხაზოვანი კავშირის არსებობა ან არარსებობა ორ რაოდენობრივ ინდიკატორს შორის, ასევე შეაფასოთ მისი სიახლოვე და სტატისტიკური მნიშვნელობა. სხვა სიტყვებით რომ ვთქვათ, პირსონის კორელაციის ტესტი საშუალებას გაძლევთ განსაზღვროთ, იცვლება თუ არა ერთი ინდიკატორი (იზრდება ან მცირდება) მეორეში ცვლილებების საპასუხოდ? სტატისტიკურ გამოთვლებში და დასკვნებში, კორელაციის კოეფიციენტი ჩვეულებრივ აღინიშნება როგორც r xy ან R xy.

1. კორელაციის კრიტერიუმის განვითარების ისტორია

პირსონის კორელაციის ტესტი შეიმუშავა ბრიტანელ მეცნიერთა ჯგუფმა, რომელსაც ხელმძღვანელობდა კარლ პირსონი(1857-1936) მე-19 საუკუნის 90-იან წლებში ორი შემთხვევითი ცვლადის კოვარიანტობის ანალიზის გასამარტივებლად. კარლ პირსონის გარდა ადამიანები პირსონის კორელაციის კრიტერიუმზეც მუშაობდნენ ფრენსის ეჯვორთიდა რაფაელ უელდონი.

2. რისთვის გამოიყენება პირსონის კორელაციის ტესტი?

პირსონის კორელაციის ტესტი საშუალებას გაძლევთ განსაზღვროთ რაოდენობრივი მასშტაბით გაზომილი ორ ინდიკატორს შორის კორელაციის სიახლოვე (ან სიძლიერე). დამატებითი გამოთვლების გამოყენებით, თქვენ ასევე შეგიძლიათ განსაზღვროთ რამდენად სტატისტიკურად მნიშვნელოვანია გამოვლენილი ურთიერთობა.

მაგალითად, Pearson-ის კორელაციის კრიტერიუმის გამოყენებით, შეგიძლიათ უპასუხოთ კითხვას, არის თუ არა კავშირი სხეულის ტემპერატურასა და სისხლში ლეიკოციტების შემცველობას შორის მწვავე რესპირატორული ინფექციების დროს, პაციენტის სიმაღლესა და წონას შორის, ფტორის შემცველობას შორის. სასმელი წყალი და კბილის კარიესის სიხშირე მოსახლეობაში.

3. პირსონის ჩი-კვადრატის ტესტის გამოყენების პირობები და შეზღუდვები

  1. შესადარებელი ინდიკატორები უნდა გაიზომოს რაოდენობრივი მასშტაბით (მაგალითად, გულისცემა, სხეულის ტემპერატურა, სისხლის თეთრი უჯრედების რაოდენობა 1 მლ სისხლში, სისტოლური არტერიული წნევა).
  2. პირსონის კორელაციის კრიტერიუმის გამოყენებით, თქვენ შეგიძლიათ განსაზღვროთ მხოლოდ რაოდენობებს შორის წრფივი ურთიერთობის არსებობა და სიძლიერე. ურთიერთობის სხვა მახასიათებლები, მათ შორის მიმართულება (პირდაპირი ან საპირისპირო), ცვლილებების ხასიათი (სწორხაზოვანი ან მრუდი), ისევე როგორც ერთი ცვლადის მეორეზე დამოკიდებულების არსებობა, განისაზღვრება გამოყენებით. რეგრესიული ანალიზი.
  3. შედარებული რაოდენობების რაოდენობა უნდა იყოს ორის ტოლი. სამი ან მეტი პარამეტრის ურთიერთკავშირის გაანალიზების შემთხვევაში, თქვენ უნდა გამოიყენოთ მეთოდი ფაქტორული ანალიზი.
  4. პირსონის კორელაციის კრიტერიუმი პარამეტრულია და ამიტომ მისი გამოყენების პირობაა თითოეული შედარებული ცვლადის ნორმალური განაწილება. თუ საჭიროა იმ ინდიკატორების კორელაციური ანალიზის ჩატარება, რომელთა განაწილებაც განსხვავდება ნორმალურიდან, მათ შორის რიგობით გაზომილი სკალით, უნდა გამოიყენოთ სპირმენის წოდების კორელაციის კოეფიციენტი.
  5. მკაფიოდ უნდა გამოიყოს დამოკიდებულების და კორელაციის ცნებები. რაოდენობების დამოკიდებულება განსაზღვრავს მათ შორის კორელაციის არსებობას, მაგრამ არა პირიქით.

მაგალითად, ბავშვის სიმაღლე დამოკიდებულია მის ასაკზე, ანუ რაც უფრო დიდია ბავშვი, მით უფრო მაღალია. თუ ავიღებთ სხვადასხვა ასაკის ორ ბავშვს, მაშინ დიდი ალბათობით უფროსი ბავშვის ზრდა უფრო დიდი იქნება ვიდრე უმცროსის. ამ ფენომენს ეწოდება დამოკიდებულება, რაც გულისხმობს ინდიკატორებს შორის მიზეზ-შედეგობრივ კავშირს. რა თქმა უნდა, მათ შორის არის კორელაციაც, რაც იმას ნიშნავს, რომ ერთი ინდიკატორის ცვლილებას ახლავს სხვა ინდიკატორის ცვლილებაც.

სხვა სიტუაციაში, განიხილეთ კავშირი ბავშვის სიმაღლესა და გულისცემას (HR) შორის. როგორც ცნობილია, ორივე ეს მნიშვნელობა პირდაპირ დამოკიდებულია ასაკზე, ასე რომ, უმეტეს შემთხვევაში, უფრო მაღალი სიმაღლის (და, შესაბამისად, ხანდაზმული ასაკის) ბავშვებს ექნებათ გულისცემის დაბალი სიხშირე. ანუ კორელაცია შეინიშნება და შეიძლება საკმაოდ მჭიდრო იყოს. თუმცა, თუ ავიღებთ იმავე ასაკის, მაგრამ სხვადასხვა სიმაღლის ბავშვებს, მაშინ, დიდი ალბათობით, მათი გულისცემა უმნიშვნელოდ განსხვავდება და, შესაბამისად, შეგვიძლია დავასკვნათ, რომ გულისცემა სიმაღლისგან დამოუკიდებელია.

ზემოაღნიშნული მაგალითი გვიჩვენებს, თუ რამდენად მნიშვნელოვანია სტატისტიკაში ფუნდამენტური ინდიკატორების კავშირისა და დამოკიდებულების ცნებების გარჩევა სწორი დასკვნების გამოსატანად.

4. როგორ გამოვთვალოთ პირსონის კორელაციის კოეფიციენტი?

პირსონის კორელაციის კოეფიციენტი გამოითვლება შემდეგი ფორმულით:

5. როგორ განვსაზღვროთ პირსონის კორელაციის კოეფიციენტის მნიშვნელობა?

პირსონის კორელაციის კოეფიციენტის მნიშვნელობები ინტერპრეტირებულია მათი აბსოლუტური მნიშვნელობების საფუძველზე. კორელაციის კოეფიციენტის შესაძლო მნიშვნელობები მერყეობს 0-დან ±1-მდე. რაც უფრო დიდია r xy-ის აბსოლუტური მნიშვნელობა, მით მეტია სიახლოვე ორ სიდიდეს შორის. r xy = 0 მიუთითებს კომუნიკაციის სრულ ნაკლებობაზე. r xy = 1 - მიუთითებს აბსოლუტური (ფუნქციური) კავშირის არსებობაზე. თუ პირსონის კორელაციის კრიტერიუმის მნიშვნელობა აღმოჩნდება 1-ზე მეტი ან -1-ზე ნაკლები, დაშვებულია შეცდომა გამოთვლებში.

კორელაციის შებოჭილობის ან სიმტკიცის შესაფასებლად ჩვეულებრივ გამოიყენება ზოგადად მიღებული კრიტერიუმები, რომლის მიხედვითაც r xy-ის აბსოლუტური მნიშვნელობები< 0.3 свидетельствуют о სუსტიკავშირი, r xy მნიშვნელობები 0.3-დან 0.7-მდე - კავშირის შესახებ საშუალოდშებოჭილობა, r xy > 0.7 - o მნიშვნელობები ძლიერიკომუნიკაციები.

კორელაციის სიძლიერის უფრო ზუსტი შეფასება შეიძლება მიღებულ იქნას ჩადოკის ცხრილის გამოყენებით:

კორელაციის კოეფიციენტის r xy სტატისტიკური მნიშვნელოვნება ფასდება t-ტესტის გამოყენებით, რომელიც გამოითვლება შემდეგი ფორმულის გამოყენებით:

მიღებული t r მნიშვნელობა შედარებულია კრიტიკულ მნიშვნელობასთან გარკვეული მნიშვნელოვნების დონეზე და თავისუფლების ხარისხების რაოდენობა n-2. თუ t r აჭარბებს t კრიტს, მაშინ კეთდება დასკვნა გამოვლენილი კორელაციის სტატისტიკური მნიშვნელობის შესახებ.

6. პირსონის კორელაციის კოეფიციენტის გამოთვლის მაგალითი

კვლევის მიზანი იყო ორ რაოდენობრივ ინდიკატორს შორის კორელაციის სიახლოვის და სტატისტიკური მნიშვნელობის დადგენა, განსაზღვრა: სისხლში ტესტოსტერონის დონე (X) და კუნთოვანი მასის პროცენტი სხეულში (Y). საწყისი მონაცემები 5 სუბიექტისგან შემდგარი ნიმუშისთვის (n = 5) შეჯამებულია ცხრილში:


SPEARMAN-ის კრიტერიუმი

Spearman-ის რანგის კორელაციის კოეფიციენტი არის არაპარამეტრული მეთოდი, რომელიც გამოიყენება ფენომენებს შორის კავშირის სტატისტიკური შესწავლის მიზნით. ამ შემთხვევაში დგინდება შესწავლილი მახასიათებლების ორ რაოდენობრივ სერიას შორის პარალელურობის ფაქტიური ხარისხი და რაოდენობრივად გამოხატული კოეფიციენტის გამოყენებით მოცემულია დადგენილი კავშირის სიახლოვის შეფასება.

1. წოდების კორელაციის კოეფიციენტის განვითარების ისტორია

ეს კრიტერიუმი შემუშავდა და შემოთავაზებული იქნა კორელაციური ანალიზისთვის 1904 წელს ჩარლზ ედვარდ სპირმანი, ინგლისელი ფსიქოლოგი, ლონდონისა და ჩესტერფილდის უნივერსიტეტების პროფესორი.

2. რისთვის გამოიყენება სპირმენის კოეფიციენტი?

Spearman-ის რანგის კორელაციის კოეფიციენტი გამოიყენება შედარებული რაოდენობრივი მაჩვენებლების ორ სერიას შორის ურთიერთობის სიახლოვის დასადგენად და შესაფასებლად. თუ ინდიკატორების რიგები, დალაგებულია ზრდის ან შემცირების ხარისხით, უმეტეს შემთხვევაში ემთხვევა (ერთი ინდიკატორის უფრო დიდი მნიშვნელობა შეესაბამება სხვა ინდიკატორის უფრო დიდ მნიშვნელობას - მაგალითად, პაციენტის სიმაღლისა და მისი სხეულის წონის შედარებისას), დასკვნა. კეთდება ყოფნის შესახებ სწორიკორელაციური კავშირი. თუ ინდიკატორების რიგებს აქვს საპირისპირო მიმართულება (ერთი ინდიკატორის უფრო მაღალი მნიშვნელობა შეესაბამება მეორის ქვედა მნიშვნელობას - მაგალითად, ასაკისა და გულისცემის შედარებისას), მაშინ ისინი საუბრობენ საპირისპიროკავშირი ინდიკატორებს შორის.

    სპირმენის კორელაციის კოეფიციენტს აქვს შემდეგი თვისებები:
  1. კორელაციის კოეფიციენტმა შეიძლება მიიღოს მნიშვნელობები მინუს ერთიდან ერთამდე და rs=1-თან არის მკაცრად პირდაპირი ურთიერთობა, ხოლო rs= -1-თან არის მკაცრად უკუკავშირის ურთიერთობა.
  2. თუ კორელაციის კოეფიციენტი უარყოფითია, მაშინ არის უკუკავშირი, თუ დადებითია, მაშინ არის პირდაპირი კავშირი.
  3. თუ კორელაციის კოეფიციენტი ნულის ტოლია, მაშინ რაოდენობებს შორის კავშირი პრაქტიკულად არ არსებობს.
  4. რაც უფრო ახლოსაა კორელაციის კოეფიციენტის მოდული ერთიანობასთან, მით უფრო ძლიერია კავშირი გაზომილ სიდიდეებს შორის.

3. რა შემთხვევაში შეიძლება გამოვიყენოთ სპირმენის კოეფიციენტი?

იმის გამო, რომ კოეფიციენტი არის არაპარამეტრული ანალიზის მეთოდი, განაწილების ნორმალურობის ტესტირება საჭირო არ არის.

შესადარებელი ინდიკატორები შეიძლება გაიზომოს როგორც უწყვეტი მასშტაბით (მაგალითად, სისხლის წითელი უჯრედების რაოდენობა 1 μl სისხლში) და რიგითი მასშტაბით (მაგალითად, ექსპერტის შეფასების ქულები 1-დან 5-მდე).

Spearman-ის შეფასების ეფექტურობა და ხარისხი მცირდება, თუ სხვაობა რომელიმე გაზომილი რაოდენობის სხვადასხვა მნიშვნელობებს შორის საკმარისად დიდია. არ არის რეკომენდებული Spearman კოეფიციენტის გამოყენება, თუ არსებობს გაზომილი რაოდენობის მნიშვნელობების არათანაბარი განაწილება.

4. როგორ გამოვთვალოთ სპირმენის კოეფიციენტი?

Spearman-ის რანგის კორელაციის კოეფიციენტის გამოთვლა მოიცავს შემდეგ ნაბიჯებს:

5. როგორ განვმარტოთ სპირმენის კოეფიციენტის მნიშვნელობა?

რანგის კორელაციის კოეფიციენტის გამოყენებისას პირობითად ფასდება მახასიათებლებს შორის კავშირის სიახლოვე, სუსტი კავშირის ნიშნად 0,3-ზე ნაკლები კოეფიციენტის მნიშვნელობების გათვალისწინებით; 0.3-ზე მეტი, მაგრამ 0.7-ზე ნაკლები მნიშვნელობები კავშირის ზომიერი სიახლოვის ნიშანია, ხოლო 0.7 ან მეტი მნიშვნელობები კავშირის მაღალი სიახლოვის ნიშანია.

ის ასევე შეიძლება გამოყენებულ იქნას კავშირის სიმჭიდროვის შესაფასებლად. ჩადოკის სასწორი.

მიღებული კოეფიციენტის სტატისტიკური მნიშვნელოვნება ფასდება Student-ის t-ტესტის გამოყენებით. თუ გამოთვლილი t-ტესტის მნიშვნელობა ნაკლებია ცხრილის მნიშვნელობაზე მოცემული რაოდენობის თავისუფლებისთვის, დაკვირვებული კავშირი არ არის სტატისტიკურად მნიშვნელოვანი. თუ ის უფრო დიდია, მაშინ კორელაცია სტატისტიკურად მნიშვნელოვანია.


კოლმოგოროვი-სმირნოვის მეთოდი

კოლმოგოროვი-სმირნოვის ტესტი არის არაპარამეტრული სიკეთის შესატყვისი ტესტი, კლასიკური გაგებით ის გამიზნულია მარტივი ჰიპოთეზების შესამოწმებლად იმის შესახებ, ეკუთვნის თუ არა გაანალიზებული ნიმუში რომელიმე ცნობილ განაწილების კანონს. ამ კრიტერიუმის ყველაზე ცნობილი გამოყენებაა შესწავლილი პოპულაციების განაწილების ნორმალურობის შემოწმება.

1. კოლმოგოროვ-სმირნოვის კრიტერიუმის განვითარების ისტორია

კოლმოგოროვ-სმირნოვის კრიტერიუმი საბჭოთა მათემატიკოსებმა შექმნეს ანდრეი ნიკოლაევიჩ კოლმოგოროვიდა ნიკოლაი ვასილიევიჩ სმირნოვი.
კოლმოგოროვი ა.ნ. (1903-1987) - სოციალისტური შრომის გმირი, მოსკოვის სახელმწიფო უნივერსიტეტის პროფესორი, სსრკ მეცნიერებათა აკადემიის აკადემიკოსი - XX საუკუნის უდიდესი მათემატიკოსი, თანამედროვე ალბათობის თეორიის ერთ-ერთი ფუძემდებელი.
სმირნოვი ნ.ვ. (1900-1966) - სსრკ მეცნიერებათა აკადემიის წევრ-კორესპონდენტი, მათემატიკური სტატისტიკის არაპარამეტრული მეთოდებისა და რიგითი სტატისტიკის ზღვრული განაწილების თეორიის ერთ-ერთი შემქმნელი.

მოგვიანებით, ამერიკელი სტატისტიკოსის, ჯორჯ ვაშინგტონის უნივერსიტეტის პროფესორის მიერ, კოლმოგოროვი-სმირნოვის სიკეთე-მორგების ტესტი შეიცვალა, რათა გამოეყენებინა პოპულაციების განაწილების ნორმალურობის შესამოწმებლად. ჰუბერტ ლილიფორსი(Hubert Whitman Lilliefors, 1928-2008). პროფესორი ლილიფორსი იყო სტატისტიკურ გამოთვლებში კომპიუტერული ტექნოლოგიების გამოყენების ერთ-ერთი პიონერი.

ჰუბერტ ლილიფორსი

2. რატომ გამოიყენება კოლმოგოროვ-სმირნოვის კრიტერიუმი?

ეს კრიტერიუმი საშუალებას გვაძლევს შევაფასოთ განსხვავებების მნიშვნელობა ორი ნიმუშის განაწილებას შორის, მათ შორის, მისი გამოყენების შესაძლებლობის შესაფასებლად შესასწავლი ნიმუშის განაწილების ნორმალური განაწილების კანონთან შესაბამისობის შესაფასებლად.

3. რა შემთხვევაში შეიძლება გამოვიყენოთ კოლმოგოროვ-სმირნოვის კრიტერიუმი?

კოლმოგოროვი-სმირნოვის ტესტი შექმნილია რაოდენობრივი მონაცემების ნაკრების ნორმალური განაწილების შესამოწმებლად.

მიღებული მონაცემების მეტი სანდოობისთვის, განსახილველი ნიმუშების მოცულობა უნდა იყოს საკმარისად დიდი: n ≥ 50. როდესაც სავარაუდო პოპულაციის ზომაა 25-დან 50 ელემენტამდე, მიზანშეწონილია გამოიყენოთ ბოლშევის კორექტირება.

4. როგორ გამოვთვალოთ კოლმოგოროვ-სმირნოვის კრიტერიუმი?

კოლმოგოროვი-სმირნოვის კრიტერიუმი გამოითვლება სპეციალური სტატისტიკური პროგრამების გამოყენებით. იგი ეფუძნება ფორმის სტატისტიკას:

სად სუპ ს- კომპლექტის S უმაღლესი, Fn- შესწავლილი მოსახლეობის განაწილების ფუნქცია, F(x)- ნორმალური განაწილების ფუნქცია

სავარაუდო ალბათობის მნიშვნელობები ეფუძნება დაშვებას, რომ ნორმალური განაწილების საშუალო და სტანდარტული გადახრა ცნობილია აპრიორი და არ არის შეფასებული მონაცემებიდან.

თუმცა, პრაქტიკაში, პარამეტრები ჩვეულებრივ გამოითვლება უშუალოდ მონაცემებიდან. ამ შემთხვევაში, ნორმალურობის ტესტი მოიცავს კომპოზიტურ ჰიპოთეზას („რამდენად არის შესაძლებელი ამ ან უფრო დიდი მნიშვნელობის D სტატისტიკის მიღება, მონაცემებიდან გამოთვლილი საშუალო და სტანდარტული გადახრის მიხედვით“) და მოცემულია Lilliefors-ის ალბათობა (Lilliefors, 1967). ).

5. როგორ განვმარტოთ კოლმოგოროვ-სმირნოვის ტესტის მნიშვნელობა?

თუ დ კოლმოგოროვი-სმირნოვის სტატისტიკა მნიშვნელოვანია (გვ<0,05), то гипотеза о том, что соответствующее распределение нормально, должна быть отвергнута.


ამ თავის დაუფლების შედეგად სტუდენტმა უნდა: ვიცი

  • ვარიაციული ინდიკატორები და მათი ურთიერთობა;
  • მახასიათებლების განაწილების ძირითადი კანონები;
  • თანხმობის კრიტერიუმების არსი; შეძლებს
  • ვარიაციის ინდექსების და სიკეთის კრიტერიუმების გამოთვლა;
  • განაწილების მახასიათებლების განსაზღვრა;
  • სტატისტიკური განაწილების სერიების ძირითადი რიცხვითი მახასიათებლების შეფასება;

საკუთარი

  • განაწილების სერიების სტატისტიკური ანალიზის მეთოდები;
  • დისპერსიული ანალიზის საფუძვლები;
  • განაწილების ძირითად კანონებთან შესაბამისობის სტატისტიკური განაწილების სერიების შემოწმების ტექნიკა.

ვარიაციის ინდიკატორები

სხვადასხვა სტატისტიკური პოპულაციების მახასიათებლების სტატისტიკური შესწავლისას დიდი ინტერესია პოპულაციის ცალკეული სტატისტიკური ერთეულების მახასიათებლების ცვალებადობის, ასევე ამ მახასიათებლის მიხედვით ერთეულების განაწილების ხასიათის შესწავლა. Ვარიაცია -ეს არის განსხვავებები მახასიათებლის ინდივიდუალურ მნიშვნელობებში შესწავლილი მოსახლეობის ერთეულებს შორის. ვარიაციის შესწავლას დიდი პრაქტიკული მნიშვნელობა აქვს. ცვალებადობის ხარისხით შეიძლება ვიმსჯელოთ მახასიათებლის ცვალებადობის საზღვრებზე, მოცემული მახასიათებლის პოპულაციის ჰომოგენურობაზე, საშუალოს ტიპურობაზე და ფაქტორების ურთიერთკავშირზე, რომლებიც განსაზღვრავენ ცვალებადობას. ვარიაციის ინდიკატორები გამოიყენება სტატისტიკური პოპულაციების დასახასიათებლად და ორგანიზებისთვის.

სტატისტიკური დაკვირვების მასალების შეჯამებისა და დაჯგუფების შედეგები, წარმოდგენილი სტატისტიკური განაწილების სერიების სახით, წარმოადგენს შესასწავლი მოსახლეობის ერთეულების დალაგებულ განაწილებას ჯგუფებად დაჯგუფების (ვარიაციის) კრიტერიუმების მიხედვით. თუ დაჯგუფების საფუძვლად ხარისხობრივი მახასიათებელია მიღებული, მაშინ ასეთი განაწილების სერია ეწოდება ატრიბუტული(განაწილება პროფესიის, სქესის, ფერის და ა.შ.). თუ განაწილების სერია აგებულია რაოდენობრივ საფუძველზე, მაშინ ასეთ სერიას უწოდებენ ვარიაციული(განაწილება სიმაღლის, წონის, ხელფასის და ა.შ.). ვარიაციის სერიის აგება ნიშნავს მოსახლეობის ერთეულების რაოდენობრივი განაწილების ორგანიზებას დამახასიათებელი მნიშვნელობებით, ამ მნიშვნელობებით (სიხშირე) მოსახლეობის ერთეულების რაოდენობის დათვლა და შედეგების დალაგება ცხრილში.

ვარიანტის სიხშირის ნაცვლად, შესაძლებელია გამოვიყენოთ მისი თანაფარდობა დაკვირვების მთლიან მოცულობასთან, რომელსაც სიხშირე (ფარდობითი სიხშირე) ეწოდება.

არსებობს ვარიაციის სერიების ორი ტიპი: დისკრეტული და ინტერვალი. დისკრეტული სერია- ეს არის ვარიაციების სერია, რომლის აგება ემყარება მახასიათებლებს უწყვეტი ცვლილებით (დისკრეტული მახასიათებლები). ეს უკანასკნელი მოიცავს საწარმოში დასაქმებულთა რაოდენობას, სატარიფო კატეგორიას, ოჯახში შვილების რაოდენობას და ა.შ. დისკრეტული ვარიაციის სერია წარმოადგენს ცხრილს, რომელიც შედგება ორი სვეტისგან. პირველი სვეტი მიუთითებს ატრიბუტის სპეციფიკურ მნიშვნელობაზე, ხოლო მეორე სვეტი მიუთითებს პოპულაციაში ატრიბუტის კონკრეტული მნიშვნელობის მქონე ერთეულების რაოდენობაზე. თუ მახასიათებელს აქვს მუდმივი ცვლილება (შემოსავლის ოდენობა, მომსახურების ხანგრძლივობა, საწარმოს ძირითადი საშუალებების ღირებულება და ა. ინტერვალის ვარიაციის სერია.ინტერვალის ვარიაციის სერიის აგებისას, ცხრილს ასევე აქვს ორი სვეტი. პირველი მიუთითებს ატრიბუტის მნიშვნელობას ინტერვალში "-დან - მდე" (ვარიანტები), მეორე მიუთითებს ინტერვალში შემავალი ერთეულების რაოდენობაზე (სიხშირე). სიხშირე (განმეორების სიხშირე) - ატრიბუტის მნიშვნელობების კონკრეტული ვარიანტის გამეორებების რაოდენობა. ინტერვალები შეიძლება იყოს დახურული ან ღია. დახურული ინტერვალები შეზღუდულია ორივე მხრიდან, ე.ი. აქვს როგორც ქვედა ("დან"), ასევე ზედა ("დან") საზღვარი. ღია ინტერვალებს აქვს ერთი საზღვარი: ზედა ან ქვედა. თუ ოფციები განლაგებულია აღმავალი ან კლებადი თანმიმდევრობით, მაშინ რიგები გამოიძახება რეიტინგული.

ვარიაციის სერიებისთვის, არსებობს ორი ტიპის სიხშირეზე რეაგირების ვარიანტი: დაგროვილი სიხშირე და დაგროვილი სიხშირე. დაგროვილი სიხშირე აჩვენებს რამდენ დაკვირვებას აიღო მახასიათებლის მნიშვნელობა მოცემულზე ნაკლები მნიშვნელობები. დაგროვილი სიხშირე განისაზღვრება მოცემული ჯგუფის მახასიათებლის სიხშირის მნიშვნელობების შეჯამებით წინა ჯგუფის ყველა სიხშირით. დაგროვილი სიხშირე ახასიათებს დაკვირვების ერთეულების პროპორციას, რომელთა ატრიბუტების მნიშვნელობები არ აღემატება მოცემული ჯგუფის ზედა ზღვარს. ამრიგად, დაგროვილი სიხშირე აჩვენებს ვარიანტების პროპორციას მთლიანობაში, რომელთა ღირებულება არ აღემატება მოცემულს. სიხშირე, სიხშირე, აბსოლუტური და ფარდობითი სიმკვრივეები, დაგროვილი სიხშირე და სიხშირე არის ვარიანტის სიდიდის მახასიათებლები.

მოსახლეობის სტატისტიკური ერთეულების მახასიათებლების ცვალებადობა, ისევე როგორც განაწილების ბუნება, შესწავლილია ვარიაციის სერიის ინდიკატორებისა და მახასიათებლების გამოყენებით, რომლებიც მოიცავს სერიის საშუალო დონეს, საშუალო ხაზოვან გადახრას, სტანდარტულ გადახრას, დისპერსიას. , რხევის კოეფიციენტები, ვარიაცია, ასიმეტრია, ქურტოზი და ა.შ.

სადისტრიბუციო ცენტრის დასახასიათებლად გამოიყენება საშუალო მნიშვნელობები. საშუალო არის განზოგადებული სტატისტიკური მახასიათებელი, რომელშიც რაოდენობრივია მახასიათებლის ტიპიური დონე, რომელსაც ფლობენ შესასწავლი პოპულაციის წევრები. თუმცა, შეიძლება იყოს არითმეტიკული საშუალებების დამთხვევის შემთხვევები სხვადასხვა განაწილების შაბლონებთან, ამიტომ, როგორც ვარიაციული სერიების სტატისტიკური მახასიათებლები, გამოითვლება ე.წ. ნაწილები (კვარტილები, დეცილები, პროცენტები და ა.შ.).

მოდა -ეს არის მახასიათებლის მნიშვნელობა, რომელიც უფრო ხშირად გვხვდება განაწილების სერიაში, ვიდრე მისი სხვა მნიშვნელობები. დისკრეტული სერიებისთვის, ეს არის ყველაზე მაღალი სიხშირის ვარიანტი. ინტერვალის ვარიაციის სერიებში, რეჟიმის დასადგენად, ჯერ უნდა განისაზღვროს ის ინტერვალი, რომელშიც ის მდებარეობს, ე.წ. ვარიაციის სერიაში თანაბარი ინტერვალებით, მოდალური ინტერვალი განისაზღვრება უმაღლესი სიხშირით, სერიებში არათანაბარი ინტერვალებით - მაგრამ უმაღლესი განაწილების სიმკვრივით. შემდეგ ფორმულა გამოიყენება რიგებში რეჟიმის დასადგენად თანაბარი ინტერვალებით

სადაც Mo არის მოდის ღირებულება; xMo - მოდალური ინტერვალის ქვედა ზღვარი; თ-მოდალური ინტერვალის სიგანე; / Mo - მოდალური ინტერვალის სიხშირე; / Mo j არის პრემოდალური ინტერვალის სიხშირე; / Mo+1 არის პოსტმოდალური ინტერვალის სიხშირე და ამ გამოთვლის ფორმულაში არათანაბარი ინტერვალების მქონე სერიებისთვის, სიხშირეების ნაცვლად / Mo, / Mo, / Mo გამოყენებული უნდა იყოს განაწილების სიმკვრივეები. გონება 0 _| , გონება 0> UMO+"

თუ არსებობს ერთი რეჟიმი, მაშინ შემთხვევითი ცვლადის ალბათობის განაწილებას ეწოდება უნიმოდალური; თუ არსებობს ერთზე მეტი რეჟიმი, მას ეწოდება მულტიმოდალური (პოლიმოდალური, მულტიმოდალური), ორი რეჟიმის შემთხვევაში - ბიმოდალური. როგორც წესი, მულტიმოდალობა მიუთითებს იმაზე, რომ შესასწავლი განაწილება არ ემორჩილება ნორმალურ განაწილების კანონს. ერთგვაროვან პოპულაციებს, როგორც წესი, ახასიათებთ ერთწახნაგოვანი განაწილებები. Multivertex ასევე მიუთითებს შესწავლილი პოპულაციის ჰეტეროგენულობაზე. ორი ან მეტი წვერის გამოჩენა საჭიროებს მონაცემთა გადაჯგუფებას უფრო ჰომოგენური ჯგუფების გამოსავლენად.

ინტერვალის ვარიაციის სერიაში, რეჟიმი შეიძლება განისაზღვროს გრაფიკულად ჰისტოგრამის გამოყენებით. ამისათვის დახაზეთ ორი გადამკვეთი ხაზი ჰისტოგრამის უმაღლესი სვეტის ზედა წერტილებიდან ორი მიმდებარე სვეტის ზედა წერტილებამდე. შემდეგ, მათი გადაკვეთის ადგილიდან, პერპენდიკულარი იშლება აბსცისის ღერძზე. პერპენდიკულარულის შესაბამისი x ღერძზე მახასიათებლის მნიშვნელობა არის რეჟიმი. ხშირ შემთხვევაში, პოპულაციის განზოგადებულ ინდიკატორად დახასიათებისას უპირატესობა ენიჭება რეჟიმს და არა საშუალო არითმეტიკულს.

მედიანა -ეს არის ატრიბუტის ცენტრალური მნიშვნელობა; მას ფლობს განაწილების რანჟირებული სერიის ცენტრალური წევრი. დისკრეტულ სერიებში, მედიანის მნიშვნელობის საპოვნელად, ჯერ დგინდება მისი სერიული ნომერი. ამისთვის, თუ ერთეულების რაოდენობა კენტია, ერთი ემატება ყველა სიხშირის ჯამს და რიცხვი იყოფა ორზე. თუ ზედიზედ არის ლუწი რაოდენობის ერთეული, იქნება ორი მედიანა ერთეული, ასე რომ, ამ შემთხვევაში მედიანა განისაზღვრება, როგორც ორი მედიანური ერთეულის მნიშვნელობების საშუალო. ამრიგად, დისკრეტული ვარიაციის სერიების მედიანა არის მნიშვნელობა, რომელიც ყოფს სერიას ორ ნაწილად, რომლებიც შეიცავს იგივე რაოდენობის ვარიანტებს.

ინტერვალის სერიებში, მედიანის სერიული ნომრის დადგენის შემდეგ, მედიალური ინტერვალი იპოვება დაგროვილი სიხშირეების (სიხშირეების) გამოყენებით, შემდეგ კი მედიანის გამოთვლის ფორმულის გამოყენებით, განისაზღვრება თავად მედიანის მნიშვნელობა:

სადაც მე არის მედიანური მნიშვნელობა; x მე -მედიანური ინტერვალის ქვედა ზღვარი; თ-მედიანური ინტერვალის სიგანე; - განაწილების სერიის სიხშირეების ჯამი; /D - პრემედიანი ინტერვალის დაგროვილი სიხშირე; / მე - მედიანური ინტერვალის სიხშირე.

მედიანა შეგიძლიათ იხილოთ გრაფიკულად კუმულაციის გამოყენებით. ამისათვის, კუმულაციის დაგროვილი სიხშირეების (სიხშირეების) შკალაზე, მედიანის რიგითი რიცხვის შესაბამისი წერტილიდან, აბსცისის ღერძის პარალელურად იხაზება სწორი ხაზი, სანამ არ გადაიკვეთება კუმულაციასთან. შემდეგი, მითითებული ხაზის კუმულატთან გადაკვეთის ადგილიდან, პერპენდიკულარი იშლება აბსცისის ღერძზე. ატრიბუტის მნიშვნელობა x ღერძზე, რომელიც შეესაბამება შედგენილ ორდინატს (პერპენდიკულარულს) არის მედიანა.

მედიანა ხასიათდება შემდეგი თვისებებით.

  • 1. ეს არ არის დამოკიდებული იმ ატრიბუტების მნიშვნელობებზე, რომლებიც მდებარეობს მის ორივე მხარეს.
  • 2. მას აქვს მინიმალისტური თვისება, რაც ნიშნავს, რომ ატრიბუტის მნიშვნელობების აბსოლუტური გადახრების ჯამი მედიანადან წარმოადგენს მინიმალურ მნიშვნელობას ატრიბუტის მნიშვნელობების სხვა მნიშვნელობიდან გადახრასთან შედარებით.
  • 3. ცნობილ მედიანასთან ორი განაწილების შერწყმისას შეუძლებელია ახალი განაწილების მედიანის მნიშვნელობის წინასწარ პროგნოზირება.

მედიანის ეს თვისებები ფართოდ გამოიყენება საჯარო მომსახურების პუნქტების ადგილმდებარეობის დიზაინის დროს - სკოლები, კლინიკები, ბენზინგასამართი სადგურები, წყლის ტუმბოები და ა.შ. მაგალითად, თუ იგეგმება კლინიკის აშენება ქალაქის გარკვეულ ბლოკში, მაშინ უფრო მიზანშეწონილი იქნება მისი განთავსება ბლოკის ისეთ წერტილში, რომელიც განახევრებს არა ბლოკის სიგრძეს, არამედ მაცხოვრებელთა რაოდენობას.

რეჟიმის, მედიანისა და საშუალო არითმეტიკული თანაფარდობა მიუთითებს აგრეგატში მახასიათებლის განაწილების ბუნებაზე და საშუალებას გვაძლევს შევაფასოთ განაწილების სიმეტრია. თუ x მე მაშინ არის სერიის მარჯვენა მხარის ასიმეტრია. ნორმალური განაწილებით X -მე - მო.

კ. პირსონმა, სხვადასხვა ტიპის მრუდების გასწორების საფუძველზე, დაადგინა, რომ ზომიერად ასიმეტრიული განაწილებისთვის მართებულია შემდეგი მიახლოებითი მიმართებები არითმეტიკულ საშუალოს, მედიანასა და მოდს შორის:

სადაც მე არის მედიანური მნიშვნელობა; მო - მოდის მნიშვნელობა; x არითმი - საშუალო არითმეტიკული მნიშვნელობა.

თუ საჭიროა ვარიაციის სერიის სტრუქტურის უფრო დეტალურად შესწავლა, მაშინ გამოთვალეთ დამახასიათებელი მნიშვნელობები მედიანის მსგავსი. ასეთი დამახასიათებელი მნიშვნელობები ყოფს ყველა განაწილების ერთეულს თანაბარ რიცხვებად; მათ უწოდებენ კვანტილებს ან გრადიენტებს. კვანტილები იყოფა კვანტილებად, დეცილებად, პროცენტულებად და ა.შ.

მეოთხედები მოსახლეობას ყოფს ოთხ თანაბარ ნაწილად. პირველი მეოთხედი გამოითვლება მედიანას მსგავსად, პირველი კვარტლის გამოთვლის ფორმულის გამოყენებით, წინასწარ განსაზღვრული პირველი კვარტალური ინტერვალით:

სადაც Qi არის პირველი მეოთხედის მნიშვნელობა; xQ ^ -პირველი მეოთხედის დიაპაზონის ქვედა ზღვარი; - პირველი მეოთხედის ინტერვალის სიგანე; /, - ინტერვალის სერიის სიხშირეები;

კუმულაციური სიხშირე პირველი მეოთხედის ინტერვალის წინა ინტერვალში; Jq ( - პირველი მეოთხედის ინტერვალის სიხშირე.

პირველი მეოთხედი აჩვენებს, რომ მოსახლეობის ერთეულების 25% ნაკლებია მის ღირებულებაზე, ხოლო 75% მეტია. მეორე მეოთხედი უდრის მედიანას, ე.ი. Q 2 =მე.

ანალოგიით, მესამე კვარტალი გამოითვლება, პირველად იპოვა მესამე კვარტალური ინტერვალი:

სად არის მესამე მეოთხედის დიაპაზონის ქვედა ზღვარი; - მესამე მეოთხედის ინტერვალის სიგანე; /, - ინტერვალის სერიის სიხშირეები; /X" -დაგროვილი სიხშირე წინა ინტერვალში

მესამე მეოთხედი ინტერვალი; Jq არის მესამე მეოთხედის ინტერვალის სიხშირე.

მესამე მეოთხედი აჩვენებს, რომ მოსახლეობის ერთეულების 75% ნაკლებია მის ღირებულებაზე, ხოლო 25% მეტია.

განსხვავება მესამე და პირველ კვარტალებს შორის არის ინტერკვარტილური დიაპაზონი:

სადაც Aq არის ინტერკვარტილური დიაპაზონის მნიშვნელობა; Q 3 -მესამე მეოთხედი მნიშვნელობა; Q, არის პირველი მეოთხედის მნიშვნელობა.

დეცილები მოსახლეობას ყოფენ 10 თანაბარ ნაწილად. დეცილი არის მახასიათებლის მნიშვნელობა განაწილების სერიაში, რომელიც შეესაბამება მოსახლეობის ზომის მეათედს. კვარტილების ანალოგიით, პირველი დეცილი აჩვენებს, რომ მოსახლეობის ერთეულების 10% მის ღირებულებაზე ნაკლებია, ხოლო 90% მეტია, ხოლო მეცხრე დეცილი ცხადყოფს, რომ მოსახლეობის ერთეულების 90% მის ღირებულებაზე ნაკლებია, ხოლო 10% არის. უფრო დიდი. მეცხრე და პირველი დეცილების შეფარდება, ე.ი. დეცილური კოეფიციენტი ფართოდ გამოიყენება შემოსავლების დიფერენციაციის შესწავლისას 10% ყველაზე შეძლებული და 10% ყველაზე ნაკლებად შეძლებული მოსახლეობის შემოსავლის დონის თანაფარდობის გასაზომად. პროცენტული მაჩვენებელი ყოფს რეიტინგულ მოსახლეობას 100 თანაბარ ნაწილად. პროცენტების გამოთვლა, მნიშვნელობა და გამოყენება დეცილების მსგავსია.

კვარტილები, დეცილები და სხვა სტრუქტურული მახასიათებლები შეიძლება განისაზღვროს გრაფიკულად მედიანასთან ანალოგიით კუმულატების გამოყენებით.

ვარიაციის ზომის გასაზომად გამოიყენება შემდეგი ინდიკატორები: ვარიაციის დიაპაზონი, საშუალო წრფივი გადახრა, სტანდარტული გადახრა, დისპერსია. ვარიაციის დიაპაზონის სიდიდე მთლიანად დამოკიდებულია სერიის უკიდურესი წევრების განაწილების შემთხვევითობაზე. ეს მაჩვენებელი საინტერესოა იმ შემთხვევებში, როდესაც მნიშვნელოვანია იცოდეთ რა არის მახასიათებლის მნიშვნელობების რყევების ამპლიტუდა:

სად R-ვარიაციის დიაპაზონის მნიშვნელობა; x max - ატრიბუტის მაქსიმალური მნიშვნელობა; x tt -ატრიბუტის მინიმალური მნიშვნელობა.

ვარიაციის დიაპაზონის გაანგარიშებისას სერიების წევრების დიდი უმრავლესობის მნიშვნელობა არ არის გათვალისწინებული, ხოლო ვარიაცია ასოცირდება სერიის წევრის თითოეულ მნიშვნელობასთან. ინდიკატორები, რომლებიც მიიღება საშუალო მნიშვნელობების მახასიათებლების გადახრებიდან მათი საშუალო მნიშვნელობიდან, არ აქვთ ეს ნაკლი: საშუალო წრფივი გადახრა და სტანდარტული გადახრა. პირდაპირი კავშირია ინდივიდუალურ გადახრებს საშუალოდან და კონკრეტული მახასიათებლის ცვალებადობას შორის. რაც უფრო ძლიერია რყევა, მით მეტია გადახრების აბსოლუტური ზომა საშუალოდან.

საშუალო წრფივი გადახრა არის ცალკეული ვარიანტების გადახრების აბსოლუტური მნიშვნელობების საშუალო არითმეტიკული საშუალო მნიშვნელობიდან.

საშუალო წრფივი გადახრა დაუჯგუფებელი მონაცემებისთვის

სადაც /pr არის საშუალო წრფივი გადახრის მნიშვნელობა; x, - არის ატრიბუტის მნიშვნელობა; X - P -ერთეულების რაოდენობა მოსახლეობაში.

დაჯგუფებული სერიის საშუალო წრფივი გადახრა

სადაც / vz - საშუალო წრფივი გადახრის მნიშვნელობა; x არის ატრიბუტის მნიშვნელობა; X -მახასიათებლის საშუალო მნიშვნელობა შესწავლილი პოპულაციისთვის; / - ცალკეულ ჯგუფში მოსახლეობის ერთეულების რაოდენობა.

ამ შემთხვევაში გადახრების ნიშნები იგნორირებულია, წინააღმდეგ შემთხვევაში ყველა გადახრის ჯამი ნულის ტოლი იქნება. საშუალო წრფივი გადახრა, გაანალიზებული მონაცემების დაჯგუფებიდან გამომდინარე, გამოითვლება სხვადასხვა ფორმულების გამოყენებით: დაჯგუფებული და დაუჯგუფებელი მონაცემებისთვის. მისი კონვენციიდან გამომდინარე, საშუალო წრფივი გადახრა, ცვალებადობის სხვა მაჩვენებლებისგან დამოუკიდებლად, გამოიყენება პრაქტიკაში შედარებით იშვიათად (კერძოდ, სახელშეკრულებო ვალდებულებების შესრულების დასახასიათებლად მიწოდების ერთგვაროვნებასთან დაკავშირებით; საგარეო სავაჭრო ბრუნვის ანალიზში, შემადგენლობა თანამშრომლები, წარმოების რიტმი, პროდუქციის ხარისხი, წარმოების ტექნოლოგიური მახასიათებლების გათვალისწინებით და ა.შ.).

სტანდარტული გადახრა ახასიათებს, თუ რამდენად გადახრის საშუალოდ შესწავლილი მახასიათებლის ინდივიდუალური მნიშვნელობები მოსახლეობის საშუალო მნიშვნელობიდან და გამოიხატება შესასწავლი მახასიათებლის გაზომვის ერთეულებში. სტანდარტული გადახრა, როგორც ცვალებადობის ერთ-ერთი მთავარი საზომი, ფართოდ გამოიყენება ერთგვაროვან პოპულაციაში მახასიათებლის ცვალებადობის საზღვრების შესაფასებლად, ნორმალური განაწილების მრუდის ორდინატთა მნიშვნელობების განსაზღვრისას, აგრეთვე გამოთვლებში, რომლებიც დაკავშირებულია ნიმუშზე დაკვირვების ორგანიზება და ნიმუშის მახასიათებლების სიზუსტის დადგენა. დაუჯგუფებელი მონაცემების სტანდარტული გადახრა გამოითვლება შემდეგი ალგორითმის გამოყენებით: ყოველი გადახრა საშუალოდან არის კვადრატი, ყველა კვადრატი ჯამდება, რის შემდეგაც კვადრატების ჯამი იყოფა სერიის წევრთა რაოდენობაზე და კვადრატული ფესვი ამოღებულია კოეფიციენტი:

სადაც Iip არის სტანდარტული გადახრის მნიშვნელობა; Xj-ატრიბუტის მნიშვნელობა; X- მახასიათებლის საშუალო მნიშვნელობა შესწავლილი პოპულაციისთვის; P -ერთეულების რაოდენობა მოსახლეობაში.

დაჯგუფებული გაანალიზებული მონაცემებისთვის, მონაცემების სტანდარტული გადახრა გამოითვლება შეწონილი ფორმულის გამოყენებით

სად - სტანდარტული გადახრის მნიშვნელობა; Xj-ატრიბუტის მნიშვნელობა; X -მახასიათებლის საშუალო მნიშვნელობა შესწავლილი პოპულაციისთვის; f x -მოსახლეობის ერთეულების რაოდენობა კონკრეტულ ჯგუფში.

ფესვის ქვეშ გამონათქვამს ორივე შემთხვევაში დისპერსიას უწოდებენ. ამრიგად, დისპერსია გამოითვლება, როგორც ატრიბუტების მნიშვნელობების გადახრების საშუალო კვადრატი მათი საშუალო მნიშვნელობიდან. შეუწონავი (მარტივი) ატრიბუტის მნიშვნელობებისთვის, დისპერსიას ადგენენ შემდეგნაირად:

შეწონილი დამახასიათებელი მნიშვნელობებისთვის

ასევე არსებობს დისპერსიის გამოთვლის სპეციალური გამარტივებული მეთოდი: ზოგადად

დაუწონავი (მარტივი) დამახასიათებელი მნიშვნელობებისთვის შეწონილი დამახასიათებელი მნიშვნელობებისთვის
ნულოვანი მეთოდის გამოყენებით

სადაც a 2 არის დისპერსიის მნიშვნელობა; x, - არის ატრიბუტის მნიშვნელობა; X -მახასიათებლის საშუალო მნიშვნელობა, თ-ჯგუფის ინტერვალის მნიშვნელობა, t 1 -წონა (A =

დისპერსიას აქვს საკუთარი გამოხატულება სტატისტიკაში და ვარიაციის ერთ-ერთი ყველაზე მნიშვნელოვანი მაჩვენებელია. იგი იზომება შესწავლილი მახასიათებლის საზომი ერთეულების კვადრატის შესაბამისი ერთეულებით.

დისპერსიას აქვს შემდეგი თვისებები.

  • 1. მუდმივი მნიშვნელობის ვარიაცია არის ნული.
  • 2. მახასიათებლის ყველა მნიშვნელობის შემცირება ერთი მნიშვნელობით A არ ცვლის დისპერსიის მნიშვნელობას. ეს ნიშნავს, რომ გადახრების საშუალო კვადრატი შეიძლება გამოითვალოს არა მახასიათებლის მოცემული მნიშვნელობებით, არამედ მათი გადახრებიდან გარკვეული მუდმივი რიცხვიდან.
  • 3. ნებისმიერი დამახასიათებელი მნიშვნელობის შემცირება ჯერ ამცირებს დისპერსიას 2-ჯერ და სტანდარტული გადახრა არის ჯერ, ე.ი. ატრიბუტის ყველა მნიშვნელობა შეიძლება დაიყოს რაიმე მუდმივი რიცხვით (ვთქვათ, სერიის ინტერვალის მნიშვნელობით), სტანდარტული გადახრის გამოთვლა და შემდეგ გამრავლება მუდმივი რიცხვით.
  • 4. თუ გამოვთვლით გადახრების საშუალო კვადრატს რომელიმე მნიშვნელობიდან დაგანსხვავდება ამა თუ იმ ხარისხით საშუალო არითმეტიკისგან, მაშინ ის ყოველთვის იქნება მეტი არითმეტიკული საშუალოდან გამოთვლილი გადახრების საშუალო კვადრატზე. გადახრების საშუალო კვადრატი მეტი იქნება ძალიან გარკვეული რაოდენობით - საშუალო და ამ პირობით აღებულ მნიშვნელობას შორის სხვაობის კვადრატით.

ალტერნატიული მახასიათებლის ცვალებადობა მოიცავს შესწავლილი ქონების არსებობას ან არარსებობას მოსახლეობის ერთეულებში. რაოდენობრივად ალტერნატიული ატრიბუტის ცვალებადობა გამოიხატება ორი მნიშვნელობით: შესწავლილი თვისების ერთეულის არსებობა აღინიშნება ერთით (1), ხოლო მისი არარსებობა აღინიშნება ნულით (0). ერთეულების პროპორცია, რომლებსაც აქვთ შესასწავლი თვისება, აღინიშნება P-ით, ხოლო ერთეულების პროპორცია, რომლებსაც არ გააჩნიათ ეს თვისება, აღინიშნება - გ.ამრიგად, ალტერნატიული ატრიბუტის ვარიაცია უდრის ამ თვისების მქონე ერთეულების პროპორციის ნამრავლს (P) იმ ერთეულების პროპორციით, რომლებიც არ ფლობენ ამ თვისებას. (G).მოსახლეობის ყველაზე დიდი ცვალებადობა მიიღწევა იმ შემთხვევებში, როდესაც მოსახლეობის ნაწილს, რომელიც შეადგენს მოსახლეობის მთლიანი მოცულობის 50%-ს, აქვს მახასიათებელი, ხოლო მოსახლეობის მეორე ნაწილს, ასევე 50%-ის ტოლი, არ გააჩნია ეს მახასიათებელი. ხოლო დისპერსია აღწევს მაქსიმალურ მნიშვნელობას 0,25, ტ .ე. P = 0.5, G= 1 - P = 1 - 0.5 = 0.5 და o 2 = 0.5 0.5 = 0.25. ამ ინდიკატორის ქვედა ზღვარი არის ნული, რაც შეესაბამება სიტუაციას, რომელშიც არ არის ვარიაცია აგრეგატში. ალტერნატიული მახასიათებლის დისპერსიის პრაქტიკული გამოყენება არის სანდო ინტერვალების აგება ნიმუშის დაკვირვების ჩატარებისას.

რაც უფრო მცირეა განსხვავება და სტანდარტული გადახრა, მით უფრო ერთგვაროვანი იქნება პოპულაცია და მით უფრო ტიპიური იქნება საშუალო. სტატისტიკის პრაქტიკაში ხშირად საჭიროა სხვადასხვა მახასიათებლების ვარიაციების შედარება. მაგალითად, საინტერესოა მუშაკთა ასაკისა და მათი კვალიფიკაციის ვარიაციების, მომსახურების ხანგრძლივობისა და ხელფასების, ხარჯებისა და მოგების, სამსახურის ხანგრძლივობისა და შრომის პროდუქტიულობის და ა.შ. ასეთი შედარებისთვის, მახასიათებლების აბსოლუტური ცვალებადობის ინდიკატორები შეუსაბამოა: შეუძლებელია სამუშაო გამოცდილების ცვალებადობის შედარება, გამოხატული წლების განმავლობაში, ხელფასის ცვალებადობასთან, გამოხატული რუბლით. ასეთი შედარებების განსახორციელებლად, ისევე როგორც ერთი და იმავე მახასიათებლის ცვალებადობის შედარებისთვის რამდენიმე პოპულაციაში სხვადასხვა არითმეტიკული საშუალოებით, გამოიყენება ვარიაციული ინდიკატორები - რხევის კოეფიციენტი, ცვალებადობის ხაზოვანი კოეფიციენტი და ცვალებადობის კოეფიციენტი, რომლებიც აჩვენებენ ზომას. უკიდურესი მნიშვნელობების რყევების საშუალოზე.

რხევის კოეფიციენტი:

სად V R -რხევის კოეფიციენტის მნიშვნელობა; - ვარიაციის დიაპაზონის მნიშვნელობა; X -

ცვალებადობის ხაზოვანი კოეფიციენტი“.

სად Vj-ცვალებადობის წრფივი კოეფიციენტის მნიშვნელობა; ᲛᲔ -საშუალო წრფივი გადახრის მნიშვნელობა; X -მახასიათებლის საშუალო მნიშვნელობა შესწავლილი პოპულაციისთვის.

ვარიაციის კოეფიციენტი:

სად V a -ვარიაციის მნიშვნელობის კოეფიციენტი; a არის სტანდარტული გადახრის მნიშვნელობა; X -მახასიათებლის საშუალო მნიშვნელობა შესწავლილი პოპულაციისთვის.

რხევის კოეფიციენტი არის ცვალებადობის დიაპაზონის პროცენტული თანაფარდობა შესასწავლი მახასიათებლის საშუალო მნიშვნელობასთან, ხოლო ცვალებადობის ხაზოვანი კოეფიციენტი არის საშუალო წრფივი გადახრის თანაფარდობა შესასწავლი მახასიათებლის საშუალო მნიშვნელობასთან, გამოხატული როგორც პროცენტი. ცვალებადობის კოეფიციენტი არის სტანდარტული გადახრის პროცენტი შესასწავლი მახასიათებლის საშუალო მნიშვნელობამდე. როგორც ფარდობითი მნიშვნელობა, გამოხატული პროცენტულად, ცვალებადობის კოეფიციენტი გამოიყენება სხვადასხვა მახასიათებლების ცვალებადობის ხარისხის შესადარებლად. ვარიაციის კოეფიციენტის გამოყენებით ფასდება სტატისტიკური პოპულაციის ჰომოგენურობა. თუ ვარიაციის კოეფიციენტი 33%-ზე ნაკლებია, მაშინ შესწავლილი პოპულაცია ერთგვაროვანია და ვარიაცია სუსტია. თუ ვარიაციის კოეფიციენტი 33%-ზე მეტია, მაშინ შესწავლილი პოპულაცია ჰეტეროგენულია, ვარიაცია ძლიერია და საშუალო მნიშვნელობა ატიპიურია და არ შეიძლება გამოყენებულ იქნას ამ პოპულაციის ზოგად მაჩვენებლად. გარდა ამისა, ვარიაციის კოეფიციენტები გამოიყენება ერთი მახასიათებლის ცვალებადობის შესადარებლად სხვადასხვა პოპულაციაში. მაგალითად, ორ საწარმოში მუშაკთა სტაჟის ცვალებადობის შესაფასებლად. რაც უფრო მაღალია კოეფიციენტის მნიშვნელობა, მით უფრო მნიშვნელოვანია მახასიათებლის ცვალებადობა.

გამოთვლილი კვარტლების საფუძველზე, ასევე შესაძლებელია კვარტალური ვარიაციის ფარდობითი ინდიკატორის გამოთვლა ფორმულის გამოყენებით

სადაც ქ 2 და

კვარტლთაშორისი დიაპაზონი განისაზღვრება ფორმულით

მეოთხედი გადახრა გამოიყენება ვარიაციის დიაპაზონის ნაცვლად, რათა თავიდან იქნას აცილებული უკიდურესი მნიშვნელობების გამოყენებასთან დაკავშირებული უარყოფითი მხარეები:

არათანაბარი ინტერვალის ვარიაციის სერიებისთვის, ასევე გამოითვლება განაწილების სიმკვრივე. იგი განისაზღვრება, როგორც შესაბამისი სიხშირის ან სიხშირის კოეფიციენტი გაყოფილი ინტერვალის მნიშვნელობაზე. არათანაბარი ინტერვალის სერიებში გამოიყენება აბსოლუტური და ფარდობითი განაწილების სიმკვრივეები. განაწილების აბსოლუტური სიმკვრივე არის სიხშირე ინტერვალის სიგრძის ერთეულზე. ფარდობითი განაწილების სიმკვრივე - სიხშირე ერთეული ინტერვალის სიგრძეზე.

ყოველივე ზემოთქმული მართალია განაწილების სერიებისთვის, რომელთა განაწილების კანონი კარგად არის აღწერილი ნორმალური განაწილების კანონით ან ახლოსაა მასთან.

ვარიაციების სერია: განმარტება, ტიპები, ძირითადი მახასიათებლები. გაანგარიშების მეთოდი
რეჟიმი, მედიანა, საშუალო არითმეტიკული სამედიცინო და სტატისტიკურ კვლევებში
(აჩვენეთ პირობითი მაგალითით).

ვარიაციული სერია არის შესასწავლი მახასიათებლის რიცხვითი მნიშვნელობების სერია, რომლებიც განსხვავდება ერთმანეთისგან სიდიდით და განლაგებულია გარკვეული თანმიმდევრობით (აღმავალი ან კლებადი თანმიმდევრობით). სერიის თითოეულ ციფრულ მნიშვნელობას ეწოდება ვარიანტი (V), ხოლო ციფრებს, რომლებიც გვიჩვენებს, თუ რამდენად ხშირად ხდება კონკრეტული ვარიანტი მოცემულ სერიაში, ეწოდება სიხშირე (p).

დაკვირვების შემთხვევების საერთო რაოდენობა, რომლებიც ქმნიან ვარიაციის სერიას, აღინიშნება ასო n-ით. შესწავლილი მახასიათებლების მნიშვნელობის განსხვავებას ვარიაცია ეწოდება. თუ ცვალებად მახასიათებელს არ აქვს რაოდენობრივი საზომი, ვარიაციას ეწოდება ხარისხობრივი, ხოლო განაწილების სერიას - ატრიბუტი (მაგალითად, განაწილება დაავადების შედეგის მიხედვით, ჯანმრთელობის მდგომარეობა და ა.შ.).

თუ ცვალებად მახასიათებელს აქვს რაოდენობრივი გამოხატულება, ასეთ ცვალებადობას ეწოდება რაოდენობრივი, ხოლო განაწილების სერიას ეწოდება ცვალებადობა.

ვარიაციების სერიები იყოფა უწყვეტად და უწყვეტად - რაოდენობრივი მახასიათებლის ბუნებიდან გამომდინარე; მარტივი და შეწონილი - ვარიანტის გაჩენის სიხშირის მიხედვით.

მარტივი ვარიაციის სერიებში, თითოეული ვარიანტი ჩნდება მხოლოდ ერთხელ (p=1), შეწონილ სერიაში ერთი და იგივე ვარიანტი ხდება რამდენჯერმე (p>1). ასეთი სერიის მაგალითები შემდგომში იქნება განხილული ტექსტში. თუ რაოდენობრივი მახასიათებელი უწყვეტია, ე.ი. მთელ რიცხვებს შორის არის შუალედური წილადი სიდიდეები; ვარიაციის სერიას უწყვეტი ეწოდება.

მაგალითად: 10.0 – 11.9

14.0 – 15.9 და ა.შ.

თუ რაოდენობრივი მახასიათებელი წყვეტილია, ე.ი. მისი ინდივიდუალური მნიშვნელობები (ვარიანტები) განსხვავდება ერთმანეთისგან მთელი რიცხვით და არ გააჩნიათ შუალედური წილადი მნიშვნელობები; ვარიაციის სერიას ეწოდება წყვეტილი ან დისკრეტული.

წინა მაგალითიდან გულისცემის მონაცემების გამოყენება

21 მოსწავლისთვის ავაშენებთ ვარიაციების სერიას (ცხრილი 1).

ცხრილი 1

სამედიცინო სტუდენტების განაწილება გულისცემის მიხედვით (bpm)

ამრიგად, ვარიაციის სერიის აგება ნიშნავს ხელმისაწვდომი რიცხვითი მნიშვნელობების (ვარიანტების) სისტემატიზაციას და ორგანიზებას, ე.ი. დაალაგეთ გარკვეული თანმიმდევრობით (აღმავალი ან კლებადი მიმდევრობით) მათი შესაბამისი სიხშირეებით. განსახილველ მაგალითში ოფციონები განლაგებულია ზრდადი მიმდევრობით და გამოიხატება როგორც მთელი რიცხვი უწყვეტი (დისკრეტული) რიცხვები, თითოეული ვარიანტი ხდება რამდენჯერმე, ე.ი. საქმე გვაქვს შეწონილ, წყვეტილ ან დისკრეტულ ვარიაციის სერიასთან.

როგორც წესი, თუ სტატისტიკურ პოპულაციაში დაკვირვებების რაოდენობა, რომელსაც ჩვენ ვსწავლობთ, არ აღემატება 30-ს, მაშინ საკმარისია შესასწავლი მახასიათებლის ყველა მნიშვნელობის მოწყობა აღმავალი ვარიაციის სერიაში, როგორც ცხრილში. 1, ან კლებადობით.

დაკვირვებების დიდი რაოდენობით (n>30), არსებული ვარიანტების რაოდენობა შეიძლება იყოს ძალიან დიდი; ამ შემთხვევაში, შედგენილია ინტერვალის ან დაჯგუფებული ვარიაციების სერია, რომელშიც შემდგომი დამუშავების გასამარტივებლად და განაწილების ბუნების გასარკვევად, ვარიანტები გაერთიანებულია ჯგუფებად.

როგორც წესი, ჯგუფის ვარიანტების რაოდენობა მერყეობს 8-დან 15-მდე.

სულ მცირე 5 უნდა იყოს, რადგან... წინააღმდეგ შემთხვევაში, ეს იქნება ძალიან უხეში, გადაჭარბებული გაფართოება, რაც ამახინჯებს ვარიაციულ სურათს და დიდ გავლენას ახდენს საშუალო მნიშვნელობების სიზუსტეზე. როდესაც ჯგუფის ვარიანტების რაოდენობა 20-25-ზე მეტია, საშუალო მნიშვნელობების გამოთვლის სიზუსტე იზრდება, მაგრამ მახასიათებლის ცვალებადობის მახასიათებლები მნიშვნელოვნად დამახინჯებულია და მათემატიკური დამუშავება უფრო რთული ხდება.

დაჯგუფებული სერიის შედგენისას აუცილებელია გავითვალისწინოთ

− ოფციონების ჯგუფები უნდა განლაგდეს გარკვეული თანმიმდევრობით (აღმავალი ან დაღმავალი);

− ვარიანტების ჯგუფებში ინტერვალები უნდა იყოს იგივე;

- ინტერვალის საზღვრების მნიშვნელობები არ უნდა ემთხვეოდეს, რადგან გაურკვეველი იქნება, თუ რომელ ჯგუფებად დავახარისხოთ ცალკეული ვარიანტები;

− ინტერვალის ლიმიტების დადგენისას აუცილებელია შეგროვებული მასალის ხარისხობრივი თავისებურებების გათვალისწინება (მაგალითად, მოზრდილების წონის შესწავლისას მისაღებია 3-4 კგ ინტერვალი, ხოლო ბავშვებისთვის სიცოცხლის პირველ თვეებში. არ უნდა აღემატებოდეს 100 გ)

მოდით ავაშენოთ დაჯგუფებული (ინტერვალური) სერია, რომელიც ახასიათებს მონაცემებს პულსის სიხშირეზე (წუთში) 55 სამედიცინო სტუდენტისთვის გამოცდამდე: 64, 66, 60, 62,

64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

დაჯგუფებული სერიის შესაქმნელად დაგჭირდებათ:

1. ინტერვალის ზომის განსაზღვრა;

2. დაადგინეთ ვარიაციის სერიის ჯგუფების შუა, დასაწყისი და დასასრული.

● (i) ინტერვალის ზომა განისაზღვრება სავარაუდო ჯგუფების (r) რაოდენობის მიხედვით, რომელთა რაოდენობა დგინდება დაკვირვებების რაოდენობის მიხედვით (n) სპეციალური ცხრილის მიხედვით.

ჯგუფების რაოდენობა დამოკიდებულია დაკვირვების რაოდენობაზე:

ჩვენს შემთხვევაში, 55 მოსწავლისთვის შეგიძლიათ შექმნათ 8-დან 10-მდე ჯგუფი.

(i) ინტერვალის მნიშვნელობა განისაზღვრება შემდეგი ფორმულით -

i = V max-V min/r

ჩვენს მაგალითში, ინტერვალის მნიშვნელობა არის 82-58/8=3.

თუ ინტერვალის მნიშვნელობა არის წილადი, შედეგი უნდა დამრგვალდეს უახლოეს მთელ რიცხვამდე.

არსებობს რამდენიმე ტიპის საშუალო:

● საშუალო არითმეტიკული,

● გეომეტრიული საშუალო,

● ჰარმონიული საშუალო,

● ფესვი საშუალო კვადრატი,

● საშუალო პროგრესული,

● მედიანა

სამედიცინო სტატისტიკაში ყველაზე ხშირად გამოიყენება საშუალო არითმეტიკული მაჩვენებლები.

საშუალო არითმეტიკული (M) არის განზოგადებული მნიშვნელობა, რომელიც განსაზღვრავს რა არის დამახასიათებელი მთელი პოპულაციისთვის. M-ის გამოთვლის ძირითადი მეთოდებია: საშუალო არითმეტიკული მეთოდი და მომენტების მეთოდი (პირობითი გადახრები).

საშუალო არითმეტიკული მეთოდი გამოიყენება მარტივი საშუალო არითმეტიკულისა და შეწონილი საშუალო არითმეტიკის გამოსათვლელად. არითმეტიკული საშუალოს გამოთვლის მეთოდის არჩევანი დამოკიდებულია ვარიაციის სერიის ტიპზე. მარტივი ვარიაციის სერიის შემთხვევაში, რომელშიც თითოეული ვარიანტი მხოლოდ ერთხელ ხდება, საშუალო არითმეტიკული მარტივი განისაზღვრება ფორმულით:

სადაც: M – საშუალო არითმეტიკული მნიშვნელობა;

V – ცვალებადი მახასიათებლის (ვარიანტების) მნიშვნელობა;

Σ – მიუთითებს მოქმედებაზე – შეჯამება;

n – დაკვირვების საერთო რაოდენობა.

მარტივი არითმეტიკული საშუალოს გამოთვლის მაგალითი. სუნთქვის სიხშირე (სუნთქვის მოძრაობების რაოდენობა წუთში) 35 წლის 9 მამაკაცში: 20, 22, 19, 15, 16, 21, 17, 23, 18.

35 წლის მამაკაცებში სუნთქვის სიხშირის საშუალო დონის დასადგენად აუცილებელია:

1. შექმენით ვარიაციების სერია, დაალაგეთ ყველა ვარიანტი აღმავალი ან დაღმავალი თანმიმდევრობით. ჩვენ მივიღეთ მარტივი ვარიაციის სერია, რადგან ვარიანტის მნიშვნელობები მხოლოდ ერთხელ ხდება.

M = ∑V/n = 171/9 = 19 ჩასუნთქვა წუთში

დასკვნა. 35 წლის მამაკაცებში სუნთქვის სიხშირე საშუალოდ არის 19 სუნთქვის მოძრაობა წუთში.

თუ ვარიანტის ცალკეული მნიშვნელობები მეორდება, არ არის საჭირო თითოეული ვარიანტის ხაზში ჩაწერა, საკმარისია ჩამოთვალოთ ვარიანტის (V) არსებული ზომები და მის გვერდით მიუთითოთ მათი გამეორებების რაოდენობა (გვ. ). ვარიაციის ასეთ სერიას, რომელშიც ვარიანტები, როგორც იქნა, იწონება მათ შესაბამისი სიხშირეების რაოდენობით, ეწოდება შეწონილი ვარიაციის სერიას, ხოლო გამოთვლილი საშუალო მნიშვნელობა არის შეწონილი არითმეტიკული საშუალო.

შეწონილი არითმეტიკული საშუალო განისაზღვრება ფორმულით: M= ∑Vp/n

სადაც n არის სიხშირეების ჯამის ტოლი დაკვირვებების რაოდენობა – Ср.

არითმეტიკული შეწონილი საშუალოს გამოთვლის მაგალითი.

ადგილობრივი ექიმის მიერ ჩატარებული მწვავე რესპირატორული დაავადებების (ARI) მქონე 35 პაციენტში ინვალიდობის ხანგრძლივობა (დღეებში) მიმდინარე წლის პირველ კვარტალში იყო: 6, 7, 5, 3, 9, 8, 7, 5, 6. , 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6 , 7 დღე.

მწვავე რესპირატორული ინფექციების მქონე პაციენტებში ინვალიდობის საშუალო ხანგრძლივობის განსაზღვრის მეთოდი შემდეგია:

1. ავაშენოთ შეწონილი ვარიაციის სერია, რადგან ოფციონის ინდივიდუალური მნიშვნელობები რამდენჯერმე მეორდება. ამისათვის თქვენ შეგიძლიათ მოაწყოთ ყველა ვარიანტი აღმავალი ან კლებადობით მათი შესაბამისი სიხშირეებით.

ჩვენს შემთხვევაში, ოფციები განლაგებულია ზრდადი თანმიმდევრობით

2. გამოთვალეთ საშუალო შეწონილი არითმეტიკული ფორმულის გამოყენებით: M = ∑Vp/n = 233/35 = 6,7 დღე

მწვავე რესპირატორული ინფექციების მქონე პაციენტების განაწილება ინვალიდობის ხანგრძლივობის მიხედვით:

ინვალიდობის ხანგრძლივობა (V) პაციენტების რაოდენობა (p) Vp
∑p = n = 35 ∑Vp = 233

დასკვნა. ინვალიდობის ხანგრძლივობა მწვავე რესპირატორული დაავადებების მქონე პაციენტებში საშუალოდ 6,7 დღე იყო.

რეჟიმი (Mo) არის ყველაზე გავრცელებული ვარიანტი ვარიაციების სერიაში. ცხრილში წარმოდგენილი განაწილებისთვის, რეჟიმი შეესაბამება 10-ის ტოლ ვარიანტს; ის უფრო ხშირად ხდება, ვიდრე სხვები - 6-ჯერ.

პაციენტების განაწილება საავადმყოფოს საწოლში ყოფნის ხანგრძლივობის მიხედვით (დღეებში)

გვ

ზოგჯერ რთულია რეჟიმის ზუსტი სიდიდის დადგენა, რადგან შესწავლილ მონაცემებში შეიძლება იყოს რამდენიმე „ყველაზე გავრცელებული“ დაკვირვება.

მედიანა (Me) არის არაპარამეტრული ინდიკატორი, რომელიც ყოფს ვარიაციის სერიას ორ თანაბარ ნაწილად: ერთნაირი რაოდენობის ვარიანტები განლაგებულია მედიანის ორივე მხარეს.

მაგალითად, ცხრილში ნაჩვენები განაწილებისთვის, მედიანა არის 10, რადგან ამ მნიშვნელობის ორივე მხარეს არის 14 ვარიანტი, ე.ი. რიცხვი 10 ამ სერიაში ცენტრალურ ადგილს იკავებს და არის მისი მედიანა.

იმის გათვალისწინებით, რომ ამ მაგალითში დაკვირვებების რაოდენობა ლუწია (n=34), მედიანა შეიძლება განისაზღვროს შემდეგნაირად:

მე = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

ეს ნიშნავს, რომ სერიის შუა რიცხვები მოდის მეჩვიდმეტე ვარიანტზე, რომელიც შეესაბამება 10-ის ტოლი მედიანას. ცხრილში წარმოდგენილი განაწილებისთვის საშუალო არითმეტიკული ტოლია:

M = ∑Vp/n = 334/34 = 10.1

ასე რომ, ცხრილიდან 34 დაკვირვებისთვის. 8, მივიღეთ: Mo=10, Me=10, საშუალო არითმეტიკული (M) არის 10,1. ჩვენს მაგალითში სამივე ინდიკატორი ტოლი ან ერთმანეთთან ახლოს აღმოჩნდა, თუმცა სრულიად განსხვავებულია.

საშუალო არითმეტიკული არის ყველა გავლენის შედეგიანი ჯამი; მის ფორმირებაში მონაწილეობს ყველა ვარიანტი გამონაკლისის გარეშე, ექსტრემალური ჩათვლით, ხშირად ატიპიური მოცემული ფენომენისთვის ან პოპულაციისთვის.

რეჟიმი და მედიანა, არითმეტიკული საშუალოსგან განსხვავებით, არ არის დამოკიდებული განსხვავებული მახასიათებლის ყველა ინდივიდუალური მნიშვნელობის მნიშვნელობაზე (ექსტრემალური ვარიანტების მნიშვნელობები და სერიის დისპერსიის ხარისხი). საშუალო არითმეტიკული ახასიათებს დაკვირვების მთელ მასას, რეჟიმი და მედიანა ახასიათებს ნაყარს

აშენდა რიგები რაოდენობრივ საფუძველზე, უწოდებენ ვარიაციული.

სადისტრიბუციო სერია შედგება პარამეტრები(მახასიათებელი ღირებულებები) და სიხშირეები(ჯგუფების რაოდენობა). ფარდობითი მნიშვნელობებით გამოხატული სიხშირეები (ფრაქციები, პროცენტები) ეწოდება სიხშირეები. ყველა სიხშირის ჯამს უწოდებენ განაწილების სერიის მოცულობას.

ტიპის მიხედვით, განაწილების სერიები იყოფა დისკრეტული(აშენებულია მახასიათებლის უწყვეტი მნიშვნელობების საფუძველზე) და ინტერვალი(მახასიათებლის უწყვეტი მნიშვნელობების საფუძველზე).

ვარიაციების სერიაწარმოადგენს ორ სვეტს (ან მწკრივს); რომელთაგან ერთი იძლევა სხვადასხვა მახასიათებლის ინდივიდუალურ მნიშვნელობებს, რომელსაც ეწოდება ვარიანტები და აღინიშნება X-ით; ხოლო მეორეში - აბსოლუტური რიცხვები, რომლებიც გვიჩვენებს რამდენჯერ (რამდენჯერ) ხდება თითოეული ვარიანტი. მეორე სვეტის მაჩვენებლებს სიხშირეებს უწოდებენ და პირობითად აღინიშნება f-ით. კიდევ ერთხელ აღვნიშნოთ, რომ მეორე სვეტში შეიძლება გამოყენებულ იქნას ფარდობითი ინდიკატორები, რომლებიც ახასიათებენ ცალკეული ვარიანტების სიხშირის წილს სიხშირეების ჯამში. ამ ფარდობით მაჩვენებლებს სიხშირეებს უწოდებენ და პირობითად აღინიშნება ω-ით ყველა სიხშირის ჯამი ამ შემთხვევაში ერთის ტოლია. თუმცა, სიხშირეები ასევე შეიძლება გამოხატული იყოს პროცენტებში და შემდეგ ყველა სიხშირის ჯამი იძლევა 100%.

თუ ვარიაციის სერიის ვარიანტები გამოიხატება დისკრეტული რაოდენობების სახით, მაშინ ასეთი ვარიაციის სერია ე.წ. დისკრეტული.

უწყვეტი მახასიათებლებისთვის, ვარიაციული სერიები აგებულია როგორც ინტერვალი, ანუ მათში ატრიბუტის მნიშვნელობები გამოიხატება "დან...-მდე". ამ შემთხვევაში, ასეთ ინტერვალში მახასიათებლის მინიმალურ მნიშვნელობებს უწოდებენ ინტერვალის ქვედა ზღვარს, ხოლო მაქსიმუმს - ზედა ზღვარს.

ინტერვალის ვარიაციების სერიები ასევე აგებულია დისკრეტული მახასიათებლებისთვის, რომლებიც განსხვავდება დიდ დიაპაზონში. ინტერვალის სერია შეიძლება იყოს თანაბარიდა არათანაბარიინტერვალებით.

მოდით განვიხილოთ, თუ როგორ განისაზღვრება თანაბარი ინტერვალების მნიშვნელობა. მოდით შემოგთავაზოთ შემდეგი აღნიშვნა:

მე- ინტერვალის ზომა;

- მახასიათებლის მაქსიმალური მნიშვნელობა მოსახლეობის ერთეულებისთვის;

– მახასიათებლის მინიმალური მნიშვნელობა მოსახლეობის ერთეულებისთვის;

n –გამოყოფილი ჯგუფების რაოდენობა.

თუ n ცნობილია.

თუ გასარჩევი ჯგუფების რაოდენობა ძნელია წინასწარ განისაზღვროს, მაშინ ინტერვალის ოპტიმალური მნიშვნელობის გამოსათვლელად პოპულაციის საკმარისი ზომით, შეიძლება რეკომენდებული იყოს 1926 წელს სტერჯესის მიერ შემოთავაზებული ფორმულა:

n = 1+ 3.322 log N, სადაც N არის ერთეულების რაოდენობა აგრეგატში.

არათანაბარი ინტერვალების ზომა განისაზღვრება თითოეულ ინდივიდუალურ შემთხვევაში, კვლევის ობიექტის მახასიათებლების გათვალისწინებით.

სტატისტიკური ნიმუშის განაწილებაგამოიძახეთ ოფციების სია და მათი შესაბამისი სიხშირეები (ან შედარებითი სიხშირეები).

ნიმუშის სტატისტიკური განაწილება შეიძლება განისაზღვროს ცხრილის სახით, რომლის პირველ სვეტში განთავსებულია ვარიანტები, ხოლო მეორეში - ამ ვარიანტების შესაბამისი სიხშირეები. ნი, ან შედარებითი სიხშირეები პი .

ნიმუშის სტატისტიკური განაწილება

ინტერვალის სერიები არის ვარიაციული სერიები, რომლებშიც მათი ფორმირების საფუძვლიანი მახასიათებლების მნიშვნელობები გამოხატულია გარკვეულ საზღვრებში (ინტერვალებში). სიხშირეები ამ შემთხვევაში ეხება არა ატრიბუტის ცალკეულ მნიშვნელობებს, არამედ მთელ ინტერვალს.

ინტერვალური განაწილების სერიები აგებულია უწყვეტი რაოდენობრივი მახასიათებლების საფუძველზე, ასევე დისკრეტული მახასიათებლების მიხედვით, რომლებიც განსხვავდება მნიშვნელოვანი საზღვრებში.

ინტერვალის სერია შეიძლება წარმოდგენილი იყოს ნიმუშის სტატისტიკური განაწილებით, რომელიც მიუთითებს ინტერვალებზე და მათ შესაბამის სიხშირეებზე. ამ შემთხვევაში, ამ ინტერვალში მოხვედრილი ვარიანტების სიხშირეების ჯამი მიიღება როგორც ინტერვალის სიხშირე.

რაოდენობრივი უწყვეტი მახასიათებლების მიხედვით დაჯგუფებისას მნიშვნელოვანია ინტერვალის ზომის განსაზღვრა.

სინჯის საშუალო და ნიმუშის დისპერსიის გარდა, ასევე გამოიყენება ვარიაციის სერიის სხვა მახასიათებლები.

მოდაყველაზე მაღალი სიხშირის მქონე ვარიანტს ე.წ.


დახურვა