სტატისტიკურ ანალიზში განსაკუთრებული ადგილი უკავია შესწავლილი თვისების ან ფენომენის საშუალო დონის განსაზღვრას. მახასიათებლის საშუალო დონე იზომება საშუალო მნიშვნელობებით.

საშუალო მნიშვნელობა ახასიათებს შესწავლილი ნიშნის ზოგად რაოდენობრივ დონეს და წარმოადგენს სტატისტიკური პოპულაციის ჯგუფურ საკუთრებას. იგი ასუსტებს, ასუსტებს ინდივიდუალური დაკვირვებების შემთხვევით გადახრებს ამა თუ იმ მიმართულებით და ხაზს უსვამს შესასწავლი თვისების ძირითად, ტიპურ თვისებას.

საშუალოდ ფართოდ გამოიყენება:

1. მოსახლეობის ჯანმრთელობის მდგომარეობის შეფასება: ფიზიკური განვითარების მახასიათებლები (სიმაღლე, წონა, გულმკერდის გარშემოწერილობა და ა.შ.), სხვადასხვა დაავადების გავრცელების და ხანგრძლივობის განსაზღვრა, დემოგრაფიული მაჩვენებლების ანალიზი (მოსახლეობის ბუნებრივი მოძრაობა, სიცოცხლის საშუალო ხანგრძლივობა, მოსახლეობის რეპროდუქცია. საშუალო მოსახლეობა და ა.შ.).

2. სამედიცინო დაწესებულებების, სამედიცინო პერსონალის საქმიანობის შესწავლა და მათი მუშაობის ხარისხის შეფასება, მოსახლეობის საჭიროებების დაგეგმვა და განსაზღვრა სხვადასხვა სახის სამედიცინო მომსახურებაზე (წელიწადში განცხადებების ან ვიზიტების საშუალო რაოდენობა ერთ მოსახლეზე, ყოფნის საშუალო ხანგრძლივობა. საავადმყოფოში მყოფი პაციენტის, პაციენტის გამოკვლევის საშუალო ხანგრძლივობა, ექიმების საშუალო უზრუნველყოფა, საწოლები და ა.შ.).

3. სანიტარული და ეპიდემიოლოგიური მდგომარეობის დახასიათება (საამქროში ჰაერის საშუალო მტვრიანობა, საშუალო ფართობი ერთ ადამიანზე, ცილების, ცხიმებისა და ნახშირწყლების საშუალო მოხმარება და სხვ.).

4. ნორმასა და პათოლოგიაში სამედიცინო და ფიზიოლოგიური პარამეტრების დადგენა, ლაბორატორიული მონაცემების დამუშავებისას, სოციო-ჰიგიენურ, კლინიკურ, ექსპერიმენტულ კვლევებში შერჩევითი კვლევის შედეგების სანდოობის დადგენა.

საშუალო მნიშვნელობების გაანგარიშება ხორციელდება ვარიაციის სერიების საფუძველზე. ვარიაციების სერია- ეს არის თვისობრივად ერთგვაროვანი სტატისტიკური ნაკრები, რომლის ცალკეული ერთეულები ახასიათებს შესწავლილი მახასიათებლის ან ფენომენის რაოდენობრივ განსხვავებებს.

რაოდენობრივი ცვალებადობა შეიძლება იყოს ორი სახის: წყვეტილი (დისკრეტული) და უწყვეტი.

წყვეტილი (დისკრეტული) ნიშანი გამოიხატება მხოლოდ მთელი რიცხვის სახით და არ შეიძლება ჰქონდეს რაიმე შუალედური მნიშვნელობები (მაგალითად, ვიზიტების რაოდენობა, საიტის პოპულაცია, ოჯახში ბავშვების რაოდენობა, დაავადების სიმძიმე წერტილებში. და ა.შ.).

უწყვეტმა ნიშანმა შეიძლება მიიღოს ნებისმიერი მნიშვნელობა გარკვეული საზღვრებში, მათ შორის წილადი და გამოიხატება მხოლოდ დაახლოებით (მაგალითად, წონა - მოზრდილებისთვის შეგიძლიათ შემოიფარგლოთ კილოგრამებით, ხოლო ახალშობილებისთვის - გრამებით; სიმაღლე, არტერიული წნევა, დრო. დაიხარჯა პაციენტის ნახვაზე და ა.შ.).



ვარიაციების სერიაში შემავალი თითოეული ინდივიდუალური მახასიათებლის ან ფენომენის ციფრულ მნიშვნელობას ეწოდება ვარიანტი და მითითებულია ასოებით . მათემატიკურ ლიტერატურაში სხვა აღნიშვნებიც არის, მაგალითად x ან წ.

ვარიაციულ სერიას, სადაც თითოეული ვარიანტი ერთხელ არის მითითებული, მარტივი ეწოდება.ასეთი სერიები გამოიყენება უმეტეს სტატისტიკურ ამოცანებში კომპიუტერული მონაცემების დამუშავების შემთხვევაში.

დაკვირვებების რაოდენობის მატებასთან ერთად, როგორც წესი, არსებობს ვარიანტის განმეორებითი მნიშვნელობები. ამ შემთხვევაში ის ქმნის დაჯგუფებული ვარიაციების სერია, სადაც მითითებულია გამეორებების რაოდენობა (სიხშირე, აღინიშნება ასო " »).

რანჟირებული ვარიაციების სერიაშედგება აღმავალი ან კლებადი თანმიმდევრობით დალაგებული ვარიანტებისგან. როგორც მარტივი, ისე დაჯგუფებული სერიების შედგენა შესაძლებელია რეიტინგით.

ინტერვალის ვარიაციის სერიაშედგენილია კომპიუტერის გამოყენების გარეშე შესრულებული შემდგომი გამოთვლების გასამარტივებლად, დაკვირვების ერთეულების ძალიან დიდი რაოდენობით (1000-ზე მეტი).

უწყვეტი ვარიაციის სერიამოიცავს ვარიანტების მნიშვნელობებს, რომლებიც შეიძლება იყოს ნებისმიერი მნიშვნელობა.

თუ ვარიაციის სერიაში ატრიბუტის (ვარიანტების) მნიშვნელობები მოცემულია ცალკეული კონკრეტული რიცხვების სახით, მაშინ ასეთ სერიას ე.წ. დისკრეტული.

ვარიაციის სერიაში ასახული ატრიბუტის მნიშვნელობების ზოგადი მახასიათებლები არის საშუალო მნიშვნელობები. მათ შორის ყველაზე მეტად გამოიყენება: საშუალო არითმეტიკული მ,მოდა მოდა მედიანა მე.თითოეული ეს მახასიათებელი უნიკალურია. ისინი ერთმანეთს ვერ შეცვლიან და მხოლოდ მთლიანობაში, საკმაოდ სრულად და ლაკონურ ფორმაშია ვარიაციის სერიების მახასიათებლები.

მოდა (მო) დაასახელეთ ყველაზე ხშირად არსებული ვარიანტების მნიშვნელობა.

მედიანური (მე) არის ვარიანტის მნიშვნელობა, რომელიც ყოფს დიაპაზონის ვარიაციულ სერიას შუაზე (მედიანას თითოეულ მხარეს არის ვარიანტის ნახევარი). იშვიათ შემთხვევებში, როდესაც არსებობს სიმეტრიული ვარიაციის სერია, რეჟიმი და მედიანა ერთმანეთის ტოლია და ემთხვევა საშუალო არითმეტიკული მნიშვნელობას.

ვარიანტის მნიშვნელობების ყველაზე ტიპიური მახასიათებელია საშუალო არითმეტიკულიღირებულება ( ). მათემატიკურ ლიტერატურაში აღინიშნება .

Საშუალო არითმეტიკული (მ, ) არის შესწავლილი ფენომენების გარკვეული მახასიათებლის ზოგადი რაოდენობრივი მახასიათებელი, რომლებიც ქმნიან თვისობრივად ერთგვაროვან სტატისტიკურ სიმრავლეს. განასხვავებენ მარტივ არითმეტიკულ საშუალოსა და შეწონილ საშუალოს. მარტივი არითმეტიკული საშუალო გამოითვლება მარტივი ვარიაციული სერიებისთვის ყველა ვარიანტის შეჯამებით და ამ ჯამის გაყოფით ამ ვარიაციულ სერიაში შეტანილი ვარიანტების საერთო რაოდენობაზე. გამოთვლები ხორციელდება ფორმულის მიხედვით:

სად: - მარტივი არითმეტიკული საშუალო;

Σ - თანხის ვარიანტი;

- დაკვირვებების რაოდენობა.

დაჯგუფებული ვარიაციების სერიაში განისაზღვრება შეწონილი არითმეტიკული საშუალო. მისი გაანგარიშების ფორმულა:

სად: - საშუალო შეწონილი არითმეტიკული;

Σ vp - ვარიანტის პროდუქტების ჯამი მათ სიხშირეებზე;

- დაკვირვებების რაოდენობა.

ხელით გამოთვლების შემთხვევაში დაკვირვების დიდი რაოდენობით შეიძლება გამოყენებულ იქნას მომენტების მეთოდი.

საშუალო არითმეტიკას აქვს შემდეგი თვისებები:

ვარიანტის გადახრების ჯამი საშუალოდან ( Σ ) უდრის ნულს (იხ. ცხრილი 15);

ყველა ვარიანტის ერთ ფაქტორზე (გამყოფზე) გამრავლების (გაყოფისას) საშუალო არითმეტიკული მრავლდება (იყოფა) იმავე კოეფიციენტზე (გამყოფზე);

თუ ყველა ვარიანტს ერთსა და იმავე რიცხვს დაამატებთ (აკლებთ), საშუალო არითმეტიკული იგივე რიცხვით იზრდება (მცირდება).

არითმეტიკული საშუალო, თავისთავად მიღებული, სერიების ცვალებადობის გათვალისწინების გარეშე, საიდანაც ისინი გამოითვლება, შეიძლება სრულად არ ასახავდეს ვარიაციული სერიის თვისებებს, განსაკუთრებით მაშინ, როდესაც საჭიროა სხვა საშუალო მაჩვენებლებთან შედარება. საშუალო მნიშვნელობებით მიახლოებული მნიშვნელობების მიღება შესაძლებელია სერიებიდან სხვადასხვა ხარისხის დისპერსიით. რაც უფრო ახლოსაა ცალკეული ვარიანტები ერთმანეთთან მათი რაოდენობრივი მახასიათებლებით, მით ნაკლებია გაფანტვა (რყევა, ცვალებადობა)სერია, მით უფრო ტიპიურია მისი საშუალო.

ძირითადი პარამეტრები, რომლებიც საშუალებას გაძლევთ შეაფასოთ ნიშან-თვისების ცვალებადობა, არის:

· ფარგლები;

Დიაპაზონი;

· Სტანდარტული გადახრა;

· ვარიაციის კოეფიციენტი.

დაახლოებით, ნიშან-თვისების მერყეობა შეიძლება შეფასდეს ვარიაციის სერიის მასშტაბით და ამპლიტუდით. დიაპაზონი მიუთითებს სერიის მაქსიმალურ (V max) და მინიმალურ (V min) ვარიანტებს. ამპლიტუდა (A m) არის განსხვავება ამ ვარიანტებს შორის: A m = V max - V min .

ვარიაციული სერიების რყევების ძირითადი, ზოგადად მიღებული საზომია დისპერსიას ( ). მაგრამ უფრო მოსახერხებელი პარამეტრი ყველაზე ხშირად გამოიყენება, რომელიც გამოითვლება დისპერსიის საფუძველზე - სტანდარტული გადახრა ( σ ). იგი ითვალისწინებს გადახრის მნიშვნელობას ( ) ვარიაციის სერიის თითოეული ვარიანტის არითმეტიკული საშუალოდან ( d=V - M ).

ვინაიდან ვარიანტის გადახრები საშუალოდან შეიძლება იყოს დადებითი და უარყოფითი, შეჯამებისას ისინი აძლევენ მნიშვნელობას "0" (S d=0). ამის თავიდან ასაცილებლად, გადახრის მნიშვნელობები ( ) ამაღლებულია მეორე ხარისხზე და საშუალოდ. ამრიგად, ვარიაციული სერიის ვარიაცია არის ვარიანტის გადახრების საშუალო კვადრატი არითმეტიკული საშუალოდან და გამოითვლება ფორმულით:

ეს არის ცვალებადობის ყველაზე მნიშვნელოვანი მახასიათებელი და გამოიყენება მრავალი სტატისტიკური ტესტის გამოსათვლელად.

იმის გამო, რომ განსხვავება გამოიხატება როგორც გადახრების კვადრატი, მისი მნიშვნელობა არ შეიძლება გამოყენებულ იქნას საშუალო არითმეტიკასთან შედარებით. ამ მიზნებისათვის იგი გამოიყენება სტანდარტული გადახრა, რომელიც აღინიშნება ნიშნით "სიგმა" ( σ ). იგი ახასიათებს ვარიაციის სერიის ყველა ვარიანტის საშუალო გადახრას არითმეტიკული საშუალოდან იმავე ერთეულებში, როგორც თავად საშუალო, ასე რომ მათი გამოყენება შესაძლებელია ერთად.

სტანდარტული გადახრა განისაზღვრება ფორმულით:

ეს ფორმულა გამოიყენება დაკვირვებების რაოდენობისთვის ( ) მეტია 30. უფრო მცირე რიცხვით სტანდარტული გადახრის მნიშვნელობას ექნება შეცდომა, რომელიც დაკავშირებულია მათემატიკურ მიკერძოებასთან ( - 1). ამასთან დაკავშირებით, უფრო ზუსტი შედეგის მიღება შესაძლებელია სტანდარტული გადახრის გამოთვლის ფორმულაში ასეთი მიკერძოების გათვალისწინებით:

სტანდარტული გადახრა ( ) არის შემთხვევითი ცვლადის სტანდარტული გადახრის შეფასება Xმის მათემატიკურ მოლოდინთან შედარებით, მისი დისპერსიის მიუკერძოებელი შეფასებით.

ღირებულებებისთვის > 30 სტანდარტული გადახრა ( σ ) და სტანდარტული გადახრა ( ) იგივე იქნება ( σ=ს ). ამიტომ, უმეტეს პრაქტიკულ სახელმძღვანელოებში ეს კრიტერიუმები განიხილება, როგორც განსხვავებული მნიშვნელობის მქონე. Excel-ში სტანდარტული გადახრის გამოთვლა შესაძლებელია ფუნქციით =STDEV(დიაპაზონი). და სტანდარტული გადახრის გამოსათვლელად, თქვენ უნდა შექმნათ შესაბამისი ფორმულა.

ფესვის საშუალო კვადრატი ან სტანდარტული გადახრა საშუალებას გაძლევთ განსაზღვროთ რამდენად შეიძლება განსხვავდებოდეს მახასიათებლის მნიშვნელობები საშუალო მნიშვნელობიდან. დავუშვათ, რომ არსებობს ორი ქალაქი ზაფხულში ერთი და იგივე საშუალო დღიური ტემპერატურის მქონე. ამ ქალაქებიდან ერთი მდებარეობს სანაპიროზე, მეორე კი კონტინენტზე. ცნობილია, რომ სანაპიროზე მდებარე ქალაქებში დღისით ტემპერატურის სხვაობა ნაკლებია, ვიდრე შიდა ქალაქებში. აქედან გამომდინარე, დღის ტემპერატურის სტანდარტული გადახრა ზღვისპირა ქალაქთან შედარებით ნაკლები იქნება, ვიდრე მეორე ქალაქში. პრაქტიკაში, ეს ნიშნავს, რომ კონტინენტზე მდებარე ქალაქში ყოველი კონკრეტული დღის ჰაერის საშუალო ტემპერატურა უფრო მეტად განსხვავდება საშუალოდან, ვიდრე სანაპიროზე მდებარე ქალაქში. გარდა ამისა, სტანდარტული გადახრა შესაძლებელს ხდის შეფასდეს შესაძლო ტემპერატურის გადახრები საშუალოდან ალბათობის საჭირო დონით.

ალბათობის თეორიის მიხედვით, ფენომენებში, რომლებიც ემორჩილებიან ნორმალურ განაწილების კანონს, არსებობს მკაცრი კავშირი საშუალო არითმეტიკული მნიშვნელობების, სტანდარტული გადახრასა და ვარიანტებს შორის ( სამი სიგმის წესი). მაგალითად, ცვლადი ატრიბუტის მნიშვნელობების 68.3% არის M ± 1 ფარგლებში σ , 95.5% - M ± 2-ის ფარგლებში σ ხოლო 99,7% - M ± 3 ფარგლებში σ .

სტანდარტული გადახრის მნიშვნელობა შესაძლებელს ხდის ვიმსჯელოთ ვარიაციების სერიის და შესწავლილი ჯგუფის ჰომოგენურობის ბუნებაზე. თუ სტანდარტული გადახრის მნიშვნელობა მცირეა, მაშინ ეს მიუთითებს შესასწავლი ფენომენის საკმარისად მაღალ ჰომოგენურობაზე. საშუალო არითმეტიკული ამ შემთხვევაში უნდა იყოს აღიარებული, როგორც საკმაოდ დამახასიათებელი ამ ვარიაციული სერიის. თუმცა, ძალიან მცირე სიგმა ადამიანს აიძულებს იფიქროს დაკვირვებების ხელოვნურ შერჩევაზე. ძალიან დიდი სიგმით, საშუალო არითმეტიკული ახასიათებს ვარიაციის სერიას ნაკლებად, რაც მიუთითებს შესწავლილი ნიშან-თვისების ან ფენომენის მნიშვნელოვან ცვალებადობაზე ან საკვლევი ჯგუფის ჰეტეროგენულობაზე. თუმცა, სტანდარტული გადახრის მნიშვნელობის შედარება შესაძლებელია მხოლოდ იმავე განზომილების ნიშნებისთვის. მართლაც, თუ შევადარებთ ახალშობილთა და მოზრდილთა წონის მრავალფეროვნებას, ჩვენ ყოველთვის მივიღებთ უფრო მაღალ სიგმას მოზარდებში.

სხვადასხვა განზომილების მახასიათებლების ცვალებადობის შედარება შეიძლება განხორციელდეს გამოყენებით ვარიაციის კოეფიციენტი. იგი გამოხატავს მრავალფეროვნებას საშუალოს პროცენტულად, რაც იძლევა სხვადასხვა ნიშან-თვისებების შედარების საშუალებას. სამედიცინო ლიტერატურაში ცვალებადობის კოეფიციენტი მითითებულია ნიშნით " თან "და მათემატიკაში" » და გამოითვლება ფორმულით:

ვარიაციის კოეფიციენტის მნიშვნელობები 10% -ზე ნაკლები მიუთითებს მცირე გაფანტვაზე, 10-დან 20% -მდე - საშუალოდ, 20% -ზე მეტი - არითმეტიკული საშუალოს გარშემო ძლიერი გაფანტვის შესახებ.

საშუალო არითმეტიკული ჩვეულებრივ გამოითვლება ნიმუშის მონაცემების საფუძველზე. შემთხვევითი ფენომენების გავლენის ქვეშ განმეორებითი კვლევებით, საშუალო არითმეტიკული შეიძლება შეიცვალოს. ეს გამოწვეულია იმით, რომ, როგორც წესი, დაკვირვების შესაძლო ერთეულების მხოლოდ ნაწილი, ანუ შერჩევის პოპულაცია, გამოკვლეულია. შესწავლილი ფენომენის გამომსახველი ყველა შესაძლო ერთეულის შესახებ ინფორმაციის მიღება შესაძლებელია მთლიანი პოპულაციის შესწავლით, რაც ყოველთვის არ არის შესაძლებელი. ამავდროულად, ექსპერიმენტული მონაცემების განზოგადებისთვის საინტერესოა საშუალო სიდიდე ზოგად პოპულაციაში. ამიტომ, შესასწავლი ფენომენის შესახებ ზოგადი დასკვნის ჩამოსაყალიბებლად, შერჩევის პოპულაციის საფუძველზე მიღებული შედეგები სტატისტიკური მეთოდებით უნდა გადავიდეს ზოგად პოპულაციაზე.

იმისათვის, რომ განვსაზღვროთ შეთანხმების ხარისხი სანიმუშო კვლევასა და ზოგად პოპულაციას შორის, საჭიროა შეფასდეს შეცდომის რაოდენობა, რომელიც აუცილებლად წარმოიქმნება ნიმუშის დაკვირვებისას. ასეთ შეცდომას ე.წ წარმომადგენლობითი შეცდომა” ან ”საშუალო არითმეტიკული ცდომილება”. ეს არის, ფაქტობრივად, განსხვავება შერჩევითი სტატისტიკური დაკვირვებით მიღებულ საშუალოებსა და მსგავს მნიშვნელობებს შორის, რომლებიც მიიღება ერთი და იგივე ობიექტის უწყვეტი შესწავლით, ე.ი. ზოგადი მოსახლეობის შესწავლისას. ვინაიდან შერჩევის საშუალო არის შემთხვევითი ცვლადი, ასეთი პროგნოზი კეთდება მკვლევარისთვის ალბათობის მისაღები დონით. სამედიცინო კვლევებში ეს არის მინიმუმ 95%.

წარმომადგენლობითი შეცდომა არ უნდა აგვერიოს სარეგისტრაციო შეცდომებთან ან ყურადღების შეცდომებთან (არასწორი ბეჭდვა, არასწორი გამოთვლები, არასწორი ბეჭდვა და ა.შ.), რაც მინიმუმამდე უნდა იქნას დაყვანილი ექსპერიმენტში გამოყენებული ადეკვატური მეთოდოლოგიითა და ხელსაწყოებით.

წარმომადგენლობითობის შეცდომის სიდიდე დამოკიდებულია როგორც ნიმუშის ზომაზე, ასევე მახასიათებლის ცვალებადობაზე. რაც უფრო დიდია დაკვირვებების რაოდენობა, მით უფრო ახლოსაა ნიმუში საერთო პოპულაციასთან და მით უფრო მცირეა შეცდომა. რაც უფრო ცვალებადია ფუნქცია, მით მეტია სტატისტიკური შეცდომა.

პრაქტიკაში, შემდეგი ფორმულა გამოიყენება ვარიაციულ სერიებში წარმომადგენლობითი შეცდომის დასადგენად:

სად: – წარმომადგენლობითობის შეცდომა;

σ - სტანდარტული გადახრა;

არის ნიმუშში დაკვირვებების რაოდენობა.

ფორმულიდან ჩანს, რომ საშუალო შეცდომის ზომა პირდაპირპროპორციულია სტანდარტული გადახრის, ანუ შესასწავლი ნიშან-თვისების ცვალებადობისა და უკუპროპორციულია დაკვირვებების რაოდენობის კვადრატულ ფესვთან.

ფარდობითი მნიშვნელობების გაანგარიშების საფუძველზე სტატისტიკური ანალიზის ჩატარებისას, ვარიაციის სერიის აგება სავალდებულო არ არის. ამ შემთხვევაში, შედარებითი ინდიკატორების საშუალო შეცდომის დადგენა შეიძლება განხორციელდეს გამარტივებული ფორმულის გამოყენებით:

სად: - ფარდობითი ინდიკატორის მნიშვნელობა, გამოხატული პროცენტულად, ppm და ა.შ.;

- P-ის საპასუხო და გამოხატული როგორც (1-P), (100-P), (1000-P) და ა.შ., იმის მიხედვით, თუ რა საფუძველზე გამოითვლება მაჩვენებელი;

არის ნიმუშში დაკვირვებების რაოდენობა.

ამასთან, ფარდობითი მნიშვნელობებისთვის წარმომადგენლობითი შეცდომის გამოსათვლელად მითითებული ფორმულა შეიძლება გამოყენებულ იქნას მხოლოდ მაშინ, როდესაც ინდიკატორის მნიშვნელობა მის ბაზაზე ნაკლებია. ინტენსიური ინდიკატორების გამოთვლის რიგ შემთხვევებში ეს პირობა არ სრულდება და ინდიკატორი შეიძლება გამოიხატოს 100% ან 1000%o-ზე მეტი რიცხვით. ასეთ სიტუაციაში აგებულია ვარიაციის სერია და წარმომადგენლობითი შეცდომა გამოითვლება საშუალო მნიშვნელობების ფორმულის გამოყენებით, სტანდარტული გადახრის საფუძველზე.

საერთო პოპულაციაში საშუალო არითმეტიკული მნიშვნელობის პროგნოზირება ხორციელდება ორი მნიშვნელობის მითითებით - მინიმალური და მაქსიმალური. შესაძლო გადახრების ამ უკიდურეს მნიშვნელობებს, რომლის ფარგლებშიც შეიძლება მერყეობდეს საერთო პოპულაციის სასურველი საშუალო მნიშვნელობა, ეწოდება " ნდობის საზღვრები».

ალბათობის თეორიის პოსტულატებმა დაამტკიცეს, რომ მახასიათებლის ნორმალური განაწილებით 99,7% ალბათობით, საშუალოს გადახრების უკიდურესი მნიშვნელობები არ აღემატება წარმომადგენლობითობის სამმაგი შეცდომის მნიშვნელობას ( ± 3 ); 95.5% -ში - არაუმეტეს საშუალო მნიშვნელობის გაორმაგებული საშუალო ცდომილების მნიშვნელობა ( ±2 ); 68.3%-ში - არაუმეტეს ერთი საშუალო შეცდომის მნიშვნელობა ( ± 1 ) (სურ. 9).

P%

ბრინჯი. 9. ნორმალური განაწილების ალბათობის სიმკვრივე.

გაითვალისწინეთ, რომ ზემოაღნიშნული განცხადება მართალია მხოლოდ იმ მახასიათებლისთვის, რომელიც ემორჩილება გაუსის განაწილების ნორმალურ კანონს.

ექსპერიმენტული კვლევების უმეტესობა, მათ შორის მედიცინის სფეროში, დაკავშირებულია გაზომვებთან, რომელთა შედეგებს შეუძლია მიიღოს თითქმის ნებისმიერი მნიშვნელობა მოცემულ ინტერვალში, ამიტომ, როგორც წესი, ისინი აღწერილია უწყვეტი შემთხვევითი ცვლადების მოდელით. ამასთან დაკავშირებით, სტატისტიკური მეთოდების უმეტესობა ითვალისწინებს უწყვეტ განაწილებას. ერთ-ერთი ასეთი განაწილება, რომელიც ფუნდამენტურ როლს თამაშობს მათემატიკური სტატისტიკაში, არის ნორმალური, ან გაუსიანი განაწილება.

ეს გამოწვეულია მთელი რიგი მიზეზების გამო.

1. უპირველეს ყოვლისა, მრავალი ექსპერიმენტული დაკვირვება შეიძლება წარმატებით აღიწეროს ნორმალური განაწილების გამოყენებით. დაუყოვნებლივ უნდა აღინიშნოს, რომ არ არსებობს ემპირიული მონაცემების განაწილება, რომელიც იქნება ზუსტად ნორმალური, რადგან ნორმალურად განაწილებული შემთხვევითი ცვლადი არის დიაპაზონში დან მდე, რაც არასდროს ხდება პრაქტიკაში. თუმცა, ნორმალური განაწილება ძალიან ხშირად კარგი მიახლოებაა.

ტარდება თუ არა ადამიანის სხეულის წონის, სიმაღლის და სხვა ფიზიოლოგიური პარამეტრების გაზომვები - ყველგან შემთხვევითი ფაქტორების ძალიან დიდი რაოდენობა (ბუნებრივი მიზეზები და გაზომვის შეცდომები) გავლენას ახდენს შედეგებზე. და, როგორც წესი, თითოეული ამ ფაქტორის გავლენა უმნიშვნელოა. გამოცდილება გვიჩვენებს, რომ ასეთ შემთხვევებში შედეგები დაახლოებით ნორმალურად გადანაწილდება.

2. შემთხვევით ნიმუშთან დაკავშირებული მრავალი განაწილება, ამ უკანასკნელის მოცულობის მატებასთან ერთად, ხდება ნორმალური.

3. ნორმალურ განაწილებას კარგად ერგება სხვა უწყვეტი განაწილების (მაგალითად, ასიმეტრიული) მიახლოებითი აღწერა.

4. ნორმალურ განაწილებას აქვს მთელი რიგი ხელსაყრელი მათემატიკური თვისებები, რამაც დიდწილად უზრუნველყო მისი ფართო გამოყენება სტატისტიკაში.

ამავდროულად, უნდა აღინიშნოს, რომ სამედიცინო მონაცემებში არის მრავალი ექსპერიმენტული განაწილება, რომელთა აღწერა შეუძლებელია ნორმალური განაწილების მოდელით. ამისათვის სტატისტიკამ შეიმუშავა მეთოდები, რომლებსაც ჩვეულებრივ უწოდებენ "არაპარამეტრულ".

სტატისტიკური მეთოდის არჩევა, რომელიც შესაფერისია კონკრეტული ექსპერიმენტის მონაცემების დასამუშავებლად, უნდა მოხდეს იმის მიხედვით, მიეკუთვნება თუ არა მიღებული მონაცემები ნორმალურ განაწილების კანონს. ნიშნის ნორმალურ განაწილების კანონთან დაქვემდებარების ჰიპოთეზის ტესტირება ტარდება სიხშირის განაწილების ჰისტოგრამის (გრაფიკის), ასევე რიგი სტატისტიკური კრიტერიუმების გამოყენებით. Მათ შორის:

ასიმეტრიის კრიტერიუმი ( );

ქურტოზის შემოწმების კრიტერიუმები ( );

შაპირო-ვილქსის კრიტერიუმი ( ) .

თითოეული პარამეტრისთვის ტარდება მონაცემთა განაწილების ბუნების ანალიზი (მას ასევე უწოდებენ განაწილების ნორმალურობის ტესტს). იმისთვის, რომ დარწმუნებით ვიმსჯელოთ პარამეტრის განაწილების ნორმალურ კანონთან შესაბამისობაზე, საჭიროა საკმარისად დიდი რაოდენობის სადამკვირვებლო ერთეული (მინიმუმ 30 მნიშვნელობა).

ნორმალური განაწილებისთვის, დახრილობისა და ქურტოზის კრიტერიუმები იღებენ მნიშვნელობას 0. თუ განაწილება გადატანილია მარჯვნივ. > 0 (პოზიტიური ასიმეტრია), თან < 0 - график распределения смещен влево (отрицательная асимметрия). Критерий асимметрии проверяет форму кривой распределения. В случае нормального закона =0. ზე > 0 განაწილების მრუდი უფრო მკვეთრია, თუ < 0 пик более сглаженный, чем функция нормального распределения.

ნორმალურობის შესამოწმებლად Shapiro-Wilks ტესტის გამოყენებით, საჭიროა ამ კრიტერიუმის მნიშვნელობის პოვნა სტატისტიკური ცხრილების გამოყენებით მნიშვნელოვნების საჭირო დონეზე და დაკვირვების ერთეულების რაოდენობის მიხედვით (თავისუფლების ხარისხი). დანართი 1. ნორმალურობის ჰიპოთეზა უარყოფილია ამ კრიტერიუმის მცირე მნიშვნელობებისთვის, როგორც წესი, <0,8.

დაჯგუფება- ეს არის მოსახლეობის დაყოფა ჯგუფებად, რომლებიც გარკვეულწილად ერთგვაროვანია.

სამსახურის დავალება. ონლაინ კალკულატორით შეგიძლიათ:

  • ვარიაციის სერიის შექმნა, ააგეთ ჰისტოგრამა და მრავალკუთხედი;
  • ვარიაციის ინდიკატორების პოვნა (საშუალო, რეჟიმი (მათ შორის გრაფიკულად), მედიანა, ცვალებადობის დიაპაზონი, კვარტილები, დეცილები, დიფერენციაციის კვარტალური კოეფიციენტი, ვარიაციის კოეფიციენტი და სხვა ინდიკატორები);

ინსტრუქცია. სერიის დასაჯგუფებლად, თქვენ უნდა აირჩიოთ მიღებული ვარიაციის სერიის ტიპი (დისკრეტული ან ინტერვალი) და მიუთითოთ მონაცემების რაოდენობა (სტრიქონების რაოდენობა). მიღებული გამოსავალი ინახება Word ფაილში (იხილეთ სტატისტიკური მონაცემების დაჯგუფების მაგალითი).

თუ დაჯგუფება უკვე გაკეთებულია და დისკრეტული ვარიაციის სერიაან ინტერვალის სერია, მაშინ უნდა გამოიყენოთ ონლაინ კალკულატორი Variation ინდიკატორები. ჰიპოთეზის ტესტირება განაწილების ტიპის შესახებდამზადებულია სერვისის გამოყენებით Study of form distribution.

სტატისტიკური დაჯგუფების სახეები

ვარიაციების სერია. დისკრეტული შემთხვევითი ცვლადის დაკვირვების შემთხვევაში, იგივე მნიშვნელობა შეიძლება რამდენჯერმე შეგვხვდეს. შემთხვევითი x i ცვლადის ასეთი მნიშვნელობები ჩაწერილია, რაც მიუთითებს n i რამდენჯერ გამოჩნდება n დაკვირვებაში, ეს არის ამ მნიშვნელობის სიხშირე.
უწყვეტი შემთხვევითი ცვლადის შემთხვევაში დაჯგუფება გამოიყენება პრაქტიკაში.
  1. ტიპოლოგიური დაჯგუფება- ეს არის შესწავლილი თვისობრივად ჰეტეროგენული მოსახლეობის დაყოფა კლასებად, სოციალურ-ეკონომიკურ ტიპებად, ერთეულთა ერთგვაროვან ჯგუფებად. ამ დაჯგუფების შესაქმნელად გამოიყენეთ დისკრეტული ვარიაციული სერიის პარამეტრი.
  2. სტრუქტურული დაჯგუფება ე.წ, რომელშიც ერთგვაროვანი პოპულაცია იყოფა ჯგუფებად, რომლებიც ახასიათებენ მის სტრუქტურას ზოგიერთი განსხვავებული მახასიათებლის მიხედვით. ამ დაჯგუფების შესაქმნელად გამოიყენეთ ინტერვალის სერიის პარამეტრი.
  3. დაჯგუფება, რომელიც ავლენს შესწავლილ ფენომენებსა და მათ მახასიათებლებს შორის კავშირს, ე.წ ანალიტიკური ჯგუფი(იხილეთ სერიების ანალიტიკური დაჯგუფება).

მაგალითი #1. ცხრილი 2-ის მიხედვით, შექმენით სადისტრიბუციო სერია რუსეთის ფედერაციის 40 კომერციული ბანკისთვის. მიღებული განაწილების სერიების მიხედვით განსაზღვრეთ: საშუალო მოგება ერთ კომერციულ ბანკზე, საკრედიტო ინვესტიციები საშუალოდ ერთ კომერციულ ბანკზე, მოგების მოდალური და მედიანური ღირებულება; კვარტილები, დეცილები, ვარიაციის დიაპაზონი, საშუალო წრფივი გადახრა, სტანდარტული გადახრა, ვარიაციის კოეფიციენტი.

გამოსავალი:
თავში "სტატისტიკური სერიის ტიპი"აირჩიეთ დისკრეტული სერია. დააჭირეთ ჩასმა Excel-დან. ჯგუფების რაოდენობა: Sturgess-ის ფორმულის მიხედვით

სტატისტიკური დაჯგუფების აგების პრინციპები

აღმავალი რიგით დალაგებულ დაკვირვებების სერიას ვარიაციის სერია ეწოდება. დაჯგუფების ნიშანიარის ნიშანი, რომლითაც მოსახლეობა იყოფა ცალკეულ ჯგუფებად. მას ჯგუფის საფუძველს უწოდებენ. დაჯგუფება შეიძლება დაფუძნდეს როგორც რაოდენობრივ, ასევე თვისობრივ მახასიათებლებზე.
დაჯგუფების საფუძვლის განსაზღვრის შემდეგ უნდა გადაწყდეს საკითხი ჯგუფების რაოდენობის შესახებ, რომლებშიც უნდა დაიყოს საკვლევი პოპულაცია.

სტატისტიკური მონაცემების დასამუშავებლად პერსონალური კომპიუტერების გამოყენებისას ობიექტის ერთეულების დაჯგუფება ხორციელდება სტანდარტული პროცედურების გამოყენებით.
ერთ-ერთი ასეთი პროცედურა ეფუძნება Sturgess-ის ფორმულის გამოყენებას ჯგუფების ოპტიმალური რაოდენობის დასადგენად:

k = 1+3.322*lg(N)

სადაც k არის ჯგუფების რაოდენობა, N არის მოსახლეობის ერთეულების რაოდენობა.

ნაწილობრივი ინტერვალების სიგრძე გამოითვლება როგორც h=(x max -x min)/k

შემდეგ დათვალეთ დაკვირვებების დარტყმების რაოდენობა ამ ინტერვალებში, რომლებიც აღებულია როგორც სიხშირე n i. რამდენიმე სიხშირე, რომელთა მნიშვნელობები 5-ზე ნაკლებია (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
ახალი მნიშვნელობებით აღებულია x i =(c i-1 +c i)/2 ინტერვალების შუა წერტილები.

მაგალითი #3. 5% თვით შემთხვევითი შერჩევის შედეგად მიღებული იქნა პროდუქტების შემდეგი განაწილება ტენიანობის მიხედვით. გამოთვალეთ: 1) ტენიანობის საშუალო პროცენტი; 2) ტენიანობის ცვალებადობის დამახასიათებელი ინდიკატორები.
გამოსავალი მიიღეს კალკულატორის გამოყენებით: მაგალითი No1

შექმენით ვარიაციების სერია. ნაპოვნი სერიების საფუძველზე შექმენით განაწილების პოლიგონი, ჰისტოგრამა და კუმულაცია. განსაზღვრეთ რეჟიმი და მედიანა.
გადაწყვეტის ჩამოტვირთვა

მაგალითი. შერჩევითი დაკვირვების შედეგების მიხედვით (ნიმუში A დანართი):
ა) გააკეთე ვარიაციების სერია;
ბ) გამოთვალოს ფარდობითი სიხშირეები და დაგროვილი ფარდობითი სიხშირეები;
გ) მრავალკუთხედის აშენება;
დ) ემპირიული განაწილების ფუნქციის შედგენა;
ე) გამოსახოს ემპირიული განაწილების ფუნქცია;
ვ) გამოვთვალოთ რიცხვითი მახასიათებლები: საშუალო არითმეტიკული, ვარიაცია, სტანდარტული გადახრა. გამოსავალი

ცხრილში 4 (დანართი 1) მოცემულ მონაცემებზე დაყრდნობით და თქვენი ვარიანტის შესაბამისი, შეასრულეთ:

  1. სტრუქტურული დაჯგუფების საფუძველზე ააგეთ ვარიაციური სიხშირისა და კუმულაციური განაწილების სერიები თანაბარი დახურული ინტერვალების გამოყენებით, ჯგუფების რაოდენობა 6-ია. შედეგები წარმოადგინეთ ცხრილში და გრაფიკულად.
  2. გაანალიზეთ ვარიაციული განაწილების სერია გამოთვლებით:
    • მახასიათებლის საშუალო არითმეტიკული მნიშვნელობა;
    • რეჟიმი, მედიანა, 1-ლი მეოთხედი, 1-ლი და მე-9 დეცილი;
    • სტანდარტული გადახრა;
    • ცვალებადობის კოეფიციენტი.
  3. გამოიტანე დასკვნები.

საჭიროა: სერიის რანჟირება, ინტერვალის განაწილების სერიების აგება, საშუალო, საშუალო დისპერსიის, რეჟიმი და მედიანა დიაპაზონის და ინტერვალური სერიების გამოთვლა.

საწყის მონაცემებზე დაყრდნობით ააგეთ დისკრეტული ვარიაციული სერია; წარმოადგინეთ იგი სტატისტიკური ცხრილისა და სტატისტიკური გრაფიკების სახით. 2). საწყის მონაცემებზე დაყრდნობით შექმენით ინტერვალის ვარიაციის სერია თანაბარი ინტერვალებით. თავად შეარჩიეთ ინტერვალების რაოდენობა და აუხსენით ეს არჩევანი. წარმოადგინეთ მიღებული ვარიაციების სერია სტატისტიკური ცხრილისა და სტატისტიკური გრაფიკების სახით. მიუთითეთ გამოყენებული ცხრილებისა და გრაფიკების ტიპები.

საპენსიო ფონდში მომხმარებელთა მომსახურების საშუალო ხანგრძლივობის დასადგენად, რომლის მომხმარებელთა რაოდენობაც ძალიან დიდია, ჩატარდა 100 მომხმარებლის გამოკითხვა თვითმმართველობის შემთხვევითი არაგანმეორებადი შერჩევის სქემის მიხედვით. კვლევის შედეგები მოცემულია ცხრილში. იპოვე:
ა) საზღვრები, რომლებშიც 0,9946 ალბათობით დგინდება საპენსიო ფონდის ყველა კლიენტის მომსახურების საშუალო დრო;
ბ) ალბათობა იმისა, რომ 6 წუთზე ნაკლები მომსახურების ხანგრძლივობის მქონე ფონდის ყველა კლიენტის წილი განსხვავდება ასეთი კლიენტების წილისგან ნიმუშში არაუმეტეს 10%-ით (აბსოლუტური მნიშვნელობით);
გ) ხელახალი შერჩევის მოცულობა, რომლის დროსაც 0,9907 ალბათობით შეიძლება ითქვას, რომ ფონდის ყველა კლიენტის წილი, რომელთა მომსახურების ხანგრძლივობა 6 წუთზე ნაკლებია, განსხვავდება ასეთი კლიენტების წილისგან ნიმუშში არაუმეტეს 10%-ით ( აბსოლუტური მნიშვნელობა).
2. 1-ლი ამოცანის მიხედვით, პირსონის X 2 ტესტის გამოყენებით, მნიშვნელოვნების დონეზე α = 0,05, შეამოწმეთ ჰიპოთეზა, რომ შემთხვევითი ცვლადი X - მომხმარებლის მომსახურების დრო - განაწილებულია ნორმალური კანონის მიხედვით. ააგეთ ერთ ნახაზზე ემპირიული განაწილების ჰისტოგრამა და შესაბამისი ნორმალური მრუდი.
გადაწყვეტის ჩამოტვირთვა

მოცემულია 100 ელემენტის ნიმუში. აუცილებელი:

  1. შექმენით რანჟირებული ვარიაციული სერია;
  2. იპოვეთ სერიის მაქსიმალური და მინიმალური პირობები;
  3. იპოვეთ ვარიაციის დიაპაზონი და ოპტიმალური ინტერვალების რაოდენობა ინტერვალის სერიის ასაგებად. იპოვეთ ინტერვალის სერიის ინტერვალის სიგრძე;
  4. შექმენით ინტერვალის სერია. იპოვნეთ შედგენილ ინტერვალებში მოხვედრილი ნიმუშის ელემენტების სიხშირე. იპოვეთ თითოეული ინტერვალის შუა წერტილები;
  5. ააგეთ ჰისტოგრამა და სიხშირეების მრავალკუთხედი. შედარება ნორმალურ განაწილებასთან (ანალიტიკურად და გრაფიკულად);
  6. დახაზეთ ემპირიული განაწილების ფუნქცია;
  7. ნიმუშის რიცხვითი მახასიათებლების გამოთვლა: ნიმუშის საშუალო და ცენტრალური ნიმუშის მომენტი;
  8. გამოთვალეთ სტანდარტული გადახრის, დახრილობის და ქურტოზის სავარაუდო მნიშვნელობები (MS Excel საანალიზო პაკეტის გამოყენებით). შეადარეთ სავარაუდო გამოთვლილი მნიშვნელობები ზუსტ მნიშვნელობებთან (გამოითვლება MS Excel ფორმულების გამოყენებით);
  9. შეადარეთ შერჩეული გრაფიკული მახასიათებლები შესაბამის თეორიულთან.
გადაწყვეტის ჩამოტვირთვა

ჩვენ გვაქვს შემდეგი ნიმუშის მონაცემები (10% ნიმუში, მექანიკური) გამომუშავებაზე და მოგების ოდენობაზე, მილიონი რუბლი. თავდაპირველი მონაცემებით:
ამოცანა 13.1.
13.1.1. შექმენით საწარმოების განაწილების სტატისტიკური სერია მოგების ოდენობით, თანაბარი ინტერვალებით ხუთი ჯგუფის ჩამოყალიბებით. ნაკვეთების განაწილების სერიის ნაკვეთები.
13.1.2. გამოთვალეთ საწარმოთა განაწილების სერიის რიცხვითი მახასიათებლები მოგების ოდენობით: საშუალო არითმეტიკული, სტანდარტული გადახრა, ვარიაცია, ვარიაციის კოეფიციენტი V. გამოიტანეთ დასკვნები.
ამოცანა 13.2.
13.2.1. დაადგინეთ ის საზღვრები, რომლებშიც 0,997 ალბათობით დადებულია ერთი საწარმოს მოგების ოდენობა საერთო პოპულაციაში.
13.2.2. პირსონის x2-კრიტერიუმის გამოყენებით, α მნიშვნელოვნების დონეზე, შეამოწმეთ ჰიპოთეზა, რომ შემთხვევითი ცვლადი X - მოგების ოდენობა - ნაწილდება ნორმალური კანონის მიხედვით.
ამოცანა 13.3.
13.3.1. განსაზღვრეთ ნიმუშის რეგრესიის განტოლების კოეფიციენტები.
13.3.2. დაადგინეთ წარმოებული პროდუქციის ღირებულებას (X) და თითო საწარმოს მოგების რაოდენობას (Y) შორის კორელაციის არსებობა და ბუნება. დახაზეთ სკატერპლატი და რეგრესიის ხაზი.
13.3.3. გამოთვალეთ წრფივი კორელაციის კოეფიციენტი. სტუდენტის t-ტესტის გამოყენებით შეამოწმეთ კორელაციის კოეფიციენტის მნიშვნელობა. გამოიტანეთ დასკვნა X და Y ფაქტორებს შორის ურთიერთობის სიახლოვის შესახებ ჩადოკის სკალის გამოყენებით.
გაიდლაინები. დავალება 13.3 შესრულებულია ამ სერვისის გამოყენებით.
გადაწყვეტის ჩამოტვირთვა

დავალება. ქვემოთ მოცემული მონაცემები ასახავს კლიენტების მიერ ხელშეკრულებების დადებაზე დახარჯულ დროს. შექმენით წარმოდგენილი მონაცემების ინტერვალის ვარიაციის სერია, ჰისტოგრამა, იპოვნეთ მათემატიკური მოლოდინის მიუკერძოებელი შეფასება, დისპერსიის მიკერძოებული და მიუკერძოებელი შეფასება.

მაგალითი. მე-2 ცხრილის მიხედვით:
1) შექმენით სადისტრიბუციო სერია რუსეთის ფედერაციის 40 კომერციული ბანკისთვის:
ა) მოგების ოდენობით;
ბ) საკრედიტო ინვესტიციების ოდენობით.
2) მიღებული განაწილების სერიების მიხედვით განსაზღვრეთ:
ა) საშუალო მოგება კომერციულ ბანკზე;
ბ) საკრედიტო ინვესტიციები საშუალოდ კომერციულ ბანკზე;
გ) მოგების მოდალური და მედიანური ღირებულება; კვარტილები, დეცილები;
დ) საკრედიტო ინვესტიციების მოდალური და მედიანური ღირებულება.
3) 1 პუნქტში მიღებული განაწილების სერიების მიხედვით გამოთვალეთ:
ა) ვარიაციის დიაპაზონი;
ბ) საშუალო წრფივი გადახრა;
გ) სტანდარტული გადახრა;
დ) ვარიაციის კოეფიციენტი.
ჩაწერეთ საჭირო გამოთვლები ცხრილის სახით. გაანალიზეთ შედეგები. გამოიტანეთ საკუთარი დასკვნები.
დახაზეთ მიღებული განაწილების სერია. გრაფიკულად განსაზღვრეთ რეჟიმი და მედიანა.

გამოსავალი:
თანაბარი ინტერვალებით დაჯგუფების ასაგებად გამოვიყენებთ სერვისს სტატისტიკური მონაცემების დაჯგუფება.

სურათი 1 - პარამეტრების შეყვანა

პარამეტრების აღწერა
ხაზების რაოდენობა: ნედლეული მონაცემების რაოდენობა. თუ სერიის განზომილება მცირეა, მიუთითეთ მისი ნომერი. თუ არჩევანი საკმარისად დიდია, დააჭირეთ ღილაკს ჩასმა Excel-დან.
ჯგუფების რაოდენობა: 0 - ჯგუფების რაოდენობა განისაზღვრება Sturgess-ის ფორმულით.
თუ მითითებულია ჯგუფების კონკრეტული რაოდენობა, მიუთითეთ იგი (მაგალითად, 5).
მწკრივის ტიპი: დისკრეტული სერია.
მნიშვნელოვნების დონე: მაგალითად, 0.954. ეს პარამეტრი დაყენებულია საშუალოს ნდობის ინტერვალის დასადგენად.
ნიმუში: მაგალითად, კეთდება 10%-იანი მექანიკური სინჯის აღება. მიუთითეთ ნომერი 10. ჩვენი მონაცემებისთვის ჩვენ ვაზუსტებთ 100 .

ამ თავის დაუფლების შედეგად სტუდენტმა უნდა: ვიცი

  • ვარიაციის ინდიკატორები და მათი ურთიერთკავშირი;
  • მახასიათებლების განაწილების ძირითადი კანონები;
  • თანხმობის კრიტერიუმების არსი; შეძლებს
  • ცვალებადობისა და მორგების მაჩვენებლების გამოთვლა;
  • განაწილების მახასიათებლების განსაზღვრა;
  • სტატისტიკური განაწილების სერიების ძირითადი რიცხვითი მახასიათებლების შეფასება;

საკუთარი

  • განაწილების სერიების სტატისტიკური ანალიზის მეთოდები;
  • დისპერსიული ანალიზის საფუძვლები;
  • სტატისტიკური განაწილების სერიების შემოწმების მეთოდები განაწილების ძირითად კანონებთან შესაბამისობაში.

ვარიაციის ინდიკატორები

სხვადასხვა სტატისტიკური პოპულაციის თავისებურებების სტატისტიკური შესწავლისას დიდი ინტერესია პოპულაციის ცალკეული სტატისტიკური ერთეულების მახასიათებლის ცვალებადობის, ასევე ამ მახასიათებლის მიხედვით ერთეულების განაწილების ხასიათის შესწავლა. Ვარიაცია -ეს არის განსხვავებები თვისების ინდივიდუალურ მნიშვნელობებში შესწავლილი პოპულაციის ერთეულებს შორის. ვარიაციის შესწავლას დიდი პრაქტიკული მნიშვნელობა აქვს. ცვალებადობის ხარისხით შეიძლება ვიმსჯელოთ ნიშან-თვისების ცვალებადობის საზღვრებზე, ამ ნიშანთვის პოპულაციის ჰომოგენურობაზე, საშუალოს ტიპურობაზე, ვარიაციის განმსაზღვრელ ფაქტორთა ურთიერთობაზე. ვარიაციის ინდიკატორები გამოიყენება სტატისტიკური პოპულაციების დასახასიათებლად და დასალაგებლად.

სტატისტიკური დაკვირვების მასალების შეჯამებისა და დაჯგუფების შედეგები, შედგენილი სტატისტიკური განაწილების სერიების სახით, წარმოადგენს შესწავლილი პოპულაციის ერთეულების მოწესრიგებულ განაწილებას ჯგუფებად დაჯგუფების (ცვლადი) ატრიბუტის მიხედვით. თუ დაჯგუფების საფუძვლად ხარისხობრივი მახასიათებელია მიღებული, მაშინ ასეთი განაწილების სერია ეწოდება ატრიბუტული(განაწილება პროფესიის, სქესის, ფერის და ა.შ.). თუ განაწილების სერია აგებულია რაოდენობრივ საფუძველზე, მაშინ ასეთ სერიას უწოდებენ ვარიაციული(განაწილება სიმაღლის, წონის, ხელფასის და ა.შ.). ვარიაციული სერიის აგება ნიშნავს მოსახლეობის ერთეულების რაოდენობრივი განაწილების დალაგებას ატრიბუტის მნიშვნელობების მიხედვით, ამ მნიშვნელობებით მოსახლეობის ერთეულების რაოდენობის დათვლას (სიხშირე), შედეგების დალაგებას ცხრილში.

ვარიანტის სიხშირის ნაცვლად, შესაძლებელია გამოვიყენოთ მისი თანაფარდობა დაკვირვების მთლიან მოცულობასთან, რომელსაც სიხშირე (ფარდობითი სიხშირე) ეწოდება.

არსებობს ვარიაციის სერიების ორი ტიპი: დისკრეტული და ინტერვალი. დისკრეტული სერია- ეს არის ისეთი ვარიაციული სერია, რომლის აგება ემყარება უწყვეტი ცვლილების ნიშნებს (დისკრეტული ნიშნები). ეს უკანასკნელი მოიცავს საწარმოში დასაქმებულთა რაოდენობას, სახელფასო კატეგორიას, ოჯახში ბავშვების რაოდენობას და ა.შ. დისკრეტული ვარიაციული სერია არის ცხრილი, რომელიც შედგება ორი სვეტისგან. პირველ სვეტში მითითებულია ატრიბუტის სპეციფიკური მნიშვნელობა, ხოლო მეორე - პოპულაციის ერთეულების რაოდენობა ატრიბუტის კონკრეტული მნიშვნელობით. თუ ნიშანს აქვს მუდმივი ცვლილება (შემოსავლის ოდენობა, მომსახურების ხანგრძლივობა, საწარმოს ძირითადი საშუალებების ღირებულება და ა.შ., რომელიც გარკვეულ ფარგლებში შეუძლია მიიღოს ნებისმიერი მნიშვნელობა), მაშინ ამ ნიშნისთვის შესაძლებელია აშენდეს ინტერვალის ვარიაციის სერია.ცხრილს ინტერვალის ვარიაციის სერიის აგებისას ასევე აქვს ორი სვეტი. პირველი მიუთითებს მახასიათებლის მნიშვნელობას ინტერვალში "-დან -მდე" (ოფციები), მეორე - ინტერვალში შემავალი ერთეულების რაოდენობას (სიხშირე). სიხშირე (განმეორების სიხშირე) - ატრიბუტის მნიშვნელობების კონკრეტული ვარიანტის გამეორებების რაოდენობა. ინტერვალები შეიძლება იყოს დახურული და ღია. დახურული ინტერვალები შეზღუდულია ორივე მხრიდან, ე.ი. აქვს საზღვარი ქვედა ("დან") და ზედა ("დან"). ღია ინტერვალებს აქვს ერთი საზღვარი: ზედა ან ქვედა. თუ ოფციები განლაგებულია აღმავალი ან კლებადი თანმიმდევრობით, მაშინ რიგები გამოიძახება რეიტინგული.

ვარიაციული სერიებისთვის, არსებობს ორი ტიპის სიხშირეზე რეაგირების ვარიანტი: კუმულაციური სიხშირე და კუმულაციური სიხშირე. კუმულაციური სიხშირე აჩვენებს რამდენ დაკვირვებას აიღო მახასიათებლის მნიშვნელობა მითითებულ მნიშვნელობაზე ნაკლები მნიშვნელობებით. კუმულაციური სიხშირე განისაზღვრება მოცემული ჯგუფისთვის დამახასიათებელი სიხშირის მნიშვნელობების შეჯამებით წინა ჯგუფის ყველა სიხშირეზე. დაგროვილი სიხშირე ახასიათებს დაკვირვების ერთეულების პროპორციას, რომლებშიც მახასიათებლის მნიშვნელობები არ აღემატება დღის ჯგუფის ზედა ზღვარს. ამრიგად, დაგროვილი სიხშირე აჩვენებს ვარიანტის სპეციფიკურ წონას აგრეგატში, რომლის მნიშვნელობა არ აღემატება მოცემულს. სიხშირე, სიხშირე, აბსოლუტური და ფარდობითი სიმკვრივეები, კუმულაციური სიხშირე და სიხშირე არის ვარიანტის სიდიდის მახასიათებლები.

პოპულაციის სტატისტიკური ერთეულების ნიშნის ცვალებადობა, ისევე როგორც განაწილების ბუნება, შესწავლილია ვარიაციის სერიის ინდიკატორებისა და მახასიათებლების გამოყენებით, რომლებიც მოიცავს სერიის საშუალო დონეს, საშუალო ხაზოვან გადახრას, სტანდარტულ გადახრას, დისპერსიას. , რხევის კოეფიციენტები, ვარიაცია, ასიმეტრია, ქურთოზი და ა.შ.

სადისტრიბუციო ცენტრის დასახასიათებლად გამოიყენება საშუალო მნიშვნელობები. საშუალო არის განზოგადებული სტატისტიკური მახასიათებელი, რომელშიც რაოდენობრივად არის განსაზღვრული ნიშან-თვისების ტიპიური დონე, რომელსაც ფლობენ შესწავლილი პოპულაციის წევრები. ამასთან, შეიძლება იყოს შემთხვევები, როდესაც არითმეტიკული საშუალებები ემთხვევა განაწილების განსხვავებულ ბუნებას, ამიტომ, როგორც ვარიაციული სერიის სტატისტიკური მახასიათებლები, გამოითვლება ეგრეთ წოდებული სტრუქტურული საშუალოები - რეჟიმი, მედიანა, აგრეთვე კვანტილები, რომლებიც ყოფენ განაწილებას სერიები თანაბარ ნაწილად (კვარტილები, დეცილები, პროცენტები და ა.შ.). ).

მოდა -ეს არის ფუნქციის მნიშვნელობა, რომელიც უფრო ხშირად გვხვდება განაწილების სერიაში, ვიდრე მისი სხვა მნიშვნელობები. დისკრეტული სერიებისთვის ეს არის ყველაზე მაღალი სიხშირის ვარიანტი. ინტერვალის ვარიაციულ სერიებში, რეჟიმის დასადგენად, პირველ რიგში საჭიროა განისაზღვროს ის ინტერვალი, რომელშიც ის მდებარეობს, ე.წ. ცვალებად სერიაში თანაბარი ინტერვალებით, მოდალური ინტერვალი განისაზღვრება უმაღლესი სიხშირით, სერიებში არათანაბარი ინტერვალებით - მაგრამ უმაღლესი განაწილების სიმკვრივით. შემდეგ, თანაბარი ინტერვალებით რიგებში რეჟიმის დასადგენად, გამოიყენეთ ფორმულა

სადაც Mo არის მოდის ღირებულება; x Mo - მოდალური ინტერვალის ქვედა ზღვარი; თ-მოდალური ინტერვალის სიგანე; / მო - მოდალური ინტერვალის სიხშირე; / Mo j - პრემოდალური ინტერვალის სიხშირე; / Mo+1 არის პოსტმოდალური ინტერვალის სიხშირე და ამ გამოთვლის ფორმულაში არათანაბარი ინტერვალების მქონე სერიებისთვის, სიხშირეების ნაცვლად / Mo, / Mo, / Mo გამოყენებული უნდა იყოს განაწილების სიმკვრივეები. გონება 0 _| , გონება 0> UMO+"

თუ არსებობს ერთი რეჟიმი, მაშინ შემთხვევითი ცვლადის ალბათობის განაწილებას ეწოდება უნიმოდალური; თუ არსებობს ერთზე მეტი რეჟიმი, მას ეწოდება მულტიმოდალური (პოლიმოდალური, მულტიმოდალური), ორი რეჟიმის შემთხვევაში - ბიმოდალური. როგორც წესი, მულტიმოდალობა მიუთითებს იმაზე, რომ შესასწავლი განაწილება არ შეესაბამება ნორმალურ განაწილების კანონს. ერთგვაროვანი პოპულაციები, როგორც წესი, ხასიათდება უნიმოდალური განაწილებით. Multivertex ასევე მიუთითებს შესწავლილი პოპულაციის ჰეტეროგენულობაზე. ორი ან მეტი წვერის გამოჩენა საჭიროებს მონაცემთა გადაჯგუფებას უფრო ერთგვაროვანი ჯგუფების იზოლირებისთვის.

ინტერვალის ვარიაციის სერიაში, რეჟიმი შეიძლება განისაზღვროს გრაფიკულად ჰისტოგრამის გამოყენებით. ამისათვის, ორი გადამკვეთი ხაზი გაყვანილია ჰისტოგრამის უმაღლესი სვეტის ზედა წერტილებიდან ორი მიმდებარე სვეტის ზედა წერტილებამდე. შემდეგ, მათი გადაკვეთის წერტილიდან, პერპენდიკულარი ქვეითდება აბსცისის ღერძზე. პერპენდიკულარულის შესაბამისი აბსცისაზე ფუნქციის მნიშვნელობა არის რეჟიმი. ხშირ შემთხვევაში, პოპულაციის განზოგადებულ ინდიკატორად დახასიათებისას უპირატესობა ენიჭება რეჟიმს და არა საშუალო არითმეტიკულს.

მედიანა -ეს არის მახასიათებლის ცენტრალური მნიშვნელობა; მას ფლობს რანჟირებული განაწილების სერიის ცენტრალური წევრი. დისკრეტულ სერიებში, მედიანის მნიშვნელობის საპოვნელად, ჯერ დგინდება მისი სერიული ნომერი. ამისათვის, კენტი რაოდენობის ერთეულებით, ერთი ემატება ყველა სიხშირის ჯამს, რიცხვი იყოფა ორზე. თუ არის 1-ების ლუწი რიცხვი, სერიაში იქნება 2 მედიანა 1, ასე რომ, ამ შემთხვევაში მედიანა განისაზღვრება, როგორც 2 მედიანური 1-ის მნიშვნელობების საშუალო. ამრიგად, დისკრეტული ვარიაციის სერიების მედიანა არის მნიშვნელობა, რომელიც ყოფს სერიას ორ ნაწილად, რომლებიც შეიცავს იგივე რაოდენობის ვარიანტებს.

ინტერვალის სერიაში, მედიანის რიგითი რიცხვის დადგენის შემდეგ, მედიანური ინტერვალი იპოვება დაგროვილი სიხშირეებით (სიხშირეებით), შემდეგ კი, მედიანის გამოთვლის ფორმულის გამოყენებით, განისაზღვრება თავად მედიანის მნიშვნელობა:

სადაც მე არის მედიანის მნიშვნელობა; x მე -მედიანური ინტერვალის ქვედა ზღვარი; თ-შუალედური ინტერვალის სიგანე; - განაწილების სერიის სიხშირეების ჯამი; /D - პრემედიანი ინტერვალის დაგროვილი სიხშირე; / მე - მედიანური ინტერვალის სიხშირე.

მედიანა შეგიძლიათ იხილოთ გრაფიკულად კუმულაციის გამოყენებით. ამისათვის, კუმულაციის დაგროვილი სიხშირეების (სიხშირეების) შკალაზე, მედიანის რიგითი რიცხვის შესაბამისი წერტილიდან, აბსცისის ღერძის პარალელურად იხაზება სწორი ხაზი, სანამ არ გადაიკვეთება კუმულაციასთან. გარდა ამისა, მითითებული სწორი ხაზის კუმულატთან გადაკვეთის ადგილიდან, პერპენდიკულარი ეშვება აბსცისის ღერძამდე. ნიშან-თვისების მნიშვნელობა x ღერძზე, რომელიც შეესაბამება შედგენილ ორდინატს (პერპენდიკულარულს) არის მედიანა.

მედიანა ხასიათდება შემდეგი თვისებებით.

  • 1. ეს არ არის დამოკიდებული იმ ატრიბუტების მნიშვნელობებზე, რომლებიც მდებარეობს მის ორივე მხარეს.
  • 2. მას აქვს მინიმალურობის თვისება, რაც ნიშნავს, რომ ატრიბუტის მნიშვნელობების აბსოლუტური გადახრების ჯამი მედიანადან არის მინიმალური მნიშვნელობა ატრიბუტის მნიშვნელობების სხვა მნიშვნელობიდან გადახრასთან შედარებით.
  • 3. ორი განაწილების ცნობილ მედიანასთან გაერთიანებისას შეუძლებელია ახალი განაწილების მედიანური მნიშვნელობის წინასწარ წინასწარ განსაზღვრა.

მედიანის ეს თვისებები ფართოდ გამოიყენება საჯარო სერვისების პუნქტების ადგილმდებარეობის დიზაინში - სკოლები, კლინიკები, ბენზინგასამართი სადგურები, წყლის ტუმბოები და ა.შ. მაგალითად, თუ ქალაქის გარკვეულ კვარტალში იგეგმება პოლიკლინიკის აშენება, მაშინ უფრო მიზანშეწონილია მისი განთავსება კვარტალის ისეთ წერტილში, რომელიც ორად ყოფს არა კვარტალის სიგრძეს, არამედ მცხოვრებთა რაოდენობას.

რეჟიმის, მედიანისა და საშუალო არითმეტიკული თანაფარდობა მიუთითებს მახასიათებლის განაწილების ბუნებაზე აგრეგატში, საშუალებას გაძლევთ შეაფასოთ განაწილების სიმეტრია. თუ x მე მაშინ არის სერიის მარჯვენა ასიმეტრია. ნორმალური განაწილებით X -მე - მო.

კ. პირსონმა, სხვადასხვა ტიპის მრუდების გასწორების საფუძველზე, დაადგინა, რომ ზომიერად ასიმეტრიული განაწილებისთვის, არითმეტიკული საშუალოს, მედიანასა და რეჟიმს შორის მოქმედებს შემდეგი მიახლოებითი მიმართებები:

სადაც მე არის მედიანის მნიშვნელობა; Mo - მოდის ღირებულება; x არითმი - საშუალო არითმეტიკული მნიშვნელობა.

თუ საჭიროა ვარიაციის სერიის სტრუქტურის უფრო დეტალურად შესწავლა, მაშინ გამოითვლება დამახასიათებელი მნიშვნელობები, მედიანის მსგავსი. ასეთი მახასიათებლების მნიშვნელობები ყოფს ყველა განაწილების ერთეულს თანაბარ რიცხვებად, მათ უწოდებენ კვანტილებს ან გრადიენტებს. კვანტილები იყოფა კვანტილებად, დეცილებად, პროცენტულებად და ა.შ.

მეოთხედები მოსახლეობას ყოფს ოთხ თანაბარ ნაწილად. პირველი მეოთხედი გამოითვლება მედიანას მსგავსად, პირველი კვარტლის გამოთვლის ფორმულის გამოყენებით, წინასწარ განსაზღვრული პირველი კვარტალური ინტერვალით:

სადაც Qi არის პირველი მეოთხედის მნიშვნელობა; xQ ^ -პირველი მეოთხედის ინტერვალის ქვედა ზღვარი; - პირველი კვარტალური ინტერვალის სიგანე; /, - ინტერვალის სერიის სიხშირეები;

დაგროვილი სიხშირე პირველი მეოთხედის ინტერვალის წინა ინტერვალში; Jq ( - პირველი მეოთხედის ინტერვალის სიხშირე.

პირველი მეოთხედი აჩვენებს, რომ მოსახლეობის ერთეულების 25% ნაკლებია მის ღირებულებაზე, ხოლო 75% მეტია. მეორე მეოთხედი უდრის მედიანას, ე.ი. Q2 =მე.

ანალოგიით, მესამე კვარტალი გამოითვლება, მანამდე იპოვა მესამე კვარტალური ინტერვალი:

სად არის მესამე მეოთხედის ინტერვალის ქვედა ზღვარი; - მესამე მეოთხედის ინტერვალის სიგანე; /, - ინტერვალის სერიის სიხშირეები; /X"-დაგროვილი სიხშირე წინა ინტერვალში

მესამე მეოთხედი ინტერვალი; Jq - მესამე მეოთხედის ინტერვალის სიხშირე.

მესამე მეოთხედი აჩვენებს, რომ მოსახლეობის ერთეულების 75% ნაკლებია მის ღირებულებაზე, ხოლო 25% მეტია.

განსხვავება მესამე და პირველ კვარტალებს შორის არის კვარტლთაშორისი ინტერვალი:

სადაც Aq არის ინტერვალის ინტერვალის მნიშვნელობა; Q 3 -მესამე მეოთხედის ღირებულება; Q, - პირველი მეოთხედის მნიშვნელობა.

დეცილები მოსახლეობას ყოფენ 10 თანაბარ ნაწილად. დეცილი არის მახასიათებლის მნიშვნელობა განაწილების სერიაში, რომელიც შეესაბამება მოსახლეობის მეათედს. კვარტილების ანალოგიით, პირველი დეცილი აჩვენებს, რომ მოსახლეობის ერთეულების 10% მის ღირებულებაზე ნაკლებია, ხოლო 90% მეტია, ხოლო მეცხრე დეცილი ცხადყოფს, რომ მოსახლეობის ერთეულების 90% მის ღირებულებაზე ნაკლებია, ხოლო 10% არის. მეტი. მეცხრე და პირველი დეცილების შეფარდება, ე.ი. დეცილური კოეფიციენტი, რომელიც ფართოდ გამოიყენება შემოსავლების დიფერენციაციის შესწავლისას ყველაზე მდიდარი მოსახლეობის 10% და ყველაზე ნაკლებად მდიდარი მოსახლეობის 10% შემოსავლის დონის შეფარდების გასაზომად. პროცენტული მაჩვენებელი ყოფს რეიტინგულ მოსახლეობას 100 თანაბარ ნაწილად. პროცენტების გამოთვლა, მნიშვნელობა და გამოყენება დეცილების მსგავსია.

კვარტილები, დეცილები და სხვა სტრუქტურული მახასიათებლები შეიძლება განისაზღვროს გრაფიკულად მედიანასთან ანალოგიით კუმულაციის გამოყენებით.

ვარიაციის ზომის გასაზომად გამოიყენება შემდეგი ინდიკატორები: ვარიაციის დიაპაზონი, საშუალო წრფივი გადახრა, სტანდარტული გადახრა და ვარიაცია. ვარიაციის დიაპაზონის სიდიდე მთლიანად დამოკიდებულია სერიის უკიდურესი წევრების განაწილების შემთხვევითობაზე. ეს მაჩვენებელი საინტერესოა იმ შემთხვევებში, როდესაც მნიშვნელოვანია იცოდეთ რა არის ატრიბუტის მნიშვნელობებში რყევების ამპლიტუდა:

სად R-ვარიაციის დიაპაზონის მნიშვნელობა; x max - მახასიათებლის მაქსიმალური მნიშვნელობა; x tt -ატრიბუტის მინიმალური მნიშვნელობა.

ვარიაციის დიაპაზონის გაანგარიშებისას მხედველობაში არ მიიღება სერიის წევრების დიდი უმრავლესობის მნიშვნელობა, ხოლო ვარიაცია ასოცირდება სერიის წევრის თითოეულ მნიშვნელობასთან. ეს ნაკლოვანება თავისუფალია ინდიკატორებისგან, რომლებიც მიიღება საშუალო ნიშან-თვისებების ცალკეული მნიშვნელობების გადახრებიდან მათი საშუალო მნიშვნელობიდან: საშუალო წრფივი გადახრა და სტანდარტული გადახრა. პირდაპირი კავშირია ინდივიდუალურ გადახრებს საშუალოდან და კონკრეტული მახასიათებლის რყევებს შორის. რაც უფრო ძლიერია არასტაბილურობა, მით მეტია გადახრების აბსოლუტური ზომა საშუალოდან.

საშუალო წრფივი გადახრა არის ცალკეული ვარიანტების გადახრების აბსოლუტური მნიშვნელობების არითმეტიკული საშუალო მათი საშუალო მნიშვნელობიდან.

საშუალო წრფივი გადახრა დაუჯგუფებელი მონაცემებისთვის

სადაც / pr - საშუალო წრფივი გადახრის მნიშვნელობა; x, - - მახასიათებლის მნიშვნელობა; X - P -მოსახლეობის ერთეულების რაოდენობა.

დაჯგუფებული სერიების საშუალო წრფივი გადახრა

სადაც / vz - საშუალო წრფივი გადახრის მნიშვნელობა; x, - მახასიათებლის მნიშვნელობა; X -თვისების საშუალო მნიშვნელობა შესწავლილი პოპულაციისთვის; / - ცალკეულ ჯგუფში მოსახლეობის ერთეულების რაოდენობა.

გადახრის ნიშნები ამ შემთხვევაში იგნორირებულია, წინააღმდეგ შემთხვევაში ყველა გადახრის ჯამი იქნება ნულის ტოლი. საშუალო წრფივი გადახრა, რომელიც დამოკიდებულია გაანალიზებული მონაცემების დაჯგუფებაზე, გამოითვლება სხვადასხვა ფორმულების გამოყენებით: დაჯგუფებული და არაჯგუფური მონაცემებისთვის. საშუალო წრფივი გადახრა, თავისი პირობითობის გამო, ვარიაციის სხვა ინდიკატორებისგან განცალკევებით, პრაქტიკაში შედარებით იშვიათად გამოიყენება (კერძოდ, სახელშეკრულებო ვალდებულებების შესრულების დასახასიათებლად მიწოდების ერთგვაროვნების თვალსაზრისით; საგარეო სავაჭრო ბრუნვის ანალიზში, თანამშრომლების შემადგენლობა, წარმოების რიტმი, პროდუქციის ხარისხი, წარმოების ტექნოლოგიური მახასიათებლების გათვალისწინებით და ა.შ.).

სტანდარტული გადახრა ახასიათებს, თუ რამდენად გადახრის საშუალოდ შესწავლილი ნიშან-თვისების ინდივიდუალური მნიშვნელობები პოპულაციის საშუალო მნიშვნელობიდან და გამოიხატება შესწავლილი მახასიათებლის ერთეულებში. სტანდარტული გადახრა, როგორც ვარიაციის ერთ-ერთი მთავარი საზომი, ფართოდ გამოიყენება ერთგვაროვან პოპულაციაში ნიშან-თვისების ცვალებადობის საზღვრების შესაფასებლად, ნორმალური განაწილების მრუდის ორდინატების მნიშვნელობების განსაზღვრისას, აგრეთვე. გამოთვლები, რომლებიც დაკავშირებულია ნიმუშზე დაკვირვების ორგანიზებასთან და ნიმუშის მახასიათებლების სიზუსტის დადგენასთან. დაუჯგუფებელი მონაცემების სტანდარტული გადახრა გამოითვლება შემდეგი ალგორითმის მიხედვით: საშუალოდან ყოველი გადახრა კვადრატდება, ყველა კვადრატი ჯამდება, რის შემდეგაც კვადრატების ჯამი იყოფა სერიების ტერმინების რაოდენობაზე და კვადრატული ფესვი აღებულია. კოეფიციენტი:

სადაც Iip - სტანდარტული გადახრის მნიშვნელობა; Xj-ფუნქციის ღირებულება; X- ატრიბუტის საშუალო მნიშვნელობა შესწავლილი პოპულაციისთვის; P -მოსახლეობის ერთეულების რაოდენობა.

დაჯგუფებული გაანალიზებული მონაცემებისთვის, მონაცემების სტანდარტული გადახრა გამოითვლება შეწონილი ფორმულის გამოყენებით

სად - სტანდარტული გადახრის მნიშვნელობა; Xj-ფუნქციის ღირებულება; X -თვისების საშუალო მნიშვნელობა შესწავლილი პოპულაციისთვის; fx-მოსახლეობის ერთეულების რაოდენობა კონკრეტულ ჯგუფში.

ორივე შემთხვევაში ფესვის ქვეშ მყოფი გამოხატულება ეწოდება დისპერსიას. ამრიგად, ვარიაცია გამოითვლება, როგორც ნიშან-თვისებების მნიშვნელობების გადახრების საშუალო კვადრატი მათი საშუალო მნიშვნელობიდან. შეუწონავი (მარტივი) მახასიათებლის მნიშვნელობებისთვის, ვარიაცია განისაზღვრება შემდეგნაირად:

შეწონილი დამახასიათებელი მნიშვნელობებისთვის

ასევე არსებობს დისპერსიის გამოთვლის სპეციალური გამარტივებული გზა: ზოგადი თვალსაზრისით

შეუწონავი (მარტივი) მახასიათებლების მნიშვნელობებისთვის შეწონილი დამახასიათებელი მნიშვნელობებისთვის
პირობითი ნულიდან დათვლის მეთოდის გამოყენებით

სადაც a 2 - დისპერსიის მნიშვნელობა; x, - - მახასიათებლის მნიშვნელობა; X -მახასიათებლის საშუალო მნიშვნელობა, თ-ჯგუფის ინტერვალის მნიშვნელობა, t 1 -წონა (A =

დისპერსიას აქვს დამოუკიდებელი გამოხატულება სტატისტიკაში და ვარიაციის ერთ-ერთი ყველაზე მნიშვნელოვანი მაჩვენებელია. იგი იზომება შესასწავლი ნიშან-თვისების საზომი ერთეულების კვადრატის შესაბამისი ერთეულებით.

დისპერსიას აქვს შემდეგი თვისებები.

  • 1. მუდმივი მნიშვნელობის დისპერსია არის ნული.
  • 2. ფუნქციის ყველა მნიშვნელობის შემცირება A-ს იგივე მნიშვნელობით არ ცვლის დისპერსიის მნიშვნელობას. ეს ნიშნავს, რომ გადახრების საშუალო კვადრატი შეიძლება გამოითვალოს არა ატრიბუტის მოცემული მნიშვნელობებით, არამედ მათი გადახრებიდან გარკვეული მუდმივი რიცხვიდან.
  • 3. ფუნქციის ყველა მნიშვნელობის შემცირება ჯერ ამცირებს დისპერსიას შიგნით 2-ჯერ, ხოლო სტანდარტული გადახრა - in ჯერ, ე.ი. ყველა ატრიბუტის მნიშვნელობა შეიძლება დაიყოს რაიმე მუდმივი რიცხვით (ვთქვათ, სერიების ინტერვალის მნიშვნელობით), სტანდარტული გადახრა შეიძლება გამოითვალოს და შემდეგ გავამრავლოთ მუდმივ რიცხვზე.
  • 4. თუ გამოვთვლით გადახრების საშუალო კვადრატს რომელიმე მნიშვნელობიდან და ზეგარკვეულწილად განსხვავდება საშუალო არითმეტიკისგან, მაშინ ის ყოველთვის იქნება მეტი არითმეტიკული საშუალოდან გამოთვლილი გადახრების საშუალო კვადრატზე. ამ შემთხვევაში, გადახრების საშუალო კვადრატი უფრო დიდი იქნება კარგად განსაზღვრული მნიშვნელობით - საშუალო და ამ პირობით აღებულ მნიშვნელობას შორის სხვაობის კვადრატით.

ალტერნატიული მახასიათებლის ვარიაცია არის შესწავლილი ქონების არსებობა ან არარსებობა მოსახლეობის ერთეულებში. რაოდენობრივად ალტერნატიული ატრიბუტის ცვალებადობა გამოიხატება ორი მნიშვნელობით: შესწავლილი თვისების არსებობა ერთეულში აღინიშნება ერთით (1), მისი არარსებობა კი ნულით (0). ერთეულების პროპორცია, რომლებსაც აქვთ შესასწავლი თვისება, აღინიშნება P-ით, ხოლო ერთეულების პროპორცია, რომლებსაც არ გააჩნიათ ეს თვისება, აღინიშნება - გ.ამრიგად, ალტერნატიული ატრიბუტის ვარიაცია უდრის იმ ერთეულების პროპორციის ნამრავლს, რომლებსაც აქვთ მოცემული თვისება (P) იმ ერთეულების პროპორციით, რომლებსაც არ გააჩნიათ ეს თვისება. (G).მოსახლეობის ყველაზე დიდი ცვალებადობა მიიღწევა იმ შემთხვევებში, როდესაც მოსახლეობის ნაწილს, რომელიც მოსახლეობის მთლიანი მოცულობის 50%-ს შეადგენს, აქვს თვისება, ხოლო მოსახლეობის მეორე ნაწილს, ასევე 50%-ის ტოლი არ აქვს. ეს ფუნქცია, ხოლო დისპერსიას აღწევს მაქსიმალურ მნიშვნელობას 0.25, მ .ე. P = 0.5, G= 1 - P \u003d 1 - 0.5 \u003d 0.5 და o 2 \u003d 0.5 0.5 \u003d 0.25. ამ ინდიკატორის ქვედა ზღვარი ნულის ტოლია, რაც შეესაბამება სიტუაციას, რომელშიც არ არის ვარიაცია აგრეგატში. ალტერნატიული მახასიათებლის დისპერსიის პრაქტიკული გამოყენება არის ნდობის ინტერვალების აგება ნიმუშის დაკვირვების ჩატარებისას.

რაც უფრო მცირეა განსხვავება და სტანდარტული გადახრა, მით უფრო ერთგვაროვანი იქნება პოპულაცია და მით უფრო ტიპიური იქნება საშუალო. სტატისტიკის პრაქტიკაში ხშირად ხდება საჭირო სხვადასხვა მახასიათებლების ვარიაციების შედარება. მაგალითად, საინტერესოა მუშაკთა ასაკისა და მათი კვალიფიკაციის ვარიაციების, მომსახურების ხანგრძლივობისა და ხელფასების, ხარჯებისა და მოგების, სამსახურის ხანგრძლივობისა და შრომის პროდუქტიულობის და ა.შ. ასეთი შედარებისთვის, მახასიათებლების აბსოლუტური ცვალებადობის ინდიკატორები შეუსაბამოა: შეუძლებელია სამუშაო გამოცდილების ცვალებადობის შედარება, გამოხატული წლების განმავლობაში, ხელფასის ცვალებადობასთან, გამოხატული რუბლით. ასეთი შედარებების განსახორციელებლად, ისევე როგორც რამდენიმე პოპულაციაში ერთი და იმავე ატრიბუტის რყევის შედარებისთვის სხვადასხვა არითმეტიკული საშუალებებით, გამოიყენება ვარიაციული ინდიკატორები - რხევის კოეფიციენტი, ცვალებადობის წრფივი კოეფიციენტი და ცვალებადობის კოეფიციენტი, რომლებიც აჩვენებენ ზომას. უკიდურესი მნიშვნელობების რყევები საშუალოზე.

რხევის ფაქტორი:

სად V R -რხევის კოეფიციენტის მნიშვნელობა; - ვარიაციის დიაპაზონის მნიშვნელობა; X -

ცვალებადობის ხაზოვანი კოეფიციენტი“.

სად vj-ცვალებადობის წრფივი კოეფიციენტის მნიშვნელობა; ᲛᲔ-საშუალო წრფივი გადახრის მნიშვნელობა; X -ნიშნის საშუალო მნიშვნელობა შესწავლილი პოპულაციისთვის.

ვარიაციის კოეფიციენტი:

სად ვა-ცვალებადობის კოეფიციენტის მნიშვნელობა; a - სტანდარტული გადახრის მნიშვნელობა; X -ნიშნის საშუალო მნიშვნელობა შესწავლილი პოპულაციისთვის.

რხევის კოეფიციენტი არის ცვალებადობის დიაპაზონის პროცენტი შესასწავლი ნიშან-თვისების საშუალო მნიშვნელობამდე, ხოლო ცვალებადობის წრფივი კოეფიციენტი არის საშუალო წრფივი გადახრის თანაფარდობა შესასწავლი თვისების საშუალო მნიშვნელობასთან, გამოხატული პროცენტულად. ვარიაციის კოეფიციენტი არის სტანდარტული გადახრის პროცენტი შესასწავლი თვისების საშუალო მნიშვნელობამდე. ფარდობითი მნიშვნელობის სახით, გამოხატული პროცენტულად, ვარიაციის კოეფიციენტი გამოიყენება სხვადასხვა ნიშან-თვისებების ვარიაციის ხარისხის შესადარებლად. ვარიაციის კოეფიციენტის გამოყენებით ფასდება სტატისტიკური პოპულაციის ჰომოგენურობა. თუ ვარიაციის კოეფიციენტი 33%-ზე ნაკლებია, მაშინ შესწავლილი პოპულაცია ერთგვაროვანია, ვარიაცია კი სუსტი. თუ ვარიაციის კოეფიციენტი 33%-ზე მეტია, მაშინ შესწავლილი პოპულაცია ჰეტეროგენულია, ვარიაცია ძლიერია და საშუალო მნიშვნელობა ატიპიურია და არ შეიძლება გამოყენებულ იქნას ამ პოპულაციის განზოგადების ინდიკატორად. გარდა ამისა, ვარიაციის კოეფიციენტები გამოიყენება სხვადასხვა პოპულაციაში ერთი მახასიათებლის რყევის შესადარებლად. მაგალითად, ორ საწარმოში მუშაკთა სტაჟის ცვალებადობის შესაფასებლად. რაც უფრო მაღალია კოეფიციენტის მნიშვნელობა, მით უფრო მნიშვნელოვანია მახასიათებლის ცვალებადობა.

გამოთვლილი კვარტლების საფუძველზე, ასევე შესაძლებელია კვარტალური ვარიაციის ფარდობითი ინდიკატორის გამოთვლა ფორმულის გამოყენებით

სადაც ქ 2 და

კვარტლთაშორისი დიაპაზონი განისაზღვრება ფორმულით

მეოთხედი გადახრა გამოიყენება ვარიაციის დიაპაზონის ნაცვლად, რათა თავიდან იქნას აცილებული უკიდურესი მნიშვნელობების გამოყენებასთან დაკავშირებული უარყოფითი მხარეები:

არათანაბარი ინტერვალის ვარიაციული სერიებისთვის ასევე გამოითვლება განაწილების სიმკვრივე. იგი განისაზღვრება, როგორც შესაბამისი სიხშირის ან სიხშირის კოეფიციენტი გაყოფილი ინტერვალის მნიშვნელობაზე. არათანაბარი ინტერვალის სერიებში გამოიყენება აბსოლუტური და ფარდობითი განაწილების სიმკვრივეები. განაწილების აბსოლუტური სიმკვრივე არის სიხშირე ინტერვალის სიგრძის ერთეულზე. ფარდობითი განაწილების სიმკვრივე - სიხშირე ინტერვალის სიგრძის ერთეულზე.

ყოველივე ზემოთქმული მართალია განაწილების სერიებისთვის, რომელთა განაწილების კანონი კარგად არის აღწერილი ნორმალური განაწილების კანონით ან ახლოსაა მასთან.

ვარიაციულირაოდენობრივ საფუძველზე აგებული განაწილების სერიები. მოსახლეობის ცალკეულ ერთეულებში რაოდენობრივი მახასიათებლების მნიშვნელობები არ არის მუდმივი, მეტ-ნაკლებად განსხვავდება ერთმანეთისგან.

Ვარიაცია- მერყეობა, ატრიბუტის მნიშვნელობის ცვალებადობა პოპულაციის ერთეულებში. გამოკვლეულ პოპულაციაში არსებული ნიშან-თვისების ცალკეული რიცხვითი მნიშვნელობები ეწოდება პარამეტრებიღირებულებები. საშუალო მნიშვნელობის არასაკმარისი რაოდენობა მოსახლეობის სრული დახასიათებისთვის საჭიროებს საშუალო მნიშვნელობების შევსებას ინდიკატორებით, რაც შესაძლებელს გახდის შეაფასოს ამ საშუალოების ტიპიურობა შესასწავლი თვისების რყევების (ვარიაციის) გაზომვით.

ვარიაციის არსებობა განპირობებულია დიდი რაოდენობით ფაქტორების გავლენით ნიშან-თვისებების დონის ფორმირებაზე. ეს ფაქტორები მოქმედებს არათანაბარი ძალით და სხვადასხვა მიმართულებით. ვარიაციის ინდიკატორები გამოიყენება ნიშან-თვისებების ცვალებადობის საზომის აღსაწერად.

ვარიაციის სტატისტიკური შესწავლის ამოცანები:

  • 1) მოსახლეობის ცალკეულ ერთეულებში ნიშნების ცვალებადობის ბუნებისა და ხარისხის შესწავლა;
  • 2) ცალკეული ფაქტორების ან მათი ჯგუფების როლის განსაზღვრა პოპულაციის გარკვეული მახასიათებლების ცვალებადობაში.

სტატისტიკაში გამოიყენება ვარიაციის შესწავლის სპეციალური მეთოდები, ინდიკატორების სისტემის გამოყენებაზე დაყრდნობით, თანრომლითაც ვარიაცია იზომება.

ვარიაციის შესწავლა აუცილებელია. ვარიაციების გაზომვა აუცილებელია ნიმუშის დაკვირვების, კორელაციისა და დისპერსიული ანალიზის ჩატარებისას და ა.შ. ერმოლაევი O.Yu. მათემატიკური სტატისტიკა ფსიქოლოგებისთვის: სახელმძღვანელო [ტექსტი] / O.Yu. ერმოლაევი. - მ.: მოსკოვის ფსიქოლოგიური და სოციალური ინსტიტუტის ფლინტის გამომცემლობა, 2012. - 335გვ.

ცვალებადობის ხარისხის მიხედვით, შეიძლება ვიმსჯელოთ მოსახლეობის ჰომოგენურობაზე, მახასიათებლების ინდივიდუალური მნიშვნელობების სტაბილურობაზე და საშუალო ტიპურობაზე. მათ საფუძველზე შემუშავებულია ნიშანთა ურთიერთობის სიახლოვის ინდიკატორები, შერჩევითი დაკვირვების სიზუსტის შეფასების ინდიკატორები.

არის ცვალებადობა სივრცეში და ცვალებადობა დროში.

სივრცის ცვალებადობა გაგებულია, როგორც მახასიათებლის მნიშვნელობების რყევა ცალკეულ ტერიტორიებზე წარმოდგენილ პოპულაციის ერთეულებში. დროის ცვალებადობაში იგულისხმება ატრიბუტის მნიშვნელობების ცვლილება დროის სხვადასხვა პერიოდში.

განაწილების სერიის ცვალებადობის შესასწავლად, ატრიბუტების მნიშვნელობების ყველა ვარიანტი განლაგებულია აღმავალი ან კლებადობით. ამ პროცესს სერიების რანჟირება ეწოდება.

ვარიაციის უმარტივესი ნიშნებია მინიმალური და მაქსიმალური- ატრიბუტის უმცირესი და უდიდესი მნიშვნელობა აგრეგატში. მახასიათებლების მნიშვნელობების ცალკეული ვარიანტების გამეორებების რაოდენობას ეწოდება გამეორების სიხშირე (fi). მოსახერხებელია სიხშირეების ჩანაცვლება სიხშირეებით - wi. სიხშირე - სიხშირის ფარდობითი მაჩვენებელი, რომელიც შეიძლება გამოიხატოს ერთეულის ფრაქციებში ან პროცენტებში და საშუალებას გაძლევთ შეადაროთ ვარიაციების სერიები სხვადასხვა რაოდენობის დაკვირვებით. გამოხატულია ფორმულით:

სადაც Xmax, Xmin - ატრიბუტის მაქსიმალური და მინიმალური მნიშვნელობები აგრეგატში; n არის ჯგუფების რაოდენობა.

ნიშან-თვისების ცვალებადობის გასაზომად გამოიყენება სხვადასხვა აბსოლუტური და ფარდობითი ინდიკატორი. ვარიაციის აბსოლუტური მაჩვენებლები მოიცავს ვარიაციის დიაპაზონს, საშუალო ხაზოვან გადახრას, დისპერსიას, სტანდარტულ გადახრას. რყევის ფარდობითი მაჩვენებლები მოიცავს რხევის კოეფიციენტს, ფარდობით ხაზოვან გადახრას, ვარიაციულ კოეფიციენტს.

ვარიაციის სერიის პოვნის მაგალითი

ვარჯიში.ამ ნიმუშისთვის:

  • ა) იპოვნეთ ვარიაციის სერია;
  • ბ) განაწილების ფუნქციის აგება;

No=42. ნიმუშები:

1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

გამოსავალი.

  • ა) რანჟირებული ვარიაციული სერიის აგება:
    • 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
  • ბ) დისკრეტული ვარიაციული სერიის აგება.

მოდით გამოვთვალოთ ჯგუფების რაოდენობა ვარიაციების სერიაში Sturgess-ის ფორმულის გამოყენებით:

ავიღოთ ჯგუფების რაოდენობა 7-ის ტოლი.

ჯგუფების რაოდენობის ცოდნა, ჩვენ ვიანგარიშებთ ინტერვალის მნიშვნელობას:

ცხრილის აგების მოხერხებულობისთვის ავიღებთ 8-ის ტოლი ჯგუფების რაოდენობას, ინტერვალი იქნება 1.

ბრინჯი. 1 მაღაზიის მიერ საქონლის გაყიდვების მოცულობა გარკვეული პერიოდის განმავლობაში


დახურვა