Жалпы нәтиже

Кесте 8.3А. Регрессиялық статистика
Регрессиялық статистика
Бірнеше R. 0,998364
R-квадрат 0,99673
Қалыпты R-алаң 0,996321
Стандартты қате 0,42405
Бақылаулар 10

Біріншіден, 8.3А кестесінде ұсынылған есептеулердің жоғарғы бөлігін қарастырыңыз, бұл регрессиялық статистика.

R-алаңның мәні, сонымен қатар сенімділік өлшемі деп аталатын құндылық алынған, алынған регрессияның сапасын сипаттайды. Бұл сапа бастапқы деректер мен регрессиялық модель (есептелген деректер) арасындағы сәйкестік дәрежесімен көрінеді. Сенімділік өлшемі әрқашан аралық ішінде.

Көптеген жағдайларда R-алаңның мәні осы мәндер арасында, экстремалды деп аталады, яғни I.e. Нөлдік және бірлік арасында.

Егер r-квадраттың мәні бірге жақын болса, бұл салынған модель тиісті айнымалылардың барлық өзгергіштігін түсіндіреді дегенді білдіреді. Керісінше, R-квадраттың мәні нөлге жақын, салынған модельдің сапасыздығын білдіреді.

Біздің мысалда, сенімділік өлшемі - 0,99673, ол бастапқы мәліметтерге тікелей сәйкес келетін регрессияны көрсетеді.

Бірнеше R. - R корреляциялық коэффициенті R - тәуелсіз айнымалылардың (x) және тәуелді айнымалысының (y) тәуелділігін білдіреді.

Бірнеше r анықтау коэффициентінен квадрат түбірге тең, бұл мән мәнді нөлден бірден алады.

Қарапайым сызықтық регрессиялық талдауда, бірнеше r Пирсон корреляция коэффициентіне тең. Шынында да, біздің жағдайда бірнеше р бірнеше-сы алдыңғы мысалдағы Пирсон корреляция коэффициентіне тең (0,998364).

Кесте 8.3b. Рецессия коэффициенттері
Факторлар Стандартты қате t-статистика
Y-қиылыс 2,694545455 0,33176878 8,121757129
Айнымалы x 1. 2,305454545 0,04668634 49,38177965
* Есептелген есептеу опциясы беріледі.

Енді есептеулердің ортаңғы бөлігін қарастырыңыз, 8.3b кестесінде келтірілген. B (2.305454545) регрессия коэффициенті және түзету осіндегі ось бойында ось, i.e. Тұрақты a (2694545455).

Есептеулер негізінде біз регрессиялық теңдеуді осылай жаза аламыз:

Y \u003d x * 2,3305454545 + 2694545455

Айнымалылар арасындағы байланыс бағыты белгілер негізінде анықталады (теріс немесе оң) рецессия коэффициенттері (B коэффициенті b).

Егер белгі болса рецессия коэффициенті - оң, тәуелді айнымалыдың тәуелсіз қарым-қатынасы оң болады. Біздің жағдайда регрессия коэффициенті оң, сондықтан байланыс оң.

Егер белгі болса рецессия коэффициенті - Теріс, тәуелді айнымалыдан тәуелсіз қарым-қатынас теріс (кері) болып табылады.

Кесте 8.3b. Қалдық шығыстарының нәтижелері ұсынылған. Осы нәтижелер туралы есепте пайда болу үшін «Регрессия» құралын бастаған кезде «қалады» құсбелгісін қосу қажет.

Қорытынды қалдық

Кесте 8.3b. Қалдық
Қадағалау Болжалды y. Қалдық Стандартты қалдықтар
1 9,610909091 -0,610909091 -1,528044662
2 7,305454545 -0,305454545 -0,764022331
3 11,91636364 0,083636364 0,209196591
4 14,22181818 0,778181818 1,946437843
5 16,52727273 0,472727273 1,182415512
6 18,83272727 0,167272727 0,418393181
7 21,13818182 -0,138181818 -0,34562915
8 23,44363636 -0,043636364 -0,109146047
9 25,74909091 -0,149090909 -0,372915662
10 28,05454545 -0,254545455 -0,636685276

Есептің осы бөлігімен біз әр нүктенің құрылған регрессия сызығынан ауытқуын көре аламыз. Ең үлкен абсолютті мәні

Регрессиялық талдау - өлшенген мәліметтерді және олардың қасиеттерін зерттеу әдісі. Деректер бу мәндерінен тұрады тәуелді айнымалы (жауап айнымалы) және тәуелсіз айнымалы (Айнымалыны түсіндіру). Регрессия моделі - бұл тәуелсіз айнымалы және кездейсоқ өзгермелі параметрлер. Үлгі параметрлері модель деректерді жақсы әкелетіндей етіп теңшелген. Жазу сапасының өлшемі (мақсатты функция), әдетте, стандартты қате: модельдік мәндердің айырмашылық үлгісіндегі квадраттардың қосындысы және тәуелсіз айнымалы, тәуелсіз айнымалы, тәуелсіз айнымалы, тәуелсіз айнымалы. Регрессиялық талдау - математикалық статистика және машиналарды оқыту бөлімі. Тәуелді айнымалы белгілі бір үлгідегі және кездейсоқ айнымалы мәндерінің қосындысы болып табылады деп болжанады. Осы үлгіні тарату сипатына қатысты, болжамдар жасалады, мәліметтерді құру гипотезасы деп аталады. Осы гипотезаны растау немесе талап ету үшін статистикалық сынақтар қалдық талдау деп аталады. Бұл тәуелсіз айнымалы қателіктер жоқ деп болжайды. Регрессиялық талдау уақыт серияларын болжау, талдау, гипотезаларды сынау және мәліметтердегі жасырын өзара байланыстарды анықтауға қолданылады.

Регрессиялық талдауды анықтау

Үлгі функция болмауы мүмкін, бірақ көзқарас. Мысалы, регрессияны құру туралы мәліметтер келесі болуы мүмкін :. Мұндай үлгіде айнымалы мәннің бір мәні бірнеше айнымалы мәндерге сәйкес келеді.

Сызықтық регрессия

Сызықтық регрессия функциясы параметрлердің параметрлеріне байланысты болады деп болжайды. Бұл жағдайда тегін айнымалыға сызықтық тәуелділік міндетті емес,

Сызықтық регрессиялық мүмкіндік болған кезде

вектордың құрамдас бөліктері бар.

Сызықтық регрессия жағдайындағы параметрлердің мәндері ең аз квадраттар әдісі арқылы табылған. Бұл әдісті қолдану кездейсоқ айнымалының гауссиялық таралуымен дәлелденеді.

Тәуелді айнымалы және қалпына келтірілген нақты мәндер арасындағы айырмашылықтар деп аталады регрессиялық қалдық (Қалдық). Синонимдер әдебиетте де қолданылады: сусис және Қателіктер. Алынған тәуелділіктің маңызды бағаларының бірі - қалдықтардың квадраттарының қосындысы:

Мұнда - квадраттық қателіктердің қосындысы.

Қалдықтардың дисперсиясы формула бойынша есептеледі

Мұнда - орташа шаршы қатесі, стандартты қате.

Графиктер көгілдір нүктелермен және қатты сызықтармен көрсетілген регрессиялық тәуелділіктер келтіреді. ABSCISSA осінде, тегін айнымалы, алынды, алынды осьтің бойымен - тәуелді. Барлық үш тәуелділік параметрлерге қатысты сызықтық болып табылады.

Сызықты емес регрессия

Сызықты емес регрессиялық модельдер - форманың модельдері

скаляр өнімі ретінде көрсетілмейді

мұндағы - регрессиялық модельдің параметрлері бос орын, тәуелді айнымалы, - кездейсоқ мән және белгілі бір жиынтықтан жасалған функция болып табылады.

Сызықты емес регрессия жағдайындағы параметрлердің мәндері градиент түсірілген әдістердің бірінің бірі, мысалы, Левенберг-Маркардт алгоритмі арқылы табылған.

Шарттар туралы

«Регрессия» терминін Франсис Галтон 19 ғасырдың аяғында енгізді. Галтон ата-аналардың балалары жоғары немесе төмен өсуі бар балалар, әдетте, көрнекті өсімді мұра етпейді және бұл құбылысты «орта регрессия» деп атады. Алдымен бұл термин тек биологиялық мағынада қолданылды. Чарльз Пирсонның туындыларынан кейін бұл термин қолдана бастады және статистика.

Статистикалық әдебиеттерде бір тегін айнымалы және бірнеше тегін айнымалылардың қатысуымен регрессияны ажыратады - бір өлшемді және көп өлшемді Регрессия. Біз бірнеше тегін айнымалыларды, яғни тегін айнымалы векторды қолданамыз деп болжанады. Атап айтқанда, ақысыз айнымалы скаляр болған кезде, ол тағайындалады. Айыру сызықтық және сызықтық Регрессия. Егер регрессиялық модель функциялардың параметрлерден сызықтық тіркесімі болмаса, олар сызықты емес регрессия туралы айтады. Сонымен бірге, модель кейбір жиынтықтан функциялардың еркін болуы мүмкін. Сызықты емес модельдер, экспоненциалды, тригонометриялық және басқалары (мысалы, радиальды негіздер немесе юценарийлер функциялары немесе Penspond Runlatt), параметрлер мен тәуелді айнымалы сызықты емес.

Айыру параметрлік және параметрлік емес Регрессия. Осы екі типтегі қатаң шекараны өткізу қиын. Енді модельдердің бір түрін екіншісінен ажыратуға арналған жалпы қабылданған критерий жоқ. Мысалы, сызықтық модельдер параметрлік модельдер және ақысыз айнымалы мәндер кеңістігінде тәуелді айнымалы мәнді енгізуді қамтитын модельдер және модельдер деп саналады. Параметрлік регрессиялық модельдің мысалы: сызықтық болжамшы, көп қабатты қабылдау. Аралас регрессиялық модельдің мысалдары: радиалды негіз функциялары. Параметрлік емес модель - бұл біршама ені терезеде жылжымалы орта. Жалпы, параметрлік емес регрессивті емес регрессивті параметрлерден тәуелді айнымалы мәнсіз айнымалының бір мәнінен, бірақ осы мәннің белгілі бір маңында байланысты болады.

Шарттардың арасында айырмашылық бар: «функцияларды жақындату», «жуықтау», «интерполяция» және «регрессия». Бұл келесідей.

Функцияларды жақындату. Дискретті немесе үздіксіз дәлелдің функциясы беріледі. Кейбір параметрлер отбасынан, мысалы, белгілі бір дәрежедегі алгебралық полиномдарлар арасында функцияны табу қажет. Функция параметрлері минималды функцияларды жеткізуі керек, мысалы,

Мерзім жақындау - «функцияларды жақындату» терминінің синонимі. Бұл белгілі бір функцияға дискретті дәлелдің функциясы ретінде жиі қолданылады. Сондай-ақ, ол көрсетілген функцияның барлық нүктелеріне жақын орналасқан осындай функцияны табуды талап етеді. Бұл жағдайда тұжырымдама енгізілді сусис - үздіксіз функцияның нүктелері мен дискретті аргументтің сәйкес нүктелері арасындағы қашықтық.

Артарялық Функциялар - Белгілі бір нүктелерде болу үшін қажет болған кезде жуықтау тапсырмасының ерекше жағдайы интерполяциялық түйіндер Функция мен жақындау функциясының мәні сәйкес келеді. Тағы бір жағдайда, кейбір туынды құралдардың құндылықтарына шектеулер қойылады. Яғни, дискретті дәлелдің функциясы берілген. Барлық нүктелерден өтетін осындай функцияны табу қажет. Бұл жағдайда, метрика әдетте қолданылмайды, алайда «тегістік» түсінігі жиі енгізіледі.

Регрессияны талдаудың мақсаты - тәуелді айнымалы және біреуі (жұпталған регрессиялық талдау) немесе бірнеше (бірнеше) тәуелсіз айнымалылар арасындағы байланысты өлшеу. Тәуелсіз айнымалы мәндер де фактор, түсіндіру, анықтау, регресорлар мен болжаушылар деп те аталады.

Тәуелді айнымалы кейде «жауап», «жауап» деп аталады. Эмпирикалық зерттеулерде регрессиялық талдау өте ыңғайлы талдау, бұл тек ыңғайлы тестілеу құралының гипотеотездері екендігімен ғана байланысты емес. Регрессия, әсіресе көп мәртелік, бұл модельдеу мен болжаудың тиімді әдісі.

Регрессиялық талдаумен жұмыс принциптерін түсіндіру қарапайым жұп әдісімен басталады.

Жұпталған регрессиялық талдау

Регрессиялық талдауды қолдана отырып, алғашқы әрекеттер бізге корреляция коэффициентін есептеу аясында бірдей болады. Пирсон әдісі арқылы корреляциялық талдаудың тиімділігі үшін үш негізгі шартты - айнымалылардың қалыпты таралуы, айнымалылардың аралық өлшенуі, айнымалылар арасындағы сызықтық байланыстар бірнеше регрессияға қатысты. Тиісінше, бірінші кезеңде шашыраңқы диаграммалар салынады, айнымалыларға статистикалық сипаттамалық талдау жүргізіліп, регрессия сызығы есептеледі. Корреляциялық талдау шеңберіндегідей, регрессиялық желілер ең кішкентай квадрат әдісімен салынған.

Деректерді талдаудың екі әдісі арасындағы айырмашылықтарды нақты көрсету үшін, біз қазірдің өзінде қарастырылған мысалды «ATP қолдау» және «Ауыл тұрғындарының үлесі» айнымалы түрлерімен бірге бұрамыз. Бастапқы деректер бірдей. Шашыраңқы диаграммалардағы айырмашылық регрессиялық талдауда, тәуелді айнымалы, тәуелді айнымалы дұрыс көңілсіз болып табылады - біздің «ATP үшін қолдау» біздің осьтерде «ATP қолдау», ал корреляциялық талдауда бұл маңызды емес. Шығарындыларды тазартқаннан кейін, шашыраңқы диаграмма:

Регрессиялық талдаудың негізгі идеясы - айнымалылардың жалпы үрдісі - регрессия сызығы түрінде, - сіз тәуелсіз құндылықтың құнын болжай аласыз.

Кәдімгі математикалық сызықтық функцияны елестетіп көріңіз. Евклид кеңістігіндегі кез-келген тікелей формула бойынша сипаттауға болады:

мұндағы a, бұл тұрақты, бұл тұрақты түрде декларацияның осінде орналасады; B - бұл сызықтардың бұрышын анықтайтын коэффициент.

Бұрыштық коэффициентті және тұрақты, сіз кез-келген X үшін мән бере аласыз (болжау) мәнін аласыз.

Бұл қарапайым функция регрессиялық талдау моделінің негізін құрып, брондау арқылы біз нақты емес, бірақ белгілі бір сенімділік аралығында, бірақ белгілі бір аралық шегінде, I.E. туралы.

Тұрақты - бұл регрессия сызығының қиылысу нүктесі және түзету осінің (F-қиылыс, статистикалық пакеттерде, әдетте, «интерцецтор») белгіленеді. Біздің мысалда ATP-ге дауыс беру арқылы оның дөңгеленген мәні 10,55 болады. «Коммерсант» бұрыштық коэффициенті шамамен -0,1 болады (корреляциялық талдаудағыдай, белгі байланыс түрі - тікелей немесе кері). Осылайша, алынған модель C \u003d -0.1 x ауылдарында бірлескен кәсіпорынның нысаны болады. Біз. + 10.55.

Сонымен, «АДЕГИЯ» республикасы үшін ауыл халқының акцияларымен болжамды құнның 47% -ы 5,63 болады:

ATP \u003d -0.10 x 47 + 10.55 \u003d 5.63.

Бастапқы және болжамды мәндер арасындағы айырмашылық қалдық деп аталады (осы мерзіммен - статистика принциптері - біз конъюгация кестелерін талдау кезінде кездестік). Сонымен, «Адигея Республикасы» жағдайы үшін қалдық 3,92 - 5.63 \u003d -1.71 құрайды. Қалдық қалдықтың модульдік мәні үлкен болса, ол аз сәтті болады.

Барлық істер бойынша болжамды мәндер мен қалдықтарды есептеңіз:
Болып тұр Сель. Біз. Рақмет

(Бастапқы)

Рақмет

(болжалды)

Қалдық
Адыгея Республикасы 47 3,92 5,63 -1,71 -
Алтай Республикасы 76 5,4 2,59 2,81
Башқұртстан Республикасы 36 6,04 6,78 -0,74
Бурятия Республикасы 41 8,36 6,25 2,11
Дағыстан Республикасы 59 1,22 4,37 -3,15
Ингушетия Республикасы 59 0,38 4,37 3,99
Және т.б.

Бастапқы және болжамды мәндердің арақатынасын талдау алынған модельдің сапасын, оның болжамды қабілеттілігін бағалау үшін қолданылады. Регрессия статистикасының негізгі көрсеткіштерінің бірі - r - тәуелді айнымалының бастапқы және болжамды мәндері арасындағы корреляция коэффициенті. Жұпты регрессиялық талдау кезінде ол тәуелді және тәуелсіз айнымалы арасындағы әдеттегі пеконон корреляция коэффициентіне тең, біздің жағдайымызда - 0.63. Бірнеше r-ді едәуір түсіндіру үшін оны анықтау коэффициентіне ауыстырылуы керек. Бұл корреляциялық талдаудағыдай - алаңның құрылысы сияқты жасалады. R -kvAdrat (R 2) коэффициентін анықтау коэффициенті тәуелсіз (тәуелсіз) айнымалы мәндер түсіндірілген тәуелді айнымалының өзгеруінің үлесін көрсетеді.

Біздің жағдайда, r 2 \u003d 0.39 (0.63 2); Бұл дегеніміз, «ауыл тұрғындарының үлесі» айнымалысы «ATP қолдауының» нұсқасының шамамен 40% -ын түсіндіреді. Анықтау коэффициентінің мәні неғұрлым көп болса, модельдің сапасы соғұрлым жоғары болады.

Тағы бір үлгі сапасының индикаторы - стандартты бағалау қатесі (стандартты бағалау қателігі). Бұл регрессия сызығының айналасында «шашыраңқы» дегеннің көрсеткіші. Аралық айнымалылардың өзгеруі - стандартты ауытқу. Тиісінше, стандартты бағалау қатесі қалдық бөлудің стандартты ауытқуы болып табылады. Оның мәні неғұрлым көп болса, спрэд күшті және модельдің нашарлайды. Біздің жағдайда стандартты қате - 2.18. Бұл магниту үшін «ATP» айнымалысын қолдаудың мәнін болжай кезде біздің модель «орташа деңгейде» болады.

Регрессиялық статистика сонымен қатар дисперсиялық талдауды қамтиды. Онымен біз: 1) тәуелді айнымалы мәнінің вариациясының (дисперсиясы) қандай үлесті тәуелсіз айнымалы арқылы түсіндіреді; 2) тәуелді айнымалы дисперсияның қандай үлес салмағы балансқа түседі (эмылмалы бөлігі); 3) осы екі мәннің көзқарасы қандай (/ «- көзқарас). Дисперсиялық статистика, әсіресе, үлгілік зерттеулер үшін өте маңызды - бұл жалпы халыққа тәуелсіз және тәуелді айнымалылар арасындағы қарым-қатынастың болуы мүмкін. Алайда, үздіксіз Зерттеу (біздің мысалдағыдай), дисперсиялық талдау нәтижелерін білу тексерілмейді. Бұл жағдайда олар анықталған статистикалық үлгі, егер олар анықталған статистикалық үлгі, ол сауалнамаға қатысқан жағдайларға тән болса, тексеріледі Жазылған, яғни нәтиженің ақиқаты, олардың кеңейтілген жалпы жиынтық және оның үлгілерінің дәрежесі, кездейсоқ әсерден босатылған.

Біздің жағдайда дисперсиялық талдау статистикасы келесідей:

Ss. df. ХАНЫМ. F. бағалау
Регнет. 258,77 1,00 258,77 54,29 0.000000001
Сол. 395,59 83,00 L, 11.
Түгел 654,36

F-коэффициенті 54.29 54.29 едәуір, 0,0000001. Тиісінше, біз нөлдік гипотезаны сенімді түрде қабылдамай, біз тапқан байланыс кездейсоқ сипатқа ие болса, ол кездейсоқ сипатқа ие болады.

Ұқсас функция T критерийлері бойынша орындалады, бірақ регрессивті коэффициенттерге қатысты (бұрыштық және F-қиылысу). Критерий көмегімен / біз жалпы жиналған регрессиялық коэффициенттердің нөлдік бөлігінде гипотезаны тексереміз. Біздің жағдайда біз нөлдік гипотезаны сенімді түрде тастай аламыз.

Бірнеше регрессиялық талдау

Бірнеше регрессиялық модель жұпталған регрессия моделіне бірдей; Жалғыз айырмашылық - бірнеше тәуелсіз айнымалылар сызықты функцияға дәйекті түрде енгізілген:

Y \u003d b1x1 + b2x2 + ... + bpxp + a.

Егер тәуелсіз айнымалылар екіден көп болса, бізде олардың байланысы туралы визуалды идея алуға мүмкіндік жоқ, осыған байланысты, бу бөлмесіне қарағанда «визуалды» аз регрессия. Егер екі тәуелсіз айнымалы болса, деректер үш өлшемді шашыраңқы диаграммада көрсету үшін пайдалы. Кәсіби статистикалық бағдарламалық қамтамасыздандыру пакеттерінде (мысалы, статистикалық), үш өлшемді диаграмманы бұру мүмкіндігі бар, бұл сізге деректер құрылымын көруге мүмкіндік береді.

Бірнеше регрессиямен жұмыс кезінде, бу бөлмесіне қарағанда, талдау алгоритмін анықтау қажет. Стандартты алгоритмде соңғы регрессиялық модельдегі барлық болжаушылар кіреді. Қадамдық алгоритм «Салмақ» түсіндірмесі негізінде тәуелсіз айнымалылардың дәйекті түрде қосылуын (ерекшеліктерін) білдіреді. Қадамдық кезең әдісі көптеген тәуелсіз айнымалылар болған кезде жақсы; Ол модельді ашық, әлсіз болжамдардан «тазартады», оны ықшам және лаконикалық етеді.

Бірнеше регрессияның дұрыс болуының қосымша шарты (интервализм, қалыпты және сызықтық) - бұл мультиколлизмнің болмауы - тәуелсіз айнымалылар арасында берік корреляциялық байланыстардың болуы.

Бірнеше регрессиялық статистиканы түсіндіру бізде жұптық регрессия жағдайында қарастырылған барлық өлшемдерді қамтиды. Сонымен қатар, бірнеше регрессиялық талдау статистикасында басқа да маңызды компоненттер бар.

Біз Ресей аймақтарындағы сайлау қызметінен айырмашылықтарды түсіндіретін гипотезаларды сынау мысалымен біз бірнеше регрессиямен жұмыс жасаймыз. Бетон эмпирикалық зерттеулер барысында сайлаушылар айналымының деңгейі келесідей болжамдар жасалды:

Ұлттық фактор («Ресей халқының» айнымалы »; Ресей Федерациясының субъектілеріндегі Ресей халқының үлесі ретінде өмірден арылады). Ресей халқының үлесі сайлаушылардың белсенділігінің төмендеуіне әкеледі деп болжанады;

Урбанизация коэффициенті («Қала тұрғындары»; «Қала халқының» айнымалы »; Ресей Федерациясының субъектілеріндегі қала халқының үлесі ретінде зерттелген, біз осы фактормен корреляциялық талдау аясында жұмыс істедік). Қала халқының үлесі де өсу сайлаушылардың белсенділігінің төмендеуіне әкеледі деп болжануда.

Тәуелді айнымалы - «Сайлау қызметінің қарқындылығы» («Актив») 1995 жылдан бастап 2003 жылдан бастап федералды сайлаудағы аймақтардың орташа мәліметтері арқылы сақталады. 1995 жылдан 2003 ж. Деректердің бастапқы кестесі екі тәуелсіз және бір тәуелді айнымалы Келесі формасы бар:

Болып тұр Айнымалылар
Активтер. Таулар Біз. Рус. Біз.
Адыгея Республикасы 64,92 53 68
Алтай Республикасы 68,60 24 60
Бурятия Республикасы 60,75 59 70
Дағыстан Республикасы 79,92 41 9
Ингушетия Республикасы 75,05 41 23
Қалмақия Республикасы 68,52 39 37
Карачай-циркасса 66,68 44 42
Карелия Республикасы 61,70 73 73
Коми Республикасы 59,60 74 57
Мари Эльсия 65,19 62 47

Және т.б. (Шығарындыларды тазалағаннан кейін 88 жағдай 83)

Модельдің сапасын сипаттайтын статистика:

1. бірнеше R \u003d 0.62; L-Square \u003d 0.38. Демек, ұлттық факторлар мен урбанизация факторы «сайлау қызметі» айнымалысының өзгеруінің шамамен 38% -ын түсіндіреді.

2. Орташа қате - 3,38. Көрініс деңгейін болжау кезінде салынған модель «орташа емес».

3. / Түйіндеме және түсініксіз өзгерудің L-арақатынасы 25.2-ді 0,000000003 деңгейінде. Анықталған қосылыстардың мүмкіндігі туралы нөлдік болжам қабылданбайды.

4. «Қала халқының» және «Ресей халқының» және «Ресей халқының» өзгеруі үшін / регрессивті коэффициенттері үшін / 0.0000001 ж. Сәйкесінше 0.00005 және 0.007. Коэффициенттердің кездейсоқ болуы туралы нөлдік болжам қабылданбады.

Қосымша пайдалы статистика Тәуелді айнымалығының бастапқы және болжамды мәндерінің арақатынасымен Махалабидің қашықтық және аспаз қашықтық. Біріншісі - істің бірегейлігі өлшемі (барлық тәуелсіз айнымалылардың мәндерінің барлық тәуелсіз айнымалылардан бір уақытта ауытқуы қанша болғанын көрсетеді). Екінші - істің әсерін өлшеу. Әр түрлі бақылаулар әр түрлі жолдарда әр түрлі бағыттар регрессия сызығының көлбеуіне әсер етеді, сонымен қатар аспазшының көмегімен оларды осы көрсеткішпен салыстыруға болады. Бұл шығарындыларды тазалаған кезде пайдалы (шығарындыларды артық әсерлі іс ретінде ұсынуға болады).

Біздің мысалда, Дағыстан бірегей және ықпалды істерді білдіреді.

Болып тұр Қайнар көз

Құндылықтар

Предика

Құндылықтар

Қалдық Қашықтық

Махаланобис

Қашықтық
Адигейа 64,92 66,33 -1,40 0,69 0,00
Алтай Республикасы 68,60 69.91 -1,31 6,80 0,01
Бурятия Республикасы 60,75 65,56 -4,81 0,23 0,01
Дағыстан Республикасы 79,92 71,01 8,91 10,57 0,44
Ингушетия Республикасы 75,05 70,21 4,84 6,73 0,08
Қалмақия Республикасы 68,52 69,59 -1,07 4,20 0,00

Нақты регрессиялық модельде келесі параметрлер бар: U-қиылысы (тұрақты) \u003d 75.99; B (таулар. Біз.) \u003d -0.1; Коммерсант (RUS. АҚШ.) \u003d -0.06. Қорытынды формула:

Aaceive, \u003d -0.1 x таулары. R + - 0.06 x rus. R + 75.99.

Болжамдардың «Түсіндірме күшін» 61-коэффициенттің құнына қарай салыстырып, Иә, өйткені тәуелсіз айнымалылар да бірдей пайыздық форматқа ие бола ала ма? Алайда, көбінесе әр түрлі таразыларда өлшенген айнымалылармен көп регрессия келіседі (мысалы, жылдардағы рубльдегі кіріс деңгейі). Сондықтан, жалпы, айнымалылардың болжамды мүмкіндіктерін регрессия арақатынасымен салыстырыңыз. Осы мақсатта бірнеше рет регрессия статистикасында, әр тәуелсіз айнымалы үшін бөлек есептелген арнайы бета коэффициенті (b) бар. Бұл жеке (барлық басқа болжамшылардың әсерін ескергеннен кейін есептеледі) фактор мен реакцияның корреляциялық коэффициентіне және жауап беру құндылықтарының болжамына тәуелді қосқанын көрсетеді. Жұптық регрессиялық талдау кезінде айқын себептер бойынша бета коэффициенттері тәуелді және тәуелсіз айнымалы арасындағы жұп корреляция коэффициентіне тең.

Біздің мысалда бета (таулар. Біз.) \u003d -0.43, бета (рус. Біз.) \u003d -0.28. Осылайша, екі фактор да сайлау қызметінің деңгейіне әсер етеді, ал урбанизация факторының маңыздылығы ұлттық фактордың маңыздылығынан едәуір жоғары. Екі фактордың жиынтық әсері «сайлау белсенділігінің» айнымалы өзгеруінің шамамен 38% -ын анықтайды (L-Square мәнін қараңыз).

Регрессиялық талдау - бұл параметрдің бір немесе бірнеше тәуелсіз айнымалылардан тәуелділігін көрсететін статистикалық зерттеу әдісі. Оны қосымшаны, әсіресе егер ол көп мөлшерде болса, оны қолдану қиын болды. Бүгінгі таңда Excel бағдарламасында регрессия жасауды үйрену, сіз кешенді статистикалық тапсырмаларды бірнеше минуттан кейін шеше аласыз. Төменде экономика саласынан нақты мысалдар келтірілген.

Регрессия түрлері

Бұл тұжырымдама 1886 жылы математикаға енгізілді. Регрессия болады:

  • сызықтық;
  • параболалық;
  • Қуат;
  • экспоненциалды;
  • гиперболалық;
  • көрсеткіш;
  • логарифмдік.

1-мысал.

Команданың мүшелерінің санының санының орташа жалақысынан 6 өнеркәсіптік кәсіпорындардағы тәуелділігін анықтау міндетін қараңыз.

Тапсырма. Алты кәсіпорында орташа айлық жалақы және өз өтініші бойынша жұмыстан шыққан қызметкерлердің саны талданды. Кестелік түрінде бізде:

Жүрек саны

Жалақы

30000 рубль

35 000 рубль

40000 рубль

45 000 рубль

50 000 рубль

55 000 рубль

60000 рубль

6 кәсіпорынның орташа жалақысының ортасына тәуелділікті анықтау мәселесі үшін регрессия моделінің мәні y \u003d a 0 + a 1 x 1 + ... + akxk теңдеуінің формасы бар, онда XI Айнымалыларға әсер ету және регрессия коэффициенттері, AK - факторлардың саны.

Бұл тапсырма үшін, Y - қызметкерлердің жанжалдарының және әсер ететін факторлардың көрсеткіші - x-ді X белгіленетін жалақы.

«Excel» кестесінің процессорының мүмкіндіктерін пайдалану

Excel бағдарламасындағы регрессиялық талдау алдын-ала бекітілген функциялардың кесте деректеріне қолданылуы керек. Алайда, бұл мақсаттар үшін «Талдау пакетін» өте пайдалы суперструкцияны қолданған дұрыс. Оны іске қосу үшін сізге қажет:

  • файл қойындысынан «Параметрлер» бөліміне өтіңіз;
  • ашылған терезеде «Жоғарыдан құрылымды» жолын таңдаңыз;
  • төмендегі «GO» түймесін басыңыз, «Менеджмент» жолының оң жағында;
  • «Талдау пакеті» атауының жанына белгі қойыңыз да, OK түймесін басу арқылы әрекеттеріңізді растаңыз.

Егер бәрі дұрыс жасалса, «Excel» жұмыс станциясының үстінде орналасқан «Деректер» қойындысының оң жағында, қалаған батырма пайда болады.

Excel бағдарламасында

Енді сізде эконометриялық есептеулерді жүзеге асыру үшін барлық виртуалды құралдар болған кезде, біз өз міндетімізді шешуге кірісе аламыз. Осыған:

  • «Деректерді талдау» түймесін басыңыз;
  • ашылған терезеде «Регрессия» түймесін басыңыз;
  • пайда болған қойындысында біз Y мәндерінің ауқымын (жойылған қызметкерлердің саны) және X үшін (олардың жалақысы) үшін енгіземіз;
  • «OK» түймесін басу арқылы әрекеттеріңізді растаңыз.

Нәтижесінде бағдарлама регрессиялық талдаулармен кесте процессорының жаңа парағын автоматты түрде толтырады. Назар аударыңыз! Excel бағдарламасы сіз осы мақсатта өзіңіз қалаған жерден өз бетінше сұрай аласыз. Мысалы, бұл мәндер Y және X, немесе тіпті осындай деректерді сақтау үшін арнайы жасалған жаңа кітап болуы мүмкін.

R-алаң үшін регрессия нәтижелерін талдау

Excel бағдарламасында мәліметтерді қарау кезінде алынған мәліметтер қарастырылған болып көрінеді:

Біріншіден, сіз R-алаңның құнына назар аударуыңыз керек. Бұл анықтау коэффициенті. Бұл мысалда r-Square \u003d 0.755 (75,5%), I.E. Модельдің есептелген параметрлері қарастырылып, 75,5% -ға болатын параметрлер арасындағы байланысты түсіндіреді. Анықтау коэффициентінің мәні неғұрлым жоғары болса, таңдалған модель белгілі бір тапсырма үшін қажет деп саналады. Бұл r-квадраттың 0,8-ден жоғары нақты жағдайды дұрыс сипаттайды деп саналады. Егер r-квадр болса<0,5, то такой анализа регрессии в Excel нельзя считать резонным.

Коэффициенттерді талдау

641428 нөмірі бізде Xi барлық айнымалылары Xi-ді қалпына келтіретін болса, не болады. Басқаша айтқанда, талданған параметрдің мәні нақты модельде сипатталмаған басқа факторларға әсер етеді деп айтуға болады.

В18 ұяшығында орналасқан келесі коэффициент -0.16285 x айнымалысының әсерінің салмағын көрсетеді. Бұл қарастырудағы модельдегі қызметкерлердің орташа айлық жалақысы -0,16285, яғни, Оның әсер ету дәрежесі мүлде аз. «-» белгісі коэффициенттің теріс мәнге ие екенін көрсетеді. Бұл әркім, кәсіпорындағы жалақы көп екенін білсе, аз адамдар еңбек шартын бұзуға немесе жұмыстан шығарылғанын білдіретінін біледі.

Бірнеше регрессия

Мұндай терминдің астында түрдің бірнеше тәуелсіз айнымалымен байланыс теңдеуі түсініледі:

y \u003d f (x 1 + x 2 + ... x m) + x ε, мұндағы Y, ал Y, ал x 1, x 2, ... x m - факторлардың белгілері (тәуелсіз айнымалылар).

Параметрлерді бағалау

Бірнеше регрессия (MR) үшін ол ең кішкентай квадраттар (MNC) әдісімен жүзеге асырылады. Пішіннің сызықтық теңдеулері үшін y \u003d a + b 1 x 1 + ... + b m x m + ε біз қалыпты теңдеулер жүйесін құрамыз (төменде қараңыз)

Әдістің принципін түсіну үшін екі факторлы жағдайды қарастырыңыз. Содан кейін бізде формула сипатталған жағдай бар

Осы жерден аламыз:

мұндағы σ - индексте көрсетілген сәйкес функцияның дисперсиясы.

MNK стандартты масштабтағы теңдеу мырзаға қолданылады. Бұл жағдайда біз теңдеуді аламыз:

қай t y, t x 1, ... t xm - бұл орташа мәндер 0-ге тең стандартты айнымалылар β Мен стандартталған регрессиялық коэффициенттер және стандартты ауытқу - 1.

Осы жағдайда мен бұл жағдайда барлық β I β i i қалыпқа келтірілген және орталықтандырылған, сондықтан оларды салыстыру дұрыс деп саналады. Сонымен қатар, II-дің ең кіші мәндерін тастап, әр факторларды жүзеге асыру әдеттегідей, бұл әдеттегідей.

Сызықтық регрессиялық теңдеуді қолдану

Соңғы 8 айда N нақты өнім бағасының динамикасы динамикасы бар делік. Өз партиясын сатып алудың негізі 1850 рубль / т бағамен шешім қабылдау қажет.

айдың саны

айдың атауы

Өнім бағасы N.

Бір тонна үшін 1750 рубль

Бір тонна үшін 1755 рубль

Бір тонна үшін 1767 рубль

Бір тонна үшін 1760 рубль

Бір тонна үшін 1770 рубль

Бір тонна үшін 1790 рубль

Тонға 1810 рубль

Тонға 1840 рубль

Бұл тапсырманы Excel кесте процессорында шешу үшін жоғарыда көрсетілген «Деректерді талдау» құралын пайдалану қажет. Әрі қарай, «Регрессия» бөлімін таңдап, параметрлерді орнатыңыз. Есіңізде болсын, тәуелді айнымалы мәндерінің ауқымы «INPUT Inval Y» (осы жағдайда нақты айлардағы тауарлардың бағасы) және «INPUT аралығы X» -ке енгізілуі керек екенін есте ұстаған жөн тәуелсіз (айдың саны). OK түймесін басу арқылы әрекеттерді растаңыз. Жаңа параққа (егер ол осылайша көрсетілген болса) біз регрессия үшін мәліметтер аламыз.

Біз Y \u003d AX + B формасының сызықтық теңдеуін жасаймыз, онда айдың санының және «Y-қиылыс» коэффициенттері мен коэффициенттері мен коэффициенттері мен коэффициенттері және регрессиялық талдау нәтижелері бар, егер A және B параметрлері ретінде. Осылайша, 3-тапсырма үшін регрессия сызықты теңдеуі (ur) форматта жазылған:

Өнім бағасы N \u003d 11.714 * Ай ай + 1727.54.

немесе алгебралық белгілерде

y \u003d 11,714 x + 1727,54

Нәтижелерді талдау

Нәтижесінде сызықты регрессиялық теңдеулердің жеткілікті мөлшерде болғанын анықтау үшін, бірнеше корреляциялық коэффициенттер (KMK) және анықтама, сондай-ақ Фишер критерийлері мен студенттік критерий қолданылады. Регрессия нәтижелері бойынша «Excel» кестесінде олар бірнеше R, R-SQURAL, F-SQUART, F-статистика және Т-статистика ретінде әрекет етеді.

KMK R тәуелсіз және тәуелді айнымалылар арасындағы ықтималды байланыстың жақындық деңгейін бағалауға мүмкіндік береді. Оның жоғары мәні «Айдың саны» және «1 тонна рубльдегі n өнімнің бағасы» айнымалыларының арасында жеткілікті күшті байланыс көрсетеді. Алайда, осы қосылымның сипаты белгісіз болып қалады.

R 2 (RI) коэффициенті квадраты - бұл жалпы шашырау үлесінің сандық сипаттамасы және эксперименттік мәліметтердің қай бөлігін көрсетеді, яғни. Тәуелді айнымалы мәндер сызықты регрессия теңдеуіне сәйкес келеді. Қарастырылып отырған мәселеде, бұл көрсеткіш 84,8%, яғни, дәлдігі жоғары, дәлдігі жоғары статистикалық мәліметтер, немесе алынған.

F-статистика, сонымен қатар Fisher-тің критерийі деп аталатын статистика сызықтық тәуелділіктің маңыздылығын бағалау үшін, оның бар екендігі туралы гипотезацияның маңыздылығын бағалау үшін қолданылады.

(Студенттің критерийі) белгісіз немесе еркін сызықтық тәуелділікке коэффициенттің маңыздылығын бағалауға көмектеседі. Егер T-критерийдің мәні\u003e T болса, сызықтық теңдеудің еркін мүшесінің марсабайлығы қабылданбайды.

Еркін мүше үшін қарастырылған мәселеде «Excel» құралдары, T \u003d 169 ZHER20903 және P \u003d 2.89E-12, яғни, бізде тегін болжамның дұрыс гипотезасы бар, яғни бізде нөлдік ықтималдығы бар мүше қабылданбайды. Белгісіз T \u003d 5,79405 және P \u003d 0.001158 коэффициенті үшін. Басқаша айтқанда, коэффициенттің елеусіз гипотезасы белгісіз жерде қабылданбаған ықтималдығы 0,12% құрайды.

Осылайша, сызықты регрессияның нәтижесінде пайда болатын теңдеуі бар деп айтуға болады.

Акциялар пакетін сатып алудың орындылығы туралы тапсырма

Excel бағдарламасындағы бірнеше регрессиялық бүкіл «Деректерді талдау» құралы арқылы жүзеге асырылады. Белгілі бір қолданылатын тапсырманы қарастырыңыз.

«ҰНН» басқарушы компаниясы «МММ» АҚ-да 20% акциялар пакетін сатып алудың орындылығы туралы шешім қабылдауы керек. Пакеттің құны (SP) - 70 млн. АҚШ доллары. «NNN» мамандары ұқсас транзакциялар туралы мәліметтер жинады. Миллиондаған американдық доллармен көрсетілген мұндай параметрлердің құнын бағалау туралы шешім қабылданды:

  • кредиторлық берешек (ВК);
  • жылдық айналым көлемі (VO);
  • дебиторлық берешек (VD);
  • негізгі құралдардың құны (SOF).

Сонымен қатар, жалақы кәсіпорнын (V3 P) орналастыру мың АҚШ долларымен есеп айырысу қолданылады.

Кесте процессорының Excel бағдарламасының шешімдері

Біріншіден, сіз бастапқы деректер кестесін жасауыңыз керек. Оның келесі формасы бар:

  • «Деректерді талдау» терезесіне қоңырау шалыңыз;
  • «Регрессия» бөлімін таңдаңыз;
  • «INPUT Invaly Y» терезесінде g бағанынан тәуелді айнымалылардың ауқымы енгізіледі;
  • «Кіріс аралығы X» терезесінің оң жағындағы қызыл көрсеткі белгішесін нұқыңыз және B, C, D, F бағандарынан барлық мәндер ауқымын бөліңіз.

«Жаңа жұмыс тізімі» тармағын таңдап, «ОК» түймесін басыңыз.

Осы тапсырма үшін талдау алыңыз.

Нәтижелер мен қорытындыларды зерттеу

Жоғарыда келтірілген дөңгелек мәліметтерден «жинау» Excel бағдарламасының парағында, регрессия теңдеуі:

SP \u003d 0.103 * SOF + 0.541 * VO - 0.031 * vk + 0.405 * vd + 0.405 * vd + 0.691 * VZP - 265,844.

Таныс математикалық түрінде, оны келесідей жазуға болады:

y \u003d 0.103 * x1 + 0,541 * x2 - 0.031 * x3 + 0,405 * x4 + 0,405 * x4 + 0,691 * x5 - x5 - 265,844

«МММ» АҚ мәліметтері кестеде келтірілген:

Оларды регрессия теңдеуіне ауыстыру, олар 64,72 миллион АҚШ долларын құрайды. Бұл дегеніміз, «МММ» АҚ акцияларын сатып алуға болмайды, өйткені олардың құны 70 млн. АҚШ доллары мөлшері жеткілікті мөлшерде бағаланады.

Көріп отырғанымыздай, «Excel» кестесі процессорын және регрессиялық теңдеулерді қолдану толығымен нақты мәміленің орындылығы туралы ақылға қонымды шешім қабылдауға мүмкіндік берді.

Енді сіз регрессияның не екенін білесіз. Жоғарыда талқыланған Excel мысалдары сізге эконометрика саласындағы практикалық тапсырмаларды шешуге көмектеседі.

Регрессиялық талдау статистикалық зерттеулердің ең қызықты әдістерінің бірі болып табылады. Онымен тәуелсіз мәндердің тәуелді айнымалыға әсер ету дәрежесін анықтауға болады. Microsoft Excel функциясының ұқсас талдау түріне арналған құрал бар. Олар өздерін және оларды қалай пайдалану керектігін талдайық.

Бірақ, регрессиялық талдау жасауға мүмкіндік беретін функцияны пайдалану үшін, ең алдымен, талдау пакетін іске қосу керек. Тек содан кейін осы процедураға қажет құрал, қуғын-сүргін таспасында пайда болады.


Енді біз қойындыға өткен кезде «Деректер»Құрал блогындағы таспада «Талдау» Біз жаңа батырманы көреміз - «Деректерді талдау».

Регрессиялық талдау түрлері

Регрессияның бірнеше түрі бар:

  • параболалық;
  • Қуат;
  • логарифмдік;
  • экспоненциалды;
  • көрсеткіш;
  • гиперболалық;
  • сызықтық регрессия.

Excele-де өткен регрессиялық талдаудың соңғы түрін енгізу туралы көбірек сөйлесеміз.

Excel бағдарламасындағы сызықтық регрессия

Төменде, мысалы, кестесі көшедегі ауа температурасы орташа тәуліктік ауа температурасы және тиісті жұмыс күніне арналған дүкен сатып алушыларының саны көрсетіледі. Регрессияны талдаудың көмегімен, ауа температурасы түріндегі ауа температурасы үшін ауа температурасы коммерциялық мекеменің қатысуына қалай әсер етуі мүмкін екенін білейік.

Сызықтық түрлердің жалпы теңдеуі келесідей: Y \u003d A0 + A1x1 + ... + AKK. Осы формулада Y. Айнымалы дегеніміз, біз оны зерттейтін факторлардың әсері. Біздің жағдайда бұл сатып алушылар саны. Бағалау х. - Бұл айнымалыға әсер ететін әртүрлі факторлар. Параметрлер а. Регрикалық коэффициенттер. Яғни, олар белгілі бір фактордың маңыздылығын анықтайды. Көрсеткіш к. Осы факторлардың жалпы санын көрсетеді.


Талдау нәтижелерін талдау

Регрессияны талдау нәтижелері Параметрлерде көрсетілген жерде кесте түрінде көрсетіледі.

Негізгі көрсеткіштердің бірі R-квадрат. Бұл модельдің сапасын көрсетеді. Біздің жағдайда бұл коэффициент 0,705 немесе шамамен 70,5% құрайды. Бұл сапаның қолайлы деңгейі. Тәуелділік 0,5-тен кем емес.

Тағы бір маңызды индикатор кесіп өту сызығындағы ұяшықта орналасқан «Y-қиылыс» және «Факторлар». Бұл Y-де қандай мән болатынын көрсетеді, және біздің жағдайда бұл сатып алушылардың саны, барлық басқа факторлар нөлге тең. Бұл кестеде осы кестеде 58.04 бар.

Графиктің қиылысындағы мән «X1 айнымалысы» және «Факторлар» Y деңгейінің деңгейін көрсетеді. Біздің жағдайда, бұл біздің дүкендер санының температурадан тәуелділігінің деңгейі. 1.31 коэффициенті әсердің жоғары көрсеткіші болып саналады.

Көріп отырғаныңыздай, Microsoft Excel бағдарламасын пайдаланып, регрессиялық талдау кестесін жасау өте оңай. Бірақ, шығу кезінде алынған мәліметтермен жұмыс істеуге және олардың мәнін түсінуге дайын, тек дайын адам ғана қол жеткізе алады.


Жабық.