Една од главните алатки на економското истражување е факторска анализа,кој е дел од мултиваријантна статистичка анализа која ги комбинира методите за проценка на димензијата на многу набљудувани променливи преку испитување на структурата на коваријансните или корелационите матрици. За разлика од другите методи на анализа, тоа им овозможува на аналитичарите да одлучуваат две главни задачи:компактно и сеопфатно опишете го предметот на мерење и идентификувајте ги факторите одговорни за присуството на линеарни статистички корелации помеѓу набљудуваните променливи.

Оправдано применувајќи го методот на главни компоненти, наменети за замена на корелирани фактори со неповрзани, а исто така ограничувајќи се на проучување на најзначајните информативни фактори и исклучувајќи ги останатите од анализата, со што се поедноставува толкувањето на резултатите, факторската анализа се појавува како техника за сеопфатно и систематско проучување на зависноста на другите фактори од вредноста на индикаторот за изведба на критериумот .

Главни типови на факторска анализасе: детерминистички, функционален(резултативен критериумски индикатор, кој е производ на делумен или алгебарски збир на фактори); стохастичка, корелација(доколку постои нецелосна или веројатна врска помеѓу резултантните и факторските показатели); директен, дедуктивен(Од општо до специфично); обратна, индуктивна(од особено кон општо); статични и динамични; ретроспективна и перспективна; едностепен и повеќестепен.

Факторската анализа започнува со проверка на нејзината задолжителна Услови,според кој: сите знаци се квантитативни; бројот на карактеристики е двојно поголем од бројот на променливи; примерокот е хомоген; распределбата на оригиналните променливи е симетрична; проучувањето на факторите се врши со користење на корелирани променливи. Факторската анализа се врши во неколку фази: избор на фактори; класификација и систематизација на факторите; моделирање на односите помеѓу показателите за перформанси и фактори; пресметка на влијанието на факторите и проценка на улогата на секој од нив во промената на вредноста на ефективниот индикатор; практично користење на факторскиот модел (пресметка на резерви за раст на ефективниот индикатор). Врз основа на природата на односот помеѓу индикаторите, се разликуваат методите на детерминистичка и стохастичка факторска анализа (Табела 1.5).

Методи за анализа на фактори

Табела 1.5

Методи

краток опис на

Детерминистичка факторска анализа

Детерминистичка факторска анализа- ова е техника за влијание на фактори кои се функционално поврзани со индикаторот за изведба на критериумот, што ни овозможува да го прикажеме критериумскиот индикатор на факторскиот модел како количник, производ или алгебарски збир на променливи. Детерминистичката факторска анализа се карактеризира со следново методи:замени на синџири; апсолутни разлики; релативни разлики; интегрален; логаритми

Стохастички

Стохастичка анализа- методологија за проучување на фактори чија поврзаност со критериумскиот индикатор за успешност е, за разлика од функционалната поврзаност, по природа нецелосна, веројатност (корелација). Со корелација, со менување на аргументот во зависност од комбинацијата на други променливи кои влијаат на вредноста на индикаторот за изведба, може да се добијат голем број вредности за зголемување на функцијата, додека со функционална (целосна) зависност, промената на аргументот секогаш води до соодветни промени во функцијата. Стохастичката анализа се врши со користење на следново методифакторска анализа: пар корелација; анализа на повеќекратна корелација; матричен модел; математичко програмирање; теорија на игри

Статични и динамични

Статичнисе практикува факторска анализа со цел да се процени влијанието на факторите врз показателите за извршување на критериумот на одреден датум и динамичен -да се идентификува динамиката на причинско-последичните односи

Ретроспективна и перспективна

Факторската анализа може да се користи како ретроспективакарактер (да се идентификуваат причините за промените на вредноста на индикаторот за успешност во изминатиот период) и перспектива(да се проучува влијанието на факторите врз вредноста на критериумскиот индикатор во иднина)

За економска анализа, важно е да се користат детерминистичко моделирање и различни типови модели на детерминистички фактори дизајнирани за моделирање на корелации помеѓу критериумот ефективен фактор и другите индикатори на променливи фактори. Суштината на ова моделирање е да се прикаже односот на индикаторот што се проучува со факторите како специфична математичка равенка која изразува функционална или корелација.

Детерминистичките модели на фактори овозможуваат проучување на функционалната врска помеѓу проучуваните индикатори доколку се исполнети следниве барања при конструирање на факторски модел: факторите вклучени во моделот мора да бидат реални, а не апстрактни; факторите мора да бидат во причинско-последична врска со индикаторот за успешност што се проучува; индикаторите на факторскиот модел мора да бидат квантитативно мерливи; мора да биде можно да се измери влијанието на поединечните фактори; Прво, квантитативните фактори се запишуваат во факторскиот модел, а потоа квалитативните; Доколку во факторскиот модел има повеќе квантитативни или квалитативни фактори, тогаш прво се евидентираат фактори од повисок ред, а потоа пониски.

Најшироко користени во факторската анализа се следниве: типови модели на детерминистички фактори(Табела 1.6).

Видови модели на детерминистички фактори

Табела 1.6

Факториски

модели

краток опис на

Адитив

Тие се користат ако индикаторот за изведба на критериумот е претставен во форма на алгебарски збир на голем број факторски параметри на индикаторите:

Развиениот факторски модел може да биде подложен на дополнителни трансформации кога тековното истражување ќе се продлабочи, користејќи голем број методи и техники за овие цели. Конечните резултати од економската анализа на бизнисот на организацијата зависат од тоа колку реално и точно развиените модели ја одразуваат врската помеѓу индикаторите што се проучуваат. Моделирањето на системите со адитивни фактори вклучува имплементација на секвенцијално распаѓање на факторите на оригиналниот факторски систем во компонентни променливи:

на= а + б.

Така, факторите на прво ниво а и бзависат, пак, од голем број други фактори:

а= c + d, b= д+ m,

y = c+ г+ e+m.

Факториски

модели

краток опис на

Мултипликативни модели

Тие се користат во случаи кога индикаторот за изведба на критериумот се изразува како производ на голем број фактори на индикатори:

Суштината на моделирањето на мултипликативните факторски системи лежи во деталното последователно разложување на сложените фактори на оригиналниот факторски систем на фактори:

на= Јас X б.

Големината на факторите на првото ниво a и б,за возврат, зависи од голем број други фактори:

a = c X, b = e X Т,

y=cxd*exm

Повеќе модели

Ако критериумот показател за изведба може да се дефинира како однос на еден фактор показател со друг, тогаш

Се разликуваат следниве: методи за трансформација на факторилни повеќекратни модели:

1)издолжување(го трансформира броителот со замена на еден фактор или голем број фактори со збир на хомогени показатели):

2) формално распаѓање(го проширува именителот со замена на еден или повеќе фактори со збир или производ на хомогени показатели):

3) продолжување(го трансформира оригиналниот модел на фактор со множење на броителот и именителот на односот со еден индикатор или неколку нови индикатори):

Индикаторите за изведба засновани на критериуми може да се разложат на фактори на различни начини и да се претстават како различни типови детерминистички модели на фактори. Методот на моделирање се избира во зависност од предметот на проучување и поставените цели, како и од професионалните знаења и вештини на аналитичарот.

Повеќето методи за проценка на факторите во моделите за одредување се засноваат на елиминација, чиј најуниверзален метод е замена на синџир, кој се користи за мерење на влијанието на факторите во сите видови модели за одредување фактори: мултипликативен, адитивен, повеќекратен и мешан (комбиниран). Благодарение на овој метод, можно е да се процени како поединечните фактори влијаат на вредноста на индикаторот за изведба на критериумот, постепено заменувајќи ја основната вредност на секој фактор на индикаторот како дел од индикаторот за критериум со вистинската вредност во периодот на известување. За да го направите ова, се пресметуваат голем број условни вредности на индикаторот за изведба на критериумот, земајќи ја предвид последователната промена на еден, два или повеќе фактори, при што преостанатите вредности остануваат непроменети. Компаративната проценка на промената на вредноста на параметарот на критериумот пред и по промената на нивото на одреден фактор овозможува да се исклучи (елиминира) влијанието на сите фактори, освен оној чие влијание врз зголемувањето на се одредува индикатор за успешност.

Влијанието на еден или друг индикатор се проценува со последователно одземање: од втората пресметка на првата, од третата - втората, итн. Во првата пресметка, сите вредности се планирани, во последната - вистински. На пример, пресметковниот алгоритам за трифакторен мултипликативен модел е како што следува:

Во алгебарска форма, збирот на влијанието на факторите е еквивалентен на вкупното зголемување на индикаторот за изведба на критериумот:

Ако оваа еднаквост не се почитува, аналитичарот треба да бара грешки во неговите пресметки. Врз основа на ова, развиено е правило според кое произлегува дека бројот на пресметки по единица е поголем од бројот на индикатори на дадената равенка.

При користење на методот на замена на синџирот, се претпоставува обезбедување на придржување до строга секвенца на замена,бидејќи нејзината произволна промена е полн со искривување на резултатите од анализата. ВОпроцес на аналитички постапки Препорачливо е прво да се идентификува влијанието на квантитативните показатели, а потоа на квалитативните.На пример, потребно е да се процени влијанието на бројот на вработени и продуктивноста на трудот врз обемот на индустриското производство. За да се направи ова, прво се проценува влијанието на квантитативниот индикатор (број на вработени), а потоа и квалитативниот индикатор (продуктивноста на трудот).

Методот на замена на синџирот има значителен недостатокбидејќи кога се користи, треба да се претпостави дека вредностите на факторите се менуваат независно еден од друг. Иако во реалноста тие се менуваат истовремено и во меѓусебна врска, што повлекува дополнително зголемување на ефективниот индикатор, како по правило, поврзан со последниот од факторите што се проучуваат. Така, големината на влијанието на факторите врз промената на индикаторот за перформанси зависи од локацијата на одреден фактор во шемата на аналитичкиот модел. Ова ја објаснува разликата во пресметките при промена на секвенцата на замена. Така, степенот на влијание на факторите врз промените на индикаторот за критериум варира во зависност од местото на факторот во моделот на определување. Овој недостаток на детерминистичка факторска анализа се елиминира со користење на покомплексна интегрален метод,овозможувајќи да се оцени влијанието на факторите во мултипликативните, повеќекратните и мешаните модели од повеќекратен тип на адитиви.

Метод на апсолутна разлика- ова е модификација на методот на замена на синџирот, во кој промената на индикаторот за критериум поради секој фактор со методот на апсолутни разлики се дефинира како производ на отстапувањето на проучуваниот фактор според основната или извештајната вредност на друг фактор , во зависност од избраната секвенца за замена:

Метод на релативна разликаима за цел да го процени влијанието на факторите врз растот на индикаторот за критериум во мултипликативни и мешани модели од формата:

Тоа вклучува пронаоѓање на релативното отстапување на секој индикатор на факторот и одредување на насоката и големината на влијанието на факторите како процент со секвенцијално одземање (од првиот - секогаш 100%).

При користење скратен метод на заменаиндикатори за пресметка се меѓупроизводи со секвенцијална акумулација на фактори кои влијаат. Се прават замени, а потоа со секвенцијално одземање се наоѓа влијанието на факторите.

Интегрален методви овозможува да постигнете целосно распаѓање на ефективниот индикатор на фактори и е универзален по природа, т.е. применливи за мултипликативни, повеќекратни и мешани модели. Промената на индикаторот за критериум се мери во бесконечно мали временски периоди со собирање на порастот на резултатот, дефиниран како парцијални производи помножени со зголемувањата на факторите во бесконечно мали интервали.

Употребата на интегралниот метод обезбедува поголема точност во пресметувањето на влијанието на факторите во споредба со методите на замена на синџирот, апсолутни и релативни разлики, што овозможува да се елиминира двосмислената проценка на влијанието, бидејќи во овој случај резултатите не зависат од локацијата на факторите во моделот и дополнителното зголемување на ефективниот показател што произлегува од интеракцијата на факторите, се распределува рамномерно меѓу нив.

За да се дистрибуира дополнителен раст, не е доволно да се земе неговиот дел што одговара на бројот на фактори, бидејќи факторите можат да дејствуваат во различни насоки. Затоа, промената на ефективниот индикатор се мери во бесконечно мали временски периоди со собирање на порастот на резултатот, дефиниран како парцијални производи помножени со зголемувањата на факторите во бесконечно мали интервали. Операцијата на пресметување на определен интеграл се сведува на конструирање интегради кои зависат од типот на функцијата или моделот на факторскиот систем.

Поради сложеноста на пресметувањето на некои дефинитивни интеграли и дополнителните тешкотии поврзани со можното дејство на факторите во спротивни насоки, во пракса се користат специјално формирани работни формули:

1. Погледнете го моделот

2. Погледнете го моделот

3. Погледнете го моделот

4. Погледнете го моделот

Главните методи на елиминација, кои се засноваат на релативни показатели на динамиката, просторни споредби, имплементација на планот (проценети според односот на вистинското ниво на индикаторот што се проучува со оној што се споредува), вклучуваат метод на индекс.

Индексните модели овозможуваат да се конструира квантитативна проценка на улогата на поединечните фактори во трендовите во динамиката на промените во општите индикатори во статистиката, планирањето и економската анализа. Пресметката на кој било индекс вклучува споредба на измерената вредност со основната вредност. Ако индексот се рефлектира во форма на однос на директно споредливи величини, тогаш тој се нарекува индивидуален, а ако индексот го претставува односот на сложените појави, тогаш се нарекува група или вкупно. Постојат повеќе форми на индекси (агрегат, аритметички, хармонски).

Основата на која било форма на општ индекс е збирен индекс,овозможувајќи да се процени степенот на влијание на различни фактори врз промените на нивото на критериумските индикатори во мултипликативните и повеќекратните модели. На точноста на одредувањето на големината на секој фактор влијае: бројот на децимални места (најмалку четири); бројот на самите фактори (односот е обратно пропорционален).

Принципи за конструирање на збирни индексисе: промена на еден фактор додека сите други се одржуваат константни. Притоа, ако генерализираниот економски показател е производ на квантитативни (волумен) и квалитативни показатели на фактори, тогаш при определување на влијанието на квантитативниот фактор, квалитативниот индикатор се фиксира на основно ниво, а при одредувањето на влијанието на квалитативниот фактор , квантитативниот индикатор е фиксиран на ниво на извештајниот период.

Да претпоставиме дека Y - a * b * c x d,

А;

Факторски индекс што покажува како се менува индикаторот битн.;

Таканаречениот „општ индекс на промени во добиениот индикатор“ во зависност од сите фактори.

При што

Користејќи го методот на индекс, можно е да се разложат на фактори не само релативни, туку и апсолутни отстапувања на генерализирачкиот индикатор, притоа одредувајќи го влијанието на поединечните фактори користејќи ја разликата помеѓу броителот и именителот на соодветните индекси, т.е. при пресметување на влијанието на еден фактор, елиминирање на влијанието на друг:

Користејќи го методот на индекс на факторска анализа, можно е да се разложат на фактори не само релативни, туку и апсолутни отстапувања во општиот индикатор. Со други зборови, влијанието на поединечен фактор може да се одреди со помош на разликата помеѓу броителот и именителот на соодветните индекси, т.е. при пресметување на влијанието на еден фактор, елиминирање на влијанието на друг.

Да речеме:

Каде А -квантитативен фактор и б-квалитативни,

индикатор поради фактор А;

Апсолутно зголемување на добиеното

индикатор поради фактор б

- апсолутно зголемување на добиеното

индикатор поради влијанието на сите фактори.

Препорачливо е да се примени разгледуваниот принцип на разложување на апсолутниот раст на генерализирачкиот индикатор на фактори ако бројот на фактори е еднаков на два (еден од нив е квантитативен, другиот е квалитативен), а анализираниот индикатор е претставен како нивен производ. , бидејќи теоријата на индекси не обезбедува општ метод за разложување на апсолутните отстапувања на генерализирачки индикатор во фактори кога бројот на фактори е повеќе од два. За да се реши овој проблем, се користи методот на замена на синџири.

Успешно се применуваат методите на факторска анализа со цел објективно да се процени влијанието на факторите врз критериумскиот показател за успешноста на организацијата.Како еден пример за овој пристап, разгледајте како промените во обемот на продажба на производи влијаат на финансиските резултати на една организација. По правило, промената на приходите од продажба настанува поради: 1) промена на обемот на продажба (физички поглед); 2) промени во продажните цени. Вкупната промена во приходите од продажба може да се претстави како збир на отстапувања на факторите:

Каде N x -приходи за извештајната година;

N 0 -приход од основната година;

А N-промена на приходите како резултат на промени во обемот на продажба;

А Нп- промена на приходите како резултат на промени во продажните цени на производите;

А Н в- промена на приходите како резултат на промени во структурата на продажбата на производите.

Да ги замислиме приходите (N)како производ на продажната цена (Р)на обемот на продажба ( П):

N 0 = P 0 X Q 0 -приход од основната година;

jV, = P, x (2, - приход од извештајната година.

Влијанието на промените во обемот на продажбата на производите (по постојани цени) врз промените во приходите се оценува на следниов начин:

Влијанието на промената на продажната цена (со постојан обем) врз промената на приходите се оценува на следниов начин:

Во процесот на анализа се утврдува влијанието на факторите како што се промените во продажната структура, како и учеството на поединечните артикли од асортиманот во вкупниот обем на продажба во основните и анализираните периоди, а потоа и влијанието на структурните промени врз се пресметува вкупниот обем на продажба. Изгубениот приход како резултат на промените во асортиманот на продадени производи се оценува негативно, додека вишокот приходи се оценува позитивно.

Нивната класификација
Во модерната статистика, факторската анализа се подразбира како збир на методи кои, врз основа на реално постоечките врски помеѓу карактеристиките, предметите или појавите, овозможуваат да се идентификуваат латентен(скриени и недостапни за директно мерење) генерализирачки карактеристики на организираната структура и механизам на развој на појавите или процесите што се проучуваат.

Концептот на латентност е клучен и значи имплицитност на карактеристиките откриени со помош на методите за факторска анализа.

Идејата за основната факторска анализа е прилично едноставна. Како резултат на мерењето, имаме работа со збир на елементарни карактеристики X јас, мерено на неколку скали. Ова - експлицитни променливи.Ако знаците се менуваат постојано, тогаш можеме да претпоставиме постоење на одредени вообичаени причини оваа варијабилност, т.е. постоењето на некои скриени (латентни) фактори. Задачата на анализата е да се пронајдат овие фактори.

Бидејќи факторите се комбинација од одредени променливи, произлегува дека овие променливи се поврзани една со друга, т.е. имаат корелација (коваријанса), згора на тоа, поголема меѓу себе отколку со другите варијабли вклучени во друг фактор. Методите за наоѓање фактори се засноваат на употреба на коефициенти на корелација (коваријанса) помеѓу променливите. Факторската анализа дава нетривијално решение, т.е. решението не може да се предвиди без употреба на специјална техника на екстракција на фактори. Оваа одлука е од големо значење за карактеризирање на феноменот, бидејќи на почетокот се карактеризираше со прилично голем број променливи, а како резултат на примената на анализата се покажа дека може да се карактеризира со помал број други променливи - фактори. .

Не само експлицитните променливи можат да корелираат X јас , но и набљудувани објекти Н јас. Во зависност од тоа каков тип на корелациска врска се разгледува - помеѓу карактеристики или објекти - се разликуваат, соодветно, техниките за обработка на податоци R и Q.

Во согласност со општите принципи на факторска анализа, резултатот од секое мерење се одредува со дејство на општи фактори, специфични фактори и „фактор“ на мерна грешка. Општосе нарекуваат фактори кои влијаат на резултатите од мерењата на неколку мерни скали. Секој од специфиченфакторите влијаат на резултатот од мерењето само на една од скалите. Под грешка при мерењеподразбира збир на причини кои не можат да се земат предвид кои ги одредуваат резултатите од мерењето. Варијабилноста на добиените емпириски податоци обично се опишува со помош на нејзината варијанса.


Веќе добро знаете дека коефициентот на корелација најчесто се користи за квантитативно опишување на врската помеѓу две променливи. Постојат многу варијанти на овој коефициент, а изборот на соодветна мерка за поврзување се одредува и од спецификите на емпириските податоци и од мерната скала.

Сепак, постои и геометриска можност за опишување на односот помеѓу карактеристиките. Графички, коефициентот на корелација помеѓу две променливи може да се претстави како два вектори - стрелки, кои потекнуваат од иста точка. Овие вектори се наоѓаат под агол еден на друг, чиј косинус е еднаков на коефициентот на корелација. Косинусот на аголот е тригонометриска функција, чија вредност може да се најде во референтна книга. Во оваа тема нема да разговараме за тригонометриската косинус функција, доволно е да се знае каде да се најдат соодветните податоци.

Табелата 7.1 покажува неколку вредности на косинусите на аглите, што ќе даде општа идеја за нив.

Табела 7.1

Косинусна табела за графичка слика

корелации помеѓу променливите.

Во согласност со оваа табела на вкупна позитивна корелација ( р1) ќе одговара на агол од 0 ( cos 0 1), т.е. графички ова ќе одговара на целосното совпаѓање на двата вектори (види Сл. 7.3 а).

Вкупно негативна корелација ( р -1) значи дека двата вектори лежат на иста права линија, но се насочени во спротивни насоки ( cos 180 -1). (Сл. 7.3 б).

Взаемна независност на променливите ( р = 0) е еквивалентно на меѓусебната перпендикуларност (ортогоналност) на векторите ( cos 90°=0). (Сл. 7.3 в).

Средните вредности на коефициентот на корелација се прикажани како парови вектори кои формираат или остри ( р > 0), или тап ( р   0 0 , р 1  180, р -1

V 1

V 2

А б
 90, р 0   90, р  0   90, р  0

V 2

V 1
Слика 7.3. Геометриска интерпретација на коефициентите на корелација.

Геометриски пристап кон факторската анализа


Горенаведената геометриска интерпретација на коефициентот на корелација е основа за графичко прикажување на целата матрица на корелација и последователно толкување на податоците во факторската анализа.

Конструирањето на матрицата започнува со конструирање на вектор што претставува која било променлива. Другите променливи се претставени со вектори со еднаква должина, сите потекнуваат од иста точка. Како пример, разгледајте го геометрискиот израз на корелации помеѓу пет променливи. (Слика 7.4.)


V 1

V 5 V 2

V 4
Слика 7.4. Геометриска интерпретација на матрицата на корелација (5x5).
Јасно е дека не е секогаш можно да се прикаже корелацијата во две димензии (на рамнина). Некои вектори на променливи би требало да бидат под агол на страницата. Овој факт не е проблем за вистинските математички процедури, но бара одредена имагинација од страна на читателот. На слика 7.5. може да се види дека корелацијата помеѓу променливите V1 V2 е голема и позитивна (бидејќи аглите помеѓу овие вектори се мали). Променливите V2 V3 се практично независни една од друга, бидејќи аголот меѓу нив е многу блиску до 90 , т.е. корелацијата е 0. Променливите V3 - V5 се силно и негативно поврзани. Високите корелации помеѓу V1 и V2 се доказ дека и двете од овие променливи практично го мерат истото својство и дека, всушност, една од овие променливи може да се исклучи од понатамошно разгледување без значителна загуба на информации. Најинформативни за нас се променливите кои се независни една од друга, т.е. имаат минимални меѓусебни корелации или агли кои одговараат на 90  (сл. 7.5.)

V 1

Слика 7.5. Геометриска интерпретација на матрицата на корелација
Од оваа слика е јасно дека постојат две групи на корелации: V 1, V 2, V 3 и V 4, V5. Корелациите помеѓу променливите V 1, V 2, V 3 се многу големи и позитивни (постојат мали агли помеѓу овие вектори и, следствено, големи косинусни вредности). Слично на тоа, корелацијата помеѓу променливите V 4 и V 5 е исто така голема и позитивна. Но, меѓу овие групи на променливи корелацијата е блиску до нула, бидејќи овие групи на променливи се практично ортогонални една на друга, т.е. лоцирани еден во однос на друг под прав агол. Горенаведениот пример покажува дека постојат две групи на корелации и информациите добиени од овие променливи може да се приближат со два заеднички фактори (F 1 и F 2), кои во овој случај се ортогонални еден на друг. Сепак, тоа не е секогаш случај. Сорти на факторска анализа во кои се пресметуваат корелации помеѓу фактори кои не се ортогонално лоцирани се нарекуваат косо решение. Сепак, ние нема да разгледуваме такви случаи во овој курс, и ќе се фокусираме исклучиво на ортогонални решенија.

Со мерење на аголот помеѓу секој заеднички фактор и секоја заедничка променлива, може да се пресметаат корелации помеѓу тие променливи и нивните соодветни фактори. Корелацијата помеѓу променлива и заеднички фактор обично се нарекува факторско оптоварување. Геометриската интерпретација на овој концепт е дадена на сл. 7.6.

F 2

Значи, од условите на проблемот презентиран погоре, произлегува дека имаме низа на податоци што се состои од 24 независни променливи (изјави), во различни аспекти кои ја опишуваат моменталната состојба на авиокомпанијата X на меѓународниот пазар на воздушен транспорт. Главната задача на факторската анализа е да се групираат искази со слично значење во макрокатегории со цел да се намали бројот на променливи и да се оптимизира структурата на податоците.

Користејќи го менито Analyze > Reduction Data > Factor, отворете го прозорецот Factor Analysis. Поместете ги променливите за анализа (ql-q24) од левата листа во десната, како што е прикажано на сл. 5.32. Полето Selection Variable ви овозможува да изберете променлива во однос на која ќе се изврши анализата (на пример, класа на лет). Во нашиот случај, оставете го ова поле празно.

Кликнете на копчето Описи и во полето за дијалог што се отвора (сл. 5.33), изберете KMO и Барлетовиот тест за сферичност.Ова ќе одреди колку достапните податоци се соодветни за факторска анализа. Прозорецот Описи ви овозможува да прикажете други неопходни описни статистики Меѓутоа, во повеќето примери од маркетинг истражување, овие можности обично не се користат.

Ориз. 5.32.

Ориз. 5.33.

Затворете го прозорецот Описи со кликнување на копчето Продолжи. Следно, отворете го прозорецот Extraction (сл. 5.34) со кликнување на соодветното копче во главното поле за дијалог Factor Analysis. Овој прозорец е наменет за избор на метод за формирање на фактор модел; направете го следново во него.

Ориз. 5.34.

Прво, во полето Метод изберете го методот на екстракција (формирање) на фактори. Општата препорака за избор на метод е како што следува. Неопходно е да се избере метод на екстракција на фактори кој ви овозможува недвосмислено да класифицирате што е можно повеќе променливи. Така, главните размислувања овде се бројот на класифицирани фактори и недвосмисленоста на класификацијата (односно, секоја променлива треба да припаѓа само на еден фактор). Како што ќе видите подолу, стандардниот метод на Главни компоненти во SPSS во нашиот случај ни овозможува недвосмислено да класифицираме 22 променливи од 24 достапни (92%), што е многу добар показател. Врз основа на постојното искуство, авторот може да тврди дека добар резултат од факторската анализа е пропорцијата на недвосмислено класифицирани променливи од најмалку 90%. Изберете го методот на главни компоненти. Овој метод е најпогоден за решавање на повеќето проблеми на маркетинг истражување со помош на факторска анализа.

Второ, наведете го бројот на формирани фактори (Екстракт група). Стандардно, методот за одредување на бројот на фактори што треба да се извлечат се поставува врз основа на вредностите на карактеристичните броеви (сопствени вредности над). Без да навлегуваме во статистички детали, забележуваме дека SPSS ги користи карактеристичните бројки за одредување на квантитативниот и квалитативниот состав на извлечените фактори. Со претходно поставена вредност на овој индикатор еднаква на 1, бројот на формираните фактори ќе биде еднаков на бројот на променливи за кои вредноста на карактеристичните броеви е поголема или еднаква на 1.

Исто така, можно е рачно да се определи на програмата колку фактори треба да се извлечат (Број на фактори). Оваа функција е обезбедена во SPSS, така што ако има премногу променливи со карактеристичен број поголем од 1, можете рачно да го намалите бројот на фактори. Голем број фактори е тешко да се толкуваат, затоа, ако методот на карактеристични броеви не успее да извлече прифатлив број фактори за толкување (колку помалку, толку подобро), треба самостојно да го наведете бројот на фактори во програмата. Овој проблем го решава аналитичарот во секој конкретен случај поединечно. Едно можно решение би било да се зголеми бројот на сопствена вредност од претходно поставената вредност од 1, да речеме, на 1,5 или повеќе. Ова ќе ви помогне ако сте добиле голем број фактори со карактеристичен број приближно еднаков на 1 и неколку (2-3 или повеќе) фактори со карактеристичен број поголем од 1,5 или друга вредност. Исто така, при рачно одредување на бројот на фактори, аналитичарот може да донесе релевантна одлука врз основа на неговото искуство или на какви било други претпоставки. Конечно, треба да се забележи дека при рачно одредување на бројот на извлечени фактори, понекогаш бројот на уникатно класифицирани променливи излегува дека е помал отколку со методот на екстракција врз основа на вредноста на карактеристичните броеви. Сепак, оваа негативна точка се компензира со зголемената јасност на резултатите од факторската анализа - на крајот на краиштата, ова ви овозможува да се ослободите од факторите кои не содржат променливи со значителен коефициент на корелација (во нашиот случај, 0,5).

Затворете го полето за дијалог Извлекување со кликнување на копчето Продолжи. Изберете го типот на ротација на коефициентната матрица (копче за ротација во главното поле за дијалог Факторска анализа). Коефициентната матрица се ротира со цел да се приближи факторскиот модел што е можно поблиску до идеалот: способност за недвосмислено класификација на сите променливи. Во полето за дијалог Ротација (Слика 5.35), изберете специфичен метод на ротација. Во повеќето случаи, методот Varimax е најсоодветната опција. Ја олеснува интерпретацијата на факторите со минимизирање на бројот на променливи со високи факторски оптоварувања. Изберете го овој тип на ротација и затворете го полето за дијалог со кликнување на копчето Продолжи.

Ориз. 5.35.

Следно, отворете го полето за дијалог Factor Scores (Слика 5.36) со кликнување на копчето Scores. Овој прозорец служи за создавање на нови променливи во изворната датотека со податоци, што последователно ќе овозможи секој испитаник да биде доделен на одредена група (фактор). Бројот на новосоздадените променливи е еднаков на бројот на извлечените фактори. Подолу ќе покажеме како да ги користиме овие променливи. Изберете Зачувај како променливи во полето за дијалог Factor Scores и изберете Regression како метод за одредување на вредностите за овие нови променливи. После ова, затворете го полето за дијалог со кликнување на копчето Продолжи.

Ориз. 5.36.

Последниот чекор пред да започнете со процедурата за факторска анализа е да изберете некои дополнителни параметри (копче Опции). Во полето за дијалог што се отвора (сл. 5.37), изберете две ставки: Подредени по големина и Потиснете апсолутни вредности помали од. Првата опција ви овозможува да ги прикажете променливите вклучени во секој фактор по опаѓачки редослед на нивните коефициенти на факторот (големината на придонесот на променливата во формирањето на факторот). Вториот се покажува како многу корисен, бидејќи ја олеснува задачата за недвосмислено толкување на добиените фактори. Вредноста на овој параметар наведена во соодветното поле (во нашиот случај 0,5) ги отсекува променливите со коефициенти на фактор помали од оваа вредност. Ова овозможува да се поедностави ротираната факторска матрица, бидејќи од неа исчезнуваат незначителни променливи вклучени во секој извлечен фактор. Ако не ја овозможите оваа опција, секоја променлива ќе прикаже коефициент на фактор за секој фактор, што непотребно ќе го преоптовари факторскиот модел и ќе го отежне разбирањето за истражувачите.

Воведен е параметарот Suppress апсолутни вредности помали од параметарот за да се олесни практичното толкување на резултатите од факторската анализа. Бидејќи коефициентите на факторот во добиената ротирана матрица на коефициенти се коефициенти на корелација помеѓу соодветните променливи и фактори, во повеќето практични случаи препорачливо е почетната гранична вредност за незначајните променливи да се постави на 0,5. Ако факторската анализа резултира со помалку од прифатлив број класифицирани променливи (на пример, ако структурата на податоците не е добро прилагодена за факторска анализа; видете подолу), можете повторно да го пресметате факторскиот модел со помала гранична вредност (на пример, 0,4 ). Во спротивна ситуација, доколку променливата е вклучена во неколку фактори, може да се предложи зголемување на нивото на екстракција од 0,5 на 0,6. Ова ќе ги елиминира променливите вклучени во неколку фактори одеднаш, зголемувајќи ја практичната соодветност на резултатите од факторската анализа.

Значи, откако ќе ги наведете сите потребни параметри во прозорецот Опции, затворете го (копчето Продолжи) и започнете ја процедурата за анализа на фактори со кликнување на копчето 0K во главното поле за дијалог Факторска анализа.

Ориз. 5.37.

Откако програмата ќе ги направи сите потребни пресметки, ќе се отвори прозорецот SPSS Viewer со резултатите од конструирањето на факторскиот модел. Првото нешто што не интересира е соодветноста на достапните податоци за факторска анализа воопшто. Да ја погледнеме табелата КМО и Барлетовиот тест (сл. 5.38).Таа има два показатели кои нè интересираат: КМО тестот и значењето на Барлет тестот.Резултатите од тестот КМО ни овозможуваат да извлечеме заклучок во однос на општото соодветноста на достапните податоци за факторска анализа, односно колку добро конструиран факторскиот модел ја опишува структурата на одговорите на испитаниците на анализираните прашања. Резултатите од овој тест се движат од 0 (факторскиот модел е апсолутно неприменлив) до 1 (на факторскиот модел совршено ја опишува структурата на податоците).Факторската анализа треба да се смета за соодветна ако КМО е во опсег од 0,5 до 1. Во нашиот случај, оваа бројка е 0,9, што е многу добар резултат.

Барлетовиот тест за сферичност ја тестира хипотезата дека променливите вклучени во факторската анализа не се меѓусебно поврзани. Статистиката која ја одредува соодветноста на факторската анализа според Барлет тестот е значајна (линија Sig.).На прифатливо ниво

значајност (под 0,05), факторската анализа се смета за погодна за анализа на популацијата на примерокот што се испитува. Во нашиот случај, тестот што се разгледува покажува многу мала значајност (помалку од 0,001), од која произлегува заклучокот за применливоста на факторската анализа.

Така, врз основа на тестовите KMO и Barlett, дојдовме до заклучок дека податоците што ги имавме беа речиси идеално прилагодени за истражување со помош на факторска анализа.

Ориз. 5.38.

Следниот чекор во толкувањето на резултатите од факторската анализа е да се земе предвид добиената ротирана матрица на коефициенти на фактори: табелата со матрица на ротирана компонента (сл. 5.39). Оваа табела е главниот резултат на факторската анализа. Ги одразува резултатите од класифицирањето на променливите во фактори. Во нашиот случај, со користење на автоматски метод за одредување на бројот на фактори (врз основа на карактеристични бројки поголеми од 1), беше изграден практично прифатлив факторски модел, во кој 22 од 24 променливи може недвосмислено да се класифицираат во мал број фактори (5 ). Овој резултат може да се смета за добар.

Можете да се справите со некласифицираните променливи на следниов начин. Едноставно треба повторно да го пресметате моделот на фактор со отстранување на претходно поставената вредност на прекин од 0,5 во полето за дијалог Опции. Следно, ќе се конструира факторска матрица (сл. 5.40), во која аналитичарот ќе треба самостојно да ја утврди припадноста на некласифицираните променливи на одреден фактор врз основа на критериумот највисок коефициент на корелација помеѓу променливите и петте фактори. Во нашиот случај, гледате дека променливата ql6 е највисоко корелирана со факторот 1 (коефициент на фактор 0,468) и затоа треба да му се додели на овој фактор, а променливата q24 треба да биде доделена на факторот 4 (0,474).

Откако недвосмислено ги класифициравме сите променливи, да се вратиме на табелата на сл. 5.40. Добивме пет групи на променливи (фактори) кои ја опишуваат моменталната конкурентска позиција на авиокомпанијата X од пет различни аспекти. Тоа се групите.

q2. Авиокомпанијата X може да се натпреварува со најдобрите авиокомпании во светот. q3. Верувам дека Airline X има ветувачка иднина во глобалното воздухопловство. q23. Авиокомпанијата X е подобра отколку што многу луѓе мислат дека е. q!4. Авиокомпанијата X е лицето на Русија.

Ориз. 5.39.

qlO. Авиокомпанијата X навистина се грижи за своите патници.

ql. Авиокомпанијата X има репутација за одлична услуга за патници.

q21. Airline X е ефикасна авиокомпанија. q5. Горд сум што работам за X Airline.

ql6. Услугата на авиокомпанијата X е конзистентна и препознатлива низ целиот свет.

ql2. Верувам дека високите менаџери работат напорно за да ја направат авиокомпанијата успешна.

qll. Постои висок степен на задоволство од работата кај вработените во авиокомпаниите.

q6. Во рамките на авиокомпанијата X постои добра комуникација помеѓу одделите.

q8. Сега авиокомпанијата X брзо се подобрува.

q7. Секој вработен во авиокомпанијата работи напорно за да го обезбеди нејзиниот успех.

q4. Знам каква ќе биде стратегијата за развој на авиокомпанијата Х во иднина.

ql7. Не би сакал авиокомпанијата Х да се промени.

q20. Промените во авиокомпанијата X ќе бидат позитивен развој.

ql8. Авиокомпанијата X треба да се промени за да го искористи својот целосен потенцијал.

q9. Имаме долг пат да одиме пред да можеме да тврдиме дека сме авиокомпанија од светска класа.

q22. Би сакал да видам подобрување на имиџот на авиокомпанијата X од гледна точка на странските патници.

q24. Важно е луѓето ширум светот да знаат дека ние сме руска авиокомпанија.

ql9. Мислам дека авиокомпанијата Х треба визуелно да се претстави на помодерен начин.

ql3. Ми се допаѓа начинот на кој Airline X моментално визуелно се претставува пред пошироката јавност (во смисла на шема на бои и брендирање).

ql5. Изгледаме како вчера во споредба со другите авиокомпании.

Најтешката задача при спроведување на факторска анализа е толкувањето на факторите што произлегуваат. Овде нема универзално решение: во секој конкретен случај, аналитичарот го користи постојното практично искуство со цел да разбере зошто факторскиот модел доделува одредена променлива на овој конкретен фактор. Има случаи (особено со мал број добро формализирани променливи) кога формираните фактори се очигледни, а разликите меѓу променливите се видливи со голо око. Во таква ситуација, можете да направите без факторска анализа и рачно да ги делите променливите во групи. Сепак, ефективноста и моќта на факторската анализа се манифестира во сложени и нетривијални случаи кога променливите не можат однапред да се класифицираат, а нивните формулации се збунувачки. Потоа, класификацијата на променливите врз основа на мислењата на испитаниците ќе биде од голем истражувачки интерес, што ќе овозможи да се идентификува како самите испитаници го разбрале ова или она прашање.

Секогаш кога е можно и соодветно за целите на студијата, варијаблите треба да се формализираат пред да се спроведе факторска анализа. Ова ќе му овозможи на аналитичарот да направи однапред претпоставки за поделба на множеството достапни променливи во групи. Задачата на истражувачот при толкување на резултатите од факторската матрица во овој случај ќе биде поедноставена, бидејќи тој повеќе нема да започне „од нула“. Неговата задача ќе се сведе на тестирање на претходно поставени хипотези за припадноста на одредена променлива на одредена група.

Понекогаш се појавуваат случаи кога променливата доделена на одреден фактор од SPSS логично не е поврзана на кој било начин со другите променливи што го сочинуваат истиот фактор. Можете повторно да го пресметате факторот модел без отсекување на незначителни коефициенти (како на примерот на сл. 5.40) и да видите со кој друг фактор оваа нелогична променлива е во корелација со речиси иста јачина како и со факторот на кој автоматски му е доделена. На пример, променливата Z има коефициент на корелација со фактор 1 од 0,505, а со фактор 2 корелира со коефициент од 0,491. SPSS автоматски ја доделува оваа променлива на факторот со кој се идентификува најголемата корелација, без да се земе предвид дека оваа променлива корелира со речиси иста јачина со друг фактор. Во таква ситуација (со мала разлика во коефициентите на корелација) можете да се обидете да ја доделите променливата Z на факторот 2, а ако тоа се покаже логично, сметајте ја во групата на променливи од вториот фактор.

Можно е рачно да се намали бројот на фактори што треба да се извлечат, што ќе ја олесни задачата на истражувачот при толкувањето на резултатите од факторската анализа. Сепак, мора да се има предвид дека таквото намалување ќе ја намали флексибилноста на факторот модел и може дури да доведе до ситуација кога променливите се лажно поделени на неточни, од практична гледна точка, групи. Исто така, намалувањето на бројот на извлечени фактори неизбежно ќе го намали процентот на недвосмислено класифицирани фактори.

Како варијанта на претходното решение, можно е да се предложи комбинирање на два или повеќе фактори со мали количини на нивните составни променливи. Ваквото групирање, од една страна, ќе го намали бројот на толкуваливи фактори, а од друга страна ќе го олесни разбирањето на малите фактори.

Ако истражувачот дошол во ќорсокак и ниеден начин не помага да се објасни припадноста на одредена променлива на одреден фактор, останува да се примени друга статистичка процедура (на пример, кластерска анализа).

Да се ​​вратиме на нашите пет фактори. Задачата за нивно опишување и објаснување не изгледа многу тешка. Така, може да се забележи дека изјавите вклучени во првиот фактор (q2, q3, q23, ql4, qlO, ql, q21, q5 и ql6) се општи, односно се однесуваат на целата авиокомпанија и го опишуваат односот кон тоа од страна на патниците во воздухопловството. Единствен исклучок беше променливата q5, која е повеќе поврзана со вториот фактор. Коефициентот на корелација со факторот 2 е 0,355 (види Сл. 5.40), што овозможува да се вклучи во оваа група од логични причини. Факторот 2 (ql2, qll, q6, q8, q7 и q4) го опишува односот кон авиокомпанијата X од страна на вработените. Третиот фактор (ql7, q20 и ql8) го опишува ставот на испитаниците кон промените во авиокомпанијата (ги вклучува сите изјави со коренот „мажи“ - од зборот „промена“). Четвртиот фактор (q9, q22 и q24) го опишува ставот на испитаниците кон имиџот на авиокомпанијата. Конечно, петтиот фактор (ql9, ql3 и ql5) ги комбинира изјавите што го карактеризираат ставот на испитаниците кон визуелната слика на авиокомпанијата X.

Така, добивме пет групи на изјави кои ја опишуваат моменталната конкурентна позиција на компанијата X на меѓународниот пазар за воздушен транспорт. Врз основа на интерпретативната (семантичка) анализа, на овие групи (фактори) може да им се доделат следните дефиниции.

¦ Фактор 1 ја карактеризира општата позиција на авиокомпанијата X во очите на нејзините клиенти.

¦ Фактор 2 ја карактеризира внатрешната состојба на авиокомпанијата X од гледна точка на нејзините вработени.

¦ Фактор 3 ги карактеризира промените што се случуваат во авиокомпанијата X.

¦ Фактор 4 ја карактеризира сликата на авиокомпанијата X.

¦ Фактор 5 ја карактеризира визуелната слика на авиокомпанијата X.

Откако успешно ги протолкувавме сите добиени фактори, факторската анализа може да ја сметаме за целосна и успешна. Следно, ќе покажеме како резултатите од факторската анализа може да се користат за конструирање на пресеци.

Потсетете се дека оценките на факторите (т.е. членството на секој испитаник во одреден фактор) ги зачувавме во оригиналната датотека со податоци како нови променливи. Овие променливи имаат имиња како: facX_Y, каде што X е факторот број, а Y е серискиот број на факторот модел. Ако изградиме факторски модел двапати и завршивме со три фактори извлечени првиот пат и два фактори вториот пат, имињата на променливите ќе бидат како што следува:

¦ facl_l, fac2_l, fac3_l (за три фактори од првиот изграден модел);

¦ facl_2, fac2_2 (за два фактори од вториот модел).

Во нашиот случај, ќе се создадат пет нови променливи (според бројот на извлечени фактори). Овие оценки на фактори може да се користат во иднина, на пример, за изградба на пресеци. Така, ако е неопходно да се открие како испитаниците - мажи и жени - оценуваат различни аспекти од активностите на авиокомпанијата X, тоа може да се направи со анализа на рејтингот на факторите.

Најчестиот начин да се користат рејтинзите на факторите во понатамошните пресметки е да се рангираат и потоа да се поделат новосоздадените променливи што ги претставуваат извлечените фактори на четири квартили (25% перцентили). Овој пристап овозможува создавање на нови променливи на редовна скала кои ги опишуваат четирите нивоа на секој фактор. Во нашиот случај, за изјавите што го сочинуваат факторот 2, овие нивоа ќе бидат: не се согласувам (состојбата со внатрешните работи на компанијата не ги задоволува вработените), а не се согласувам (проценката на внатрешната состојба во компанијата е под просекот) , попрво се согласувам (оценка над просекот), се согласувам (оценка Одлично).

За да креирате променливи според кои испитаниците дополнително ќе се групираат, повикајте го менито Transform > Rank Cases. Во полето за дијалог што се отвора (сл. 5.41), од левата листа изберете ја променливата што содржи оценки на фактори за фактор 2 (fac2_l) и ставете ја во полето Variables. Следно, во областа Додели ранг I на областа, изберете ја ставката со најмала вредност, во нашиот случај тоа значи дека првата група (не се согласувам) ќе се состои од испитаници кои ја оценуваат состојбата на внатрешните работи на авиокомпанијата како лоша. Според тоа, групите 2, 3 и 4 ќе бидат дефинирани за категориите на прилично не се согласувам, напротив се согласувам и се согласувам соодветно.

Ориз. 5.41.

Кликнете Rank Types > Types, откажете ја стандардната опција Rank и наместо тоа изберете Ntiles со бројот на групи претходно поставен на 4 (Слика 5.42). Кликнете на копчето Продолжи, а потоа на ОК во главниот дијалог прозорец. Оваа постапка ќе создаде нова променлива nfac2_l (2 значи втор фактор) во датотеката со податоци, класифицирајќи ги испитаниците во четири групи.

Ориз. 5.42.

Сите испитаници во примерокот се карактеризираат со позитивен, прилично позитивен, прилично негативен или негативен став кон моменталната состојба на работите во авиокомпанијата X. За да се зголеми јасноста, се препорачува да се доделат етикети на секое од идентификуваните четири нивоа; Можете исто така да ја преименувате самата променлива. Сега можете да вршите пресек анализи користејќи ја новата редовна променлива, како и да изградите други статистички модели обезбедени во SPSS. Подолу ќе покажеме како да ги искористиме резултатите од конструирањето на факторски модел во кластерската анализа.

За да ги илустрираме можностите за практична употреба на новата променлива, ќе спроведеме пресек анализа на влијанието на полот на испитаниците врз нивната проценка на моменталната состојба на авиокомпанијата X (Слика 5.43). Како што следува од презентираната табела, машките испитаници обично имаат тенденција да даваат пониски оценки на параметарот на авиокомпанијата што се разгледува во споредба со жените. Така, во структурата на рејтингот многу лош, лош и задоволителен, преовладува процентот на мажи; оценките се многу добри, напротив доминираат жените. Кога се префрлате во секоја следна (повисока) категорија на оценување, уделот на мажите подеднакво се намалува, а уделот на жените, соодветно, се зголемува. Тестот %2 покажува дека идентификуваната врска е статистички значајна.

Ориз. 5.43. Вкрстена дистрибуција: влијанието на полот на испитаниците врз нивната проценка за моменталната состојба на авиокомпанијата X

ФАКТОРСКА АНАЛИЗА

Идејата за факторска анализа

При проучување на сложени предмети, појави, системи, факторите кои многу често ги одредуваат својствата на овие предмети не можат директно да се измерат, а понекогаш дури и нивниот број и значење се непознати. Но, други количини може да бидат достапни за мерење, во зависност на еден или друг начин од факторите што нè интересираат. Освен тоа, кога влијанието на непознат фактор за нас се манифестира во неколку измерени знаци или својства на некој предмет, овие знаци можат да покажат блиска врска меѓу себе и вкупниот број на фактори може да биде многу помал од бројот на измерените променливи.

За да се идентификуваат факторите кои ги одредуваат измерените карактеристики на објектите, се користат методи на факторска анализа

Пример за примена на факторска анализа е проучувањето на особините на личноста врз основа на психолошки тестови. Карактеристиките на личноста не можат директно да се мерат. Тие можат да се проценат само според однесувањето на една личност или природата на нивните одговори на прашањата. За да се објаснат резултатите од експериментите, тие се подложени на факторска анализа, што ни овозможува да ги идентификуваме оние лични својства кои влијаат на однесувањето на поединецот.
Основата на различните методи на факторска анализа е следнава хипотеза: набљудуваните или измерените параметри се само индиректни карактеристики на предметот што се проучува; во реалноста, постојат внатрешни (скриени, латентни, не директно забележливи) параметри и својства, бројот на која е мала и која ги одредува вредностите на набљудуваните параметри. Овие внатрешни параметри обично се нарекуваат фактори.

Целта на факторската анализа е да се концентрираат првичните информации, изразувајќи голем број карактеристики што се разгледуваат преку помал број на пообемни внатрешни карактеристики на феноменот, кои, сепак, не можат директно да се измерат.

Утврдено е дека идентификацијата и последователното следење на нивото на заеднички фактори овозможуваат откривање на условите пред дефект на објектот во многу раните фази на развојот на дефектот. Факторската анализа ви овозможува да ја следите стабилноста на корелациите помеѓу поединечните параметри. Корелационите врски помеѓу параметрите, како и помеѓу параметрите и општите фактори, ги содржат главните дијагностички информации за процесите. Користењето на алатките од пакетот Statistica при вршење на факторска анализа ја елиминира потребата од користење дополнителни компјутерски алатки и ја прави анализата визуелна и разбирлива за корисникот.

Резултатите од факторската анализа ќе бидат успешни доколку е можно да се интерпретираат идентификуваните фактори врз основа на значењето на индикаторите што ги карактеризираат овие фактори. Оваа фаза на работа е многу одговорна; бара јасно разбирање на суштинското значење на индикаторите кои се користат за анализа и врз основа на кои се идентификуваат факторите. Затоа, кога однапред се избираат индикаторите за факторска анализа, треба да се води според нивното значење, а не од желбата да се вклучат што повеќе од нив во анализата.

Суштината на факторската анализа

Да претставиме неколку основни одредби за факторска анализа. Нека за матрицата Xод мерените параметри на објектот постои матрица на коваријанса (корелација). В, Каде Р- број на параметри, n– број на набљудувања. Со линеарна трансформација X=QY+Уможете да ја намалите димензијата на оригиналниот факторски простор Xда се израмни Y, при што Р"<<Р. Ова одговара на трансформацијата на точка која ја карактеризира состојбата на објектот во ј-димензионален простор, во нов димензионален простор со помала димензија Р„. Очигледно, геометриската близина на две или многу точки во новиот факторски простор значи стабилност на состојбата на објектот.

Матрица Yсодржи незабележливи фактори, кои во суштина се хиперпараметри кои ги карактеризираат најопштите својства на анализираниот објект. Заедничките фактори најчесто се избираат да бидат статистички независни, што го олеснува нивното физичко толкување. Вектор на набљудуваните карактеристики Xпоследиците од промената на овие хиперпараметри имаат смисла.

Матрица Усе состои од резидуални фактори, кои главно вклучуваат грешки при мерењето на карактеристиките x(јас). Правоаголна матрица Псодржи факторски оптоварувања кои ја одредуваат линеарната врска помеѓу карактеристиките и хиперпараметрите.
Факторските оптоварувања се вредностите на коефициентите на корелација на секоја од оригиналните карактеристики со секој од идентификуваните фактори. Колку е поблиску поврзаноста на дадената карактеристика со факторот што се разгледува, толку е поголема вредноста на факторското оптоварување. Позитивен знак за факторско оптоварување укажува на директна (и негативен знак - инверзна) врска помеѓу дадена карактеристика и фактор.

Така, податоците за факторските оптоварувања овозможуваат да се формулираат заклучоци за збирот на почетни карактеристики кои одразуваат одреден фактор и за релативната тежина на поединечна карактеристика во структурата на секој фактор.

Моделот за факторска анализа е сличен на моделите за мултиваријатна регресија и анализа на варијанса. Фундаменталната разлика помеѓу моделот на факторска анализа е во тоа што векторот Y е фактори кои не се набљудуваат, додека во регресивната анализа тоа се евидентираните параметри. На десната страна на равенката (8.1), непознатите се матрицата на факторски оптоварувања Q и матрицата на вредностите на заедничките фактори Y.

За да ја пронајдете матрицата на факторски оптоварувања, користете ја равенката QQ t = S–V, каде што Q t е транспонираната матрица Q, V е матрица на коваријанса на резидуални фактори U, т.е. . Равенката се решава со итерации со одредување нулта приближување на коваријансната матрица V(0). По наоѓањето на матрицата на факторски оптоварувања Q, заедничките фактори (хиперпараметри) се пресметуваат со помош на равенката
Y=(Q t V -1)Q -1 Q t V -1 X

Пакетот за статистичка анализа Statistica ви овозможува интерактивно да пресметате матрица на оптоварувања на фактори, како и вредности на неколку предефинирани главни фактори, најчесто два - врз основа на првите две главни компоненти на оригиналната параметарска матрица.

Факторска анализа во системот Статистика

Да ја разгледаме низата на факторска анализа користејќи го примерот на обработка на резултатите прашалник анкета на вработените во претпријатието. Потребно е да се идентификуваат главните фактори кои го одредуваат квалитетот на работниот живот.

Во првата фаза, потребно е да се изберат променливи за факторска анализа. Користејќи корелациска анализа, истражувачот се обидува да ја идентификува врската помеѓу карактеристиките што се проучуваат, што, пак, му дава можност да идентификува целосен и неизлишен сет на карактеристики со комбинирање на високо корелирани карактеристики.

Ако се спроведе факторска анализа на сите променливи, резултатите можеби не се целосно објективни, бидејќи некои варијабли се одредуваат со други податоци и не можат да бидат регулирани од вработените во организацијата за која станува збор.

За да разбереме кои индикатори треба да се исклучат, ајде да изградиме матрица на коефициенти на корелација користејќи ги достапните податоци во Statistica: Статистика / Основна статистика / Матрици за корелација / Ок. Во почетниот прозорец на оваа постапка Производ-момент и парцијални корелации (сл. 4.3), копчето за листа на една променлива се користи за пресметување на квадратната матрица. Изберете ги сите променливи (изберете ги сите), Ок, Резиме. Ја добиваме матрицата на корелација.

Ако коефициентот на корелација варира од 0,7 до 1, тогаш тоа значи силна корелација на индикаторите. Во овој случај, една променлива со силна корелација може да се елиминира. Спротивно на тоа, ако коефициентот на корелација е мал, можете да ја елиминирате променливата поради фактот што таа нема да додаде ништо на вкупниот број. Во нашиот случај, не постои силна корелација помеѓу која било променлива и ќе спроведеме факторска анализа за целосниот сет на променливи.

За да извршите факторска анализа, треба да го повикате модулот Статистика/Мултиваријатни истражувачки техники/факторска анализа. Прозорецот на модулот за Факторска анализа ќе се појави на екранот.



За анализа, ги избираме сите променливи на табелата; Променливи: изберете ги сите, Во ред. Линијата Влезна датотека означува необработени податоци. Во модулот се можни два вида изворни податоци - необработени податоци и корелација матрица - корелација матрица.

Делот за бришење MD одредува како се постапува со вредностите што недостасуваат:
* Casewise – начин да се исклучат вредностите што недостасуваат (стандардно);
* Pairwise – парен метод за елиминирање на вредностите што недостасуваат;
* Средна замена – замена на средната вредност наместо вредностите што недостасуваат.
Методот Casewise е да се игнорираат сите редови во табела која содржи податоци кои имаат барем една вредност што недостасува. Ова се однесува на сите променливи. Методот Pairwise ги игнорира вредностите што недостасуваат не за сите променливи, туку само за избраниот пар.

Ајде да избереме начин да се справиме со вредностите што недостасуваат.

Статистика ќе ги обработи вредностите што недостасуваат на наведениот начин, ќе пресмета матрица за корелација и ќе понуди неколку методи за анализа на фактори за избор.

По кликнување на копчето Ok, се појавува прозорецот Дефинирај метод на екстракција на фактори.

Горниот дел од прозорецот е информативен. Ова известува дека вредностите што недостасуваат се постапуваат со методот Casewise. Обработени се 17 набљудувања и прифатени 17 набљудувања за понатамошни пресметки. Матрицата на корелација беше пресметана за 7 променливи. Долниот дел од прозорецот содржи 3 јазичиња: Брзо, Напредно, Описи.

Постојат две копчиња во табулаторот Описи:
1- преглед на корелации, средства и стандардни отстапувања;
2- изгради повеќекратна регресија.

Со кликнување на првото копче, можете да ги видите просеците и стандардните отстапувања, корелации, коваријанси и да изградите различни графикони и хистограми.

Во табулаторот Advanced, на левата страна, изберете го методот на екстракција на факторска анализа: Главни компоненти. На десната страна, изберете го максималниот број фактори (2). Наведен е или максималниот број на фактори (Max no of factor) или минималната сопствена вредност: 1 (сопствената вредност).

Кликнете Ok, и Statistica брзо ќе ги изврши пресметките. На екранот се појавува прозорецот Резултати од факторска анализа. Како што беше наведено претходно, резултатите од факторската анализа се изразуваат со збир на факторски оптоварувања. Затоа, понатаму ќе работиме со јазичето Вчитувања.

Горниот дел од прозорецот е информативен:
Број на променливи (број на анализирани променливи): 7;
Метод (метод на селекција на фактор): Главни компоненти;
Лог (10) детерминанта на матрица на корелација: –1,6248;
Број на извлечени фактори: 2;
Сопствени вредности (сопствени вредности): 3,39786 и 1,19130.
На дното на прозорецот има функционални копчиња кои ви овозможуваат сеопфатно да ги прегледате резултатите од анализата, нумерички и графички.
Ротација на фактори – ротација на фактори; во овој паѓачки прозорец можете да изберете различни ротации на оските. Со ротирање на координатниот систем може да се добие множество решенија од кои мора да се избере интерпретабилно решение.

Постојат различни методи за ротирање на просторните координати. Пакетот Статистика нуди осум такви методи, претставени во модулот за факторска анализа. Така, на пример, варимакс методот одговара на координатна трансформација: ротација што ја максимизира варијансата. Во методот варимакс, се добива поедноставен опис на колоните на факторската матрица, намалувајќи ги сите вредности на 1 или 0. Во овој случај, се разгледува дисперзијата на вчитувањата на квадратните фактори. Факторската матрица добиена со методот на ротација на варимакс е понепроменлива во однос на изборот на различни групи на променливи.

Квартимакс ротацијата има за цел слично поедноставување само во однос на редовите на факторската матрица. Дали е Equimax помеѓу? При ротирачки фактори користејќи го овој метод, се прави обид да се поедностават и колоните и редовите. Разгледаните методи на ротација се однесуваат на ортогонални ротации, т.е. резултатот е неповрзани фактори. Методите на директна облиминација и промакс ротација се однесуваат на коси ротации, кои резултираат со фактори кои се меѓусебно корелирани. Терминот?нормализиран? во имињата на методите покажува дека факторските оптоварувања се нормализирани, односно поделени со квадратниот корен на соодветната варијанса.

Од сите предложени методи, прво ќе го разгледаме резултатот од анализата без ротирање на координатниот систем - Неротиран. Ако добиениот резултат се покаже како толкувачки и ни одговара, тогаш можеме да застанеме таму. Ако не, можете да ги ротирате оските и да погледнете други решенија.

Кликнете на копчето „Factor Loading“ и нумерички погледнете ги вчитувањата на факторите.



Да потсетиме дека факторските оптоварувања се вредностите на коефициентите на корелација на секоја променлива со секој од идентификуваните фактори.

Вредноста на вчитување на факторот поголема од 0,7 покажува дека оваа карактеристика или променлива е тесно поврзана со факторот за кој станува збор. Колку е поблиску поврзаноста на дадената карактеристика со факторот што се разгледува, толку е поголема вредноста на факторското оптоварување. Позитивен знак за факторско оптоварување укажува на директна (и негативен знак? инверзна) врска помеѓу дадена карактеристика и фактор.
Значи, од табелата на факторски оптоварувања, беа идентификувани два фактора. Првиот го дефинира OSB - чувство на социјална благосостојба. Останатите променливи се одредуваат со вториот фактор.

Во линијата Expl. Var (сл. 8.5) ја покажува варијансата што се припишува на еден или друг фактор. Во линија Прп. Тотл ја покажува пропорцијата на варијансата одговорена од првиот и вториот фактор. Според тоа, првиот фактор учествува со 48,5% од вкупната варијанса, а вториот фактор отпаѓа 17,0% од вкупната варијанса, а остатокот е одговорен од други неотсметани фактори. Како резултат на тоа, двата идентификувани фактори објаснуваат 65,5% од вкупната варијанса.



Овде гледаме и две групи фактори - OCB и остатокот од многуте променливи, од кои се издвојува JSR - желбата за промена на работните места. Очигледно, има смисла да се истражи оваа желба потемелно со собирање дополнителни податоци.

Избор и појаснување на бројот на фактори

Откако ќе добиете информации за тоа колку варијанса придонесе секој фактор, можете да се вратите на прашањето колку фактори треба да се задржат. По својата природа, оваа одлука е произволна. Но, постојат некои општо прифатени препораки, а во пракса нивното следење дава најдобри резултати.

Бројот на заеднички фактори (хиперпараметри) се одредува со пресметување на сопствените вредности (сл. 8.7) на матрицата X во модулот за факторска анализа. За да го направите ова, во табулаторот Објаснето варијанса (сл. 8.4), треба да кликнете на копчето Scree plot.


Максималниот број на заеднички фактори може да биде еднаков на бројот на сопствени вредности на матрицата на параметрите. Но, како што се зголемува бројот на фактори, тешкотиите на нивното физичко толкување значително се зголемуваат.

Прво, може да се изберат само фактори со сопствени вредности поголеми од 1. Во суштина, тоа значи дека ако факторот не придонесува варијанса еквивалентна барем на варијансата на една променлива, тогаш тој се испушта. Овој критериум е најшироко користен. Во горниот пример, врз основа на овој критериум, треба да се задржат само 2 фактори (две главни компоненти).

Можете да најдете место на графиконот каде што намалувањето на сопствените вредности од лево кон десно се забавува колку што е можно повеќе. Се претпоставува дека десно од оваа точка има само „факториски гребен“. Во согласност со овој критериум, можете да оставите 2 или 3 фактори во примерот.
Од Сл. може да се види дека третиот фактор благо го зголемува учеството на вкупната варијанса.

Факторската анализа на параметрите овозможува во рана фаза да се идентификува повреда на работниот процес (појава на дефект) во различни предмети, што често не може да се забележи со директно набљудување на параметрите. Ова се објаснува со фактот дека прекршувањето на корелацијата помеѓу параметрите се случува многу порано од промената на еден параметар. Ова нарушување на корелациите овозможува навремено откривање на факторската анализа на параметрите. За да го направите ова, доволно е да имате низи од регистрирани параметри.

Може да се дадат општи препораки за употреба на факторска анализа, без оглед на предметната област.
* Секој фактор мора да има најмалку два измерени параметри.
* Бројот на мерења на параметрите мора да биде поголем од бројот на променливи.
* Бројот на фактори мора да се оправда врз основа на физичката интерпретација на процесот.
* Секогаш треба да се осигурате дека бројот на фактори е многу помал од бројот на променливи.

Критериумот Кајзер понекогаш задржува премногу фактори, додека критериумот scree понекогаш задржува премногу малку фактори. Сепак, и двата критериуми се доста добри во нормални услови, кога има релативно мал број фактори и многу променливи. Во пракса, поважното прашање е кога може да се толкува добиеното решение. Затоа, вообичаено е да се испитаат неколку решенија со повеќе или помалку фактори, а потоа да се избере она што има најмногу смисла.

Просторот на почетните карактеристики треба да се прикаже во хомогени мерни скали, бидејќи тоа овозможува користење на корелација матрици во пресметките. Во спротивно, се јавува проблемот на „тежини“ на различни параметри, што доведува до потреба од користење на матрици на коваријанса при пресметување. Ова може да резултира со дополнителен проблем на повторливост на резултатите од факторската анализа кога се менува бројот на карактеристики. Треба да се напомене дека овој проблем едноставно се решава во пакетот Statistica со преминување кон стандардизирана форма на претставување на параметри. Во овој случај, сите параметри стануваат еквивалентни во однос на степенот на нивната поврзаност со процесите во предметот на проучување.

Лошо условени матрици

Ако има вишок променливи во изворниот сет на податоци и тие не се елиминирани со корелациона анализа, тогаш инверзната матрица (8.3) не може да се пресмета. На пример, ако променливата е збир на две други променливи избрани за оваа анализа, тогаш матрицата на корелација за тој сет на променливи не може да се преврти, а факторската анализа фундаментално не може да се изврши. Во пракса, ова се случува кога некој се обидува да примени факторска анализа на многу високо зависни променливи, како што понекогаш се случува, на пример, при обработката на прашалниците. Тогаш е можно вештачки да се спуштат сите корелации во матрицата со додавање на мала константа на дијагоналните елементи на матрицата, а потоа да се стандардизира. Оваа постапка обично резултира со матрица која може да се преврти и затоа е применлива за факторска анализа. Покрај тоа, оваа постапка не влијае на множеството фактори, но проценките се помалку точни.

Факторско и регресивно моделирање на системи со променливи состојби

Систем за променлива состојба (VSS) е систем чиј одговор не зависи само од влезното дејство, туку и од генерализираниот параметар на временска константа што ја одредува состојбата. Променлив засилувач или атенуатор? Ова е пример за наједноставниот SPS, во кој коефициентот на пренос може да се менува дискретно или непречено според некој закон. Студијата на SPS обично се изведува за линеаризирани модели во кои се смета дека е завршен минливиот процес поврзан со промената на параметарот на состојбата.

Најраспространети се атенуаторите направени врз основа на врски во форма на L-, T- и U на диоди поврзани во серија и паралелно. Отпорот на диодите под влијание на контролната струја може да варира во широк опсег, што овозможува да се промени фреквентниот одговор и слабеењето на патеката. Независноста на фазното поместување при контролирање на слабеењето кај таквите атенуатори се постигнува со користење на реактивни кола вклучени во основната структура. Очигледно е дека со различни соодноси на отпорност на паралелни и сериски диоди, може да се добие исто ниво на воведено слабеење. Но, промената во фазното поместување ќе биде поинаква.

Ја истражуваме можноста за поедноставување на автоматизираниот дизајн на атенуаторите, елиминирајќи ја двојната оптимизација на корективните кола и параметрите на контролираните елементи. Како SPS што се проучува, ќе користиме електрично контролиран атенуатор, чие еквивалентно коло е прикажано на сл. 8.8. Минималното ниво на слабеење е обезбедено во случај на низок отпор на елементот Rs и висок отпор на елементот Rp. Како што се зголемува отпорноста на елементот Rs, а отпорноста на елементот Rp се намалува, воведеното слабеење се зголемува.

Зависностите на промената на фазното поместување од фреквенцијата и слабеењето за колото без корекција и со корекција се прикажани на сл. 8,9 и 8,10 соодветно. Во коригираниот придушувач, во опсегот на слабеење од 1,3-7,7 dB и фреквенцискиот опсег од 0,01-4,0 GHz, постигната е промена во фазното поместување не повеќе од 0,2 °. Во атенуатор без корекција, промената на фазното поместување во истиот фреквентен опсег и опсегот на слабеење достигнува 3°. Така, фазното поместување е намалено за речиси 15 пати поради корекција.


Ќе ги разгледаме параметрите за корекција и контрола како независни променливи или фактори кои влијаат на слабеењето и промената во фазното поместување. Ова овозможува, користејќи го системот Statistica, да се изврши факторска и регресивна анализа на SPS со цел да се воспостават физички обрасци помеѓу параметрите на колото и индивидуалните карактеристики, како и да се поедностави пребарувањето за оптимални параметри на колото.

Првичните податоци беа генерирани на следниов начин. За параметрите за корекција и контролните отпори кои се разликуваат од оптималните нагоре и надолу на фреквентната мрежа од 0,01–4 GHz, беа пресметани воведеното слабеење и промената на фазното поместување.

Методите на статистичко моделирање, особено анализата на фактори и регресија, кои претходно не биле користени за дизајнирање на дискретни уреди со променливи состојби, овозможуваат да се идентификуваат физичките обрасци на работа на системските елементи. Ова придонесува за создавање структура на уред врз основа на даден критериум за оптималност. Конкретно, овој дел го дискутираше фазно непроменливиот придушувач како типичен пример на систем со променлива состојба. Идентификувањето и толкувањето на факторските оптоварувања кои влијаат на различните карактеристики што се испитуваат овозможува да се промени традиционалната методологија и значително да се поедностави пребарувањето на параметрите за корекција и параметрите за регулација.

Утврдено е дека употребата на статистички пристап за дизајнирање на такви уреди е оправдана и за проценка на физиката на нивната работа и за оправдување на дијаграмите на кола. Статистичкото моделирање може значително да го намали обемот на експериментални истражувања.

резултати

  • Набљудувањето на заедничките фактори и соодветните факторски оптоварувања е неопходна идентификација на внатрешните модели на процеси.
  • За да се утврдат критичните вредности на контролираните растојанија помеѓу факторските оптоварувања, треба да се акумулираат и генерализираат резултатите од факторската анализа за слични процеси.
  • Употребата на факторска анализа не е ограничена само на физичките карактеристики на процесите. Факторската анализа е моќен метод за следење на процесите и е применлива за дизајнирање системи за широк спектар на цели.

Затвори