Един от основните инструменти на икономическото изследване е факторен анализ,което е част от многовариантния статистически анализ, който съчетава методи за оценка на измерението на много наблюдавани променливи чрез изследване на структурата на ковариационни или корелационни матрици. За разлика от други методи за анализ, той позволява на анализаторите да вземат решение две основни задачи:компактно и изчерпателно описват обекта на измерване и идентифицират факторите, отговорни за наличието на линейни статистически корелации между наблюдаваните променливи.

Оправдано прилагайки метода на главните компоненти, предназначен да замени корелираните фактори с некорелирани, а също и да се ограничи до изследването на най-значимите информативни фактори и да изключи останалите от анализа, като по този начин опростява интерпретацията на резултатите, факторният анализ изглежда като техника за цялостно и систематично изследване на зависимостта на други фактори от стойността на показателя за ефективност на критерия.

Основни видове факторен анализса: детерминистичен, функционален(резултатен критериален показател, който е произведение на частична или алгебрична сума от фактори); стохастичен, корелация(ако има непълна или вероятностна връзка между резултатните и факторните показатели); директен, дедуктивен(От общо към конкретно); обратен, индуктивен(от частно към общо); статични и динамични; ретроспективен и проспективен; едностепенни и многостъпални.

Факторният анализ започва с проверка на неговата задължителност условия,според който: всички признаци са количествени; броят на характеристиките е два пъти по-голям от броя на променливите; пробата е хомогенна; разпределението на оригиналните променливи е симетрично; изследването на факторите се извършва с помощта на корелиращи променливи. Факторният анализ се извършва на няколко етапа: подбор на факторите; класификация и систематизация на факторите; моделиране на връзки между показатели за изпълнение и фактор; изчисляване на влиянието на факторите и оценка на ролята на всеки от тях за промяна на стойността на ефективния показател; практическо използване на факторния модел (изчисляване на резервите за растеж на ефективния показател). Въз основа на естеството на връзката между показателите се разграничават методи за детерминиран и стохастичен факторен анализ (Таблица 1.5).

Методи за факторен анализ

Таблица 1.5

Методи

кратко описание на

Детерминистичен факторен анализ

Детерминистичен факторен анализ- това е техника за влияние на фактори, които са функционално свързани с индикатора за ефективност на критерия, което ни позволява да представим индикатора на критерия на факторния модел като частно, произведение или алгебрична сума от променливи. Детерминираният факторен анализ се характеризира със следното методи:верижни замествания; абсолютни разлики; относителни разлики; интегрална; логаритми

Стохастичен

Стохастичен анализ- методология за изследване на фактори, чиято връзка с показателя за ефективност на критерия е, за разлика от функционалната връзка, непълна, вероятностна (корелационна) по природа. С корелационна връзка, като промените аргумента в зависимост от комбинацията от други променливи, които влияят върху стойността на показателя за ефективност, можете да получите редица стойности за увеличение на функцията, докато с функционална (пълна) зависимост, промяна в аргумента винаги води до съответните промени във функцията. Стохастичният анализ се извършва, като се използва следното методифакторен анализ: двойна корелация; множествен корелационен анализ; матричен модел; математическо програмиране; теория на играта

Статично и динамично

Статичнопрактикува се факторен анализ, за ​​да се оцени влиянието на факторите върху показателите за ефективност на критерия на конкретна дата, и динамичен -за идентифициране на динамиката на причинно-следствените връзки

Ретроспективен и перспективен

Факторният анализ може да се използва като ретроспекцияхарактер (идентифицирайте причините за промените в стойността на показателя за ефективност през изминалия период) и перспектива(да се проучи влиянието на факторите върху стойността на критериалния показател в бъдеще)

За икономическия анализ е важно да се използва детерминистично моделиране и различни видове модели на детерминистични фактори, предназначени да моделират корелациите между ефективния фактор на критерия и други променливи факторни показатели. Същността на това моделиране е да представи връзката на изследвания показател с факторите като специфично математическо уравнение, изразяващо функционална или корелационна връзка.

Детерминираните факторни модели позволяват да се изследва функционалната връзка между изследваните показатели, ако при изграждането на факторен модел са изпълнени следните изисквания: включените в модела фактори трябва да са реални, а не абстрактни; факторите трябва да са в причинно-следствена връзка с показателя за ефективност, който се изследва; показателите на факторния модел трябва да бъдат количествено измерими; трябва да е възможно да се измери влиянието на отделните фактори; Първо, количествените фактори се записват във факторния модел, след това качествените; Ако във факторния модел има няколко количествени или качествени фактора, първо се записват факторите от по-висок порядък, а след това по-ниските.

Най-широко използваните във факторния анализ са следните: видове детерминистични факторни модели(Таблица 1.6).

Видове детерминирани факторни модели

Таблица 1.6

Факториал

модели

кратко описание на

Добавка

Те се използват, ако показателят за ефективност на критерия е представен под формата на алгебрична сума от редица факторни параметри на показателите:

Разработеният факторен модел може да бъде подложен на допълнителни трансформации при задълбочаване на текущите изследвания, като за тези цели се използват редица методи и техники. Крайните резултати от икономическия анализ на дейността на организацията зависят от това колко реалистично и точно разработените модели отразяват връзката между изследваните показатели. Моделирането на адитивни факторни системи включва прилагането на последователно разлагане на факторите на оригиналната факторна система в компонентни променливи:

при= а + b.

По този начин факторите на първо ниво a и bзависят от своя страна от редица други фактори:

а= c + d, b= д+ м,

y = c+ д+ e+m.

Факториал

модели

кратко описание на

Мултипликативни модели

Те се използват в случаите, когато показателят за ефективност на критерия се изразява като произведение на редица факторни показатели:

Същността на моделирането на мултипликативни факторни системи се състои в подробното последователно разлагане на сложните фактори на оригиналната факторна система на факторни фактори:

при= I X b.

Големината на факторите от първо ниво a и б,от своя страна зависят от редица други фактори:

a = cХ, b = eх T,

y=cxd*exm

Множество модели

Ако индикаторът за ефективност на критерия може да се дефинира като съотношение на един факторен индикатор към друг, тогава

Различават се следните: методи за трансформиране на факторни множествени модели:

1)удължаване(преобразува числителя чрез заместване на един фактор или редица фактори със сумата от хомогенни показатели):

2) формално разлагане(разширява знаменателя чрез заместване на един или няколко фактора със сумата или произведението на хомогенни показатели):

3) разширение(преобразува оригиналния факторен модел чрез умножаване на числителя и знаменателя на съотношението по един индикатор или няколко нови индикатора):

Базираните на критерии индикатори за изпълнение могат да бъдат разложени на фактори по различни начини и представени като различни типове модели на детерминистични фактори. Методът на моделиране се избира в зависимост от обекта на изследване и поставените цели, както и от професионалните знания и умения на анализатора.

Повечето методи за оценка на факторите в моделите за определяне се основават на елиминиране, най-универсалният метод от които са верижните замествания, използвани за измерване на влиянието на факторите във всички видове модели за определяне на фактори: мултипликативни, адитивни, множествени и смесени (комбинирани). Благодарение на този метод е възможно да се оцени как отделните фактори влияят върху стойността на показателя за ефективност на критерия, като постепенно се заменя основната стойност на всеки фактор на показателя като част от индикатора на критерия с действителната стойност през отчетния период. За да направите това, се изчисляват редица условни стойности на показателя за ефективност на критерия, като се вземе предвид последователната промяна на един, два или повече фактора, като останалите стойности остават непроменени. Сравнителната оценка на промяната в стойността на критериален параметър преди и след промяна в нивото на конкретен фактор позволява да се изключи (елиминира) влиянието на всички фактори, с изключение на този, чието въздействие върху увеличаването на определя се показател за ефективност.

Влиянието на един или друг показател се оценява чрез последователно изваждане: от второто изчисление на първото, от третото - второто и т.н. В първото изчисление всички стойности са планирани, в последното - действителни. Например алгоритъмът за изчисление за трифакторен мултипликативен модел е както следва:

В алгебрична форма сумата от влиянието на факторите е еквивалентна на общото увеличение на показателя за ефективност на критерия:

Ако това равенство не се спазва, анализаторът трябва да търси грешки в изчисленията си. Въз основа на това е разработено правило, според което следва, че броят на изчисленията на единица е по-голям от броя на показателите на даденото уравнение.

При използване на метода на верижното заместване се приема осигуряване на спазване на стриктна последователност на заместване,защото произволната му промяна е изпълнена с изкривяване на резултатите от анализа. INпроцес на аналитични процедури Препоръчително е първо да се идентифицира влиянието на количествените показатели, а след това на качествените.Например, изисква се да се оцени влиянието на броя на заетите и производителността на труда върху обема на промишленото производство. За целта първо се оценява въздействието на количествен показател (брой служители), а след това качествен показател (производителност на труда).

Методът на верижното заместване има значителен недостатъктъй като при използването му трябва да се приеме, че стойностите на факторите се променят независимо една от друга. Въпреки че в действителност те се променят едновременно и във взаимовръзка, което води до допълнително увеличение на ефективния показател, като правило, свързан с последния от изследваните фактори. По този начин степента на влияние на факторите върху промяната на показателя за ефективност зависи от местоположението на конкретен фактор в схемата на аналитичния модел. Това обяснява разликата в изчисленията при промяна на последователността на заместване. По този начин степента на влияние на факторите върху промените в критериалния показател варира в зависимост от мястото на фактора в модела за определяне. Този недостатък на детерминирания факторен анализ се елиминира чрез използване на по-сложен интегрален метод,което позволява да се оцени влиянието на факторите в мултипликативни, множествени и смесени модели от множествен адитивен тип.

Метод на абсолютната разлика- това е модификация на метода на верижното заместване, при който изменението на критериалния показател, дължащо се на всеки фактор по метода на абсолютните разлики, се определя като произведение на отклонението на изследвания фактор от базисната или отчетната стойност на друг фактор , в зависимост от избраната последователност на заместване:

Метод на относителната разликае предназначен да оцени влиянието на факторите върху растежа на критериален показател в мултипликативни и смесени модели от формата:

Тя включва намиране на относителното отклонение на всеки факторен показател и определяне на посоката и размера на влиянието на факторите в проценти чрез последователно изваждане (от първия - винаги 100%).

При използване съкратен метод на заместванепоказателите за изчисляване са междинни продукти с последователно натрупване на влияещи фактори. Правят се замествания и след това чрез последователно изваждане се установява влиянието на факторите.

Интегрален методви позволява да постигнете пълно разлагане на ефективния индикатор на фактори и има универсален характер, т.е. приложим за мултипликативни, множествени и смесени модели. Промяната в индикатора на критерия се измерва за безкрайно малки периоди от време чрез сумиране на нарастването на резултата, дефиниран като частични продукти, умножени по увеличенията на факторите за безкрайно малки интервали.

Използването на интегралния метод осигурява по-висока точност при изчисляване на влиянието на факторите в сравнение с методите на верижно заместване, абсолютни и относителни разлики, което позволява да се елиминира нееднозначната оценка на влиянието, тъй като в този случай резултатите не зависят от местоположението на факторите в модела, а допълнителното увеличение на ефективния показател, произтичащо от взаимодействието на факторите, се разпределя равномерно между тях.

За да разпределите допълнителен растеж, не е достатъчно да вземете неговата роля, съответстваща на броя на факторите, тъй като факторите могат да действат в различни посоки. Следователно промяната в ефективния индикатор се измерва за безкрайно малки периоди от време чрез сумиране на нарастването на резултата, дефиниран като частични продукти, умножени по увеличенията на факторите за безкрайно малки интервали. Операцията по изчисляване на определен интеграл се свежда до конструиране на интегранти, които зависят от вида на функцията или модела на факторната система.

Поради сложността на изчисляването на някои определени интеграли и допълнителни трудности, свързани с възможното действие на фактори в противоположни посоки, на практика се използват специално формирани работни формули:

1. Вижте модела

2. Вижте модела

3. Вижте модела

4. Вижте модела

Основните методи за елиминиране, които се основават на относителни показатели за динамика, пространствени сравнения, изпълнение на плана (оценява се чрез съотношението на действителното ниво на изследвания показател с този, който се сравнява), включват индексен метод.

Индексните модели позволяват да се изгради количествена оценка на ролята на отделните фактори в тенденциите в динамиката на изменението на общите показатели в статистиката, планирането и икономическия анализ. Изчисляването на всеки индекс включва сравняване на измерената стойност с базовата стойност. Ако индексът е отразен под формата на съотношение на пряко сравними величини, тогава той се нарича индивидуален, а ако индексът представлява съотношението на сложни явления, тогава той се нарича групов или общ. Има няколко форми на индекси (агрегирани, аритметични, хармонични).

Основата на всяка форма на общ индекс е обобщен индекс,което позволява да се оцени степента на влияние на различни фактори върху промените в нивото на критериалните показатели в мултипликативни и множествени модели. Правилността на определяне на размера на всеки фактор се влияе от: броя на десетичните знаци (поне четири); броя на самите фактори (връзката е обратно пропорционална).

Принципи за конструиране на агрегатни индексиса: промяна в един фактор при запазване на всички останали постоянни. Освен това, ако обобщаващ икономически показател е продукт на количествени (обем) и качествени показатели на фактори, тогава при определяне на влиянието на количествен фактор качественият показател се фиксира на основно ниво, а при определяне на влиянието на качествен фактор , количественият показател е фиксиран на нивото на отчетния период.

Да приемем, че Y - a * b * c x d,

А;

Индекс на фактора, показващ как се променя индикаторът bи др.;

Така нареченият „общ индекс на промените в резултатния индикатор“ в зависимост от всички фактори.

При което

Използвайки метода на индекса, е възможно да се разлагат на фактори не само относителни, но и абсолютни отклонения на обобщаващия индикатор, като същевременно се определя влиянието на отделните фактори, като се използва разликата между числителя и знаменателя на съответните индекси, т.е. при изчисляване на влиянието на един фактор, елиминиране на влиянието на друг:

Използвайки индексния метод на факторния анализ, е възможно да се разложат на фактори не само относителни, но и абсолютни отклонения в общия показател. С други думи, влиянието на отделен фактор може да се определи чрез разликата между числителя и знаменателя на съответните индекси, т.е. при изчисляване на влиянието на един фактор, елиминиране на влиянието на друг.

Да речем:

Където А -количествен фактор и б-качествен,

индикатор поради фактор А;

Абсолютно увеличение на получената

индикатор поради фактор b

- абсолютно увеличение на резултантната

показател поради влиянието на всички фактори.

Препоръчително е да се приложи разглежданият принцип за разлагане на абсолютния ръст на обобщаващ показател на фактори, ако броят на факторите е равен на два (единият от тях е количествен, другият е качествен), а анализираният показател се представя като техния продукт , тъй като теорията на индексите не предоставя общ метод за разлагане на абсолютните отклонения на обобщаващ показател на фактори, когато броят на факторите е повече от два. За решаването на този проблем се използва методът на верижните замествания.

Успешно се прилагат методите на факторния анализ за да се оцени обективно влиянието на факторите върху критериалния показател за ефективността на организацията.Като пример за този подход, помислете как промените в обема на продажбите на продукти влияят върху финансовите резултати на една организация. По правило промяната в приходите от продажби възниква поради: 1) промяна в обема на продажбите (във физическо изражение); 2) промени в продажните цени. Общата промяна в приходите от продажби може да бъде представена като сбор от факторни отклонения:

Където N x -приходи за отчетната година;

N 0 -приходи за базова година;

А Н-промяна в приходите в резултат на промени в обема на продажбите;

А Np- промяна в приходите в резултат на промени в продажните цени на продуктите;

А Nc- промяна в приходите в резултат на промени в структурата на продажбите на продукта.

Нека си представим приходите (Н)като произведение на продажната цена (R)върху обема на продажбите ( Q):

N 0 = P 0х Q 0 -приходи за базова година;

jV, = P, x (2, - приходи за отчетната година.

Въздействието на промените в обема на продажбите на продукта (при постоянни цени) върху промените в приходите се оценява, както следва:

Въздействието на промяна в продажната цена (с постоянен обем) върху промяна в приходите се оценява, както следва:

В процеса на анализ се определя влиянието на фактори като промени в структурата на продажбите, както и дела на отделните асортиментни позиции в общия обем на продажбите през базовия и анализирани периоди, а след това влиянието на структурните промени върху изчислява се общият обем на продажбите. Пропуснатите приходи в резултат на промени в гамата от продадени продукти се оценяват отрицателно, докато свръхприходите се оценяват положително.

Тяхната класификация
В съвременната статистика факторният анализ се разбира като набор от методи, които въз основа на действително съществуващи връзки между характеристики, обекти или явления позволяват да се идентифицират латентен(скрити и недостъпни за пряко измерване) обобщаващи характеристики на организираната структура и механизма на развитие на изучаваните явления или процеси.

Концепцията за латентност е ключова и означава имплицитността на характеристиките, разкрити чрез методите на факторен анализ.

Идеята, залегнала в основата на факторния анализ, е доста проста. В резултат на измерването имаме работа с набор от елементарни характеристики х аз, измерено в няколко скали. Това - явни променливи.Ако знаците се променят последователно, тогава можем да предположим съществуването на определени общи причини тази променливост, т.е. наличието на някои скрити (латентни) фактори. Задачата на анализа е да открие тези фактори.

Тъй като факторите са комбинация от определени променливи, следва, че тези променливи са свързани една с друга, т.е. имат корелация (ковариация), освен това по-голяма помежду си, отколкото с други променливи, включени в друг фактор. Методите за намиране на фактори се основават на използването на коефициенти на корелация (ковариация) между променливите. Факторният анализ дава нетривиално решение, т.е. решението не може да бъде предвидено без използване на специална техника за извличане на фактори. Това решение е от голямо значение за характеризиране на явлението, тъй като първоначално то се характеризираше с доста голям брой променливи, а в резултат на прилагането на анализа се оказа, че може да се характеризира с по-малък брой други променливи - фактори .

Не само явните променливи могат да корелират х аз , но и наблюдаеми обекти н аз. В зависимост от това какъв тип корелационна връзка се разглежда - между характеристики или обекти - се разграничават съответно R и Q техники за обработка на данни.

В съответствие с общите принципи на факторния анализ, резултатът от всяко измерване се определя от действието на общи фактори, специфични фактори и „фактора“ на грешката на измерване. Общфактори, които влияят върху резултатите от измерванията в няколко измервателни скали, се наричат. Всеки от специфиченфактори влияят върху резултата от измерването само на една от скалите. Под грешка при измерванепредполага набор от причини, които не могат да бъдат взети под внимание, които определят резултатите от измерването. Променливостта на получените емпирични данни обикновено се описва с помощта на нейната дисперсия.


Вече добре знаете, че коефициентът на корелация най-често се използва за количествено описание на връзката между две променливи. Има много разновидности на този коефициент, като изборът на адекватна мярка за връзка се определя както от спецификата на емпиричните данни, така и от скалата на измерване.

Съществува обаче и геометрична възможност за описание на връзката между характеристиките. Графично коефициентът на корелация между две променливи може да се представи като два вектора - стрелки, изхождащи от една и съща точка. Тези вектори са разположени под ъгъл един спрямо друг, чийто косинус е равен на коефициента на корелация. Косинусът на ъгъл е тригонометрична функция, чиято стойност може да се намери в справочник. В тази тема няма да обсъждаме тригонометричната косинусова функция; достатъчно е да знаете къде да намерите съответните данни.

Таблица 7.1 показва няколко стойности на косинусите на ъглите, които ще дадат обща представа за тях.

Таблица 7.1

Косинусова таблица за графично изображение

корелации между променливите.

В съответствие с тази таблица на общата положителна корелация ( r1) ще съответства на ъгъл от 0 ( cos 0 1), т.е. графично това ще съответства на пълното съвпадение на двата вектора (виж фиг. 7.3 а).

Обща отрицателна корелация ( r -1) означава, че двата вектора лежат на една и съща права линия, но са насочени в противоположни посоки ( cos 180 -1). (Фиг. 7.3 b).

Взаимна независимост на променливите ( r = 0) е еквивалентен на взаимната перпендикулярност (ортогоналност) на векторите ( cos 90°= 0). (Фиг. 7.3 c).

Междинните стойности на коефициента на корелация са изобразени като двойки вектори, образуващи или остри ( r > 0), или тъп ( r   0 0 , r 1  180, r -1

V 1

V 2

А b
 90, r 0   90, r  0   90, r  0

V 2

V 1
Фигура 7.3. Геометрична интерпретация на коефициентите на корелация.

Геометричен подход към факторния анализ


Горната геометрична интерпретация на коефициента на корелация е основата за графичното представяне на цялата корелационна матрица и последващата интерпретация на данните във факторния анализ.

Конструирането на матрица започва с конструирането на вектор, представящ всяка променлива. Други променливи са представени от вектори с еднаква дължина, всички произхождащи от една и съща точка. Като пример, разгледайте геометричния израз на корелациите между пет променливи. (Фигура 7.4.)


V 1

V 5 V 2

V 4
Фигура 7.4. Геометрична интерпретация на корелационната матрица (5x5).
Ясно е, че не винаги е възможно да се представи корелацията в две измерения (на равнина). Някои променливи вектори трябва да са под ъгъл спрямо страницата. Този факт не е проблем за реалните математически процедури, но изисква малко въображение от страна на читателя. На фигура 7.5. можете да видите, че корелацията между променливите V1 V2 е голяма и положителна (тъй като ъглите между тези вектори са малки). Променливите V2 V3 са практически независими една от друга, т.к ъгълът между тях е много близък до 90 , т.е. корелацията е 0. Променливите V3 - V5 са силно и отрицателно свързани. Високите корелации между V1 и V2 са доказателство, че и двете от тези променливи практически измерват едно и също свойство и че всъщност една от тези променливи може да бъде изключена от по-нататъшно разглеждане без значителна загуба на информация. Най-информативни за нас са променливите, които са независими една от друга, т.е. имащи минимални корелации един с друг или ъгли, съответстващи на 90  (фиг. 7.5.)

V 1

Фигура 7.5. Геометрична интерпретация на корелационната матрица
От тази фигура става ясно, че има две групи корелации: V 1, V 2, V 3 и V 4, V5. Корелациите между променливите V 1, V 2, V 3 са много големи и положителни (има малки ъгли между тези вектори и, следователно, големи стойности на косинуса). По същия начин, корелацията между променливите V 4 и V 5 също е голяма и положителна. Но между тези групи променливи корелацията е близка до нула, тъй като тези групи променливи са практически ортогонални една спрямо друга, т.е. разположени една спрямо друга под прав ъгъл. Горният пример показва, че има две групи корелации и информацията, получена от тези променливи, може да бъде апроксимирана чрез два общи фактора (F 1 и F 2), които в този случай са ортогонални един на друг. Това обаче не винаги е така. Разновидностите на факторния анализ, при които се изчисляват корелации между фактори, които не са ортогонално разположени, се наричат ​​косо решение. Ние обаче няма да разглеждаме такива случаи в този курс и ще се съсредоточим изключително върху ортогонални решения.

Чрез измерване на ъгъла между всеки общ фактор и всяка обща променлива могат да бъдат изчислени корелациите между тези променливи и съответните им фактори. Корелацията между променлива и общ фактор обикновено се нарича факторно натоварване. Геометричната интерпретация на тази концепция е дадена на фиг. 7.6.

Е 2

И така, от условията на задачата, представена по-горе, следва, че имаме масив от данни, състоящ се от 24 независими променливи (изявления), в различни аспекти, описващи текущото състояние на авиокомпания X на международния пазар на въздушен транспорт. Основната задача на факторния анализ е да групира твърдения с подобно значение в макрокатегории, за да намали броя на променливите и да оптимизира структурата на данните.

Като използвате менюто Анализ > Намаляване на данни > Фактор, отворете прозореца Факторен анализ. Преместете променливите за анализ (ql-q24) от левия списък в десния, както е показано на фиг. 5.32. Полето Selection Variable ви позволява да изберете променлива, по отношение на която ще бъде извършен анализът (например класа на полета). В нашия случай оставете това поле празно.

Щракнете върху бутона Описателни и в диалоговия прозорец, който се отваря (фиг. 5.33), изберете KMO и тест за сферичност на Барлет. Това ще определи колко подходящи са наличните данни за факторен анализ. Прозорецът Описателни ви позволява да покажете други необходими описателни статистики Въпреки това, в повечето примери от маркетингови проучвания тези възможности обикновено не се използват.

Ориз. 5.32.

Ориз. 5.33.

Затворете прозореца с описания, като щракнете върху бутона Продължи. След това отворете прозореца Извличане (Фиг. 5.34), като щракнете върху съответния бутон в главния диалогов прозорец Факторен анализ. Този прозорец е предназначен за избор на метод за формиране на факторен модел; направете следното в него.

Ориз. 5.34.

Първо, в полето Метод изберете метода за извличане (формиране) на фактора. Общата препоръка за избор на метод е следната. Необходимо е да изберете метод за извличане на фактори, който ви позволява недвусмислено да класифицирате възможно най-много променливи. По този начин основните съображения тук са броят на класифицираните фактори и недвусмислеността на класификацията (т.е. всяка променлива трябва да принадлежи само на един фактор). Както ще видите по-долу, методът на основните компоненти по подразбиране в SPSS в нашия случай ни позволява недвусмислено да класифицираме 22 променливи от 24 налични (92%), което е много добър показател. Въз основа на съществуващия опит авторът може да твърди, че добър резултат от факторния анализ е делът на недвусмислено класифицирани променливи от най-малко 90%. Изберете метода на главните компоненти. Този метод е най-подходящ за решаване на повечето проблеми на маркетинговите изследвания чрез факторен анализ.

Второ, посочете броя на формираните фактори (група Екстракт). По подразбиране методът за определяне на броя на факторите, които трябва да бъдат извлечени, е зададен въз основа на стойностите на характерните числа (Собствени стойности над). Без да навлизаме в статистически подробности, отбелязваме, че характеристичните числа се използват от SPSS за определяне на количествения и качествен състав на извлечените фактори. При предварително зададена стойност на този индикатор, равна на 1, броят на формираните фактори ще бъде равен на броя на променливите, за които стойността на характерните числа е по-голяма или равна на 1.

Също така е възможно ръчно да посочите на програмата колко фактора трябва да бъдат извлечени (Брой фактори). Тази функция е предоставена в SPSS, така че ако има твърде много променливи с характеристично число, по-голямо от 1, можете ръчно да намалите броя на факторите. Голям брой фактори е трудно да се интерпретират, следователно, ако методът на характерните числа не успее да извлече приемлив брой фактори за интерпретация (колкото по-малко, толкова по-добре), трябва независимо да посочите броя на факторите в програмата. Този проблем се решава от аналитика във всеки конкретен случай поотделно. Едно възможно решение би било да се увеличи броят на собствените стойности от предварително зададената стойност от 1, да речем, на 1,5 или повече. Това ще помогне, ако сте получили голям брой фактори с характеристично число, приблизително равно на 1, и няколко (2-3 или повече) фактора с характеристично число над 1,5 или друга стойност. Освен това, когато ръчно определя броя на факторите, анализаторът може да вземе подходящо решение въз основа на своя опит или на всякакви други предположения. И накрая, трябва да се отбележи, че при ръчно указване на броя на извлечените фактори понякога броят на уникално класифицираните променливи се оказва по-малък, отколкото при метода на извличане въз основа на стойността на характерните числа. Тази отрицателна точка обаче се компенсира от повишената яснота на резултатите от факторния анализ - в крайна сметка това ви позволява да се отървете от фактори, които не съдържат променливи със значителен коефициент на корелация (в нашия случай 0,5).

Затворете диалоговия прозорец Извличане, като щракнете върху бутона Продължи. Изберете типа ротация на матрицата на коефициента (бутон Ротация в основния диалогов прозорец Факторен анализ). Матрицата на коефициента се завърта, за да се доближи факторният модел възможно най-близо до идеала: способността за недвусмислено класифициране на всички променливи. В диалоговия прозорец Завъртане (Фигура 5.35) изберете конкретен метод на завъртане. В повечето случаи методът Varimax е най-подходящият вариант. Той улеснява факторната интерпретация чрез минимизиране на броя на променливите с високо факторно натоварване. Изберете този тип ротация и затворете диалоговия прозорец, като щракнете върху бутона Продължи.

Ориз. 5.35.

След това отворете диалоговия прозорец Факторни резултати (Фигура 5.36), като щракнете върху бутона Резултати. Този прозорец служи за създаване на нови променливи в изходния файл с данни, което впоследствие ще позволи на всеки респондент да бъде причислен към определена група (фактор). Броят на новосъздадените променливи е равен на броя на извлечените фактори. По-долу ще покажем как да използвате тези променливи. Изберете Запазване като променливи в диалоговия прозорец Факторни резултати и изберете Регресия като метод за определяне на стойностите за тези нови променливи. След това затворете диалоговия прозорец, като щракнете върху бутона Продължи.

Ориз. 5.36.

Последната стъпка преди започване на процедурата за факторен анализ е да изберете някои допълнителни параметри (бутон Опции). В диалоговия прозорец, който се отваря (фиг. 5.37), изберете два елемента: Сортирани по размер и Потискане на абсолютни стойности по-малко от. Първата опция ви позволява да покажете променливите, включени във всеки фактор в низходящ ред на техните факторни коефициенти (големината на приноса на променливата към формирането на фактора). Вторият се оказва много полезен, тъй като улеснява задачата за еднозначно тълкуване на получените фактори. Стойността на този параметър, посочена в съответното поле (в нашия случай 0,5), отрязва променливи с факторни коефициенти, по-малки от тази стойност. Това прави възможно опростяването на ротираната факторна матрица, тъй като незначимите променливи, включени във всеки извлечен фактор, изчезват от нея. Ако не активирате тази опция, всяка променлива ще показва факторен коефициент за всеки фактор, което ненужно ще претовари факторния модел и ще затрудни разбирането му от изследователите.

Параметърът Потискане на абсолютни стойности по-малко от е въведен, за да се улесни практическата интерпретация на резултатите от факторния анализ. Тъй като факторните коефициенти в получената ротирана матрица на коефициента са коефициенти на корелация между съответните променливи и фактори, в повечето практически случаи е препоръчително да се зададе първоначалната гранична стойност за незначими променливи на 0,5. Ако факторният анализ води до по-малко от приемлив брой класифицирани променливи (например, ако структурата на данните не е подходяща за факторен анализ; вижте по-долу), можете да преизчислите факторния модел с по-ниска гранична стойност (например 0,4 ). В обратната ситуация, ако променливата е включена в няколко фактора, може да се предложи повишаване на нивото на извличане от 0,5 на 0,6. Това ще елиминира променливите, включени в няколко фактора наведнъж, увеличавайки практическата пригодност на резултатите от факторния анализ.

И така, след като посочите всички необходими параметри в прозореца с опции, затворете го (бутона Продължи) и стартирайте процедурата за факторен анализ, като щракнете върху бутона 0K в главния диалогов прозорец за факторен анализ.

Ориз. 5.37.

След като програмата направи всички необходими изчисления, ще се отвори прозорецът SPSS Viewer с резултатите от конструирането на факторния модел. Първото нещо, което ни интересува, е пригодността на наличните данни за факторен анализ като цяло. Нека разгледаме таблицата на KMO и теста на Barlett (фиг. 5.38).Той има два показателя, които ни интересуват: тестът KMO и значението на теста Barlett.Резултатите от теста KMO ни позволяват да направим заключение относно общия пригодност на наличните данни за факторен анализ, т.е. колко добре конструиран факторният модел описва структурата на отговорите на респондентите на анализираните въпроси.Резултатите от този тест варират от 0 (факторният модел е абсолютно неприложим) до 1 (факторният модел е абсолютно неприложим факторният модел идеално описва структурата на данните).Факторният анализ трябва да се счита за подходящ, ако KMO е в диапазона от 0,5 до 1. В нашия случай тази цифра е 0,9, което е много добър резултат.

Тестът на Барлет за сферичност тества хипотезата, че променливите, включени във факторния анализ, не са корелирани помежду си. Ако този тест даде положителен резултат (променливите не са корелирани), факторният анализ трябва да се счита за неподходящ за използване на други статистически методи (например клъстерен анализ ).Статистиката, която определя пригодността на факторния анализ според теста на Барлет е значимостта (линия Сиг.).На приемливо ниво

значимост (под 0,05), факторният анализ се счита за подходящ за анализ на изследваната извадка. В нашия случай разглежданият тест показва много ниска значимост (под 0,001), от което следва изводът за приложимостта на факторния анализ.

И така, въз основа на тестовете KMO и Barlett, стигнахме до заключението, че данните, които имахме, бяха почти идеални за изследване с помощта на факторен анализ.

Ориз. 5.38.

Следващата стъпка в тълкуването на резултатите от факторния анализ е да се вземе предвид получената ротирана матрица на коефициентите на факторите: таблицата Rotated Component Matrix (фиг. 5.39). Тази таблица е основният резултат от факторния анализ. Той отразява резултатите от класифицирането на променливите във фактори. В нашия случай, използвайки автоматичен метод за определяне на броя на факторите (на базата на характерни числа, по-големи от 1), беше изграден практически приемлив факторен модел, в който 22 от 24 променливи могат да бъдат недвусмислено класифицирани в малък брой фактори (5 ). Този резултат може да се счита за добър.

Можете да работите с некласифицирани променливи, както следва. Просто трябва да преизчислите факторния модел, като премахнете предварително зададената гранична стойност от 0,5 в диалоговия прозорец Опции. След това ще бъде изградена факторна матрица (фиг. 5.40), в която анализаторът ще трябва самостоятелно да определи принадлежността на некласифицирани променливи към определен фактор въз основа на критерия за най-високия коефициент на корелация между променливите и петте фактора. В нашия случай виждате, че променлива ql6 е най-силно корелирана с фактор 1 (факторен коефициент 0,468) и следователно трябва да бъде приписана на този фактор, а променлива q24 трябва да бъде приписана на фактор 4 (0,474).

След като сме класифицирали недвусмислено всички променливи, нека се върнем към таблицата на фиг. 5.40. Получихме пет групи променливи (фактори), които описват текущата конкурентна позиция на авиокомпания X от пет различни аспекта. Това са групите.

q2. Airline X може да се конкурира с най-добрите авиокомпании в света. q3. Вярвам, че Airline X има обещаващо бъдеще в световната авиация. q23. Airline X е по-добра, отколкото много хора си мислят, че е. q!4. Airline X е лицето на Русия.

Ориз. 5.39.

qlO. Airline X наистина се грижи за своите пътници.

ql. Airline X има репутация за отлично обслужване на пътниците.

q21. Airline X е ефективна авиокомпания. q5. Горд съм, че работя за X Airline.

ql6. Услугата на Airline X е последователна и разпознаваема в целия свят.

ql2. Вярвам, че висшите мениджъри работят усилено, за да направят авиокомпанията успешна.

qll. Съществува висока степен на удовлетворение от работата сред служителите на авиокомпанията.

q6. В рамките на авиокомпания X има добра комуникация между отделите.

q8. Сега авиокомпания X се подобрява бързо.

q7. Всеки служител на авиокомпанията работи усилено, за да осигури нейния успех.

q4. Знам каква ще бъде стратегията за развитие на авиокомпания X в бъдеще.

ql7. Не бих искал авиокомпания X да се променя.

q20. Промените в авиокомпания X ще бъдат положително развитие.

ql8. Авиокомпания X трябва да се промени, за да използва пълния си потенциал.

q9. Трябва да извървим дълъг път, преди да можем да твърдим, че сме авиокомпания от световна класа.

q22. Бих искал да видя имиджа на авиокомпания X да се подобри от гледна точка на чуждестранните пътници.

q24. Важно е хората по целия свят да знаят, че ние сме руска авиокомпания.

ql9. Мисля, че авиокомпания X трябва да се представи визуално по по-модерен начин.

ql3. Харесва ми начина, по който Airline X в момента се представя визуално на широката публика (по отношение на цветова схема и брандиране).

ql5. Изглеждаме като вчера в сравнение с други авиокомпании.

Най-трудната задача при провеждането на факторен анализ е интерпретацията на получените фактори. Тук няма универсално решение: във всеки конкретен случай анализаторът използва съществуващия практически опит, за да разбере защо факторният модел приписва определена променлива на този конкретен фактор. Има случаи (особено при малък брой добре формализирани променливи), когато формираните фактори са очевидни и разликите между променливите са видими с просто око. В такава ситуация можете да се справите без факторен анализ и да разделите променливите на групи ръчно. Въпреки това, ефективността и силата на факторния анализ се проявява в сложни и нетривиални случаи, когато променливите не могат да бъдат класифицирани предварително и техните формулировки са объркващи. Тогава класификацията на променливите въз основа на мненията на респондентите ще бъде от голям изследователски интерес, което ще позволи да се установи как самите респонденти разбират този или онзи въпрос.

Когато е възможно и подходящо за целите на изследването, променливите трябва да бъдат формализирани преди провеждането на факторен анализ. Това ще позволи на анализатора да направи предварителни предположения относно разделянето на набора от налични променливи на групи. Задачата на изследователя при интерпретиране на резултатите от факторната матрица в този случай ще бъде опростена, тъй като той вече няма да започне „от нулата“. Задачата му ще бъде сведена до тестване на предишни хипотези за принадлежността на определена променлива към определена група.

Понякога възникват случаи, когато променлива, присвоена на определен фактор от SPSS, логически не е свързана по никакъв начин с другите променливи, които съставляват същия фактор. Можете да преизчислите факторния модел, без да отрязвате незначими коефициенти (както в примера на Фиг. 5.40) и да видите с какъв друг фактор тази нелогична променлива корелира с почти същата сила, както с фактора, към който е автоматично присвоена. Например, променлива Z има корелационен коефициент с фактор 1 от 0,505, а с фактор 2 корелира с коефициент от 0,491. SPSS автоматично присвоява тази променлива на фактора, с който е идентифицирана най-голямата корелация, без да взема предвид, че тази променлива корелира с почти същата сила с друг фактор. Именно в такава ситуация (с малка разлика в коефициентите на корелация) можете да опитате да присвоите променливата Z на фактор 2 и ако това се окаже логично, да я разгледате в групата променливи от втория фактор.

Възможно е ръчно да се намали броят на факторите за извличане, което ще улесни задачата на изследователя при интерпретиране на резултатите от факторния анализ. Трябва обаче да се има предвид, че подобно намаление ще намали гъвкавостта на факторния модел и дори може да доведе до ситуация, при която променливите са неправилно разделени на неправилни, от практическа гледна точка, групи. Освен това намаляването на броя на извлечените фактори неизбежно ще намали дела на недвусмислено класифицираните фактори.

Като вариант на предишното решение е възможно да се предложи комбиниране на два или повече фактора с малки количества от съставните им променливи. Такова групиране, от една страна, ще намали броя на интерпретируемите фактори, а от друга ще улесни разбирането на малките фактори.

Ако изследователят е стигнал до задънена улица и никакви средства не помагат да се обясни принадлежността на определена променлива към определен фактор, остава да се приложи друга статистическа процедура (например клъстерен анализ).

Нека се върнем към нашите пет фактора. Задачата да ги опишем и обясним не изглежда много трудна. По този начин може да се отбележи, че твърденията, включени в първия фактор (q2, q3, q23, ql4, qlO, ql, q21, q5 и ql6), са общи, тоест те се отнасят за цялата авиокомпания и описват отношението към от страна на въздушните пътници. Единственото изключение е променливата q5, която е по-свързана с втория фактор. Коефициентът на корелация с фактор 2 е 0,355 (виж Фиг. 5.40), което позволява по логични причини да бъде включен в тази група. Фактор 2 (ql2, qll, q6, q8, q7 и q4) описва отношението към авиокомпания X от страна на служителите. Третият фактор (ql7, q20 и ql8) описва отношението на респондентите към промените в авиокомпанията (включва всички твърдения с корен „men” – от думата „промяна”). Четвъртият фактор (q9, q22 и q24) описва отношението на респондентите към имиджа на авиокомпанията. И накрая, петият фактор (ql9, ql3 и ql5) съчетава твърдения, характеризиращи отношението на респондентите към визуалния образ на авиокомпания X.

По този начин получихме пет групи твърдения, описващи текущата конкурентна позиция на компания X на международния пазар на въздушен транспорт. Въз основа на интерпретативния (семантичен) анализ на тези групи (фактори) могат да бъдат приписани следните определения.

¦ Фактор 1 характеризира общата позиция на авиокомпания X в очите на нейните клиенти.

¦ Фактор 2 характеризира вътрешното състояние на авиокомпания X от гледна точка на нейните служители.

¦ Фактор 3 характеризира промените, настъпващи в авиокомпания X.

¦ Фактор 4 характеризира имиджа на авиокомпания Х.

¦ Фактор 5 характеризира визуалния образ на авиокомпания X.

След като сме интерпретирали успешно всички получени фактори, можем да считаме факторния анализ за завършен и успешен. След това ще покажем как резултатите от факторния анализ могат да се използват за конструиране на напречни сечения.

Спомнете си, че съхранихме факторните оценки (т.е. членството на всеки респондент в конкретен фактор) в оригиналния файл с данни като нови променливи. Тези променливи имат имена като: facX_Y, където X е факторният номер, а Y е серийният номер на факторния модел. Ако изградим факторен модел два пъти и завършим с три извлечени фактора първия път и два фактора втория път, имената на променливите ще бъдат както следва:

¦ facl_l, fac2_l, fac3_l (за три фактора от първия построен модел);

¦ facl_2, fac2_2 (за два фактора от втория модел).

В нашия случай ще бъдат създадени пет нови променливи (според броя на извлечените фактори). Тези факторни оценки могат да се използват в бъдеще, например, за конструиране на напречни сечения. По този начин, ако е необходимо да се разбере как респондентите - мъже и жени - оценяват различни аспекти от дейността на авиокомпания X, това може да стане чрез анализиране на факторни оценки.

Най-често срещаният начин за използване на факторни рейтинги в по-нататъшни изчисления е да се класират и след това да се разделят новосъздадените променливи, представляващи извлечените фактори, на четири квартила (25% процентили). Този подход позволява създаването на нови променливи на порядковия мащаб, които описват четирите нива на всеки фактор. В нашия случай, за твърденията, които съставляват фактор 2, тези нива ще бъдат: не съм съгласен (състоянието на вътрешните работи на компанията не удовлетворява служителите), по-скоро не съм съгласен (оценката на вътрешната ситуация в компанията е под средното) , по-скоро съгласен (оценка над средното), съгласен (оценка Отличен).

За да създадете променливи, по които респондентите ще бъдат допълнително групирани, извикайте менюто Трансформиране > Класиране на случаите. В диалоговия прозорец, който се отваря (фиг. 5.41), от левия списък изберете променливата, съдържаща факторни оценки за фактор 2 (fac2_l) и я поставете в полето Променливи. След това в областта Присвояване на ранг I изберете елемента с най-малка стойност, в нашия случай това означава, че първата група (несъгласни) ще се състои от респонденти, които оценяват състоянието на вътрешните работи на авиокомпанията като лошо. Съответно, групи 2, 3 и 4 ще бъдат дефинирани съответно за категориите по-скоро несъгласен, по-скоро съгласен и съгласен.

Ориз. 5.41.

Щракнете върху Типове класиране > Типове, отменете опцията за класиране по подразбиране и вместо това изберете Ntiles с предварително зададен брой групи на 4 (Фигура 5.42). Щракнете върху бутона Продължи и след това върху OK в главния диалогов прозорец. Тази процедура ще създаде нова променлива nfac2_l (2 означава втори фактор) във файла с данни, класифицирайки респондентите в четири групи.

Ориз. 5.42.

Всички респонденти в извадката се характеризират с положително, по-скоро положително, по-скоро отрицателно или отрицателно отношение към текущото състояние на авиокомпания X. За по-голяма яснота се препоръчва да се присвоят етикети на всяко от идентифицираните четири нива; Можете също да преименувате самата променлива. Вече можете да извършвате анализи на напречно сечение, като използвате новата ординална променлива, както и да изграждате други статистически модели, предоставени в SPSS. По-долу ще покажем как да използваме резултатите от конструирането на факторен модел в клъстерен анализ.

За да илюстрираме възможностите за практическо използване на новата променлива, ще проведем напречен анализ на влиянието на пола на респондентите върху тяхната оценка за текущото състояние на нещата в авиокомпания X (Фигура 5.43). Както следва от представената таблица, анкетираните мъже като цяло са склонни да дават по-ниски оценки на параметъра на разглежданата авиокомпания в сравнение с жените. Така в структурата на оценките много лошо, лошо и задоволително преобладават мъжете; оценките са много добри, напротив, преобладават жените. При преминаване към всяка следваща (по-висока) категория за оценка делът на мъжете равномерно намалява, а делът на жените съответно се увеличава. Тестът %2 показва, че идентифицираната връзка е статистически значима.

Ориз. 5.43. Кръстосано разпределение: влиянието на пола на респондентите върху оценката им за текущото състояние на нещата в авиокомпания X

ФАКТОРЕН АНАЛИЗ

Идеята на факторния анализ

Когато се изучават сложни обекти, явления, системи, факторите, които определят свойствата на тези обекти, много често не могат да бъдат измерени директно, а понякога дори техният брой и значение са неизвестни. Но други количества могат да бъдат налични за измерване, в зависимост по един или друг начин от факторите, които ни интересуват. Освен това, когато влиянието на неизвестен фактор, който ни интересува, се проявява в няколко измерени признака или свойства на обект, тези признаци могат да показват тясна връзка помежду си и общият брой фактори може да бъде много по-малък от броя на измерените променливи.

За идентифициране на факторите, които определят измерените характеристики на обектите, се използват методи на факторен анализ

Пример за прилагане на факторния анализ е изследването на личностните черти въз основа на психологически тестове. Личностните черти не могат да бъдат директно измерени. Те могат да бъдат съдени само по поведението на дадено лице или естеството на неговите отговори на въпроси. За да се обяснят резултатите от експериментите, те се подлагат на факторен анализ, който ни позволява да идентифицираме тези лични свойства, които влияят върху поведението на индивида.
В основата на различни методи за факторен анализ е следната хипотеза: наблюдаваните или измерените параметри са само косвени характеристики на обекта, който се изследва; в действителност има вътрешни (скрити, латентни, не пряко наблюдавани) параметри и свойства, броят на което е малко и които определят стойностите на наблюдаваните параметри. Тези вътрешни параметри обикновено се наричат ​​фактори.

Целта на факторния анализ е да концентрира първоначалната информация, изразяваща голям брой разглеждани характеристики чрез по-малък брой по-обемни вътрешни характеристики на явлението, които обаче не могат да бъдат директно измерени.

Установено е, че идентифицирането и последващият мониторинг на нивото на общите фактори позволява да се открият предаварийни състояния на обект на много ранни етапи на развитие на дефекта. Факторният анализ ви позволява да наблюдавате стабилността на корелациите между отделните параметри. Именно корелационните връзки между параметрите, както и между параметрите и общите фактори, съдържат основната диагностична информация за процесите. Използването на инструментите на пакета Statistica при извършване на факторен анализ премахва необходимостта от използване на допълнителни изчислителни инструменти и прави анализа визуален и разбираем за потребителя.

Резултатите от факторния анализ ще бъдат успешни, ако е възможно да се интерпретират идентифицираните фактори въз основа на значението на показателите, характеризиращи тези фактори. Този етап от работата е много отговорен; изисква ясно разбиране на същинското значение на показателите, които се използват за анализ и въз основа на които се идентифицират факторите. Ето защо, когато предварително внимателно подбирате показатели за факторен анализ, трябва да се ръководите от тяхното значение, а не от желанието да включите възможно най-много от тях в анализа.

Същността на факторния анализ

Нека представим няколко основни положения на факторния анализ. Нека за матрицата хна измерваните параметри на обекта има ковариационна (корелационна) матрица ° С, Където Р– брой параметри, н– брой наблюдения. Чрез линейна трансформация х=QY+Uможете да намалите размерността на оригиналното факторно пространство хза изравняване Y, при което Р"<<Р. Това съответства на трансформацията на точка, характеризираща състоянието на даден обект, в й-дименсионално пространство, в ново дименсионално пространство с по-ниско измерение Р". Очевидно геометричната близост на две или много точки в новото факторно пространство означава стабилността на състоянието на обекта.

Матрица Yсъдържа ненаблюдаеми фактори, които по същество са хиперпараметри, характеризиращи най-общите свойства на анализирания обект. Общите фактори най-често се избират като статистически независими, което улеснява тяхната физическа интерпретация. Вектор на наблюдаваните характеристики хпоследствията от промяната на тези хиперпараметри имат смисъл.

Матрица Uсе състои от остатъчни фактори, които включват главно грешки при измерване на характеристиките х(аз). Правоъгълна матрица Qсъдържа факторни натоварвания, които определят линейната връзка между характеристиките и хиперпараметрите.
Факторните натоварвания са стойностите на корелационните коефициенти на всяка от първоначалните характеристики с всеки от идентифицираните фактори. Колкото по-тясна е връзката на дадена характеристика с разглеждания фактор, толкова по-висока е стойността на факторното натоварване. Положителният знак на факторното натоварване показва пряка (а отрицателният знак – обратна) връзка между дадена характеристика и фактор.

По този начин данните за факторните натоварвания позволяват да се формулират изводи за набора от първоначални характеристики, които отразяват определен фактор, и за относителното тегло на отделна характеристика в структурата на всеки фактор.

Моделът на факторния анализ е подобен на моделите на многовариантната регресия и дисперсионния анализ. Основната разлика между модела на факторния анализ е, че векторът Y е ненаблюдаеми фактори, докато при регресионния анализ това са записаните параметри. От дясната страна на уравнение (8.1) неизвестните са матрицата на факторните натоварвания Q и матрицата на стойностите на общите фактори Y.

За да намерите матрицата на факторните натоварвания, използвайте уравнението QQ t = S–V, където Q t е транспонираната матрица Q, V е ковариационната матрица на остатъчните фактори U, т.е. . Уравнението се решава чрез итерации чрез задаване на някакво нулево приближение на ковариационната матрица V(0). След намиране на матрицата на факторните натоварвания Q, общите фактори (хиперпараметри) се изчисляват с помощта на уравнението
Y=(Q t V -1)Q -1 Q t V -1 X

Пакетът за статистически анализ Statistica ви позволява интерактивно да изчислявате матрица от факторни натоварвания, както и стойностите на няколко предварително дефинирани основни фактора, най-често два - въз основа на първите два основни компонента на оригиналната матрица на параметрите.

Факторен анализ в системата Statistica

Нека разгледаме последователността на факторния анализ, като използваме примера за обработка на резултатите анкетно проучване на служителите на предприятието. Необходимо е да се идентифицират основните фактори, които определят качеството на трудовия живот.

На първия етап е необходимо да се изберат променливи за факторен анализ. Използвайки корелационен анализ, изследователят се опитва да идентифицира връзката между изследваните характеристики, което от своя страна му дава възможност да идентифицира пълен и неизлишен набор от характеристики чрез комбиниране на силно корелирани характеристики.

Ако факторният анализ се извърши върху всички променливи, резултатите може да не са напълно обективни, тъй като някои променливи се определят от други данни и не могат да бъдат регулирани от служителите на въпросната организация.

За да разберем кои показатели трябва да бъдат изключени, нека изградим матрица от коефициенти на корелация, като използваме наличните данни в Statistica: Статистика/ Основна статистика/ Корелационни матрици/ Ok. В началния прозорец на тази процедура Продукт-момент и частични корелации (фиг. 4.3), бутонът за списък с една променлива се използва за изчисляване на квадратната матрица. Изберете всички променливи (изберете всички), Добре, Резюме. Получаваме корелационната матрица.

Ако коефициентът на корелация варира от 0,7 до 1, това означава силна корелация на показателите. В този случай една променлива със силна корелация може да бъде елиминирана. Обратно, ако коефициентът на корелация е малък, можете да елиминирате променливата поради факта, че тя няма да добави нищо към общата сума. В нашия случай няма силна корелация между променливите и ние ще проведем факторен анализ за пълния набор от променливи.

За да стартирате факторен анализ, трябва да извикате модула Статистика/Многовариантни изследователски техники/Факторен анализ. На екрана ще се появи прозорецът на модула за факторен анализ.



За анализ избираме всички променливи на електронната таблица; Променливи: изберете всички, ОК. Редът за входен файл показва необработени данни. В модула са възможни два вида изходни данни - Raw Data и Correlation Matrix - корелационна матрица.

Разделът за изтриване на MD указва как се обработват липсващите стойности:
* Casewise – начин за изключване на липсващи стойности (по подразбиране);
* Pairwise – метод по двойки за елиминиране на липсващи стойности;
* Средно заместване – заместване на средната вместо липсващи стойности.
Методът Casewise е да игнорира всички редове в електронна таблица, съдържащи данни, които имат поне една липсваща стойност. Това важи за всички променливи. Методът Pairwise игнорира липсващите стойности не за всички променливи, а само за избраната двойка.

Нека изберем начин за обработка на липсващите стойности Casewise.

Statistica ще обработи липсващите стойности по посочения начин, ще изчисли корелационна матрица и ще предложи няколко метода за факторен анализ, от които да избирате.

След като щракнете върху бутона Ok, се появява прозорецът Дефиниране на метода за извличане на фактор.

Горната част на прозореца е информационна. Това съобщава, че липсващите стойности се обработват с помощта на метода Casewise. Бяха обработени 17 наблюдения и 17 наблюдения бяха приети за допълнителни изчисления. Корелационната матрица е изчислена за 7 променливи. Долната част на прозореца съдържа 3 раздела: Бързо, Разширено, Описателни.

Има два бутона в раздела Описания:
1- преглед на корелации, средни стойности и стандартни отклонения;
2- изграждане на множествена регресия.

Като щракнете върху първия бутон, можете да видите средни стойности и стандартни отклонения, корелации, ковариации и да изградите различни графики и хистограми.

В раздела Разширени от лявата страна изберете метода за извличане на факторен анализ: Основни компоненти. От дясната страна изберете максималния брой фактори (2). Посочва се или максималният брой фактори (максимален брой фактори), или минималната собствена стойност: 1 (собствена стойност).

Щракнете върху Ok и Statistica бързо ще извърши изчисленията. На екрана се появява прозорецът с резултатите от факторния анализ. Както беше посочено по-рано, резултатите от факторния анализ се изразяват чрез набор от факторни натоварвания. Следователно по-нататък ще работим с раздела Зареждания.

Горната част на прозореца е информационна:
Брой променливи (брой анализирани променливи): 7;
Метод (метод за избор на фактор): Основни компоненти;
Log (10) детерминанта на корелационната матрица: –1,6248;
Брой извлечени фактори: 2;
Собствени стойности (собствени стойности): 3.39786 и 1.19130.
В долната част на прозореца има функционални бутони, които ви позволяват да видите изчерпателно резултатите от анализа, числено и графично.
Факторна ротация – ротация на факторите; в този падащ прозорец можете да изберете различни ротации на осите. Чрез завъртане на координатната система може да се получи набор от решения, от които трябва да се избере интерпретируемо решение.

Има различни методи за завъртане на пространствените координати. Пакетът Statistica предлага осем такива метода, представени в модула за факторен анализ. Така, например, методът varimax съответства на координатна трансформация: ротация, която максимизира дисперсията. В метода varimax се получава опростено описание на колоните на факторната матрица, като се намаляват всички стойности до 1 или 0. В този случай се разглежда дисперсията на квадратните факторни натоварвания. Факторната матрица, получена с помощта на метода на ротация на varimax, е по-инвариантна по отношение на избора на различни набори от променливи.

Quartimax ротацията има за цел подобно опростяване само по отношение на редовете на факторната матрица. Equimax между тях ли е? Когато ротационните фактори използват този метод, се прави опит да се опростят както колоните, така и редовете. Разгледаните ротационни методи се отнасят до ортогонални ротации, т.е. резултатът е несвързани фактори. Методите на директна облиминна и промаксимална ротация се отнасят до наклонени ротации, които водят до фактори, които са корелирани един с друг. Терминът?нормализиран? в имената на методите показва, че факторните натоварвания са нормализирани, т.е. разделени на корен квадратен от съответната дисперсия.

От всички предложени методи първо ще разгледаме резултата от анализа без завъртане на координатната система – Unrotated. Ако полученият резултат се окаже интерпретируем и ни устройва, тогава можем да спрем дотук. Ако не, можете да завъртите осите и да разгледате други решения.

Щракнете върху бутона "Зареждане на факторите" и разгледайте числено зарежданията на факторите.



Нека си припомним, че факторните натоварвания са стойностите на корелационните коефициенти на всяка променлива с всеки от идентифицираните фактори.

Стойност на факторно натоварване, по-голяма от 0,7, показва, че тази характеристика или променлива е тясно свързана с въпросния фактор. Колкото по-тясна е връзката на дадена характеристика с разглеждания фактор, толкова по-висока е стойността на факторното натоварване. Положителен знак на факторно натоварване показва пряка (а отрицателен знак? обратна) връзка между дадена характеристика и фактор.
И така, от таблицата на факторните натоварвания бяха идентифицирани два фактора. Първият определя OSB - чувство за социално благополучие. Останалите променливи се определят от втория фактор.

На линия Expl. Var (фиг. 8.5) показва дисперсията, дължаща се на един или друг фактор. На линия Prp. Totl показва пропорцията на дисперсията, отчетена от първия и втория фактор. Следователно, първият фактор представлява 48,5% от общата дисперсия, а вторият фактор представлява 17,0% от общата дисперсия, останалата част се отчита от други неотчетени фактори. В резултат на това двата идентифицирани фактора обясняват 65,5% от общата дисперсия.



Тук също виждаме две групи фактори - OCB и останалите много променливи, от които се откроява JSR - желанието за смяна на работата. Очевидно има смисъл това желание да се изследва по-задълбочено чрез събиране на допълнителни данни.

Избор и изясняване на броя на факторите

След като имате информация за това колко вариация е допринесъл всеки фактор, можете да се върнете към въпроса колко фактора трябва да бъдат запазени. По своята същност това решение е произволно. Но има някои общоприети препоръки и на практика тяхното спазване дава най-добри резултати.

Броят на общите фактори (хиперпараметри) се определя чрез изчисляване на собствените стойности (фиг. 8.7) на X матрицата в модула за факторен анализ. За да направите това, в раздела Explained variance (Фиг. 8.4), трябва да щракнете върху бутона Scree plot.


Максималният брой общи фактори може да бъде равен на броя на собствените стойности на матрицата на параметрите. Но с увеличаването на броя на факторите, трудностите при тяхното физическо тълкуване нарастват значително.

Първо, могат да бъдат избрани само фактори със собствени стойности, по-големи от 1. По същество това означава, че ако даден фактор не допринася за дисперсия, еквивалентна поне на дисперсията на една променлива, тогава той се пропуска. Този критерий е най-широко използваният. В примера по-горе, въз основа на този критерий, трябва да се запазят само 2 фактора (два основни компонента).

Можете да намерите място на графиката, където намаляването на собствените стойности отляво надясно се забавя възможно най-много. Предполага се, че вдясно от тази точка има само "факториален сипей". В съответствие с този критерий можете да оставите 2 или 3 фактора в примера.
От фиг. се вижда, че третият фактор леко увеличава дела на общата дисперсия.

Факторният анализ на параметрите дава възможност да се идентифицира на ранен етап нарушение на работния процес (поява на дефект) в различни обекти, които често не могат да бъдат забелязани чрез директно наблюдение на параметрите. Това се обяснява с факта, че нарушаването на корелациите между параметрите се случва много по-рано от промяната на един параметър. Това изкривяване на корелациите позволява своевременно откриване на факторния анализ на параметрите. За целта е достатъчно да имате масиви от регистрирани параметри.

Могат да се дадат общи препоръки за използването на факторния анализ, независимо от предметната област.
* Всеки фактор трябва да има поне два измерени параметъра.
* Броят на измерванията на параметрите трябва да бъде по-голям от броя на променливите.
* Броят на факторите трябва да бъде обоснован въз основа на физическата интерпретация на процеса.
* Винаги трябва да гарантирате, че броят на факторите е много по-малък от броя на променливите.

Критерият на Кайзер понякога задържа твърде много фактори, докато критерият за сипеи понякога задържа твърде малко фактори. И двата критерия обаче са доста добри при нормални условия, когато има сравнително малък брой фактори и много променливи. На практика по-важният въпрос е кога полученото решение може да бъде интерпретирано. Следователно е обичайно да се изследват няколко решения с повече или по-малко фактори и след това да се избере това, което има най-голям смисъл.

Пространството на първоначалните характеристики трябва да бъде представено в хомогенни измервателни скали, тъй като това позволява използването на корелационни матрици в изчисленията. В противен случай възниква проблемът с „теглата“ на различни параметри, което води до необходимостта от използване на ковариационни матрици при изчисляване. Това може да доведе до допълнителен проблем с повторяемостта на резултатите от факторния анализ, когато броят на характеристиките се промени. Трябва да се отбележи, че този проблем е просто решен в пакета Statistica чрез преминаване към стандартизирана форма на представяне на параметри. В този случай всички параметри стават еквивалентни по отношение на степента на връзката им с процесите в обекта на изследване.

Лошо кондиционирани матрици

Ако има излишни променливи в изходния набор от данни и те не са били елиминирани чрез корелационен анализ, тогава обратната матрица (8.3) не може да бъде изчислена. Например, ако една променлива е сумата от две други променливи, избрани за този анализ, тогава корелационната матрица за този набор от променливи не може да бъде обърната и факторният анализ по същество не може да бъде извършен. На практика това се случва, когато човек се опитва да приложи факторен анализ към много силно зависими променливи, както понякога се случва, например, при обработката на въпросници. След това е възможно изкуствено да се намалят всички корелации в матрицата чрез добавяне на малка константа към диагоналните елементи на матрицата и след това да се стандартизира. Тази процедура обикновено води до матрица, която може да бъде обърната и следователно е приложима за факторен анализ. Освен това тази процедура не засяга набора от фактори, но оценките са по-малко точни.

Факторно и регресионно моделиране на системи с променливи състояния

Система с променливо състояние (VSS) е система, чийто отговор зависи не само от входното действие, но и от обобщен постоянен във времето параметър, който определя състоянието. Променлив усилвател или атенюатор? Това е пример за най-простата SPS, при която коефициентът на предаване може да се променя дискретно или плавно по някакъв закон. Изследването на SPS обикновено се извършва за линеаризирани модели, в които преходният процес, свързан с промяна в параметъра на състоянието, се счита за завършен.

Най-разпространени са атенюаторите, направени на базата на L-, T- и U-образни връзки на диоди, свързани последователно и паралелно. Съпротивлението на диодите под въздействието на управляващия ток може да варира в широк диапазон, което прави възможно промяната на честотната характеристика и затихването в пътя. Независимостта на фазовото изместване при контролиране на затихването в такива атенюатори се постига с помощта на реактивни вериги, включени в основната структура. Очевидно е, че с различни съотношения на съпротивление на паралелни и последователни диоди може да се получи същото ниво на въведено затихване. Но промяната във фазовото изместване ще бъде различна.

Ние проучваме възможността за опростяване на автоматизирания дизайн на атенюаторите, елиминирайки двойната оптимизация на коригиращите вериги и параметрите на управляваните елементи. Като изследван SPS ще използваме електрически контролиран атенюатор, чиято еквивалентна схема е показана на фиг. 8.8. Минималното ниво на затихване се осигурява в случай на ниско съпротивление на елемент Rs и високо съпротивление на елемент Rp. Тъй като съпротивлението на елемента Rs се увеличава и съпротивлението на елемента Rp намалява, въведеното затихване се увеличава.

Зависимостите на промяната на фазовото изместване от честотата и затихването за веригата без корекция и с корекция са показани на фиг. 8.9 и 8.10 съответно. В коригирания атенюатор в диапазона на затихване 1,3-7,7 dB и честотната лента 0,01-4,0 GHz се постига промяна във фазовото отместване с не повече от 0,2°. В атенюатор без корекция промяната във фазовото изместване в същата честотна лента и диапазон на затихване достига 3°. По този начин фазовото изместване се намалява почти 15 пъти поради корекция.


Ще разглеждаме коригиращите и контролните параметри като независими променливи или фактори, влияещи върху затихването и промяната във фазовото отместване. Това прави възможно, използвайки системата Statistica, да се извърши факторен и регресионен анализ на SPS, за да се установят физически модели между параметрите на веригата и индивидуалните характеристики, както и да се опрости търсенето на оптимални параметри на веригата.

Първоначалните данни бяха генерирани по следния начин. За коригиращи параметри и контролни съпротивления, които се различават от оптималните нагоре и надолу на честотна мрежа от 0,01–4 GHz, бяха изчислени въведеното затихване и промяната във фазовото отместване.

Методите за статистическо моделиране, по-специално факторен и регресионен анализ, които преди това не са били използвани за проектиране на дискретни устройства с променливи състояния, позволяват да се идентифицират физическите модели на работа на системните елементи. Това допринася за създаването на структура на устройството, базирана на даден критерий за оптималност. По-специално, този раздел обсъжда фазово-инвариантния атенюатор като типичен пример за система с променливи състояния. Идентифицирането и тълкуването на факторните натоварвания, които влияят на различни изследвани характеристики, прави възможно промяната на традиционната методология и значително опростяване на търсенето на коригиращи параметри и параметри на регулиране.

Установено е, че използването на статистически подход при проектирането на такива устройства е оправдано както за оценка на физиката на тяхната работа, така и за обосноваване на електрическите схеми. Статистическото моделиране може значително да намали обема на експерименталните изследвания.

резултати

  • Наблюдаването на общите фактори и съответните факторни натоварвания е необходимо идентифициране на вътрешни модели на процеси.
  • За да се определят критичните стойности на контролираните разстояния между факторните натоварвания, трябва да се натрупат и обобщят резултатите от факторния анализ за подобни процеси.
  • Използването на факторен анализ не се ограничава до физическите характеристики на процесите. Факторният анализ е едновременно мощен метод за наблюдение на процесите и е приложим при проектирането на системи за голямо разнообразие от цели.

Близо