Проблеми по часа на провеждане на факторен анализ. Подготовка на данни. Факторен анализ

ETAPI VICONANNY ФАКТОР АНАЛИЗ

Можете да видите девет стъпки във факторния анализ. За по-голяма яснота, нека представим стъпките в схемата и нека да им дадем кратко описание.

Етапите на факторния анализ са показани на фиг.

Ориз.

ФОРМУЛИРАНЕ НА ПРОБЛЕМИ И ВЪЗДЕЙСТВИЕ НА КОРЕЛАЦИОННАТА МАТРИЦА

Формулиране на проблема.Необходимо е ясно да се посочи броят на факторния анализ. Промените, подложени на факторен анализ, се задават от предишните резултати, теоретични последици за изследването на ученика. Необходимо е промените да са направени в интервалили изтъкнатмащаб. Dosvіd pokazyє, scho obsjag vybirki може да бъде по-голямо в chotiri - пет пъти, по-малък брой промени.

Корелационна матрица на Побудов.Анализът се основава на корелационната матрица между променливите. Доталността на факторния анализ зависи от наличието на корелации между промените. Въпреки че корелациите между обичайните променливи са малки, тогава факторният анализ се извършва по стандартен начин. Промените, тясно свързани една с друга, като правило, тясно корелират с един и същ фактор или фактори.

За да се провери отново валидността на вариацията на факторния модел, има извадка от статистически данни. За допълнителния критерий за сферичност на Бартлет се преразглежда нулевата хипотеза за наличие на корелации между промените в общия брак. Tse означава, че твърдостта се вижда при тези, които имат корелативна матрица на sukupnosti - tse сама матрица, в която всички диагонални елементи са равни на единица, останалите са равни на нула. Повторна проверка за допълнителния критерий за сферичност на полето при повторното преобразуване на детерминантата на корелационната матрица върху статистиката хи-квадрат. За голямото значение на статистиката се възхвалява нулевата хипотеза. Въпреки че нулевата хипотеза не се поддържа, факторният анализ е подценен. Друга ключова статистика е критерият за адекватност на подбора на Кайзер-Майер-Олкин (KMO). Този коефициент сравнява стойността на коефициентите на корелация със стойностите на частните коефициенти на корелация. Малките стойности на KMO - статистиката сочат към тези, че корелациите между двойки променливи не могат да бъдат обяснени с други променливи, но това означава, че вариацията на факторния анализ е подценена.

Дисперсионен анализ на факторите

Факторна матрица

Промяна на фактор А Фактор Б

Както може да се види от матрицата, факторното отклонение (или вагини) A и B за различни оцелели може да бъде значително подобрено. Фактор отклонение A, в допълнение към T 1, показва плътна връзка, която се характеризира с коефициент на корелация, равен на 0,83, tobto. добър (tіsna) застоял. Фактор navantazhennya B по същата причина да rk\u003d 0,3, което дава слаба плътност. Както се случи, фактор В е по-добре свързан с успокояващите агенти Т2, Т4 и Т6.

Vrakhovuyuchi, scho factor bias като A, така і B добавете по-бавни vimogi, така че те да не се припокриват с техните групи, с тясна връзка не повече от 0,4 (това е слабо), можете да считате, че матрицата на взаимното корелиране е повече представител на два независими фактора, yakі техните chergoy означават шест spozhivchih vimog (crim T 7).

Промяната в T 7 може да се разглежда като независим фактор, но няма значително корелационно отклонение (по-голямо от 0,4). Но според нас няма и следа от работа, защото факторът „вратите не са виновни за ръждата“ конструкцииврати.

По този начин при утвърждаване на техническата спецификация за проектиране на вратите на автомобила ще се впише като помощно самото наименование на взетите фактори, за които е необходимо да се знае конструктивното решение по отношение на инженерните характеристики.

Например, един принцип е важен за силата на коефициента на корелация между промените: квадратът, прозорците показват, като част от дисперсията (разпръскването) на признаците на основната за две промени, мащабите се променят силно. Така например две промени T 1 и T 3 с корелация от 0,8 се припокриват със стъпка от 0,64 (0,8 2), което означава, че 64% от вариациите са малки, а другите промени са извънредни, т.е. избягал. Можете също да кажете това сънливост tsikh zminnykh dorivnyu 64%.

Да предположим, че факторното отклонение във факторната матрица е и коефициентите на корелация, но също и между факторите, които се променят (устойчиви вимогами).

Промяна на фактор А Фактор Б

Следователно квадратът на факторната промяна (дисперсия) характеризира степента на сънливост (или припокриване) на даден фактор на промяна. Значително припокриващо се ниво (дисперсия D) на двата фактора на промяна (по-бавен живот) T1. Следователно е необходимо да се изчисли сумата от квадратите на тези длъжностни лица от първата промяна, tobto. 0,83 x 0,83 + 0,3 x 0,3 = 0,70. По този начин стабилността на промяната T 1 и с двата фактора става 70%. Tse dosit signa perekrittya.


Точно в този час може да се види ниска сънливост в това, което се променя vimiryu chi vibivayas, сякаш е сънливо в очите на други zminnykh, като в анализ. Tse може да е на ръба, на което се дава промяна, няма да се промени поради фактори по една причина: в противен случай ще бъде по-лесно за разбиране (като например промяна на T 7), или може да е страхотно извинение да спечелите , в противен случай ще разкрие признаци, които насърчават разпръскването.

Трябва да се отбележи, че значимостта на кожния фактор се определя и от големината на вариацията между промените и факторните предпочитания (vago). За да се изчисли стойността на фактора, е необходимо да се знае в матрицата на скин фактор сумата от квадратите на стойността на фактора за промяната на кожата. Така, например, дисперсията на фактор A (D A) на склад е 2,42 (0,83 x 0,83 + 0,3 x 0,3 + 0,83 x 0,83 + 0,4 x 0,4 + 0 , 8 x 0,8 + 0,35 x 0,35). Анализът на значимостта на официалния B показа, че D B = 2,64, т.е. значимостта на фактор В е по-висока, по-ниският фактор А.

Въпреки че стойността на фактора е разделена на броя на променливите (в нашия случай това е sim), тогава стойността се отнема като част от дисперсията (или общата информация) в запасния фактор на изходната корелационна матрица. За фактор А? ~ 0,34 (34%), а за фактор B -? = 0,38 (38%). Обобщавайки резултатите, otrimaemo 72%. По този начин два фактора, взети заедно, представляват само 72% от дисперсията на показателите в изходната матрица. Tse означава, че в резултат на факторизация, част от информацията в изходна матрицаБулата беше пожертвана, за да се насърчи двуфакторен модел. В резултат на това 28% от информацията беше пропиляна, въпреки че можеше да се разпознае, че е възприет моделът с шест фактора.

Къде е позволено помилване, vrakhovuchi, какви всички промени се разглеждат, какво може да се направи за дизайна на вратите, vrakhovaniya? Nayimovіrnіshe, че стойностите на коефициентите на корелация на промените, сякаш струват на едно длъжностно лице, са подценени. Въз основа на резултатите от извършения анализ е възможно да се премине към формиране на други стойности на коефициентите на корелация във взаимната корелационна матрица (раздел. Таблица 2.2).

На практика често се среща такава ситуация, ако броят на независимите фактори е голям, за да се преодолеят всички основни проблеми, било то от техническа или икономическа гледна точка. Іsnuє редица начини за обмен на редица фактори. Най-важният от тях е анализът на Парето. Когато изберете тези фактори (светът има промяна в значимостта), те консумират до 80-85% между общата значимост.

Факторният анализ може да бъде постигнат при прилагането на метода на функцията на структурата на качеството (QFD), който се използва широко извън кордона за формиране на техническа задача за нова версия.

За да обясним корелационната матрица, се нуждаем не от един, а от цаца от фактори. Кожният фактор се характеризира с , промяна на кожата - ред матрици. Факторът се нарича генералим,тъй като всички свободни работни места са значително променени от нула, те могат да бъдат замислени от обичайните промени. Общият фактор е по-важен от останалите и такъв фактор е показан схематично на фиг.1. стовпцем.Коефициентът се нарича див yakscho би искал да b две yogo vantagennia значително се покачват от нула. Стовпци, на Ориз. един.за установяване на такива изгарящи фактори. Вонята може да е по-приключенска от тях двамата. Като коефициент на повече от една суета, той значително се счита за нула, vin се нарича характерен фактор(Div. stovptsі на Ориз. един.) Такъв фактор е повече от една промяна. Virishalne znachennya факторен анализ може да zagalnі factori. Веднага след инсталирането на коефициентите на нагряване, характерните фактори се появяват автоматично. Броят на високите печалби от промяната на високия фактор се нарича сгъване. Например променете на Фиг. 1.максималното сгъване е 2, а смяната е три.

Ориз. 1. Схематично представяне на факторната ферментация. Кръст означава по-висок фактор на интерес.

Отже, забудуемо модел

, (4)

de - фактори, които не се страхуват м< к,

Промени (външни знаци), които се пазят,

Факторна суета,

Випадков помилване се дължи само на нулева средна стойност и дисперсия:

аз - несвързани,

Некорелирани флуктуации с нулева средна стойност и единична дисперсия .

(5)

Тук - и-и spіlnіst є частична дисперсия, объркана от фактори, - частично дисперсия, объркана от помилване. Матричният запис има факторен модел в бъдещето:

(6)

de е матрицата на предпочитанията, е векторът на факторите, е векторът на помилване.

Връзката между променящите се, изразени фактори може да се покаже по следния начин:

де - матрицата е диагонална на реда, за да отмъсти за вариацията на помилванията. Основният ум: - диагонал, - матрицата е невидима. Dodatkovoy интелектуално единство на решението е диагоналност на матрицата.

Є безлични методи за rozv'yazannya факторно изравняване. Най-ранният метод за факторен анализ метод на главния фактор, При която техника за анализ на компонентите на главата има напълно намалена корелационна матрица от паралелите по диагонала на главата. За оценка на кохезионността използвайте коефициента на множествената корелация между различните сортове и съвместното съществуване на други промени.

Факторният анализ се извършва от изравняването на характеристиките, както при анализа на основните компоненти:

(8)

Virishyuyu също така, otrimuyut valnі числа i і матрицата на нормализиращи (характерни) вектори във V, и след това познайте матрицата на факторната ферментация:

Емпиричен итеративен алгоритъм, който е подобен на оценките на референтните параметри, се използва за оценка на резултатите и факторните печалби. Същността на алгоритъма се свежда до следното: повечето от оценките на факторните предимства се приписват на допълнителния метод на основните фактори. На базата на корелационната матрица R формално се приписват оценките на основните компоненти и основните фактори:

(9)

de - стойността на матрицата R;

Външни данни (vector-stowpts);

Коефициенти за високи фактори;

Компоненти на главата (вектор-stovptsі).

Оценките на факторните печалби е стойности

Оценките на сънливостта изглежда са

При следващата итерация матрицата R се модифицира; на базата на модифицираната матрица R за допълнителната изчислителна схема на компонентния анализ се повтаря анализът на основните компоненти (тъй като те не са еднакви от гледна точка на компонентния анализ), оценките на основните фактори , факторни печалби, разделяния и специфики се обсъждат. Факторният анализ трябва да бъде завършен, тъй като при две самоубийствени итерации оценките за кохерентност се променят слабо.

Забележка.Преобразуването на матрицата R може да унищожи положителното значение на матрицата R + i, в резултат на това стойностите на R + могат да бъдат отрицателни.

СТАТИСТИЧЕСКИ ФАКТОРЕН АНАЛИЗ

Корелации (фактор.sta) PD разлика в реда n=100

Zminna

РОБОТ_1

РОБОТ_2

РОБОТ_3

DIM 1

DIM 2

DIM 3

Както може да се види от корелационната матрица на промените, за които се вижда, че са доволни от роботите, по-корелирани помежду си и променените, за които се вижда, че са доволни от къщата, също корелират помежду си. Корелациите между двата вида промяна (промяна, причинена от удовлетвореност от роботите, и промяна, причинена от удовлетвореност от къщата) са еднакво малки. Следователно изглежда правдоподобно, че има два привидно независими фактора (два вида фактори), показани в корелационната матрица: единият е доволен от работата, а другият е доволен от домашния живот.

    Факториален интерес

Друг етап от факторния анализ е първото виждане на длъжностните лица сред основните компоненти, по линия на главните длъжностни лица. Резултатът за нашето дупе е решение от два фактора. Нека да разгледаме корелациите между промяната и два фактора (или „нови“ променящи се). Qi корелациите се наричат ​​факториални.

Таблица 3.16

Таблица на факторните печалби (метод на главните компоненти)

СТАТИСТИЧЕСКИ ФАКТОРЕН АНАЛИЗ

Factor navantage (Без опаковане) Основни компоненти

Zminna

Чиник 1

Фактор 2

Глобална дисперсия

Частка загъл ї дисп.

Както се вижда от таблица 3.16, първият фактор е по-свързан с промените, другият е по-нисък (скалите на стойността на другия фактор според кожата изменението на първия фактор са по-големи, по-ниски от другия). Очевидно е, защото, тъй като е назначен повече, факторите се виждат последователно и отмъщават все по-малко и по-малко глобална дисперсия (раздел. Vlasnі стойност и брой фактори, които се виждат, Магазин. 61).

    Методи за обвиване на фактори

Третият етап на факторния анализ е обвиване на факторния напредък, което е резултат от предишния етап. Типични методи и стратегии за опаковане varimax, flatmax, і equimax. Методът на тези методи е да се отнеме рационализираната (интерпретирана) матрица на ползите, така че факторите да са ясно обозначени с високи предпочитания (например повече от 0,7) за определени промени и ниски - за други. Глобалният модел Qiu се нарича по различен начин проста структура.

Метод за опаковане на идеи varimaxбулата е описана по-добре (див. раздил Метод на главния компонент, Магазин. 60). По този начин може да се залепи и за дупето. Както преди, нашата задача е да знаем обвивката, която максимизира дисперсията по новите оси; или, с други думи, да вземем матрицата на предпочитание към кожния фактор по такъв начин, че вонята да се раздразни максимално и да е възможна възможността за опростената им интерпретация. По-долу е дадена таблица на рентабилността на фактора на завъртане.

Таблица 3.17

Таблица с факторни предпочитания (обвивка - varimax)

СТАТИСТИЧЕСКИ ФАКТОРЕН АНАЛИЗ

Факторно изместване (Varimax нормализиране) Изглед: Основни компоненти

Zminna

Чиник 1

Фактор 2

Глобална дисперсия

Частка загъл ї дисп.

Както се вижда от Таблица 3.17, първият фактор се определя от високите амбиции за промяна, поради удовлетвореността от работата, а другият фактор се дължи на удовлетвореността от работата. От които е възможно да се отглеждат мустаци, това удовлетворение, vymiryan за помощта на детската стая, се сгъва от две части: удовлетворение от кабина и робот. В такъв ранг, смачкан класификация doslіdzhuvanih промяна. Въз основа на взетата класификация първият фактор може да се нарече фактор на удовлетвореност от работата (или фактор на социалните ценности) и, очевидно, другият фактор на удовлетвореност от къщата (или фактор на специални ценности).

    Интерпретация на резултатите от факторния анализ

Последният етап на факторния анализ е промяната на интерпретацията на факторите, които имат резултат от обвиването. Тук, с оглед на миналото, е важна добрата теоретична подготовка и познаването на експерименталните резултати, вече натрупани от този галуси.

Всъщност интерпретацията на факторите е по-благоприятна за наблюдаваните значими факторни фактори (референтни промени) в кожните фактори. Точните критерии позволяват разграничаване между значителен факторен vag (предимство) и незначителен, никакъв. Например, във времена на голям избор (няколко стотици хора и повече), важността на 0,3 и повече се счита за значима. С промяна в броя на победите до няколко десетки души, толкова значителен, колкото и броят на победите, от порядъка на 0,4-0,5.

Превод на длъжностни лица, който винаги протича гладко; в някои случаи той е само леко неподвижен (например в различни случаи на данни, които са различни видове скали), а в някои случаи авторите се ръководят в него, факторът включва тестове, в някои случаи е важно да се работа върху съня.

В идеален вариант (подразделенията на промените не изглеждат като нормални), интерпретацията на резултатите от факторния анализ може да бъде анализирана от анализа на корелационната матрица, след което можем да преминем към факторни предимства (виждайки референтните промени). Предстоящият клин е изявлението на резултатите от корелационната матрица и наблюдението на фактори, които отмъщават за значимите. І, нареши, последният етап - анализ на елиминирането на различията между природата и все още съществуващите изменения (знак), които могат да намерят корелация с този фактор. Именуването на факторите се основава на подобряването на тихите референтни променливи, тъй като те отнемат максималната стойност на фактора и може да открият корелация с фактора. Например, тъй като тест, който оценява качеството на придобиване на безглузден материал, може да има голям интерес към този фактор, тогава останалата част може да бъде наречена като фактор на "механична памет".

Факторният анализ е същността на математическата статистика. Yogo qіlі, като метод на други раздели на математическата статистика, които се използват при разработването на модели, за разбиране на методите, които позволяват анализиране и интерпретиране на масив от експериментални данни по отношение на данни независимо от тяхната физическа форма.

Една от най-типичните форми на представяне на експериментални данни е матрица, чиито стойности съответстват на различни параметри, мощности, тестове и редове - нека наречем обекти, прояви, режими, които се описват с набор от специфични стойности на параметри. Всъщност размерите на матрицата изглеждат големи: например броят на редовете в центъра на матрицата може да бъде разделен на много десетки за няколко стотици хиляди (например със социологически условия), а броят на колони - в една - двеста. Не междинен, "визуален" анализ на матрици с такъв размер е невъзможен, следователно в математическата статистика има много подходи и методи, които се използват за "изстискване" на визуална информация, положена в матрица , ", vydkinuvshi "друг ред", "vipadkove".

При анализ на данните, представени под формата на матрица, се появяват два вида задачи. Задачите от първия тип трябва да се вземат въз основа на "краткото описание" на подраздела на обектите, а задачите на другия - да се показват взаимно между параметрите.

Вниманието на майката е на ръба, че основният стимул за появата на назначените задачи е не само и не стилът в града за кратко време да се кодира голям набор от числа, а в много по-голяма принципна среда, която може да има методологичен характер: ако беше възможно да се опише накратко големия масив от числа, тогава можете да повярвате, че той е разкрит като обективна закономерност, че възможността за кратко описание е увеличена; Aje същото търсене на обективни закономерности и е основният метод, за който по правило се събират данни.

Мисленето за методите за обработка на матрицата от данни се преразглежда, какъв тип задача за обработка на данните смрад се разпознава като virishuvati, і tim, към матрицата на каква воня воня.

Що се отнася до проблема за кратко описание на връзките между параметрите със среден брой на тези параметри, то в този случай най-често срещаната корелационна матрица може да бъде запълнена с няколко десетки или стотици числа и сама по себе си не може да служи като "кратко описание" на съществените връзки между параметрите, но то е виновно за метода на подаване на по-нататъшен преглед.

Факториален анализ с набор от модели и методи, които се използват за “щамповане” на информация, която се поставя в корелационната матрица. В основата на различните модели на факторен анализ лежи следната хипотеза: охраняващите или оцеляващите параметри са само косвени характеристики на обекта, които се развиват, или изяви, всъщност, базирани на вътрешни (прикрепени, неохранявани без средни) параметри или мощност , чийто брой е малки параметри Вътрешните параметри на Qi се наричат ​​фактори. Задачата на факторния анализ е да си представи параметрите като линейни комбинации от фактори и, евентуално, някои допълнителни, „неоригинални“ стойности - „нулиране“. Странен е фактът, че дори и самите фабрики да не знаят, такова оформление може да се отнеме, повече, да се назначават такива длъжностни лица, тобто. може да се въведе стойност на скин фактор за кожен обект.

Факторният анализ, независимо от методите, започва от обработката на таблици на интеркорелацията, взети върху безликите тестове, като корелационна матрица и завършва с вземането на факторната матрица след това. таблици, които показват важността на факторите за кожни тестове. Таблица 1 е хипотетична факторна матрица, която включва само два фактора.

Длъжностните лица се подреждат на горния ред на таблицата от най-значимите до най-малко значимите, а техният брой в кожния тест от 10 е даден при най-значимите.

маса 1

Хипотетична факторна матрица

Координатни оси.Обичайно е факторите да се представят геометрично като координатни оси, въпреки че такива изображения могат да бъдат представени като точки. Ориз. 1 обяснява процедурата. На тази графика на скинове от 10 теста, сочещи към Таблица 1, визуализациите на точките на два фактора, които съответстват на осите I и II. И така, тест 1 на представяния чрез точка с координати 0,74 ос I и 0,54 ос II. Krapki, scho представляват іnshi 9 теста, pobudovanі по подобен начин, s vikoristannymi стойност vаgi z tab. един.

Посочете позицията на координатните оси да не е фиксирана от данни. Таблицата на външната корелация показва само позицията на тестовете (това е точката на фиг. 1) шодо един.Тези точки могат да бъдат приложени към равнината на всяка позиция на координатните оси. От гледна точка на причините, когато правите факторен анализ, започнете да увивате осите до края, докато бъде отнето най-приемливият и лесно интерпретируем израз.

Ориз. 1. Хипотетичен фактор на ферментация, който показва два групови кожни фактора в 10 теста.

На фиг. 1 отримани след обвиване на ос I "и II" е показана пунктирани линии. Tse опаковане vykonano vіdpovіdno според критериите за предлагане на Thurstone. положителна разлика на тази проста структура.Първият прехвърля обвиването на осите към станцията, в която всички значими отрицателни сигнали се изключват. Повечето психолози обръщат внимание на пристрастието към отрицателния фактор на логически непоследователните тестове за здраве, така че това пристрастие означава, че колкото по-висок е резултатът на индивида за конкретен фактор, толкова по-нисък е резултатът от добър тест. Критерият за проста структура по същество означава, че кожният тест е виновен за майката на най-малкото фактори.

Vikonannya и двата критерия са дадени фактори, които могат лесно и недвусмислено да бъдат интерпретирани. Като тест, има голямо отклонение за един фактор и няма значителни отклонения за други фактори, можем да разберем за естеството на този фактор, като изберем даден тест. Навпаки, ако тестът е среден или нисък за шест фактора, тогава можем да ни кажем малко за естеството на някой от тях.

На фиг. 1 ясно се вижда, че след обвиването на координатните оси на всички словесни тестове (1-5) те се завъртат леко или дори близо до оста "I", а числените тестове (6-10) са тясно групирани по протежение на оси II, посочени в Таблица 2. Факторното отклонение в Таблица 2 няма отрицателни стойности, с оправдание на незначително малки стойности, които ясно се разглеждат като прошка за селекцията. Броят на тестовете, от друга страна, може да да бъде висока за фактор "I" и маловажно ниска - за фактор "I". често се появяват повече от два Статистически анализно не променяйте естеството на разглежданата процедура.

Таблица 2

Факторна матрица след обвиване

Deyakі doslidniki keruyutsya теоретичен модел като принцип на увиване на оси. Освен това неизменността е доведена до респект, иначе потвърждение на едни и същи фактори в независимите викони, но и равни успехи.

Тълкуване на фактори. Otrimavshi след процедурата за обвиване на факторния разтвор (чи, просто изглежда, факторната матрица), можем да пристъпим към тълкуването на името на факторите. Този етап на работа ще изисква повече психологическа интуиция, по-ниска статистическа подготовка. За да разберем естеството на даден фактор, не ни остава нищо, като да се опитаме да проверим колко висок е интересът на даден фактор и да се опитаме да разкрием психологически процеси, които са предизвикателство за тях. Колкото повече тестовете показват с високи амбиции за този фактор, толкова по-лесно е да се разкрие тази природа. Таблица 3 2, например, веднага се вижда, че фактор I е вербален, а фактор II е числов. Посочете към масата. Отклонението от 2 фактора също показва корелацията на кожния тест с фактора.

Съхранение