Проблеми під час проведення факторного аналізу. Підготовка данних. Факторний аналіз Етапи виконання факторного аналізу

ЕТАПИ ВИКОНАННЯ ФАКТОРНОГО АНАЛІЗУ

Можна виділити дев'ять етапів факторного аналізу. Для наочності представимо ці етапи на схемі, та був дамо їм коротку характеристику.

Етапи виконання факторного аналізу наведено на рис.

Рис.

ФОРМУЛЮВАННЯ ПРОБЛЕМИ І ПОБУДУВАННЯ КОРРЕЛЯЦІЙНОЇ МАТРИЦІ

Формулювання проблеми.Необхідно чітко визначити цілі факторного аналізу. Змінні, подвергаемые факторному аналізу, задаються з попередніх досліджень, теоретичних викладок чи на розсуд дослідника. Необхідно, щоб змінні вимірювалися в інтервальноїабо відносноюшкалою. Досвід показує, що обсяг вибірки має бути більшим у чотири - п'ять разів, ніж кількість змінних.

Побудова кореляційної матриці.В основі аналізу лежить матриця кореляції між змінними. Доцільність виконання факторного аналізу визначається наявністю кореляцій між змінними. Якщо кореляції між усіма змінними невеликі, то факторний аналіз проводити марно. Змінні, тісно взаємопов'язані між собою, як правило, тісно корелюють з одним і тим самим фактором або факторами.

Для перевірки доцільності використання факторної моделі є кілька статистик. За допомогою критерію сферичності Бартлетта перевіряється нульова гіпотеза про відсутність кореляції між змінними у генеральній сукупності. Це означає, що розглядається твердження у тому, що кореляційна матриця сукупності - це поодинока матриця, у якій все діагональні елементи рівні одиниці, проте інші рівні нулю. Перевірка за допомогою критерію сферичності полягає в перетворенні детермінанта кореляційної матриці на статистику хі-квадрат. За великого значення статистики нульову гіпотезу відхиляють. Якщо ж нульову гіпотезу не відхиляють, виконання факторного аналізу недоцільно. Інша корисна статистика – критерій адекватності вибірки Кайзера-Мейєра-Олкіна (КМО). Цей коефіцієнт порівнює значення коефіцієнтів кореляції зі значеннями приватних коефіцієнтів кореляції. Невеликі значення КМО – статистики вказують на те, що кореляції між парами змінних не можна пояснити іншими змінними, а це означає, що використання факторного аналізу є недоцільним.

Дисперсійний аналіз факторів

Факторна матриця

Змінна Фактор А Фактор Б

Як видно з матриці, факторні навантаження (або ваги) А та Б для різних споживчих вимог значно відрізняються. Факторна навантаження А вимоги Т 1 відповідає тісноті зв'язку, що характеризується коефіцієнтом кореляції, рівним 0,83, тобто. хороша (тісна) залежність. Факторне навантаження Б для того ж вимоги дає r k= 0,3, що відповідає слабкій тісноті зв'язку. Як і передбачалося, фактор Б дуже добре корелюється зі споживчими вимогами Т2, Т4 і Т6.

Враховуючи, що факторні навантаження як А, так і Б впливають на споживчі вимоги, що не належать до їх групи, з тіснотою зв'язку не більше 0,4 (тобто слабо), можна вважати, що представлена ​​вище матриця інтеркореляцій визначається двома незалежними факторами, які своєю чергою визначають шість споживчих вимог (крім Т 7).

Змінну Т 7 можна було виділити в самостійний фактор, оскільки з жодною споживчою вимогою вона не має значного кореляційного навантаження (більше 0,4). Але, на наш погляд, цього не слід робити, тому що фактор «двері не повинні іржавіти» не мають безпосереднього відношення до споживчих вимог щодо конструкціїдвері.

Таким чином, при затвердженні технічного завдання на проектування конструкції дверей автомобіля, саме назви отриманих факторів будуть вписані як споживчі вимоги, за якими необхідно знайти конструктивне рішення у вигляді інженерних характеристик.

Вкажемо одне принципово важливе властивість коефіцієнта кореляції між змінними: зведений квадрат, він показує, яка частина дисперсії (розкиду) ознаки є загальної для двох змінних, наскільки сильно ці змінні перекриваються. Так, наприклад, якщо дві змінні Т 1 і Т 3 з кореляцією 0,8 перекриваються зі ступенем 0,64 (0,8 2), це означає, що 64% ​​дисперсій тієї та іншої змінної є загальними, тобто. збігаються. Можна також сказати, що спільністьцих змінних дорівнює 64%.

Нагадаємо, що факторні навантаження у факторній матриці є також коефіцієнтами кореляції, але між факторами та змінними (споживчими вимогами).

Змінна Фактор А Фактор Б

Тому зведена у квадрат факторне навантаження (дисперсія) характеризує ступінь спільності (або перекриття) даної змінної та даного фактора. Визначимо ступінь перекриття (дисперсію D) обох факторів зі змінною (споживчою вимогою) Т1. І тому необхідно обчислити суму квадратів терезів чинників із першої змінної, тобто. 0,83 х 0,83 + 0,3 х 0,3 = 0,70. Таким чином, спільність змінної Т 1 з обома факторами становить 70%. Це досить значне перекриття.


У той самий час низька спільність може свідчити у тому, що змінна вимірює чи відбиває щось, якісно відрізняється від інших змінних, які у аналіз. Це має на увазі, що дана змінна не поєднується з факторами з однієї з причин: або вона вимірює інше поняття (як, наприклад, змінна Т 7), або має велику помилку виміру, або існують ознаки, що спотворюють дисперсію.

Слід зазначити, що значимість кожного фактора також визначається величиною дисперсії між змінними та факторним навантаженням (вагою). Для того, щоб обчислити власне значення фактора, потрібно знайти в кожному стовпчику факторної матриці суму квадратів факторного навантаження для кожної змінної. Таким чином, наприклад, дисперсія фактора А (D А) складе 2,42 (0,83 х 0,83 + 0,3 х 0,3 + 0,83 х 0,83 + 0,4 х 0,4 + 0 , 8 х 0,8 + 0,35 х 0,35). Розрахунок значущості чинника Б показав, що D Б = 2,64, тобто. значущість фактора Б вища, ніж фактора А.

Якщо власне значення фактора розділити на число змінних (у нашому прикладі їх сім), то отримана величина покаже, яку частку дисперсії (або обсяг інформації) у вихідній кореляційній матриці складе цей фактор. Для фактора А? ~ 0,34 (34%), а для фактора Б -? = 0,38 (38%). Підсумувавши результати, отримаємо 72%. Таким чином, два фактори, об'єднані, заповнюють лише 72% дисперсії показників вихідної матриці. Це означає, що в результаті факторизації частина інформації в вихідної матрицібула принесена в жертву побудови двофакторної моделі. В результаті втрачено 28% інформації, яка могла б відновитися, якби було прийнято шестифакторну модель.

Де ж допущена помилка, враховуючи, що всі розглянуті змінні, що стосуються вимог щодо конструкції дверей, враховані? Найімовірніше, що значення коефіцієнтів кореляції змінних, які стосуються одного чинника, дещо занижені. З урахуванням проведеного аналізу можна було б повернутись до формування інших значень коефіцієнтів кореляції в матриці інтеркореляцій (див. табл. 2.2).

На практиці часто стикаються з такою ситуацією, коли кількість незалежних факторів досить велика, щоб їх все врахувати у вирішенні проблеми або з технічної або економічної точки зору. Існує ряд способів обмеження кількості факторів. Найбільш відомий з них – аналіз Парето. При цьому відбираються ті фактори (у міру зменшення значущості), які потрапляють до 80-85%-ної межі їх сумарної значущості.

Факторний аналіз можна використовувати при реалізації методу структурування функції якості (QFD), що широко застосовується за кордоном для формування технічного завдання на новий виріб.

У випадку для пояснення кореляційної матриці знадобиться не один, а кілька факторів. Кожен фактор характеризується стовпцем , кожна змінна - рядком матриці. Фактор називається генеральним,якщо всі його навантаження значно відрізняються від нуля, він має навантаження від усіх змінних. Генеральний фактор має навантаження від усіх змінних та схематично такий фактор зображений на рис.1. стовпцем .Фактор називається загальнимякщо хоча б два його навантаження значно відрізняються від нуля. Стовпці , на Рис. 1.становлять такі загальні фактори. Вони мають навантаження від більш як двох змінних. Якщо фактор лише одне навантаження, значно відрізняється від нуля, він називається характерним фактором(Див. стовпці на Рис. 1.) Кожен такий фактор є лише однією змінною. Вирішальне значення факторному аналізі мають загальні фактори. Якщо загальні фактори встановлені, характерні фактори виходять автоматично. Число високих навантажень змінної на загальні фактори називається складністю. Наприклад, змінна на рис.1.має складність 2, а змінна – три.

Рис. 1. Схематичне зображення факторного відображення. Хрестик означає високе факторне навантаження.

Отже, збудуємо модель

, (4)

де - фактори, що не спостерігаються m< k,

Перемінні (вихідні ознаки), що спостерігаються,

Факторні навантаження,

Випадкова помилка пов'язана тільки з нульовим середнім та дисперсією:

І - некорельовані,

Некорельовані випадкові величини з нульовим середнім та одиничною дисперсією .

(5)

Тут - i-а спільність є частиною дисперсії, обумовлена ​​факторами, - частина дисперсії, обумовлена ​​помилкою. У матричному записі факторна модель набуде вигляду:

(6)

де – матриця навантажень, – вектор факторів, – вектор помилок.

Кореляції між змінними, виражені факторами, можна вивести так:

де - діагональна матриця порядку, що містить дисперсії помилок. Основна умова: – діагональна, – невід'ємно визначена матриця. Додатковою умовою єдиності рішення є діагональність матриці.

Є безліч методів розв'язання факторного рівняння. Найбільш раннім методом факторного аналізу є метод основних факторів, В якому методика аналізу головних компонент використовується стосовно редукованої кореляційної матриці із спільностями на головній діагоналі. Для оцінки спільностей зазвичай користуються коефіцієнтом множинної кореляції між відповідною змінною та сукупністю інших змінних.

Факторний аналіз проводиться з характеристичного рівняння, як й у аналізі основних компонент:

(8)

Вирішуючи яке, отримують власні числа i і матрицю нормованих (характеристичних) векторів V, і потім знаходять матрицю факторного відображення:

Для отримання оцінок спільностей та факторних навантажень використовується емпіричний ітеративний алгоритм, який схожий на справжні оцінки параметрів. Сутність алгоритму зводиться до такого: початкові оцінки факторних навантажень визначаються за допомогою методу основних факторів. На підставі кореляційної матриці R формально визначаються оцінки основних компонентів та загальних факторів:

(9)

де - відповідне значення матриці R;

Вихідні дані (вектор-стовпці);

Коефіцієнти за загальних факторів;

Головні компоненти (вектор-стовпці).

Оцінками факторних навантажень є величини

Оцінки спільностей виходять як

На наступній ітерації модифікується матриця R замість елементів головної діагоналі підставляються оцінки спільностей, отримані на попередній ітерації; на підставі модифікованої матриці R за допомогою обчислювальної схеми компонентного аналізу повторюється розрахунок основних компонент (які не є такими з точки зору компонентного аналізу), шукаються оцінки основних факторів, факторних навантажень, спільностей, специфік. Факторний аналіз вважатимуться закінченим, як у двох сусідніх ітераціях оцінки спільностей змінюються слабо.

Примітка.Перетворення матриці R можуть порушувати позитивну визначеність матриці R+ і, як наслідок, деякі власні значення R+ можуть бути негативними.

STATISTICA ФАКТОРНИЙ АНАЛІЗ

Кореляції (factor.sta) Порядкове видалення ПД n=100

Змінна

РОБОТА_1

РОБОТА_2

РОБОТА_3

ДІМ 1

ДІМ 2

ДІМ 3

Як видно з кореляційної матриці змінні, що відносяться до задоволеності на роботі, більш кореловані між собою, і змінні, що відносяться до задоволеності будинком, також корелює між собою. Кореляції між цими двома типами змінних (змінні, пов'язані із задоволеністю на роботі, та змінні, пов'язані із задоволеністю будинком) порівняно малі. Тому здається правдоподібним, що є два відносно незалежні фактори (два типи факторів), відображені в кореляційній матриці: один відноситься до задоволеності на роботі, а інший до задоволеності домашнім життям.

    Факторні навантаження

Другий етап факторного аналізу - початкове виділення чинників чи шляхом основних компонент, чи шляхом основних чинників. Результатом для нашого прикладу є рішення із двома факторами. Розглянемо кореляції між змінними та двома факторами (або "новими" змінними). Ці кореляції називаються факторними.

Таблиця 3. 16

Таблиця факторних навантажень (метод основних компонентів)

STATISTICA ФАКТОРНИЙ АНАЛІЗ

Факторні навантаження (Немає обертання) Головні компоненти

Змінна

Чинник 1

Фактор 2

Загальна дисперсія

Частка загальної дисп.

Як видно з таблиці 3.16, перший фактор більш корелює зі змінними, ніж другий (оскільки значення вагових навантажень по кожній змінній першого фактора більше, ніж другого). Це очевидно, тому що, як було зазначено вище, фактори виділяються послідовно і містять все менше і менше загальної дисперсії (див. розділ Власні значення і кількість факторів, що виділяються, Стор. 61).

    Методи обертання факторів

Третій етап факторного аналізу – обертання факторних навантажень, що є результатом попереднього етапу. Типовими методами обертання є стратегії варімакс, квартімакс, і еквімакс. Метою цих методів є отримання зрозумілої (інтерпретованої) матриці навантажень, тобто факторів, чітко відзначених високими навантаженнями (наприклад, більше 0.7) для деяких змінних і низькими – для інших. Цю загальну модель іноді називають простою структурою.

Ідея обертання методом варімаксбула описана вище (див. розділ Метод основних компонент, Стор. 60). Цей спосіб можна також застосувати і до прикладу. Як і раніше, наше завдання – знайти обертання, що максимізує дисперсію по нових осях; або, іншими словами, отримати матрицю навантажень на кожен фактор таким чином, щоб вони відрізнялися максимально, і була можливість їх простої інтерпретації. Нижче наведено таблицю навантажень на повернені фактори.

Таблиця 3. 17

Таблиця факторних навантажень (обертання – варімакс)

STATISTICA ФАКТОРНИЙ АНАЛІЗ

Факторні навантаження (Варімакс нормаліз.) Виділення: Основні компоненти

Змінна

Чинник 1

Фактор 2

Загальна дисперсія

Частка загальної дисп.

Як видно з таблиці 3.17, перший фактор відзначений високими навантаженнями на змінні, пов'язані із задоволеністю на роботі, а другий фактор – із задоволеністю будинком. З цього можна зробити висновок, що задоволеність, виміряна за допомогою опитувальника, складена з двох частин: задоволеність будинком і роботою. Таким чином, зроблена класифікаціядосліджуваних змінних. На основі отриманої класифікації перший фактор можна назвати фактором задоволеності роботою (або фактором соціальних цінностей) та, відповідно, другий – фактором задоволеності будинком (або фактором особистісних цінностей).

    Інтерпретація результатів факторного аналізу

Заключним етапом факторного аналізу є змістовна інтерпретація факторів, одержаних у результаті обертання. Тут від дослідника вимагається хороша теоретична підготовка та знання експериментальних результатів, вже накопичених у цій галузі дослідження.

Фактично інтерпретація факторів полягає у виділенні значних факторних ваг (референтних змінних) по кожному з факторів. Точних критеріїв, дозволяють диференціювати значні факторні ваги (навантаження) і незначні, немає. Наприклад, у разі великих вибірок (кілька сотень людей і більше) значущими іноді вважають навантаження від 0,3 і вище. При зменшенні вибірки до кількох десятків людей як значущі використовуються ваги порядку 0.4-0.5.

Інтерпретація чинників який завжди протікає гладко; у деяких випадках вона буває тільки ймовірною (наприклад, у разі використання даних, що відповідають різним типам шкал), а іноді автори зовсім відмовляються від неї, оскільки фактор включає тести, в яких важко побачити щось спільне.

В ідеальному варіанті (розподіл змінних не відрізняється від нормального) інтерпретацію результатів факторного аналізу можна розпочати з аналізу кореляційної матриці, потім перейти до факторних навантажень (виділення референтних змінних). Наступний крок - зіставлення результатів кореляційної матриці та виділених факторів, що містять значні ваги. І, нарешті, останній етап – аналіз отриманих спільностей змісту та природи тих досліджуваних змінних (ознак), які мають найвищу кореляцію з цим фактором. Називання факторів здійснюється з урахуванням тих референтних змінних, які отримали максимальні значення ваги і мають найвищу кореляцію з фактором. Наприклад, якщо тести, що оцінюють здатність зйомки безглуздого матеріалу, мають високі вагові навантаження по даному фактору, то останній може бути названий як фактор «механічного запам'ятовування».

Факторний аналіз – це галузь математичної статистики. Його цілі, як і мету інших розділів математичної статистики, полягає у розробці моделей, понять та методів, що дозволяють аналізувати та інтерпретувати масиви експериментальних чи спостережуваних даних незалежно від їх фізичної форми.

Однією з найбільш типових форм представлення експериментальних даних є матриця, стовпці якої відповідають різним параметрам, властивостям, тестам тощо, а рядки – окремим об'єктам, явищам, режимам, що описуються набором конкретних значень параметрів. Насправді розміри матриці виявляються досить великими: так, число рядків цієї матриці може коливатися від кількох десятків за кілька сотень тисяч (наприклад, при соціологічних обстеженнях), а число стовпців - від однієї - двох сотень. Безпосередній, "візуальний", аналіз матриць такого розміру неможливий, тому в математичній статистиці виникло багато підходів і методів, призначених для того, щоб "стиснути" вихідну інформацію, укладену в матриці, до доступних для огляду розмірів, витягти з вихідної інформації найбільш "істотне", відкинувши "другорядне", "випадкове".

При аналізі даних, представлених у формі матриці, з'являються два типи завдань. Завдання першого типу мають на меті отримати "короткий опис" розподілу об'єктів, а завдання другого - виявити взаємовідносини між параметрами.

Слід мати на увазі, що основний стимул для появи зазначених завдань полягає не тільки і не стільки в бажанні коротко закодувати великий масив чисел, а в значно більш принциповій обставині, що має методологічний характер: якщо вдалося коротко описати великий масив чисел, то можна вірити, що розкрито якусь об'єктивну закономірність, що зумовила можливість короткого опису; Адже саме пошук об'єктивних закономірностей і є основною метою, заради якої, як правило, і збираються дані.

Згадані підходи та методи обробки матриці даних відрізняються тим, якого типу завдання обробки даних вони призначені вирішувати, і тим, до матриць якого розміру вони застосовні.

Що ж до проблеми короткого опису зв'язків між параметрами при середній кількості цих параметрів, то в даному випадку відповідна кореляційна матриця містить кілька десятків або сотень чисел і сама по собі вона ще не може служити "коротким описом" існуючих зв'язків між параметрами, а повинна з цією метою піддатися подальшій обробці.

Факторний аналіз якраз і є набором моделей і методів, призначених для “стиснення” інформації, що міститься в кореляційній матриці. В основі різних моделей факторного аналізу лежить наступна гіпотеза: спостережувані або вимірювані параметри є лише непрямими характеристиками об'єкта, що вивчається, або явища, насправді існують внутрішні (приховані, не спостережувані безпосередньо) параметри або властивості, число яких мало і які визначають значення спостережуваних параметрів. Ці внутрішні параметри називається факторами. Завдання факторного аналізу - представити спостерігаються параметри як лінійних комбінацій чинників і, можливо, деяких додаткових, “не істотних” величин - “перешкод”. Чудовим є той факт, що, хоча самі фактори не відомі, таке розкладання можна отримати і, більше, такі чинники може бути визначено, тобто. для кожного об'єкта може бути вказано значення кожного фактора.

Факторний аналіз, незалежно від методів, починається з обробки таблиці інтеркореляцій, отриманих на безлічі тестів, відомої як кореляційна матриця, а закінчується отриманням факторної матриці, тобто. таблиці, що показує вагу або навантаження кожного з факторів кожного тесту. Таблиця 1 являє собою гіпотетичну факторну матрицю, що включає лише два фактори.

Чинники перераховуються у верхній рядку таблиці від більш значущого до менш значущого, а їх ваги в кожному з 10 тестів дано у відповідних стовпцях.

Таблиця 1

Гіпотетична факторна матриця

Осі координат.Прийнято представляти фактори геометрично як осей координат, щодо яких кожен тест може бути зображений як точки. Рис. 1 пояснює цю процедуру. На цьому графіку кожен із 10 тестів, наведених у табл.1, відображений у вигляді точки щодо двох факторів, які відповідають осям I та II. Так, тест 1 представлений точкою з координатами 0,74 осі I і 0,54 осі II. Крапки, що представляють інші 9 тестів, побудовані аналогічним способом, з використанням значень ваги з табл. 1.

Слід зазначити, що положення осей координат не фіксується даними. Вихідна таблиця кореляцій визначає лише положення тестів (тобто точок на рис. 1) щодо один одного.Ті ж точки можна нанести на площину будь-якого положення координатних осей. З цієї причини при проведенні факторного аналізу зазвичай обертають осі до тих пір, поки не отримують найбільш прийнятного та легко інтерпретованого відображення.

Рис. 1. Гіпотетичне факторне відображення, що показує ваги двох групових факторів кожного з 10 тестів.

На рис. 1 отримані після обертання осі I" та II" показані пунктирними лініями. Це обертання виконано відповідно до запропонованих Терстоуном критеріїв. позитивного різноманіття та простої структури.Перший передбачає обертання осей до становища, у якому виключаються все значні негативні ваги. Більшість психологів вважають негативні факторні навантаження логічно невідповідними тестам здібностей, тому що таке навантаження означає, що чим вище оцінка індивідуума за специфічним фактором, тим нижчим буде його результат щодо відповідного тесту. Критерій простої структури, по суті, означає, що кожен тест повинен мати навантаження якнайменше факторів.

Виконання обох критеріїв дає фактори, які можна легко і однозначно інтерпретувати. Якщо тест має високе навантаження по одному фактору і не має значних навантажень за іншими факторами, ми можемо дізнатися про природу цього фактора, вивчивши зміст даного тесту. Навпаки, якщо тест має середні або низькі навантаження за шістьма факторами, то він мало що скаже нам про природу будь-якого з них.

На рис. 1 добре видно, що після обертання осей координат всі вербальні тести (1-5) розташовуються вздовж або дуже близько до осі "І", а числові тести (6-10) тісно групуються навколо осі II". Нові факторні навантаження, виміряні щодо повернутих осей, наведено у табл. 2. Факторні навантаження у табл. 2 не мають негативних значень, за винятком зневажливо малих величин, що явно відносяться до помилок вибірки. Всі вербальні тести мають високі навантаження за фактором I" і практично нульові - за фактором II". Числові тести, навпаки, мають високі навантаження за фактором "І" і зневажливо низькі - за фактором "І". Таким чином, обертання координатних осей суттєво спростило ідентифікацію та називання обох факторів, а також опис факторного складу кожного тесту. На практиці число факторів часто виявляється більше двох, що, зрозуміло, ускладнює їхнє геометричне уявлення і статистичний аналізале не змінює істоти розглянутої процедури.

Таблиця 2

Факторна матриця після обертання

Деякі дослідники керуються теоретичною моделлю як принципом обертання осей. Крім того, береться до уваги незмінність, або підтвердження одних і тих же факторів у незалежно виконаних, але порівнянних дослідженнях.

Інтерпретація факторів.Отримавши після процедури обертання факторне рішення (чи, простіше кажучи, факторну матрицю), ми можемо переходити до інтерпретації та найменування факторів. Цей етап роботи швидше потребує психологічної інтуїції, ніж статистичної підготовки. Щоб зрозуміти природу конкретного фактора, нам нічого не залишається, як вивчити тести, що мають високі навантаження щодо цього фактора, і спробувати виявити загальні для них психологічні процеси. Чим більше виявляється тестів з високими навантаженнями за цим фактором, тим легше розкрити його природу. З табл. 2, наприклад, одночасно видно, що фактор I" вербальний, а фактор II" числовий. Наведені у табл. 2 факторні навантаження відображають також кореляцію кожного тесту з фактором.

Складання