факторен анализ

2. Методи, основани на критериите за самообслужване информативност признаци система

Официални алгоритми на тази група от методи, които не са пряко работят обучение информация за желаната стойност на променливата диагноза. В същото време тази информация е имплицитно винаги присъства в експерименталните данни. Тя постави на първия етап от изграждането на психо-диагностичен тест, когато експериментаторът формира Първоначалният набор от атрибути, всяка от които, по негово мнение, трябва да отразяват определени аспекти на тази функция. В този случай, отражение на свойствата на отделните знаци, както обикновено се разбира е най-простата форма на комуникация знак с диагноза индикатор - корелация XI с база. Ако тестът е хомогенно имот, то тогава има всички основания да вярваме, че съдържанието на информацията на крайната мярка за подбор функция може да бъде степента на координирани действия на тези атрибути в правилната посока.







Главният компонент

Основният компонент (CIM) беше предложено в 1901 от Pearson година и след това отново се отваря и разработен подробно Hottelingom / 1933 /. Той посветил много изследвания и е широко представена в литературата, позовавайки се на който е възможно да се получи информация за метода на главните компоненти с различна степен на детайлност и математическа точност (например, S. Айвазиан, А. и др. 1974, 1983, 1989). В този раздел няма за цел да се постигне подробно описание на всички функции на КИП. Ние се концентрираме върху основните феномени на главницата анализ компонент.

Главният компонент прави преход към новата система на координати y1. Ур в оригиналната функция пространство x1. XP който е система от линейни комбинации ortnormirovannyh

къде ми - очакване знак XI. Линейните комбинации са избрани така, че сред всички възможни линейни комбинации на първоначалните характеристики на нормализирана първия основен y1 компонент (х) притежава най-голямата промяна. Геометрично тя изглежда като нова ос ориентация координира y1 по посока на най-голямото удължаване на елипсоид обекти проучване проба функция пространство x1. XP. Вторият основен компонент има най-голяма промяна сред останалите линейни трансформации, които не корелира с първия основен компонент. Той се тълкува в посока на най-голямото удължение на елипсоида перпендикулярна на първия основен компонент. Направени следните основни компоненти се определят от същия график.

Изчисляване на коефициентите Wij основните компоненти въз основа на факта, че векторите Wi = (W11. WPL). WP = (W1P. ВЕЦ) "са подходящи (характерни) S. корелационната матрица вектори На свой ред, съответните собствените стойности на тази матрица са отклонения от множеството издатини на предмети върху оста на основния компонент.

Алгоритми, гарантиращи изпълнението на основната компонента включват почти всички статистически софтуерни пакети.

факторен анализ

В горния метод, главният компонент на критерия за самостоятелно информативност функция пространство се разбира, че ценен диагностичен информация да бъде отразено в линеен модел, който пасва на координатите ос в това пространство с максимално дисперсия на разпределението на проекциите на обекти. Този подход е плодотворно, когато ясно-голямата част от работните места "груб" вариант на тест последователно "работи" в проявата на свойствата на изпитване и потиска влиянието на неподходящи фактори върху разпределението на обектите. Също така е получен положителен резултат с относително малък размер на група от свързани информационни знаци, но в противоречие взаимодействие външни фактори, които влияят върху еднородността не се нарушава елипсоид, а само намалява удължение по посока на разпространение на обекти диагностициран тенденции. За разлика от метода на главните компоненти факторен анализ не се базира на характеристиките на разпръскване на критерии за саморегулиране информативност система, както и обяснение е фокусирано върху съществуващите корелации между атрибути. Следователно, анализ фактор се прилага за по-сложни случаи, съвместното структура за проява на експериментални данни от изследваните обекти и неподходящи свойства сравнима степен на вътрешна последователност, и за изолиране на групата на диагностични индекси от общото първоначално набор от атрибути.







Основният модел на факторен анализ е записано следното равенства / Nalimov система VV 1971 /

Това означава, че се предполага, че стойността на всяка функция на XI може да се изрази като претеглена сума от латентни променливи (фактори, обикновено) фантастична. брой е по-малък от броя на първоначалните симптоми и остатък # 949; и с отклонение # 963; 2 (# 949; I), в качеството само на XI. която се нарича специфичен фактор. Коефициенти lij наречени натоварване-тото променлива на фактор на натоварване на к-ти или на к-ти фактор на променливата-тото. В най-простия модел на факторния анализ се счита, че FJ фактори са независими едно от друго и техните отклонения, равни на един, както и случайни променливи # 949; аз също са независими един от друг и от всеки фактор FJ. Максималният възможен брой фактори m за определен брой р се определя от неравенството знаци

които трябва да се увери, че задачата не се изроди в тривиалното. Това неравенство се получава чрез броене на степените на свобода на разположение в проблема / Lawley D. и сътр. 1967 /. Сумата от квадратите на напрежения в формула базов модел на факторен анализ на съответния общ разговор функция ХI и по-големият е стойността, толкова по-добре описан функция XI посветена фактори FJ. Общите неща е част от знака на дисперсията, което обяснява факторите. На свой ред, # 949; I 2 показва колко от първоначалния дисперсия остава неизяснен функция използва в набор от фактори и определената стойност се нарича специфичност характеристика. По този начин,

Главна анализ съотношение фактор показва, че коефициентът на корелация на всеки две черти на XI и XJ е възможно да се изразят продукт на сумата от несвързани помежду си фактори се зареди

Задачата на факторния анализ не може да бъде решен еднозначно. Равенство основен модел на факториален анализ не дават пряка проверка от р първоначалните характеристики, определени от (п + т) с други променливи - прости и специфични фактори. Ето защо, на представянето на матрицата на съответствието на факторите, както казват, неговото разлагане, можете да направите неограничен брой начини. Ако не са в състояние да произвеждат корелация матрица факторизиране като се използва матрица на фактор натоварвания F. след всяка линейна ортогонална трансформация F (ортогонална въртене) ще доведе до същата факторизиране / Nalimov В. 1971 /.

В края на цялата процедура факторен анализ, използвайки математически преобразувания експресни фактори FJ през първите признаци, т.е. получават ясни диагностични параметри на линеен модел.

При анализа на фактор, има много привърженици и много противници. Но, както правилно отбелязва V. Nalimov ". Психолози и социолози са имали никакъв друг начин, и те са се научили тези два метода (фактор за анализ и основен анализ компонент - VD) в пълни подробности "/ Nalimov VV 1971 г., стр. 100 /. За повече подробности относно анализа на фактор и неговите методи може да се препоръча литература / Lawley 1967 Д. и др .; Харман, G. 1972 Aivazyan S. А. и сътр 1974 .; Iberl K 1980 /.

Метод контрастен групи

Първо, назначени първоначални BarChart ключове (тегло) W # 730; й за въпросите от теста (дихотомните черти) XJ. За всеки и-ти тест изчислява общия тест оценка

Обикновено, абсолютните стойности на теглата WJ се определя приблизително и често трябва да се разбират единство. Ето защо, по посока

Това ще бъде малко по-различна от посоката на главния диагонал елипсоида (х) (фиг. 3).

Фиг. 3. Илюстрация на метода контрастен групи

Но ако колебливо уч (х) диагностицира правилно отразява на имота, в краищата на разпределението на общата оценка, която е била построена по всички предмети от пробата за изследване, можем да различим контрастен група # 969; 1 и # 969; 2. който ще включва обекти с най-малко грешки, въведени от "шумни" знаци. Тези групи не трябва да са прекалено малки. За нормално разпределение, обикновено вземе контрастен групата на 27% от общия обем на пробата на равнината - 33%. Като цяло се счита за приемлива от всеки номер от 25 до 33% / 1982 А. Анастаси /. Следващата стъпка е да се определи степента на корелация на всеки елемент с дихотомна променлива - броят на контраст група. Мярка за тази връзка е т.нар дискриминация индекс представлява процентното разликата на отговор на анализирана точка полярни групи от пациенти. Най-често се използва свързване коефициент Пиърсън # 966;, който след това се сравнява с граничната стойност

където # 967; 2 в - стандартен квантил на разпределението # 967; 2 с една степен на свобода. Обикновено, ориентирана към 5% и 1% нива \ значение, за което стойността на # 967; 2 е равно на 3,84 и 6,63 съответно. Ако аз-ти елемента | # 966; аз |<|φгр |, то весовому коэффициенту wi присваивается значение нуля, то есть признак хi исключается из линейной диагностической модели уч (х). Таким образом проверяются все пункты «чернового» варианта теста. Затем для оставшихся пунктов вся процедура снова полностью повторяется и т. д.

На практика, не отговаря на случая, когато най-накрая избран с помощта на тази процедура, информационни табели са напълно съвпадат с оригиналния комплект. Сближаването на тази процедура зависи от първоначалното съотношение на "добри" и "лоши" задачи от теста. Очевидно, за диагностични модели, базирани на принципа на вътрешните последователност знаци, използвани във всеки конкретен проблем съществува определен праг съотношение информативен и "шумни" знаци, от които могат да изпитат ефекта на самоорганизация или самодиагностика модел, описан от по-горе алгоритъм.