2.4. Перевірка валідності особистісного опитувальника
Якщо надійність характеризує стійкість процедури відносно об’єктів дослідження (респондентів), то валідність – стійкість процедури та однозначність результатів відносно предмету вимірювання (вимірюваних властивостей об’єкта).
Валідність методики не може якісно та кількісно перевищувати надійність, адже валідна, але ненадійна методика є практично некорисною. Разом із тим, підвищення надійності не обов’язково супроводжується підвищенням валідності.
Валідність (англ. valid – дійсний, обґрунтований, придатний, такий, що має силу) – це відповідність психодіагностичного інструменту психічній якості, що вимірюються, тобто здатність тесту вимірювати саме ті характеристики, які необхідно виміряти. Л.Ф. Бурлачук та С.М. Морозов визначають валідність як комплексну характеристику тесту, що включає відомості про область досліджуваних явищ і репрезентативність використовуваної щодо неї діагностичної процедури. А. Анастазі зазначає, що в спрощеному й узагальненому формулюванні валідність – це поняття, яке вказує на те, що тест вимірює і наскільки добре він це робить.
У стандартних вимогах до психологічних тестів валідність визначається як обов’язкова та найважливіша частина інформації про методику, що містить опис того, відносно яких груп психологічних властивостей особистості можуть бути зроблені висновки, що спираються на конкретні тестові оцінки або інші форми оцінювання.
Виходячи з цього, методика вважається валідною, якщо на її результати впливає лише властивість, що вимірюється, та, навпаки, – невалідною, якщо результати вимірювання визначаються впливом нерелевантних змінних (попутних, неврахованих факторів).
Валідність є обов’язковою та найважливішою інформацією про ввимірювальну методику та має містити дані про:
- Конкретну спрямованість методики (контингент досліджуваних за статтю, рівнем освіти, соціально-культурної приналежності тощо) та ступінь обґрунтованості висновків у контекстних умовах використання методики;
- Зв’язок досліджуваної області поведінки та/або особистісних особливостей із певними психологічними конструктами;
- Континуум (область) досліджуваних психологічних явищ, яким змістовно відповідає процедура дослідження;
- Міру узгодженості даних методики з іншими даними, що відбивають особливості досліджуваного феномену (теоретичні очікування, дані спостереження, експертні оцінки, показники інших методик, психологічний зміст яких уже є з’ясованим тощо);
- Адекватність застосовуваної моделі діяльності з точки зору відображення в ній досліджуваної психологічної особливості, ступеня однорідності завдань, можливість їх зіставлення при кількісній оцінці результатів тесту в цілому;
- Можливість формулювання на підставі вимірювання обґрунтованого судження про актуальний стан досліджуваної психічної якості, а також висування прогнозу щодо її розвитку.
Перелічені категорії відомостей про вимірювальну мето-дику пов’язані зі спеціальними типами валідності (рис. 8).

Очевидна (зовнішня, лицьова, довірча) валідність – це уявлення про сферу використання, результативність та прогностичну цінність методики, що виникають у досліджуваного або користувача психодіагностичною інформацією, які не мають спеціальних відомостей про характер використання та цілі методики. Такі уявлення формуються на основі назви методики та ввідної інформації на бланках.
І хоча даний вид валідності не є обов’язковим компонентом об’єктивно встановлюваної валідності, її важливість стає зрозумілою з огляду на описані в літературі випадки, коли досліджувані демонстрували іронічне, негативно-критичне, вороже ставлення до обстеження і навіть відмовлялися від нього, якщо склад тестових завдань здавався їм “несерйозним”, надмірно легким, таким, що не відповідає досліджуваній сутності, нагадує розважальні опитування з популярних видань.
Із іншого боку, не зовсім адекватне уявлення про спрямованість та прогностичність дослідження може викликати у людини надмірну мотивацію, небажане емоційне напруження, тенденцію симулювати або дисимулювати відповіді, що врешті-решт призводить до зміни валідності методики. Тому наявність у інструкції інформації про мету обстеження та межі конфіденційності результату, а в тексті методики – сформульованих зрозумілою для досліджуваних мовою завдань, які є природними з точки зору вiкової, професiйної, статевої специфiки досліджуваних, значно полiпшує характеристики очевидної валiдностi.
Змістова (внутрішня, логічна) валідність відображає міру відповідності (репрезентації) завдань вимірюваній області психічних властивостей. Інакше кажучи, завдання змістовно валідної методики стосуються саме тих аспектів, які є провідними в досліджуваному психічному феномені. Валідність за змістом закладається вже при підборі пунктів майбутньої методики. Розробці конкретного змісту пунктів методики передує максимально повна систематична перевірка відповідної наукової літератури, а також консультація спеціалістів із даного предмету. На основі зібраної таким чином інформації здійснюється специфікація методики: вказуються досліджувані області, психологічні характеристики та властивості, що лежать за цими областями, а також їхнє відносне значення для опису вимірюваного конструкту.
Встановлення очевидної та змістової валідності здійснюється спеціалістами-експертами, котрі оцінюють методику з позицій предметного змісту пропонованих діагностичних завдань, стилістичних особливостей їхнього формулювання, адекватності використаної при цьому лексики та формулюють кінцеве судження про те, чи репрезентують завдання методики коло істотних властивостей та видів діяльності, що досліджуються.
Критеріальна (емпірична) валідність розкриває міру узгодженості (кореляційного зв’язку) результатів вимірювальної методики з зовнішнім незалежним критерієм, так званим критерієм валідизації. Таким критерієм є показник прояву досліджуваної психічної властивості в повсякденному житті, що має безпосередню цінність для певних областей практичної діяльності (наприклад, успішність – у навчальній, продуктивність – у професійній, стан здоров’я – в медичній діяльності тощо). Він має відповідати трьом основним вимогам: 1) бути релевантним тим психічним особливостям, котрі вимірюються даною діагностичною методикою; 2) вільним від контамінації збоку ситуативних факторів та факторів середовища; 3) мати статистично достовірну надійність, тобто відображати сталість та стійкість досліджуваної функції.
Умовно можна виділити дві групи критеріїв валідизації: об’єктивні та суб’єктивні критерії. До перших належать:
- об’єктивні соціально-демографічні та біографічні дані (стаж, освіта, кількість шлюбів та розлучень, виробничі показники в окремих видах професійної та ін. діяльностей тощо);
- ефективність виконання реальної критеріальної діяльності (малювання, моделювання тощо);
- успішність навчання (наприклад, поточні оцінки, результати іспитів, час, витрачений на засвоєння навчального матеріалу тощо);
- фізіологічні критерії (об’єктивні показники функціонування серцево-судинної, дихальної та ін. систем організму);
- заключення спеціалістів про результати обстежень (наприклад, медичний діагноз);
- дані інших методик, валідність яких вважається з’ясованою.
Суб’єктивними критеріями є оцінки, судження, висновки про об’єкт дослідження, зроблені експертами (фахівцями, педагогами, керівниками, психологами, родичами) – людьми, котрі знають досліджуваного збоку оцінюваної якості та можуть надати їй адекватну оцінку. В даному випадку вони або спільно виробляють компромісне судження про кожного досліджуваного, або здійснюють їхнє незалежне оцінювання (з наступним усередненням отриманих від кожного експерта оцінок), використовуючи при цьому бальні шкали (приписування кожному досліджуваному певного балу, що відображає ступінь вираження критеріальної ознаки), ранжування (впорядкування досліджуваних за ступенем вираження критерію) або метод парних порівнянь (у кожній парі досліджуваних визначається носій сильніше вираженої критеріальної ознаки).
Основною проблемою під час застосування експертного оцінювання є можливість виникнення інструментальних спотворень (викривлення оцінюваних особистісних рис) та, як наслідок, – зниження надійності отриманих за його допомогою результатів. У зв’язку з цим В.М. Мельников та Л.Т. Ямпольський указують на спеціальні вимоги, котрі висуваються до процедури його проведення з метою підвищення надійності отриманої інформації:
- Оцінювані риси мають визначатися в термінах поведінки, що спостерігається.
- Експерт повинен мати можливість спостерігати за поведінкою досліджуваного потягом достатньо тривалого проміжку часу.
- Необхідним є залучення не менше десяти експертів на одного досліджуваного.
- Замість експертного оцінювання одного досліджуваного відразу за всім комплексом характеристик, варто здійснювати ранжування декількох досліджуваних одноразово за однією конкретною рисою.
Окрім цього, надійність суб’єктивного критерію валідизації досягається шляхом забезпечення багатокомпонентності критерію валідизації – поєднання методу експертного оцінювання з залученням об’єктивних критеріїв (наприклад, результатів інших валідних методик), а також порівняння контрастних груп – емпіричних вибірок досліджуваних, представлених особами з мінімальним та максимальним проявом критеріальних ознак.
До комплексу відомостей про критеріальну валідність психодіагностичної методики входять дані про її поточну та прогностичну валідність.
Поточна (діагностична, конкурентна) валідність – зв’язок оцінок методики, що валідизується, з незалежними критеріями, які відображають наявний, актуальний стан діагностованої психічної властивості (наприклад, успішність навчання або продуктивність праці на момент проведення дослідження, результати інших методик, отримані в цей період тощо). Встановлюючи відповідність показників методики реальному стану психологічних особливостей досліджуваного в момент обстеження, поточна валідність визначає здатність вимірювальної методики диференціювати досліджуваних за певною діагностичною ознакою (на цю властивість вказує термін “діагностична валідність”), а також зручність та економічність методики порівняно з іншими джерелами інформації (на цю властивість методик вказує термін “конкурентна валідність”).
Прогностична валідність відображає зв’язок результатів методики зі станом психічної властивості, що вимірюється, через певний проміжок часу, тобто вказує на здатність методики передбачати перспективи розвитку вимірюваного психічного феномену та робити на основі її результатів найближчий або віддалений прогноз. Прогностична валідність також визначається за достатньо надійним зовнішнім критерієм, але інформація по ньому збирається через деякий час після вимірювання. Зовнішнім критерієм зазвичай виступає виражена в певних оцінках здібність людини до виконання тієї діяльності, для якої вона відбиралася за наслідками діагностичних випробувань, а також очікувані результати розвитку певної психічної властивості або діяльності. Передбачені таким чином показники надалі перевіряються та зіставляються з результатами виконання методики, що валідизується.
Конструкта (теоретична) валідність характеризує ступінь репрезентації досліджуваного психологічного конструкту в результатах діагностичної методики, відображаючи, по суті, ступінь її теоретичної обґрунтованості.
Для того, щоб здійснити конструктну валідизацію, необхідно, виходячи з теоретичних міркувань (гіпотез про природу вимірюваної змінної), обґрунтувати, що методика вимірює саме ту властивість, котра вона за замислом дослідника повинна вимірювати. Для цього зазвичай формулюється низка гіпотез про те, 1) як буде корелювати розроблювана методика з іншими методиками, спрямованими на діагностику конструктів, котрі знаходяться у відомому або передбачуваному зв’язку з досліджуваним конструктом; 2) наскільки теоретична модель вимірюваної властивості узгоджується з емпірично встановленою структурою взаємозв’язків між змінними; 3) чи відображаються очікувані зміни, що має зазнати конструкт у віковій, освітній, професійній та ін. динаміці, в результатах виконання методики в групах із різним віковим, статевим, професійним та ін. складом. Виходячи з цього, для перевірки конструктної валідності важливими є такі похідні характеристики:
- конвергентна валідність – інформація про наявність зв’язку (найчастіше кореляційного) даної вимірювальної методики з іншими близькими за змістом методиками, конструктне навантаження яких є відомим;
- дискримінативна валідність – інформація про відсутність будь-якого зв’язку даної методики з методиками, що вимірюють іншу за психологічним змістом властивість;
- факторна валідність – інформація про ступінь підпорядкованості окремих завдань загальній спрямованості методики, зорієнтованість кожного із них на діагностику сталого набору конструктів, факторний склад та факторні ваги результатів;
- диференціальна валідність – інформація про наявність або відсутність відмінностей у результатах виконання методики досліджуваними різного віку (валідність за віковою диференціацією), статі, професійної приналежності тощо.
У психометричній практиці для обчислення кількісного показника валідності використовуються такі методи зіставлення індивідуальних результатів, отриманих при використанні діагностичної методики, із оцінками за зовнішнім критерієм валідизації: кореляційний аналіз, аналіз вибірок, дисперсійний та факторний аналіз.
Основним завданням кореляційного аналізу є кількісний опис форми (лінійний або нелінійний), тісноти (сили) та спрямованості (позитивний, прямий або негативний, зворотній) зв’язку між ознаками, виражений у коефіцієнті кореляції. Якщо теоретично обґрунтовано наявність лінійного зв’язку між показниками, що зіставляються, а критерієм валідизації є нормально розподілені та виражені в інтервальній шкалі результати виконання іншої (еталонної) методики, то як показник валідності використовують коефіцієнт лінійної кореляції rxy Пірсона. Проте найчастіше оцінки за критерієм можуть бути дихотомічними або ранговими, що передбачає обчислення відповідно точковобісеріального або рангового коефіцієнту кореляції.
Також для встановлення значущості лінійного зв’язку при будь-якому типі даних може бути використаний коефіцієнт зв’язаності.
У випадку відсутності обґрунтованості лінійного зв’язку між показниками рекомендується використати аналіз вибірок (метод контрастних груп). Для цього формуються дві контрастні групи: досліджувані, що мають найбільш високі та найбільш низькі значення критерію валідизації (при цьому обсяг кожної групи складає 10-33% загальної вибірки, але не менше 30 осіб). У разі нормального розподілу первинних балів за методикою зіставлення контрастних груп доцільно здійснювати з використанням t-критерію Стьюдента – параметричного критерію оцінки достовірності відмінностей величин середніх значень двох статистичних сукупностей (вибірок), який обчислюється за формулою:

де та
– порівнювані середні арифметичні вибірок N1 та N2; m1 та m2 – квадрати помилок середніх величин, які, своєю чергою, обчислюються з урахуванням середнього квадратичного відхилення (σ) та обсягу вибірки (N) за формулою:
. Відповідно:
.
Якщо нормальність розподілу відсутня або дані за методикою не можна вважати інтервальними, то можна використати непараметричний U-критерій Манна-Уітні, призначений для оцінки відмінностей між двома вибірками за рівнем кількісно виміряної ознаки:

де n1 – кількість досліджуваних у вибірці 1; n2 – кількість досліджуваних у вибірці 2; Tx – більша з двох рангових сум; nx – кількість досліджуваних у групі з більшою сумою рангів.
Дисперсійний аналіз (ANOVA) – це метод аналізу (шляхом вивчення дисперсії) мінливості досліджуваної (залежної) ознаки під впливом певних контрольованих (незалежних) факторів – статі, віку, професії, місця поживання тощо. Показником такої мінливості є параметричний F-критерій Пірсона, емпіричні значення якого є тим вищими, чим впливовішими є дії незалежних факторів. Планування та проведення дисперсійного аналізу, а також схема обчислення даних залежать від кількості факторів (відповідно виділяють одно-, двох-, трьох- та мультифакторний дисперсійний аналіз), кількості градацій кожного фактору (наприклад, низький, середній та високий рівень розвитку певної властивості), зв’язаності/незв’язаності вибірок тощо.
Факторний аналіз дозволяє операціоналізувати зміст методики як сукупності латентних (шкал) та спостережуваних змінних (пунктів), виявити внутрішні закономірності їхнього взаємозв’язку, відібрати на основі аналізу факторного складу та факторних ваг результатів методики ефективні завдання, здійснити остаточну перевірку її гомогенності.
Факторний аналіз зазвичай проводиться у два етапи. Вибірка розщеплюється випадковим чином на дві статистично рівні частини. На першій підвибірці за допомогою експлораторного факторного аналізу визначається структура латентних змінних та склад зумовлених ними емпіричних показників. За допомогою конфірматорного факторного аналізу на другій підвибірці здійснюється порівняння апріорної моделі розподілу пунктів по шкалах із емпіричною моделлю, отриманою внаслідок проведення процедури експлораторного факторного аналізу.
Отже, валідність є ключовою психометричною властивістю, котра в цілому вказує на репрезентативність діагностичної процедури відносно області досліджуваних явищ. Конструювання валідного вимірювального інструменту загалом передбачає: 1) з’ясування відповідності цілей та процедури дослідження життєвим уявленням досліджуваного про природу вимірюваного явища (очевидна валідність); 2) встановлення експертами ступеня представленості у завданнях психодіагностичної методики всього обсягу вимірюваної області психічних властивостей (змістова валідність); 3) співвіднесення результатів методики з базовими для неї теоретичними поняттями (конструктна валідність); 4) розкриття зв’язку між балами, отриманими за допомогою методики, та оцінками за теоретично релевантним зовнішнім критерієм (критеріальна валідність). Для емпіричного встановлення валідності зазвичай використовуються такі кількісні способи: кореляційний аналіз, аналіз контрастних груп, дисперсійний та факторний аналіз.