2.2. СТАНДАРТИЗАЦІЯ ОСОБИСТІСНОГО ОПИТУВАЛЬНИКА
Одним із основних психометричних параметрів вимірювальної психодіагностичної методики, котрий має бути забезпечений під час її розробки, є стандартизованість - уніфікованість, регламентованість процедури її проведення та визначеність єдиного критерію оцінки результатів вимірювання. У зв’язку з цим процедура стандартизації пов’язується з вирішенням діагностом двох основних завдань: 1) забезпечення єдиних вимог до процедури організації вимірювання, що передбачає зазначення необхідних для проведення обстеження зовнішніх умов (приміщення, освітлення тощо) та правил врахування впливу ситуативних змінних на процес і результат тестування, опис характеристик цільового контингенту досліджуваних, уніфікацію змісту інструкції та способів її пред’явлення, встановлення часових обмежень при виконанні методики або їхнє скасування, приведення до стандартної форми стимульного матеріалу, бланків та способів фіксації відповідей; 2) приведення до єдиних нормативів оцінок результатів виконання методики, що передбачає встановлення так званих статистичних норм - кількісних критеріїв результативності тестування, що дозволяють визначити ступінь вираження психологічних властивостей, котрі є об’єктами вимірювання. Виступаючи як своєрідні еталони, з якими порівнюються індивідуальні показники досліджуваного, статистичні норми уможливлюють співвіднесення рівня розвитку в досліджуваного певної психологічної властивості з середнім показником по вибірці та здійснення на цій основі якісну інтерпретацію отриманих діагностичних даних.
Оскільки стандартизація психодіагностичної методики з метою встановлення статистичних норм здійснюється виключно шляхом її проведення на особливій за кількісно-якісними параметрами вибірці, зупинимось на розгляді понять генеральної та вибіркової сукупності, а також вимог до формування та обсягу вибірки залежно від виду психометричного дослідження.
При стандартизації психодіагностичної методики слід передусім визначити ту генеральну сукупність – всю множину об’єднаних за однією або декількома спільними ознаками людей, – для дослідження якої вона призначена. Виходячи з діагностичної спрямованості методики, що стандартизується, якісний склад генеральної сукупності можуть визначати такі демографічні характеристики потенційних досліджуваних, як стать, вік, професія, соціально-економічний статус, регіон проживання, національність, віросповідання тощо.
Розробка моделі генеральної сукупності передбачає: 1) її формування з респондентів, на вивчення яких потенційно орієнтована розроблювана методика; 2) вибір мінімальної кількості властивостей генеральної сукупності, котрі є суттєвими для цілей дослідження та можуть істотно вплинути на його результат (наприклад, соціально-демографічні показники); 3) визначення способів квантифікації (групування) виокремлених властивостей та мінімальну кількість градацій кожної з них; 4) з’ясування (з опертям на дані перепису населення або інші статистичні документи) відсотку людей, які мають певну ступінь (градацію) вираження встановлених у п. 2 властивостей (табл. 3).
Таблиця 3Властивості генеральної сукупності та їхні градації | ||||||||
---|---|---|---|---|---|---|---|---|
Стать | Економічний статус | Регіон проживання | ||||||
Чоловіча | Жіноча | Високий | Середній | Нижче середнього | Центрально-північний | Східний | Західний | Південний |
60% | 40% | 33% | 47% | 20% | 35% | 15% | 30% | 20% |
У реальній практиці психометричних досліджень, з огляду на неможливість продіагностувати всю генеральну сукупність, обмежуються обстеженням лише певної її частини – вибіркової сукупності, або вибірки.
Найважливішою характеристикою вибіркової сукупності, що забезпечує можливість використовувати одержані дані на всю популяцію в цілому, є репрезентативність – властивість вибірки відображати у якісному та кількісному аспекті істотні властивості генеральної сукупності. Вона переважно визначається двома факторами: способом отримання вибірки з генеральної сукупності та її обсягом.
Для забезпечення репрезентативності вибірки необхідно, щоб кожна одиниця гомогенної генеральної сукупності мала приблизно рівну ймовірність потрапляння до вибірки незалежно від досліджуваної ознаки. Найчастіше для цього використовують імовірнісні (наприклад, рандомізація) або невипадкові (наприклад, стратометричний метод) процедури відбору. Сутність техніки рандомізації полягає в наступному: максимально доступній кількості представників популяції присвоюються інди-відуальні номери, та за допомогою таблиць випадкових чисел здійснюється відбір досліджуваних у вибірку стандартизації. При реалізації стратометричного відбору генеральна сукупність розглядається як об’єднання страт – груп людей, однакових за статтю, віку, соціальному положенню тощо. Вибірка стандартизації у цьому випадку формується таким чином, аби у ній рівномірно були представлені особи з різних страт (див. докладніше: Дружинин, 2003).
Репрезентативність вибірки визначається також її обсягом, тобто кількістю досліджуваних, які потрапили до неї.
Насамперед, обсяг вибірки залежить від цілей дослідження. Так, при пілотажному дослідженні мінімальна кількість до-сліджуваних, на думку Л.Ф. Бурлачука, мусить бути в два рази більшою, ніж пунктів опитувальника, та в середньому знаходи-тись у діапазоні 50–200 осіб. Для закріплення досягнутих під час пілотажного дослідження теоретичних припущень та отриманих психометричних характеристик слід здійснити так зване розвивальне дослідження на вибірці обсягом від 300 осіб. При остаточному підтвердженні теоретичної обґрунтованості вимірюваного конструкту та задовільних психометричних параметрах розробленої діагностичної методики часто виникає необхідність проведення порівняльного аналізу ступеня вираження даної властивості в представників різних (за віковими, освітніми, професійними, культурними та ін. параметрами) вибіркових сукупностей. Рекомендований загальний обсяг вибірки при здійсненні таких багатовибіркових досліджень складає не менше 1000, а обсяг кожної окремої підвибірки – не менше 100 осіб). Насамкінець, в рамках накопичувального дослідження результати, отримані різними дослідниками за допомогою розробленої методики, збираються до єдиної бази даних. Тут верхня межа вибірки не обмежена та може вилічуватися сотнями тисяч респондентів, як це має місце у випадку зі всесвітньо відомими опитувальниками Кеттелла, Айзенка, ММРІ тощо.
Окрім цього обсяг вибіркової сукупності також визначається: 1) ступенем гомогенності генеральної сукупності (більш однорідні сукупності вимагають меншого обсягу вибіркової сукупності); 2) специфікою методів статистичного аналізу, який планується використовувати; 3) величиною довірчої ймовірності (р), за якої гарантується достовірність результатів дослідження (чим вона більша, тим більшим має бути обсяг; зазвичай, достатньою є р = 95%, тобто 0,95); 4) величиною припустимої похибки, що обчислюється як частка від вибіркової середньої та задається в межах від 0,01 до 0,5 (чим меншою є припустима похибка, тим більшою має бути кількість спостережень). Із огляду на це, Л.Ф. Бурлачук та С.М. Морозов пропонують для визначення обсягу вибірки (n) за умов припущення нормального розподілу аналізованого показника використовувати таку формулу:

де N – обсяг генеральної сукупності, t – значення абсциси для кривої нормального розподілу, що визначається бажаною точністю оцінки (наприклад, для р = 0,95 t = 1,96, для р = 0,99 t = 2,58), Δ – рівень точності в частках від вибірки, σ – стандартне відхилення.
Так, наприклад, при обсязі генеральної сукупності N = 5000 осіб; = 10; заданій похибці (Δ) не більше 5% від середнього значення; імовірності потрапляння значення змінної за межі довірчого інтервалу x ± tσ не більше 5% (р = 0,95) та стандартному відхиленні σ = 2 обсяг вибіркової сукупності (n) згідно формули (1) буде дорівнювати:

Однак на практиці досить часто виникають ситуації, які унеможливлюють дотримання всіх необхідних для формули (1) умов. Тому використовують не формульні значення, а низку “правил”:
- Правило 10 – кількість досліджуваних має бути мінімум у 10 разів більшою за кількість незалежних змінних (шкал);
- Правило відношення досліджуваних до змінних – відношення досліджуваних до змінних (шкал та всіх пунктів опитувальника) має бути не менше 5.
- Правило 100 – мінімальний обсяг вибірки дорівнює 100 осіб.
- Правило 150 – обсяг вибірки від 150 до 300 респондентів. При цьому можливість обмежитись нижньою межею даного діапазону визначається наявністю пунктів, які високо корелюють між собою. Чим їх менше, тим меншим є мінімальний припустимий обсяг вибірки.
- Правило 200 – обсяг вибіркової сукупності мусить бути не менше 200 досліджуваних.
- Правило 300 – мінімальний обсяг вибірки дорівнює 300 осіб.
- Правило значущості – кількість досліджуваних мусить бу-ти як мінімум на 51 більше, ніж кількість змінних.
Після того, як сформована вибірка стандартизації, на ній апробується розроблена методика та за результатами відповідей досліджуваних на пункти опитувальника будується емпіричний розподіл згрупованих частот.
Частотний розподіл надалі зазвичай унаочнюється в прямокутній системі координат (де на осі Х відкладаються первинні оцінки, представлені межами інтервалів групування, а на осі Y – кількість досліджуваних, які потрапили до кожного інтервалу) двома видами графіків – гістограмою та/або полігоном частот. Гістограма – це сукупність прямокутних стовпчиків, висота яких над кожним інтервалом групування відповідає кількості досліджуваних, що потрапили до нього за наслідками обстеження. Якщо середини верхніх основ прямокутників гістограми з’єднати ламаною кривою, то отримаємо полігон розподілу частот (рис. 4).

Для визначення подальшої стратегії стандартизації, насамперед, шляхів переведення “сирих” оцінок у стандартні та визначення на основі цього нормативних показників, велике значення має встановлення відповідності (чи невідповідності) емпіричного розподілу нормальному закону Гауса.
Перший етап перевірки гіпотези про нормальність розподілу первинних оцінок вимагає застосування до отриманого частотного розподілу дескриптивних статистик, що уможливлюють визначення параметрів положення (мір центральної тенденції) та параметрів розсіяння (мір мінливості). З-поміж мір центральної тенденції насамперед обчислюється вибіркове середнє арифметичне (М), яке вказує на те, де “в середньому” розташовуються значення ознаки:

де х1,..., хn – первинні (сирі) бали, набрані досліджуваними вибірки стандартизації; n – кількість випробуваних.
Поряд із визначенням середнього арифметичного також обчислюються статистичні показники варіації ознаки (змінної) відносно середнього значення – дисперсія (S2) та середнє квадратичне відхилення (σ):

Другим етапом перевірки нормальності розподілу ознаки є обчислення показників асиметрії та ексцесу.
Визначення кількісної міри асиметричної “скошеності” (А) розподілу здійснюється за формулою:

Для обчислення міри ексцесивності (Е) кривої розподілу використовують формулу:

При цьому також обчислюються помилки репрезентативності для показників асиметрії (mA) та ексцесу (mE):

де n – кількість досліджуваних.
Третім етапом перевірки гіпотези про нормальність розподілу є зіставлення емпіричних показників асиметрії та ексцесу з критичними значеннями за формулами М.О. Плохинського:

У випадку, коли показники асиметрії та ексцесу перевищують за абсолютною величиною власну помилку репрезентативності у 3 і більше разів, це свідчить про достовірні відмінності емпіричних розподілів від нормального.
Обрахунки за наведеними вище формулами (2-8) є достатньо громіздкими навіть для невеликої за обсягом вибірки, тому на практиці досить часто використовується комп’ютерний пакет статистичних програм SPSS, який, зокрема, дозволяє швидко обчислити необхідні описові статистики, показники асиметрії та ексцесу, побудувати гістограму розподілу частот.
Якщо перевірка узгодженості емпіричного розподілу з нормальним дає позитивні результати, то це означає, що отриманий розподіл є стійким, тобто репрезентативним щодо генеральної сукупності, та на його основі можна визначити статистичні норми шляхом переведення “сирих” оцінок у стандартну шкалу.
Загальний принцип побудови стандартних шкал полягає в розбитті вибірки на групи, про які відомо, який процент досліджуваних із вибірки вони містять. Встановлення меж груп уможливлює віднесення кожного індивідуального результату до певної групи та точне визначення відсотків досліджуваних, які мають більший або менший ступінь вираження психологічної властивості (рис. 5).

Спираючись на рисунок 5, можна здійснити розбиття діапазону первинних значень на 3, 5 та 7 інтервалів.
При трьохінтервальному розбиті з-поміж 99,72% досліджуваних (первинні показники яких знаходяться в межах М ± 3σ) результати 68,26% респондентів потрапляють до зони статистичної норми (М ± σ). 15,73% досліджуваних, чиї результати виявилися меншими за М – σ, знаходяться нижче норми, а 15,73% респондентів, чиї показники перевищують М + σ, – вище норми.При п’ятиінтервальному розбитті результати в межах М ± σ інтерпретуються як нормативні (≈68% досліджуваних); від М – σ до М – 2σ – як “дещо нижче норми” (≈13,7%), менше М – 2σ – як “значно нижче норми” (≈2,3%); М + σ до М + 2σ – “дещо вище норми” (≈13,7%), а більше М + 2σ – “значно вище норми” (≈2,3%).
Семиінтервальне розбиття передбачає побудову градацій ступеня вираження ознаки виходячи із кратності 2/3σ: більше М + 2σ – “дуже сильно вище норми” (≈2,3%); від М + 4/3σ до М + 2σ – “сильно вище норми” (≈6,8%); від М + 2/3σ до М + 4/3σ – “дещо вище норми” (≈16%); від М – 2/3σ до М + 2/3σ – “норма” (≈49,8%); М – 4/3σ до М – 2/3σ – “дещо нижче норми” (≈16%); від М – 2σ до М – 4/3σ – “сильно нижче норми” (≈6,8%); менше М – 2σ – “дуже сильно нижче норми” (≈2,3%).
Таким чином, за наявності нормального розподілу первинних даних (“сирих балів”) та знаючи середнє арифметичне (М) та стандартне квадратичне відхилення (σ) по вибірці вже можна встановити межі норми та діапазон відхилень від неї.
Разом із цим, на практиці з метою стандартизації первинних оцінок здійснюють так зване z-перетворення за формулою:

Розрахунки за формулою (11) передбачають послідовне здійснення процедур центрування та нормування. Центрування передбачає віднімання від кожного первинного значення хi, отриманого і-м досліджуваним середнього вибіркового значення М, а нормування – ділення центрованого значення на величину стандартного відхилення σ для вибірки.
Отримана множина значень {zi} розподілена за нормальним законом, має середнє М = 0 та стандартне відхилення σ = 1, що дозволяє зіставити кожне індивідуальне значення zi з поданими нижче у таблиці 4 граничними значеннями та проінтерпретувати його в термінах норми або відхилення від неї.
Таблиця 4Схема розбиття на три інтервали | |||
---|---|---|---|
Діапазон значень у загальному вигляді | Діапазон значень після z-перетворення | Інтерпретація | Відсоток досліджуваних |
Більше М+σ | Більше 1 | Вище норми | ≈16% |
[М–σ; М+σ] | [–1; +1] | Норма | ≈68% |
Менше М–σ | Менше –1 | Нижче норми | ≈16% |
Схема розбиття на п’ять інтервалів | |||
Більше М+2σ | Більше 2 | Значно вище норми | ≈2,3% |
[М+σ; М+2σ] | [1; 2] | Дещо вище норми | ≈13,7% |
[М–σ; М+σ] | [–1; +1] | Норма | ≈68% |
[М–2σ; М – σ] | [–2; –1] | Дещо нижче норми | ≈13,7% |
Менше М–2σ | Менше –2 | Значно нижче норми | ≈2,3% |
Схема розбиття на сім інтервалів | |||
Більше М+2σ | Більше 2 | Дуже сильно вище норми | ≈2,3% |
[М+ 4/3σ; М+2σ] | [ 4/3 ; 2] | Значно вище норми | ≈6,8% |
[М+ 2/3σ; М+ 4/3σ] | [ 2/3 ; 4/3 ] | Дещо вище норми | ≈16% |
[М– 2/3σ; М+ 2/3σ] | [– 2/3 ; 2/3 ] | Норма | ≈49,8% |
[М– 4/3σ; М – 2/3σ] | [– 4/3 ; – 2/3 ] | Дещо нижче норми | ≈16% |
[М–2σ; М – 4/3σ] | [–2; – 4/3 ] | Значно нижче норми | ≈6,8% |
Менше М–2σ | Менше –2 | Дуже сильно нижче норми | ≈2,3% |
Використання стандартної z-шкали хоча і є досить поширеним у практиці психометричних вимірювань може супроводжуватися виникненням певних незручностей, пов’язаних із наявністю від’ємних z-оцінок або великої кількості середніх значень. Тому задля уникнення подібних проблем отримані z-оцінки лінійно трансформуються в інші види стандартних шкальних оцінок (yi) за такою формулою:

Із-поміж найуживаніших стандартних шкал, які отримуються внаслідок такого лінійного перетворення, слід насамперед указати на шкалу стенів та станайнів.
Шкала стенів (англ. standard ten – стандартна десятка) забезпечує виокремлення у вибірці десяти груп досліджуваних, кожній з яких присвоюється бал від 1 до 10 (з вибірковими значеннями σ ≈ 2; М = 5,5).
Після визначення згідно формули (12) стандартизованого балу кожного респондента здійснюється впорядкування результатів від найнижчого до найвищого. Надалі виокремлюються групи з кількістю осіб, пропорційною певним частотам оцінок:
Стени | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | |
Відсоток обстежених у вибірці стандартизації | 2,26 | 4,4 | 9,19 | 14,98 | 19,15 | 19,15 | 14,98 | 9,19 | 4,4 | 2,26 |
Наприклад, у вибірці стандартизації обсягом 200 осіб по 5 досліджуваних, які мають найнижчі та найвищі оцінки, будуть віднесені до 1 і 10 стенам відповідно; по 9 осіб – до 2 і 9 стенів; по 18 осіб – до 3 і 8 стенів; по 30 осіб – до 4 і 7 стенів та по 38 осіб – до 5 і 6 стенів.
Нормативними показниками ([М – σ; М + σ]) в межах 10-бальної стандартної рівноінтервальної шкали будуть 4-7 стенів (≈68% досліджуваних), 2-3 стени (≈13,7%) та 1 стен (≈2,3%) інтерпретуватимуться, відповідно, як “дещо нижче норми” та “значно нижче норми”. Діапазон від 8 до 9 стенів (≈13,7%) вказуватиме на показники “дещо вище норми”, а 10 стенів (≈2,3%) – “значно вище норми”.
При трансформації оцінок у шкалу станайнів (англ. standard nine – стандартна дев’ятка) здійснюється аналогічна процедура лише з тією різницею, що вибірка розподіляється не на десять, а на дев’ять груп досліджуваних, кожній з яких присвоюється бал від 1 до 9 (з вибірковими значеннями σ ≈ 2; М = 5).
Відхилення гіпотези про нормальний розподіл “сирих” оцінок вимагає нормалізації вибіркових значень шляхом спеціальної трансформації первинних результатів діагностичного вимірювання.
Залежно від характеру асиметрії О.В. Мітіна рекомендує перетворювати дані в такий спосіб:
- Якщо асиметрія є незначною, то спочатку слід виконати лінійний зсув:
(якщо методика передбачає запис результатів у від’ємних балах), а потім скористатися формулами:
(при лівосторонній асиметрії) або
(у випадку правосторонньої асиметрії).
- Для середнього рівня відхилення асиметрії від нульового значення слід використовувати формулу видобутку логарифму. При цьому, якщо допускаються від’ємні значення первинних показників, то застосовується формула:
Потім, у разі лівосторонньої асиметрії, використовується формула: ui=lg yi, а в разі правосторонньої асиметрії – формула:
.
- Для сильно вираженого порушення симетрії на першому етапі здійснюється перетворення за формулою:
, а потім – основна трансформація за формулами:
(для лівосторонньої асиметрії) та
(для правосторонньої асиметрії).
Не дивлячись на те, що вказані процедури перетворення первинних результатів значно покращують психометричні характеристики та можуть бути здійснені за допомогою програми SPSS, інтерпретація трансформованих показників часто-густо викликає утруднення (як, наприклад, трактувати логарифм IQ?). У зв’язку з цим О.В. Мітіна наголошує на тому, що трансформацію не слід розглядати як обов’язкову операцію. Краще іноді скористатись іншими способами переведення “сирих” оцінок у стандартні та визначення на цій основі статистичних норм, з-поміж яких вона вказує насамперед на квантильні шкали.
Квантильна стандартизація використовується для оцінки місця, котре посідає респондент у вибірці за досліджуваною ознакою та передбачає розбиття результатів вибірки на рівні за кількістю досліджуваних частини. При такій стандартизації можуть бути використані процентильні (розбивають вибірку на 100 рівних частин), децильні (вибірка розподіляється на 10 частин), квінтельні (вибірка розподіляється на 5 частин) та квартильні (вибірка розбивається на 4 частини) шкали.
Процентилі можна розглядати як рангові градації, загальна кількість яких дорівнює 100. Усі процентилі вище 50-го (який співпадає з медіаною) представляють показники вищі за середній рівень, а ті, що розташовані нижче нього, свідчать про порівняно низький рівень вираженості діагностичної ознаки (рис. 6).

25-й та 75-й процентилі відповідають першому та третьому квартилям (Q1 та Q3). Відповідно, 25% респондентів, що розташовуються нижче Q1, матимуть найнижчу вираженість показника; оцінки 25% досліджуваних (інтервал між Q1 та Q2) можуть буть проінтерпретовані як такі, що знаходяться “дещо нижче норми”; 25% показників у діапазоні між Q2 та Q3 – як “дещо ви-ще норми”, решта 25% – як “значно вище норми”.
Використання квінтельного (де кожному з чотирьох квінтелів К1, К2, К3, К4 відповідають 20-й, 40-й, 60-й, 80-й та 100-й процентиль) та децильного (де D1 відповідає 10-й процентиль, D2 – 20-й процентиль і т.д.) нормування збільшує загальну кількість інтервалів (у даному випадку – 5 і 10), до яких потрапляють оцінки певного відсотку респондентів.
Тут слід зауважити, що первинний результат досліджуваного, віднесений до певного квантильного рангу, вказує виключно на його відносне положення у вибірці стандартизації. Наприклад, значення 100 для процентильної шкали або 10 – для децильної свідчать про те, що внаслідок виконання методики респондентом набраний максимальний бал порівняно із результатами інших досліджуваних даної вибірки.
Ще один спосіб визначення статистичних норм пропонується М.К. Акімовою та К.М. Гуревичем. Він полягає в наступному. За результатами діагностики вибірка розподіляється на 5 підгруп: 10% досліджуваних з найвищими показниками, 20% – із вираженим проявом вимірюваної ознаки, 40% – із середніми показниками, 20% – зі слабко вираженими та 10% – з мінімально вираженими показниками. Надалі для кожної рангової підгрупи обчислюється середній бал, й індивідуальна оцінка кожного досліджуваного відноситься до певної групи на основі її близькості одному з п’яти усереднених групових показників.
Закінчуючи розгляд особливостей стандартизації методики та визначення статистичних норм, слід зазначити, що будь-яка норма не є постійною та універсальною, а обмежується лише тією конкретною сукупністю людей, для яких вона вироблялася. Окрім цього, як указує О.В. Мітіна, здійснюючи процедуру стандартизації, слід мати на увазі призначення методики. Якщо метою є діагностика з наданням психодіагностичного висновку, то норми виявляються вельми необхідними. Проте, у випадку, якщо методика використовується у дослідницьких цілях, а психодіагноста цікавить не конкретний досліджуваний, а вимірювана за допомогою даної методики психічна властивість або тенденція, що має місце в досліджуваній вибірці, норми не є обов’язковими – можна обмежитись лише первинними показниками.
Отже, послідовність стандартизації вимірювальної діагностичної методики передбачає послідовну реалізацію таких кроків: 1) визначення генеральної сукупності, для якої призначена методика; 2) формування репрезентативної вибірки стандартизації та отримання на ній первинних даних про об’єкт психодіагностики; 3) перевірка нормальності емпіричного розподілу згрупованих частот. На нормальному розподілі здійснюється стандартизація шляхом використання z-шкали та її лінійних похідних, що дозволяє встановити статистичні норми. У разі, якщо розподіл відрізняється від нормального, здійснюється нелінійна трансформація або квантильна стандартизація первинних оцінок.