Критерий хи-квадрат: что это такое и как применять на практике
Суть критерия χ²
Критерий хи-квадрат Пирсона — один из самых популярных статистических инструментов. Его задача — проверить, насколько наблюдаемые данные согласуются с теоретически ожидаемыми. Простыми словами: мы предполагаем некую модель (например, игральная кость честная, все грани выпадают с вероятностью 1/6), собираем реальные данные и смотрим — укладываются ли они в наше предположение или отклонения слишком велики, чтобы быть случайными.
Ключевая идея: если расхождения между фактом и теорией малы — модель работает. Если велики — модель, скорее всего, неверна. Математически это выражается формулой χ² = Σ (O − E)² / E, где O — наблюдаемая частота, E — ожидаемая. Чем больше разница, тем больше вклад в итоговую статистику.
Когда стоит применять
Критерий χ² незаменим, когда у вас есть категориальные данные — результаты опроса, подсчёт объектов по группам, распределение признаков. Например, вы хотите понять, действительно ли новая упаковка привлекает больше покупателей, или разница в 10-15 человек — просто случайность. Или проверить, соответствует ли распределение генотипов в популяции закону Харди-Вайнберга.
Важно помнить: критерий работает с абсолютными частотами. Если у вас 100 наблюдений и 4 категории — это отличный кейс. Если 10 наблюдений и 5 категорий — χ²-аппроксимация будет неточной, лучше взять точный критерий Фишера.
Пошаговый план проверки гипотезы
1. Формулировка гипотез. H₀: различий между наблюдаемыми и ожидаемыми частотами нет (модель верна). H₁: различия есть (модель неверна).
2. Сбор данных. Запишите наблюдаемые частоты для каждой категории. Например, при 60 бросках кубика получили: 8, 12, 9, 11, 10, 10.
3. Расчёт ожидаемых частот. Если предполагается равномерное распределение, поделите общее число наблюдений поровну: 60 / 6 = 10 для каждой грани. Если теоретическая модель другая (скажем, соотношение 3:1 в генетике), рассчитайте пропорционально.
4. Вычисление χ². Для каждой категории: (O − E)² / E. Суммируйте. В примере с кубиком: (8−10)²/10 + (12−10)²/10 + … = 0.4 + 0.4 + 0.1 + 0.1 + 0 + 0 = 1.0.
5. Определение df. Число степеней свободы = количество категорий минус 1. Для кубика df = 5.
6. Сравнение с критическим значением. Для α = 0.05 и df = 5 критическое χ² = 11.07. Наше 1.0 < 11.07 — H₀ не отклоняется, кость можно считать честной.
Таблица критических значений: как читать
Критические значения зависят от двух параметров: уровня значимости α и числа степеней свободы df. α = 0.05 означает, что мы готовы ошибиться в 5% случаев, отклонив верную H₀ (ошибка первого рода). Чем меньше α, тем выше критическое значение и тем «строже» тест.
Например, для df = 1: при α = 0.05 критическое χ² = 3.84, а при α = 0.01 — уже 6.63. Если ваше наблюдаемое χ² = 4.5, то на уровне 0.05 вы гипотезу отклоняете, а на уровне 0.01 — уже нет. Выбор α всегда за исследователем и зависит от цены ошибки.
Реальные примеры из разных областей
Маркетинг. Интернет-магазин запустил три варианта баннера и получил клики: 120, 95, 85. Ожидалось равномерно по 100. χ² = 5.0, df = 2, критическое = 5.99. Вывод: разница в кликах статистически незначима — можно выбирать любой баннер.
Медицина. В клиническом исследовании из 200 пациентов, принимавших новое лекарство, выздоровело 160, а в контрольной группе из 200 — 140. Это уже таблица 2×2, и χ² считается немного иначе, но принцип тот же: проверяем, есть ли связь между лечением и выздоровлением.
Образование. Учитель хочет узнать, равномерно ли распределены оценки за контрольную. Из 50 учеников: «5» — 10, «4» — 20, «3» — 15, «2» — 5. Если ожидалось поровну (12.5), χ² покажет значимое отклонение — распределение не равномерное.
Ограничения метода и о чём молчат учебники
χ² чувствителен к размеру выборки. На огромных данных даже ничтожное отклонение станет «статистически значимым», хотя практической пользы в этом ноль. Поэтому всегда смотрите не только на p-уровень или вывод «отклоняем/не отклоняем», но и на величину эффекта — например, на стандартизованные остатки (O − E) / √E по категориям.
Ещё один нюанс: χ² не говорит о направлении различий. Если у вас 5 категорий и χ² значим — вы не знаете, какая именно категория «виновата». Для этого проводят анализ остатков или post-hoc тесты с поправкой Бонферрони.
И помните: статистическая значимость ≠ практическая важность. При выборке в 10 000 человек даже разница в 1% может дать χ² выше критического. Всегда интерпретируйте результат в контексте вашей задачи.
Практический совет
Перед расчётом всегда проверяйте визуально свои данные. Простая гистограмма наблюдаемых и ожидаемых частот часто говорит больше, чем сухие цифры χ². Если видите явные выбросы в одной-двух категориях — именно они создают значимость. Используйте калькулятор выше для быстрого прототипирования гипотез, но для серьёзных исследований дополнительно применяйте специализированное ПО (R, Python с scipy, SPSS).