Меню
Онлайн-инструментОнлайнБесплатно

Калькулятор p-value

Рассчитайте p-значение для Z-теста онлайн: по известной Z-статистике или по данным выборки. Быстрый расчёт, точные результаты, полная интерпретация p-value на уровне значимости 0.05.

Обновлено: 15 мая 2026 г.
ФормулыБыстроПриватно

Калькулятор p-value

Рассчитайте p-значение для Z-теста: по известной Z-статистике или по данным вашей выборки — быстро, точно и с полной интерпретацией результата.

Z-статистика
z
p-value (выбранный тест)
доля
p-value (двусторонний)
доля
Интерпретация (α = 0.05)
вывод

Как пользоваться калькулятором

1
Выберите режим: «По Z-статистике» — если у вас уже есть рассчитанное значение z (например, 1.96); «По данным выборки» — если нужно сначала вычислить z по средним, отклонению и размеру выборки.
2
Заполните поля. Для режима с выборкой укажите выборочное среднее (x̄), гипотетическое среднее (μ₀), стандартное отклонение (σ) и размер выборки (n). Для режима с Z-статистикой — только z-score.
3
Выберите тип теста: двусторонний (проверка отличия в любую сторону), левосторонний (x̄ < μ₀) или правосторонний (x̄ > μ₀).
4
Нажмите «Рассчитать». p-value отобразится в правой панели вместе с Z-статистикой, p-value для двустороннего теста и интерпретацией на уровне значимости 0.05.

Примеры расчёта

Пример 1: Рост учеников (z-score известен)
Z-статистика = 2.12, двусторонний тест → p-value ≈ 0.034. Вывод: статистически значимо на уровне 0.05.
Пример 2: Средний чек в магазине (данные выборки)
x̄ = 520 руб., μ₀ = 500 руб., σ = 80 руб., n = 64. Z = (520 − 500) / (80 / √64) = 20 / 10 = 2.0. Двусторонний p-value ≈ 0.0455.
Пример 3: Контроль качества (левосторонний тест)
x̄ = 98.5 г, μ₀ = 100 г, σ = 4 г, n = 50. Z = (98.5 − 100) / (4 / √50) ≈ −2.65. Левосторонний p-value ≈ 0.004. Продукт значимо легче нормы.

Формулы расчёта

Z-статистика (по данным выборки):
Z = (x̄ − μ₀) / (σ / √n)
где x̄ — выборочное среднее, μ₀ — гипотетическое среднее, σ — стандартное отклонение, n — размер выборки.
p-value (двусторонний тест):
p = 2 × (1 − Φ(|Z|))
где Φ — кумулятивная функция стандартного нормального распределения.
p-value (левосторонний тест):
p = Φ(Z)
p-value (правосторонний тест):
p = 1 − Φ(Z)

Пошаговое объяснение

Сначала вычисляется Z-статистика по формуле (если используется режим с выборкой). Она показывает, на сколько стандартных ошибок выборочное среднее отклоняется от гипотетического. Затем с помощью аппроксимации функции стандартного нормального распределения (алгоритм Абрамовица–Стегуна) определяется площадь под кривой — вероятность получить такое или более экстремальное значение при условии верности нулевой гипотезы. Для двустороннего теста эта вероятность удваивается.

Где применяется

  • A/B-тестирование: оценка значимости различий конверсии двух версий сайта.
  • Медицинские исследования: проверка эффективности нового препарата по сравнению с плацебо.
  • Контроль качества: проверка соответствия продукции заявленным характеристикам.
  • Социологические опросы: сравнение средних оценок по разным группам респондентов.
  • Финансовый анализ: проверка гипотез о средней доходности актива.
  • Образование: сравнение результатов тестирования учащихся с нормативными показателями.

Важные нюансы

  • Калькулятор использует Z-тест и предполагает нормальное распределение данных. При малых выборках (n < 30) и неизвестной σ рекомендуется t-тест.
  • Стандартное отклонение σ должно быть больше нуля. При σ ≤ 0 расчёт невозможен — появится сообщение об ошибке.
  • Размер выборки n должен быть не менее 2. При n = 1 невозможно оценить вариативность.
  • p-value не показывает величину эффекта. Маленькое p-value при огромной выборке может соответствовать ничтожному практическому различию.
  • Порог значимости α = 0.05 условен. В разных областях (физика, геномика) приняты другие уровни: 0.01, 0.001 или даже 5×10⁻⁸.
  • Двусторонний тест — более консервативный выбор. Используйте его, если не уверены в направлении эффекта.

Частые ошибки

  • Использование Z-теста при малой выборке: если n < 30 и σ неизвестна, p-value будет неточным. Используйте t-тест или увеличьте выборку.
  • Путаница между односторонним и двусторонним тестом: односторонний p-value всегда вдвое меньше двустороннего для того же Z. Если гипотеза не направленная — берите двусторонний.
  • Игнорирование предположения о нормальности: если данные сильно скошены, Z-тест даёт неверные p-value. Проверьте распределение перед тестом.
  • Подгонка гипотезы после просмотра данных (HARKing): нельзя сначала посмотреть на данные, а потом выбрать односторонний тест в «нужную» сторону — это завышает значимость.
  • Интерпретация p-value как вероятности нулевой гипотезы: p-value — это вероятность данных при условии H₀, а не вероятность того, что H₀ верна.
  • Округление p-value до нуля: очень маленькое p-value (например, 1.2×10⁻¹⁵) не равно нулю. Сообщайте точное значение.

Ответы на частые вопросы

Что означает p-value = 0.03?
Это значит, что если нулевая гипотеза верна, вероятность получить наблюдаемое (или более экстремальное) различие составляет 3%. При пороге 0.05 результат считается статистически значимым.
Чем Z-тест отличается от t-теста?
Z-тест предполагает известное стандартное отклонение генеральной совокупности (σ) и большую выборку. t-тест использует выборочное стандартное отклонение (s) и подходит для малых выборок.
Какой уровень значимости выбрать?
В большинстве социальных и биомедицинских наук принят α = 0.05. В физике элементарных частиц — 5σ (p ≈ 3×10⁻⁷). Выбирайте уровень до анализа данных.
Можно ли использовать калькулятор для t-теста?
Нет, этот калькулятор только для Z-теста. Для t-теста нужна другая функция распределения (Стьюдента), зависящая от степеней свободы.
Что делать, если p-value ровно 0.05?
Формально результат на границе значимости. Рекомендуется сообщить точное p-value и интерпретировать с осторожностью, желательно собрать дополнительные данные.
Почему p-value не всегда надёжен?
p-value зависит от размера выборки, предположений о распределении и корректности дизайна исследования. Всегда дополняйте его доверительными интервалами и оценкой величины эффекта.

Источники и справочные данные

Расчёт основан на аппроксимации функции стандартного нормального распределения (алгоритм Абрамовица и Стегуна, 1964). Метод широко применяется в статистических пакетах. Z-тест описан во всех стандартных учебниках по математической статистике. Рекомендации по интерпретации p-value соответствуют руководству Американской статистической ассоциации (ASA, 2016).

Что такое p-value и почему это важно

p-value (p-значение) — одно из центральных понятий статистической проверки гипотез. Если коротко: это вероятность получить наблюдаемый результат (или более экстремальный), если нулевая гипотеза верна. Чем меньше p-value, тем сильнее данные противоречат нулевой гипотезе.

В повседневной практике p-value помогает ответить на вопрос: «Мог ли такой результат возникнуть случайно?» Например, вы запустили рекламную кампанию и конверсия выросла с 2% до 2.5% — действительно ли кампания сработала, или это случайное колебание?

Как работает логика p-value: аналогия с монеткой

Представьте: вы подбрасываете монетку 100 раз и получаете 65 орлов. Нулевая гипотеза (H₀): монетка честная, вероятность орла 0.5. p-value отвечает: какова вероятность получить 65 или больше орлов при честной монетке? Если p-value = 0.002, значит, такой результат крайне маловероятен при H₀ — и вы, скорее всего, отвергнете гипотезу о честности монетки.

Z-тест: основа калькулятора

Z-тест — один из старейших и наиболее изученных статистических тестов. Он сравнивает выборочное среднее с гипотетическим значением, используя стандартное нормальное распределение. Z-статистика рассчитывается как (x̄ − μ₀) / (σ / √n). Если |Z| > 1.96, двусторонний p-value будет меньше 0.05.

Важное ограничение: Z-тест требует известного σ. На практике σ редко известна точно — её оценивают по большой выборке или из предыдущих исследований. При n ≥ 30 оценка σ через выборочное стандартное отклонение s даёт приемлемую точность благодаря центральной предельной теореме.

Практические примеры использования p-value

Маркетинг. Компания тестирует два заголовка лендинга — A (конверсия 3.2%) и B (3.9%). Z-тест показывает Z = 2.4, p-value = 0.016. Вывод: вариант B значимо лучше при α = 0.05.

Медицина. Клиническое испытание: в группе препарата среднее снижение давления 12 мм рт. ст., в группе плацебо — 4 мм рт. ст., σ = 18 мм, n = 100 в каждой группе. Z ≈ 3.14, p-value ≈ 0.0017 — препарат эффективен.

Производство. Заявленный вес упаковки — 500 г. Выборка из 36 упаковок дала среднее 497 г, σ = 6 г. Z = (497 − 500) / (6 / 6) = −3.0. Левосторонний p-value = 0.0013 — есть систематическое недовложение, требуется настройка линии.

Пороги значимости: традиция и реальность

Порог 0.05 был предложен Рональдом Фишером в 1925 году как удобное соглашение, а не железный закон. Сегодня многие учёные призывают снизить стандартный порог до 0.005 для повышения воспроизводимости. Другие предлагают вообще отказаться от жёстких порогов и сообщать точные p-value вместе с доверительными интервалами.

В бизнес-аналитике порог 0.05 остаётся рабочим стандартом. Но помните: p-value = 0.049 и p-value = 0.051 практически неразличимы — не принимайте решения механически.

Как избежать типичных ловушек

Не делайте множественных сравнений без поправки (Бонферрони, Холм и др.). Если вы тестируете 20 метрик одновременно и берёте ту, где p-value минимально — вы почти гарантированно найдёте «значимый» результат чисто случайно.

Не используйте односторонний тест для подстраховки. Односторонний тест уместен, только когда направление эффекта строго предсказано теорией до сбора данных. Если есть сомнения — берите двусторонний.

Всегда сообщайте размер эффекта и его практическую значимость. При выборке n = 10 000 даже крошечное различие (например, 0.1%) может дать p-value < 0.001. Но стоит ли такое различие внедрения изменений?

Практические советы для работы с p-value

  • Всегда указывайте точное p-value, а не просто «p < 0.05». Значение 0.049 и 0.0001 — совершенно разная степень уверенности.
  • Дополняйте p-value 95%-ным доверительным интервалом. Если интервал для разности средних: (0.1, 0.5) — эффект есть, но небольшой. Если (−0.02, 0.18) и p = 0.12 — интервал накрывает ноль, результат незначим.
  • Проверяйте предположения теста: нормальность распределения (хотя бы визуально, по гистограмме или QQ-plot), независимость наблюдений, отсутствие выбросов.
  • При малых выборках (n < 30) замените Z-тест на t-тест. Разница особенно заметна при n < 10 — t-распределение имеет более тяжёлые хвосты, p-value для t-теста будет больше.

Итог

p-value — мощный, но часто неверно понимаемый инструмент. Он не говорит о вероятности гипотезы, не заменяет здравый смысл и не отменяет необходимости смотреть на величину эффекта. Используйте калькулятор для быстрых расчётов Z-теста, проверяйте предположения и всегда интерпретируйте p-value в контексте вашей задачи.

Спросить у ИИ

Задайте вопрос по этому калькулятору

Осталось вопросов: 5. Только по этому инструменту.

Оцените калькулятор

Нужен другой инструмент?

Все инструменты в категории