Калькулятор Байесовской вероятности

Онлайн-калькулятор для вычисления апостериорной вероятности P(A|B) по теореме Байеса. Введите априорную и условные вероятности, получите точный результат и интерпретацию.

Обновлено: 15 мая 2026 г.

Калькулятор Байесовской вероятности

Вычислите апостериорную вероятность P(A|B) по теореме Байеса — насколько гипотеза становится вероятнее после получения нового свидетельства.

Априорная вероятность P(A) Вероятность гипотезы до наблюдения свидетельства (в %)

Условная вероятность P(B|A) Вероятность свидетельства B, если гипотеза A верна (чувствительность, в %)

Условная вероятность P(B|¬A) Вероятность свидетельства B, если гипотеза A неверна (ложноположительный результат, в %)

—

Апостериорная вероятность P(A|B)

—

Полная вероятность P(B)

—

Интерпретация

Как пользоваться калькулятором

Введите априорную вероятность P(A) — вашу оценку вероятности гипотезы до получения новых данных. Например, если базовый риск заболевания в популяции 5%, введите 5.

Введите условную вероятность P(B|A) — насколько часто свидетельство B наблюдается, когда гипотеза A верна. Например, тест определяет болезнь с точностью 80% — введите 80.

Введите условную вероятность P(B|¬A) — насколько часто свидетельство B наблюдается, когда гипотеза A неверна. Например, ложноположительный результат теста — 9,6%, введите 9.6.

Нажмите «Рассчитать» и получите апостериорную вероятность P(A|B) — уточнённую вероятность гипотезы с учётом свидетельства.

Примеры расчёта

Медицинская диагностика

Болезнь встречается у 1% населения: P(A) = 1%. Тест имеет чувствительность 95%: P(B|A) = 95%. Ложноположительный результат — 10%: P(B|¬A) = 10%. После положительного теста вероятность болезни P(A|B) ≈ 8,76%. Тест не так страшен, как кажется на первый взгляд.

Спам-фильтр

Вероятность, что любое письмо — спам: P(A) = 20%. Слово «распродажа» встречается в спаме с вероятностью 70%: P(B|A) = 70%. В обычных письмах это слово встречается с вероятностью 5%: P(B|¬A) = 5%. Если в письме есть слово «распродажа», вероятность спама P(A|B) ≈ 77,78%.

Поиск неисправности

Вероятность поломки датчика: P(A) = 15%. При поломке датчика индикатор загорается в 99% случаев: P(B|A) = 99%. При исправном датчике индикатор ложно загорается в 3% случаев: P(B|¬A) = 3%. Если индикатор загорелся, вероятность поломки P(A|B) ≈ 85,4%.

Формулы расчёта

Теорема Байеса:

P(A|B) = P(B|A) × P(A) / P(B)

Полная вероятность P(B):

P(B) = P(B|A) × P(A) + P(B|¬A) × P(¬A)

где P(¬A) = 1 − P(A)

Итоговая формула:

P(A|B) = P(B|A) × P(A) / [P(B|A) × P(A) + P(B|¬A) × (1 − P(A))]

Пошаговое объяснение

Калькулятор выполняет три последовательных шага:

Преобразование процентов в десятичные доли: все введённые значения делятся на 100, чтобы получить вероятности от 0 до 1. Например, 5% = 0,05.
Вычисление полной вероятности P(B): по формуле P(B) = P(B|A)·P(A) + P(B|¬A)·P(¬A). Эта величина показывает, насколько часто свидетельство B встречается в целом — и когда гипотеза верна, и когда нет.
Применение теоремы Байеса: P(A|B) = P(B|A)·P(A) / P(B). Результат умножается на 100 и округляется до двух знаков после запятой. Если P(B) = 0, расчёт невозможен — выводится сообщение об ошибке.

Где применяется

Медицина: оценка вероятности заболевания после положительного результата теста — основа доказательной диагностики.
Машинное обучение: наивный байесовский классификатор для спам-фильтров, анализа тональности текста, категоризации документов.
Криминалистика: оценка вероятности виновности подозреваемого с учётом улик — байесовские сети в судебной экспертизе.
Финансы: обновление прогнозов рынка при поступлении новых экономических данных, оценка кредитных рисков.
Инженерия: диагностика неисправностей оборудования по косвенным признакам, анализ надёжности систем.
Принятие решений: переоценка гипотез в условиях неопределённости — от бизнес-стратегий до повседневных ситуаций.

Важные нюансы

Априорная вероятность имеет огромное значение. При низкой базовой вероятности гипотезы даже высокоточный тест может дать лишь умеренную апостериорную вероятность. Это называют «парадоксом ложноположительного результата».
Редкие события требуют особой осторожности. Если P(A) очень мала (менее 0,01%), даже небольшая доля ложных срабатываний P(B|¬A) может «затопить» истинные сигналы, делая положительный результат статистически незначимым.
Все вероятности должны быть от 0 до 100%. Значения за этими пределами не имеют смысла. Калькулятор сообщит об ошибке при некорректном вводе. Отрицательные вероятности недопустимы.
Байесовский подход предполагает независимость свидетельств. Если вы используете несколько свидетельств последовательно, апостериорная вероятность после первого становится априорной для второго — но только при условии независимости.
Точность входных данных определяет точность результата. Ошибки в оценке P(B|A) или P(B|¬A) напрямую влияют на итоговую вероятность. Используйте наиболее надёжные доступные данные.
Результат — вероятность, а не гарантия. P(A|B) = 70% означает, что в 7 случаях из 10 гипотеза верна, но в 3 случаях — нет. Интерпретируйте результат как степень уверенности, а не как детерминированный ответ.

Частые ошибки

Путаница P(B|A) и P(A|B). Вероятность положительного теста при болезни — не то же самое, что вероятность болезни при положительном тесте. Это самая распространённая ошибка в интерпретации медицинских тестов.
Игнорирование априорной вероятности. Оценивать результат теста без учёта базовой частоты явления — классическое заблуждение, известное как «ошибка базовой ставки» (base rate fallacy).
Ввод P(B|¬A) = 0%. Если ложноположительные результаты действительно невозможны, то P(A|B) = 100% при любом P(A) > 0. Это математически корректно, но на практике абсолютная специфичность встречается крайне редко — проверяйте реалистичность данных.
Сложение вероятностей вместо применения Байеса. Нельзя просто «прибавить» уверенность от свидетельства к априорной вероятности. Теорема Байеса — единственный корректный способ обновления вероятностей.
Нормализация «на глаз». Попытки вручную подогнать цифры, чтобы P(A|B) + P(¬A|B) = 100%, без расчёта P(B) приводят к грубым ошибкам. Доверяйте формуле — она автоматически обеспечивает корректную нормализацию.
Использование Байеса для зависимых свидетельств без корректировки. Если свидетельства B1 и B2 коррелируют, последовательное применение теоремы даст смещённую оценку. В таких случаях нужны более сложные модели.

Ответы на частые вопросы

Что такое априорная и апостериорная вероятность?

Априорная вероятность P(A) — ваша оценка вероятности гипотезы до получения свидетельства. Апостериорная вероятность P(A|B) — обновлённая оценка после учёта свидетельства B. Байесовский подход формализует процесс обучения на новых данных.

Почему при редкой болезни положительный тест не означает 100% уверенности?

Потому что ложноположительные результаты накапливаются на огромной популяции здоровых людей. Если болезнь у 1% популяции, а ложноположительный результат — 5%, то среди 1000 человек будет 10 больных (тест верно покажет ~9-10) и 50 ложноположительных. Доля верных положительных результатов среди всех положительных — примерно 9/(9+50) ≈ 15%.

Можно ли использовать калькулятор для нескольких свидетельств подряд?

Да, при условии независимости свидетельств. Примите апостериорную вероятность P(A|B1) как новую априорную и введите данные для следующего свидетельства B2. Повторяйте для каждого независимого свидетельства.

Что делать, если я знаю P(B), но не знаю P(B|¬A)?

Вы можете выразить P(B|¬A) из формулы полной вероятности: P(B|¬A) = [P(B) − P(B|A)·P(A)] / P(¬A). Однако калькулятор ожидает именно P(B|¬A) — это наиболее интуитивно понятный параметр (вероятность свидетельства при ложной гипотезе).

Почему калькулятор выдаёт ошибку «деление на ноль»?

Ошибка возникает, когда P(B) = 0, то есть свидетельство B невозможно ни при каких обстоятельствах. Проверьте введённые значения — вероятно, P(B|A) и P(B|¬A) одновременно равны нулю, что противоречит факту наблюдения свидетельства.

Какая точность у расчётов калькулятора?

Результаты округляются до двух знаков после запятой. Промежуточные вычисления ведутся с плавающей точкой двойной точности (стандарт IEEE 754). При экстремально малых вероятностях (менее 0,0001%) возможны незначительные погрешности округления, не влияющие на практическую интерпретацию.

Источники и справочные данные

Расчёт основан на классической теореме Байеса, сформулированной Томасом Байесом и опубликованной в 1763 году. Формулы и интерпретация соответствуют стандартным учебникам по теории вероятностей и математической статистике (Гмурман, Вентцель), а также современным руководствам по байесовским методам (McElreath, Gelman). Медицинские примеры согласованы с рекомендациями ВОЗ по интерпретации диагностических тестов.

Байесовская вероятность: как правильно обновлять свои убеждения

Каждый день мы сталкиваемся с неопределённостью. Врач сообщает результат анализа, спам-фильтр помечает письмо, индикатор на приборной панели загорается красным — и нам нужно принять решение. Теорема Байеса даёт математически безупречный способ пересчитать вероятность гипотезы после получения новых данных. Наш калькулятор делает этот расчёт мгновенным и наглядным.

Интуитивное понимание теоремы Байеса

Представьте, что вы ищете редкую монету в огромной коллекции. Вы знаете, что таких монет всего 1 на 1000 (априорная вероятность 0,1%). У вас есть детектор, который пищит на нужную монету с вероятностью 99% (чувствительность), но ложно срабатывает на обычные монеты в 5% случаев (ложноположительный результат). Детектор запищал. Какова вероятность, что перед вами действительно редкая монета? Интуиция подсказывает: «почти наверняка». Байес говорит: примерно 1,9%. Потому что на 1000 монет детектор запищит на 1 редкую (верно) и на 50 обычных (ложно) — всего 51 сигнал, из которых только 1 истинный.

Три компонента байесовского обновления

Априорная вероятность P(A) — то, что вы знали до наблюдения. Не игнорируйте её. Если вы понятия не имеете, какова базовая частота явления, любой расчёт будет гаданием. Ищите статистику: распространённость болезней, частоту отказов оборудования, долю спама в почтовом трафике.
Правдоподобие P(B|A) — насколько хорошо ваша гипотеза объясняет наблюдаемые данные. В диагностике это чувствительность теста. В повседневной жизни — насколько типично наблюдаемое поведение для предполагаемой причины.
Маргинальное правдоподобие P(B) — насколько часто данные встречаются вообще. Это сумма двух путей: данные появились потому, что гипотеза верна, ИЛИ данные появились, хотя гипотеза неверна. Именно здесь многие ошибаются, забывая про ложноположительные срабатывания.

Медицинская диагностика: почему «точность теста 95%» обманчива

Фраза «тест точен на 95%» ничего не говорит о вероятности болезни при положительном результате. Нужно знать три цифры: распространённость болезни P(A), чувствительность P(B|A) и специфичность 1−P(B|¬A). Рассмотрим ВИЧ-тест с чувствительностью 99,9% и специфичностью 99,5%. Распространённость ВИЧ в общей популяции — около 0,3%. Подставляем в калькулятор: P(A)=0,3%, P(B|A)=99,9%, P(B|¬A)=0,5%. Результат P(A|B) ≈ 37,6%. Менее половины! А теперь представьте скрининг всего населения. Огромное количество ложноположительных результатов создаст хаос, если врачи не понимают байесовскую статистику.

Именно поэтому массовый скрининг редких заболеваний часто не рекомендуется — он приводит к больше стресса и ненужных процедур, чем к спасённым жизням. Калькулятор на этой странице позволяет мгновенно оценить реальную информативность теста для любой распространённости болезни.

Спам-фильтры и наивный Байес

Современные почтовые сервисы обрабатывают миллиарды писем ежедневно. Один из ключевых алгоритмов — наивный байесовский классификатор. Он «наивен» потому, что предполагает независимость слов в письме (что, конечно, не так — но работает удивительно хорошо). Для каждого слова вычисляется его «спамовость» — вероятность встретить это слово в спаме. Затем по теореме Байеса комбинируются вероятности для всех слов письма, и принимается решение.

Типичные цифры: слово «бесплатно» встречается в 65% спам-писем и лишь в 2% обычных. Слово «встреча» — в 30% обычных и в 5% спама. Комбинируя десятки таких сигналов, фильтр достигает точности выше 99,5%. Наш калькулятор помогает понять базовый принцип: как одно слово меняет вероятность спама от априорных 20% до апостериорных 78% или выше.

Байесовское мышление в повседневной жизни

Теорема Байеса — не просто формула. Это способ мышления. Вместо того чтобы цепляться за первоначальное мнение или, наоборот, полностью переворачивать его после каждой новости, байесовский подход предлагает обновлять степень уверенности пропорционально силе доказательств. Слабые доказательства? Небольшой сдвиг вероятности. Сильные и неожиданные данные? Значительное обновление.

Предприниматель оценивает вероятность успеха стартапа в 10%. Затем проводит опрос 100 потенциальных клиентов, и 40 из них выражают готовность купить продукт. Если бы продукт был неудачным, такой энтузиазм наблюдался бы лишь в 5% случаев. Байесовское обновление: P(A|B) взлетает до 47%. Предприниматель не становится безрассудным оптимистом, но обоснованно повышает оценку — и продолжает собирать данные.

Подводные камни и реалистичные ожидания

Байесовский анализ требует честности в оценке априорных вероятностей. Если вы искусственно завысите P(A), чтобы «подогнать» результат под желаемый, вы обманете только себя. Кроме того, реальный мир редко предоставляет идеально независимые свидетельства. Если два диагностических теста основаны на одном и том же биомаркере, их результаты будут коррелировать, и последовательное применение Байеса даст завышенную уверенность. В таких случаях нужны многомерные байесовские сети — но это уже тема для продвинутых пользователей.

Помните также, что байесовский подход не избавляет от необходимости собирать качественные данные. Мусор на входе — мусор на выходе. Если ваша оценка P(B|¬A) грубо неточна, результат будет не лучше исходных данных. Наш калькулятор — инструмент, а не оракул. Используйте его вместе с критическим мышлением и качественной статистикой.