Главная Наука Что такое вероятность? Случайность, которую мы используем каждый день
Наука

Что такое вероятность? Случайность, которую мы используем каждый день

Что такое вероятность? Случайность, которую мы используем каждый день
Поделитесь

Теория вероятности лежит в основе искусственного интеллекта, криптографии и статистики. Однако, как сказал философ Бертран Рассел: «Вероятность — самое важное понятие в современной науке, особенно потому, что никто не имеет ни малейшего понятия, что оно означает».

Я преподаю статистику инженерам, поэтому знаю: хотя вероятность и важна, она противоречит интуиции.

Вероятность — это раздел математики, который описывает случайность. Когда ученые говорят о случайности, они имеют в виду случайные события — например, подбрасывание монеты — а не странные происшествия, вроде человека, одетого как зебра. У ученых нет способа предсказывать странные случаи, но вероятность позволяет прогнозировать долгосрочное поведение — то есть тенденции, возникающие при многократном повторении событий.

Мы можем называть «случайными» странные происшествия (человек в костюме зебры), но вероятность описывает именно случайные события (подбрасывание монеты).

Моделирование с помощью вероятности

Поскольку вероятность имеет дело с событиями, ученый должен выбрать, какие именно события изучать. Этот выбор определяет пространство элементарных исходов. Например, подбрасывая монету, вы можете определить событие как то, какой стороной она упадет.

Монеты почти всегда падают орлом или решкой. Однако возможно — хоть и крайне маловероятно — что монета упадет на ребро. Таким образом, чтобы создать пространство исходов, у вас есть два варианта: орел и решка, или орел, решка и ребро. Пока давайте проигнорируем падение на ребро и будем использовать орла и решку как наше пространство исходов.

Затем нужно присвоить вероятности событиям. Вероятность описывает частоту наступления события и принимает значения от 0% до 100%. Например, при честном подбрасывании монета упадет орлом вверх в 50% случаев и решкой вверх — в 50%.

Однако, чтобы присвоить вероятности, нужно тщательно продумать сценарий. Что, если человек, подбрасывающий монету, шулер? Существует ловкая техника «вибрации» монеты без ее переворачивания, что позволяет контролировать результат. Даже если вы исключите мошенничество, реальные подбрасывания монеты немного чаще заканчиваются падении той стороной, которая была сверху в начале — так что если вы начнете подбрасывание с монеты, лежащей орлом вверх, она немного более вероятно упадет орлом вверх.

И в случае с мошенничеством, и в реальном подбрасывании вам нужно подходящее пространство исходов: начальная сторона и противоположная сторона. Чтобы добиться честного подбрасывания в реальном мире, вам понадобится дополнительный шаг: случайным образом — с равной вероятностью — выбрать начальную сторону, а затем подбросить монету.

Эти допущения быстро накапливаются. Чтобы получить честное подбрасывание, нам пришлось проигнорировать падение на ребро, предположить отсутствие мошенничества и равную вероятность выпадения начальной стороны. Вместе эти допущения составляют модель подбрасывания монеты со случайными исходами. Теория вероятности говорит нам о долгосрочном поведении этой случайной модели. В случае с моделью монеты, вероятность описывает, сколько монет из множества подбрасываний выпадет орлом.

Но вместо использования случайной модели, почему бы просто не решить задачу с подбрасыванием монеты с помощью физики? На самом деле, ученые так и сделали, и физика показывает, что малейшие изменения в скорости вращения монеты определяют, выпадет орел или решка. Эта чувствительность делает подбрасывание монеты непредсказуемым, поэтому случайная модель здесь хорошо подходит.

Частота против вероятности

Вероятность отличается от частоты, которая представляет собой долю событий в конкретной последовательности. Например, если вы подбросите монету восемь раз и получите два орла, это частота в 25%. Даже если вероятность выпадения орла при подбрасывании монеты в долгосрочной перспективе составляет 50%, каждая короткая серия подбрасываний будет отличаться. Четыре орла и четыре решки — это наиболее вероятный исход из восьми подбрасываний, но возможны и другие события, и они будут происходить.

Частота и вероятность совпадают только в одном особом случае: когда количество наблюдений стремится к бесконечности. В этом смысле вероятность говорит нам о долгосрочном поведении.

Прочитайте также  Новое окно во Вселенную: обсерватория Веры Рубин покажет первые снимки

Применение в ИИ, криптографии и статистике

Вероятность полезна не только для предсказания подбрасывания монеты. Она лежит в основе многих современных технологических систем.

Например, системы ИИ, такие как большие языковые модели (LLM), основаны на предсказании следующего слова. По сути, они вычисляют вероятность для слов, которые следуют за вашим запросом. Например, на запрос «Нью-Йорк» вы можете получить предсказанные слова «Сити» или «штат», потому что в обучающих данных эти слова следуют чаще всего.

Но поскольку вероятность описывает случайность, результаты работы LLM случайны. Как и последовательность подбрасываний монеты не гарантирует одинаковый результат каждый раз, если вы зададите LLM один и тот же вопрос снова, вы, скорее всего, получите другой ответ. По сути, каждое следующее слово обрабатывается как новое подбрасывание монеты.

Случайность также является ключевым элементом в криптографии — науке о защите информации. Криптографическая связь использует общий секрет, например пароль, для обеспечения безопасности информации. Однако для безопасности недостаточно простой удивительной случайности, именно поэтому выбор удивительного слова — плохой пароль. Общий секрет безопасен только в том случае, если его трудно угадать. Даже если слово необычное, реальные слова угадать легче, чем подбрасывать «монету» для каждой буквы.

Вы можете создать гораздо более надежный пароль, используя вероятность для случайного выбора символов на клавиатуре — или, что еще лучше, использовать менеджер паролей.

Наконец, случайность имеет ключевое значение в статистике. Статистики отвечают за разработку и анализ исследований, чтобы максимально эффективно использовать ограниченные данные. Эта практика особенно важна при изучении медицинских методов лечения, потому что каждый пациент — это чья-то жизнь.

Золотым стандартом является рандомизированное контролируемое исследование. Участников распределяют для получения нового лечения или текущего стандарта лечения на основе честного подбрасывания монеты. Может показаться странным проводить это распределение случайным образом — использовать подбрасывание монеты для принятия решений о жизни людей. Однако непредсказуемость играет важную роль, поскольку она гарантирует, что ничто в личности человека не влияет на его шанс получить лечение: ни возраст, ни пол, ни раса, ни доход, ни какой-либо другой фактор. Непредсказуемость помогает ученым убедиться, что только лечение вызывает наблюдаемый результат, а не какой-то другой фактор.

Однако важно помнить, что вероятность — это всего лишь инструмент, и его применение требует осторожности. В реальном мире события редко бывают полностью независимыми, как подбрасывания монеты. Например, прогноз погоды говорит: «Вероятность дождя завтра — 70%». Это не означает, что дождь пойдет в 70% времени или на 70% территории. Это означает, что при подобных атмосферных условиях в 70% случаев в прошлом шел дождь. Это условная вероятность, основанная на исторических данных, но она не может гарантировать, что завтрашний день будет точно таким же, как любой из дней в прошлом.

Кроме того, существует разница между теоретической вероятностью и субъективной. Теоретическая вероятность (как с монетой) основана на симметрии и известных параметрах. Субъективная же вероятность отражает нашу личную уверенность в каком-либо событии, например, «я уверен на 90%, что успею на поезд». Эта оценка основана на опыте, но не является строго математической.

Так что же означает вероятность?

Как и любой раздел математики, вероятность — это всего лишь модель, а значит, она не может идеально описать мир. В рассмотренных примерах вероятность полезна для описания долгосрочных тенденций и использования непредсказуемости для решения практических задач. Понимание ее сильных сторон и ограничений позволяет нам эффективно применять этот инструмент — от создания более надежных паролей до разработки спасающих жизни лекарств. И хотя полного, интуитивно понятного определения вероятности, возможно, до сих пор не существует, ее практическая ценность для науки и повседневной жизни неоспорима.

Поделитесь в вашей соцсети👇

Ваш комментарий

Добавить комментарий