Теория вероятностей
Видео и статья на тему «Математика за 20 уроков»
Раздел 1. Примеры вероятностей в жизни (00:00)
Ученик просыпается утром и думает: «Вот приду в школу, а школа закрыта. Все заболели. У всех грипп, например». Это невероятно, хотя для каждого человека в отдельности заболеть гриппом (особенно во время эпидемии) вполне вероятно.
На самом деле, мы все умеем вычислять вероятности, хоть и очень грубо. Мы живём в вероятностном мире.
Вот событие: «Кто-нибудь в классе сегодня болен» имеет высокую вероятность. А то, что заболел гриппом конкретный человек, например, мой друг, Петя Иванов – это событие с низкой вероятностью. Все мы это понимаем, хотя и не обязательно точно вычисляем математически.

Рассмотрим другой пример – ситуацию на автобусной остановке. Предположим, что мы знаем интервал движения автобуса № 72 – 10 минут. Я подбегаю к остановке и спрашиваю: «Давно уехал?». Если моего автобуса давно не было, то стоит подождать, а если только что ушёл, а идти надо всего несколько кварталов, то быстрее будет идти пешком.
Раздел 2. Страхование (01:50)
Вам предлагают в аэропорту застраховать сумку за 200 рублей. Вы должны принять решение, стоит страховать или нет. Как ответить на этот вопрос? У меня в сумке вещей на 20000 рублей (см. рис. 1). Говоря другими словами, я бы обменял её на 20000 рублей. Страховать мне её или нет?
Рис. 1. Ценность багажа
Если вероятность того, что что-то случится с сумкой больше 1%, то стоит её застраховать, а если меньше – то нет (см. рис. 2).
Рис. 2. Оценка необходимости страхования багажа
Сколько раз мы должны страховать багаж, чтобы набрать сумму 20000 рублей, при стоимости страховки 200 рублей? N = 20000/200 = 100 раз. Получается, что если мы 100 раз будем страховать багаж и с сумкой ничего не произойдёт, то мы это делали зря. Значит, на 100 раз страхования должен наступить хотя бы один страховой случай. Поэтому p₀ = n/N = 1/100 = 1%. Если вероятность наступления страхового случая больше 1%, значит, есть смысл страховать багаж, так как за 100 раз страхования мы можем потерять сумку не только один, но и два, и даже больше раз. Если вероятность наступления страхового случая меньше 1%, то страховать багаж невыгодно.
В жизни мы так приблизительно по такой же логике и принимаем решения. То, что для нас очень важно (по нашим оценкам) – мы страхуем.
Тут можно сделать маленькое предостережение. Нас могут упрекнуть, например, «Вот я вас послушал и не застраховал, а у меня в первом же полёте с багажом что-то произошло». Нужно отличать вероятностное ожидание от того, что может произойти.
Раздел 3. Предсказание и вероятность (03:21)
Когда мы подбрасываем монету, то знаем, что в среднем, если будем очень много раз бросать, приблизительно половину раз будет выпадать орёл, а половину – решка (см. рис. 3).
Рис. 3. Вероятность выпадения орла или решки
Но никто не гарантирует, что у нас не может выпасть орёл десять раз подряд или даже больше (см. рис. 4). Хотя это почти невозможно, как с примером, если весь класс заболел и вам можно не идти в школу.
Рис. 4. Выпадение орла 10 раз подряд
Если на этом уроке вас вызвали к доске, то на следующем, скорее всего, не вызовут. Это также является классической оценкой вероятностей. Однако гарантии, что второй урок подряд вам не придётся отвечать у доски, нет. Учитель может забыть, что на прошлом уроке вас уже спрашивал, может быть замена и придёт другой учитель и т.д. Но если такая ситуация происходила много-много раз, то окажется, что «повторных» ответов у доски оказалось очень мало. То есть вероятность этого является низкой.
В большей части случаев, мы ведём себя более или менее правильно: например, страхуем дорогие или очень ценные для нас вещи и т.д. Другое дело, что наши решения не всегда могут быть точными, так как мы живём в вероятностном мире. И теория вероятностей это не что-то совсем далёкое, а это модель для решения наших повседневных задач: страхование, поведение на остановке и т.д.
Раздел 4. Определение вероятности (04:50)
Есть ситуации, в которых мы рассуждаем, как будто бы с точки зрения теории вероятностей, но на самом деле ошибаемся. Например, какова вероятность того, что, выйдя на улицу, вы встретите человека в красном костюме, который едет на жёлтом велосипеде с одним колесом? Можно рассуждать так.

Есть два события: я его встречу и я его не встречу. Вероятность каждого равна 1/2.
Но ошибка в том, что мы считаем, что эти события равновероятны.
Мы говорим, что «встречу» и «не встречу» – это одинаковые по своей ценности события. На самом деле, конечно же, нет. Потому что на то, что вы встретите этого человека, если разбирать математически, влияет множество различных факторов: сколько вообще людей ездит в красных костюмах и т. д.

Рассмотрим аналогичную задачу, которую можно решить с использованием математической модели.

Возьмём игральную кость, она имеет шесть граней. Какова вероятность того, что при броске выпадет единица? Можно рассуждать так же, как и в предыдущем примере: или выпадет, или не выпадет: p(1) = 1/2 (см. рис. 5). Хотя каждому ясно, что p(1) = 1/6, потому что нужно учесть полный набор вариантов (см. рис. 6).
Рис. 5. Ложная вероятность выпадения 1
Рис. 6. Полный набор вариантов при подбрасывании игральной кости
Когда рассуждаем о чём-то, нужно переходить в более простые, но всё же эквивалентные формулировки.
На примере для кубика наглядно видно, почему эти события не являются равновероятными: каждая из граней может выпасть с одинаковой вероятностью, но суммарная вероятность (какое-то число на одной из граней всё-таки выпадет) равна 1. Это охватывает всё поле событий (см. рис. 7).
Рис. 7. Вероятность выпадения 1 и не 1
В примере с человеком мы тоже кого-то встретим, только не известно кого. Суммарная вероятность так же равна 1, можем разбить это поле событий на два варианта: или встретим кого-то, или нет. Но эти события разной вероятности. Например, 1/1000000, что встретим и остальное, что не встретим. Т.е. вероятность встретить такого человека около нуля. Для кубика понятно, что все грани одинаковые, поэтому каждой грани нужно отвести равную вероятность p(1) + p(2) + ... + p(6) = 1. Вероятность – это отношение количества благоприятных исходов к общему количеству исходов, т. е. получается p = 1/6 (см. рис. 8).
Рис. 8. Определение вероятности
Какая вероятность того, что выходя из дома, я увижу машину с чётным номером? Вероятность 1/2 (чётных и нечётных номеров, как и цифр, одинаковое количество). Но я могу выйти, а номер первой машины заканчивается на 7. А второй – на 3. Что же тогда?

Вероятность показывает, что если мы будем отслеживать номера достаточно большого количества машин, например, 1000, то увидим, что около половины номеров будут чётными. Или, если, например, 1000 человек выйдет из подъезда, то из них, 490 или 510 увидят чётные номера (то есть, около 500).
При этом очень важно при проведении таких экспериментов отслеживать, чтобы выборка действительно была случайной.
Например, если вы будете проводить эксперимент с машинами в городе, в котором по какой-то причине не используется цифра 3 или 7 в автомобильных номерах, то вероятность встретить машину с чётным номером будет больше, чем 1/2, так как таких номеров в городе больше, чем нечётных. Когда мы говорим про вероятности, очень важно понимать, что мы случайным образом что-то делаем (моделируем ситуацию). Например, бросаем монетку. Если её подбрасывает автомат, нужно понимать, как задать ему эту случайность: силу броска, закручивание и т. д.
Раздел 5. Зависимые и независимые события (09:04)
В казино людям часто кажется, что они смогут отыграться: мол, если мне не везло, то должно начать везти. Мы сейчас даже не говорим о том, что вероятности в казино рассчитаны таким образом, чтобы казино не оставалось в минусе (при большом количестве игроков или игр).

Вспомним пример с остановкой и автобусом. Там были зависимые события – время прибытия следующего автобуса обычно зависит от того, когда уехал предыдущий.

А вот если вам сейчас зазвонил телефон, то это никак не влияет на вероятность того, что через минуту он опять вам позвонит (см. рис. 9), хотя, может быть, вам звонят редко. Такие события называются независимыми.
Рис. 9. Иллюстрация примера со звонками
Вернёмся к игре в казино. Оказывается, что если я начал проигрывать, т. е. ушёл в отрицательную область (см. рис. 10), то большая вероятность, что я там так и останусь. Если нас пришло играть 1000 игроков, то в среднем, 500 человек будет в плюсе, а 500 в минусе.
Но для каждого, если он уже ушёл в какую-то область, велика вероятность, что он в ней и останется. Поэтому глупо думать, что если вам долго не везло, то сейчас обязательно должно повезти.
Рис. 10. Области выигрыша и проигрыша
Понятно, что когда мы говорим «выигрывает» или «проигрывает», мы не говорим о сумме выигрыша. Потому что можно быть в плюсе, поставить всё на кон, один раз проиграть и остаться с нулём. Мы говорим про то, что если делать небольшие фиксированные ставки, то с большой долей вероятности, в среднем (не локально, а глобально), мы будем либо всё время расти, либо всё время уходить вниз (см. рис. 11).
Рис. 11. Иллюстрация примера с выигрышем и проигрышем
Каждый раз вероятность проиграть или выиграть, если мы просто кидаем монетку, равна 1/2 (см. рис. 12). Но большая вероятность того, что мы останемся в одной плоскости. Отсюда следует и то, что если у меня меньше денег, а у вас намного больше, то мне с вами в «орёл-решку» не стоит играть. Большая вероятность, что я быстро проиграю.
Рис. 12. Вероятность проигрыша или выигрыша
Это не единственный пример того, где наша интуиция и навыки нас подводят при решении вероятностных задач.
Раздел 6. Ошибки при принятии решений (11:53)
Нам сообщили, что анализ домашнего животного, собаки, на какую-то болезнь дал положительный результат. При этом мы знаем, что точность анализа 0,001, то есть он ошибается 1 раз из 1000 (см. рис. 13). Заболело ли наше животное на самом деле?
Рис. 13. Оценка вероятности болезни животного
Оказывается, что всё зависит от того, насколько часто эта болезнь встречается у собак. Предположим, из миллиона собак ею болеют сто. Тогда при проверке этого миллиона собак приблизительно 1000 раз прибор сообщит о болезни (на каждую 1000 проверок – одна ошибка) (см. рис. 14). Но, на самом деле, больных не больше 100 (по статистике). Т.е. вероятность правильности анализа не больше 10%:
p правильностианализа ≤ 100/1000 ≤ 10%. Поэтому анализы и обследования всегда нужно проходить хотя бы у двух разных врачей или на разных приборах. Если, конечно, почти все болеют этой болезнью, тогда вероятность правильности результата даже одного анализа будет высокой.
Рис. 14. Вероятность редкого события
Это пример того, как мы не оцениваем условность вероятности. Или ещё пример: принесли какое-то известие. Какая вероятность, что известие неправильное, не по адресу? Нужно учитывать доверие к источнику и редкость события. По формуле Байеса, которая используется в теории вероятностей, можно вычислять такие вещи.

Ещё один пример того, когда мы неправильно определяем большее множество, меньшее множество и, соответственно, вероятность события.

Формулировка задачи: Линда – зрелая женщина 30 лет, она полна сил и энергии. На торжественных мероприятиях она любит говорить красивые тосты, при этом может, не моргнув глазом, осушить стакан вина. Кроме того, её раздражают любые проявления дискриминации и она с удовольствием участвует в демонстрациях в защиту африканских носорогов.

Вопрос: что более вероятно, что Линда – бухгалтер или что Линда – бухгалтер и феминистка? Большая часть людей отвечает, что, конечно, бухгалтер и феминистка (ведь в задаче явно перечислены характеристики, указывающие на то, что Линда – феминистка). Хотя если нарисовать множество всех женщин-бухгалтеров (см. рис. 15), то понятно, что множество женщин-бухгалтеров и феминисток будет находиться внутри множества женщин-бухгалтеров. Следовательно, вероятность того, что Линда просто бухгалтер будет больше.
Рис. 15. Множества «женщины-бухгалтеры» и « женщины-бухгалтеры и феминистки»
Раздел 7. Философские вопросы (16:23)
Представим, что мы – мастера спорта по шахматам. Во время игры к нам подходит молодой человек и спрашивает: «Как вы считаете, исход игры предопределён или он случаен?» Вы скажете: «Что за глупость? Мы же играем». Силы у нас приблизительно равные. Так что же, детерминированы исходы или случайны? Это вопрос, который сформулировал Лаплас.
Есть такая вещь, как свобода воли. Когда я играю, я могу сделать различные ходы и это моя свобода воли. Поэтому рассуждать в плоскости детерминировано это или случайно – неправильно. Можно сказать, что свобода воли зависит от эмоций, настроения и т. д., что в свою очередь определено тем, когда мы сели играть.
Если все действия преступника детерминированы генетикой, окружающей средой и прочим, то мы его и судить не имеем права. Если они случайны, то тем более не можем судить.

Логика и теория вероятности – два направления математики, которые дали большое количество парадоксов, потому что они очень тесно связаны с жизнью, мышлением, с выбором, а это всегда рождает какие-то противоречия.

То как мы думаем о нашем мире – это модели. В некоторых ситуациях они помогают, если они оказываются противоречивы, то мы стараемся их уточнить. Наши идеальные модели сталкиваются с реальным миром, и тогда могут возникать парадоксы.

Другие материалы