Контринтуитивная математика и стратегия прогрессивных нокаут-турниров

Содержание

  1. Правила игры в турниры с прогрессивными нокаутами (PKO)
  2. Дополненная модель IKCM для расчетов в PKO-турнирах
  3. Контринтуитивное свойство прогрессивных нокаутов: кому принадлежит наша награда
  4. Равен ли наш эквити баунти пула нашему Chip EV эквити?
  5. Как отличается стратегия в нокаут-турнирах от стратегии в прогрессивных нокаут-турнирах
  6. Как анализировать раздачи из турниров с прогрессивными нокаутами в ICMIZER
  7. Видео: Стратегия в МТТ турнирах с Прогрессивными Нокаутами с ICMIZER 3
  8. Выводы

Правила игры в турниры с прогрессивными нокаутами (PKO)

Прогрессивные нокаут-турниры (Progressive KnockOut) — это подвид нокаут-турниров, в которых за выбивание оппонента вы получаете половину размера его текущего баунти, а вторая половина прибавляется к текущей награде за выбивание из турнира вас. Победитель турнира с прогрессивными нокаутами получает награду за себя, остальные игроки при этом из своей собственной награды не получат ни доллара.

Таким образом, в процессе турнира растет награда за выбивание игрока, который на предыдущих этапах выбил несколько других игроков. В этом состоит отличие турниров с прогрессивными нокаутами от обычных нокаут-турниров, где награда за любого игрока фиксирована и не зависит от его истории в турнире.

Дополненная модель IKCM для расчетов в PKO-турнирах

Из-за хитрой логики выплат PKO-турниры представляют собой самый большой вызов из всех поддерживаемых в ICMIZER турниров к алгоритму оценки EV стеков игроков. Для работы модели необходимо знать стеки игроков, их текущие награды, а также обычные турнирные выплаты (принятый список выплат за финиш на определенном месте).

Расчеты с Chip EV в PKO-турнирах не имеют никакого смысла, поскольку индивидуальные награды за игроков могут кардинально изменить решение в турнире. Поэтому в ICMIZER их нужно разбирать только в режимах ICM %EV или ICM $EV.

Сложность и время работы алгоритма перевода турнирных данных в турнирные доли с использованием модели IKCM в PKO-турнирах с увеличением числа игроков за столом растут очень быстро. Сейчас ICMIZER способен поддерживать максимум девять игроков за столом.

Использование модели Future Game Simulations (FGS) в PKO турнирах доступно для восьми и меньше игроков за финальным столом. Это связано со слишком большим объемом необходимых вычислений для девяти игроков.

Контринтуитивное свойство прогрессивных нокаутов: кому принадлежит наша награда

В качестве примера рассмотрим такую турнирную ситуацию на финальном столе PKO-турнира:

Осталось 6 игроков, и награда за нас составляет $100 (поскольку мы выбили всех игроков в турнире). Остальные игроки при этом сидят с начальной наградой по $1 за каждого.

Внимание, вопрос: с точки зрения текущей претензии на турнирную долю, кем выгоднее быть в данной ситуации – героем или любым другим игроком?

Интуитивно может показаться, что герой не может сам себя выбить, а значит, в меньшей степени претендует на свои $100. При этом максимум, на который он может претендовать, — $1 награды за других игроков.

Мы можем посчитать, что быть игроком на HIJ или BB выгоднее, чем игроком на UTG (в данном случае мы не берем в расчет уже полученные нокаут-выплаты героя за выбитых игроков, а только текущее EV стеков каждого игрока).

А теперь правильный ответ. EV всех игроков в данном случае одинаковое, они в равной степени претендуют на суммарный пул PKO-выплат – прямо пропорционально своему стеку и независимо от непосредственной награды.

Герой получает нокаут за себя только в случае завершения турнира на первом месте, а учитывая, что стек героя равен стекам других игроков, и его шанс занять первое место равен ⅙. С вероятностью ⅚ он награду за себя не получит, то есть остальные 5 игроков в равной степени претендуют на его награду. Это означает, что и их доля в баунти героя равна ⅙ на каждого.

Важное следствие из этого свойства: в начале PKO-турнира мы не заинтересованы увеличивать (или не увеличивать) баунти за нас в отрыве от получения нокаут-части, которую выплачивают сразу за выбивание любого игрока. Если в обычном нокаут-турнире за выбивание мы сразу получаем всю награду, то в PKO-турнире мы получаем только половину. Соответствующим образом изменяется и размер нашего баунти. Это означает, что при равной награде за выбивание в PKO- и KO-турнире нам в 2 раза менее выгодно выбивать оппонентов в PKO-турнирах, чем в обычных.

Равен ли наш эквити баунти пула нашему Chip EV эквити?

Это было бы очень удобно. И посмотрите – эквити баунти пула равен Chip EV эквити в примере выше, когда все стеки одинаковы. Значит, это должно быть так и является правдой? Это позволило бы нам определять PKO эквити для полей бесконечного размера и охватывать крупнейшие PKO турниры.

Ниже пример, показывающий, что все намного сложнее. И что не только наш эквити баунти пула не основан на Chip EV эквити, но он также зависит от того, как именно баунти распределились между игроками.

В то время, как у игрока на баттоне в 150 раз больший стек, чем у двух остальных игроков, очевидно, что он вряд ли может рассчитывать на получение своего Chip EV из баунти пула 2,000$, который будет равен 1,500 / 1,520 × 2,000$ = 1,974$, если подход, основанный на Chip EV был бы верным.

На самом деле должно быть очевидно, что у BTN нет возможности помешать игрокам на SB и BB воспользоваться отличным шансом выбить друг друга и сразу же получить за выбивание игрока около 500$ из баунти пула или 25% от него, несмотря на их супер короткие стеки.

Согласно TrueBounty модели для PKO в ICMIZER, стеки в этой ситуации имеют следующие значения:

Таблица 1. Эквити по модели TrueBounty в ICMIZER

Стек Баунти Эквити % Эквити $
1,500 10$ 86% 1,720$
10 995$ 7% 140$
10 995$ 7% 140$

Таблица 2. Эквити по упрощенной модели Chip EV Bounty (пропорциональная модель)

Стек Баунти Эквити % Эквити $
1,500 10$ 98.68% 1,974$
10 995$ 0.66% 13$
10 995$ 0.66% 13$

Как мы видим, модель Chip EV Bounty (пропорциональная модель) недооценивает короткие стеки на 900% или «продает» их в 10 раз дешевле, чем более разумный подход. Большой стек также оценивается неправильно, в этом сценарии между 1,974$ и 1,720$ есть значительная разница.

Что забавно в подходе Chip EV, так это то, что он игнорирует фактическое распределение баунти – он просто суммирует их и работает с суммой.

Давайте поменяем местами баунти для большого и короткого стеков и посмотрим на эквити баунти пула с помощью TrueBounty модели в ICMIZER:

Таблица 3. Эквити по модели TrueBounty в ICMIZER после замены баунти BTN и SB

Стек Баунти Эквити % Эквити $
1,500 995$ 92.57% 1,851.4$
10 10$ 6.73% 134.6$
10 995$ 0.70% 14$

Здесь мы можем заметить несколько интересных изменений.

Во-первых, теперь, когда у большого стека большой баунти, его эквити намного ближе к его Chip EV эквити, чем в предыдущем примере.

Во-вторых, и гораздо важнее, мы можем видеть, что в то время, как стеки SB и BB равны, их эквити – нет. В подходе Chip EV эквити равных стеков всегда одинаковы из-за упрощенной формулы, используемой в модели Chip EV Bounty (пропорциональная модель).

Чтобы понять, почему эквити SB почти в 10 раз больше эквити BB, нам необходимо рассмотреть, как они могут попытаться реализовать свое баунти эквити. Игроку на большом блайнде нужно выбить большой стек, чтобы получить что-нибудь, кроме 5$ за выбивание SB. Шансы на такой исход, конечно, очень малы.

Однако, игрок на малом блайнде может выбить игрока на BB с разумной вероятностью, и сразу получить половину своего баунти. Ему потребуется невероятная удача, чтобы попытаться получить награду от BTN, поэтому его EV составляет примерно 1/3 × 500$ или 137$.

Теперь мы можем сделать вывод о следующей важной особенности баунти-турниров: в прогрессивных баунти-турнирах игроки с одинаковыми стеками не имеют одинакового эквити, если только все стеки не одинаковы. Таким образом, хорошая модель должна демонстрировать разные эквити, как в приведенном выше примере, в то время как подход, основанный на упрощенной Chip EV Bounty модели (пропорциональная модель), будет выдавать одинаковое EV для SB и BB в примере из таблицы 3. Этого должно быть достаточно для профессиональных игроков, чтобы предпочесть более точную модель, которая предлагается с ICMIZER.

Как отличается стратегия в нокаут-турнирах от стратегии в прогрессивных нокаут-турнирах

В обычных нокаут-турнирах баунти за игрока не зависит от стадии турнира. И в начале турнира на 2000 человек, и на финальном столе за его выбивание мы получаем одинаковую сумму денег. При этом в ранней фазе турнира баунти составляет значительную часть от ЕВ нашего стека, поэтому возможность выбить оппонента на ранней фазе сильно влияет на наше решение. В поздней же фазе нокаут-турнира гораздо важнее занять наилучшее из возможных мест и получить соответствующий приз, чем выбить игрока, поскольку в поздней стадии размер нокаут-премии будет составлять очень небольшой процент в нашей турнирной доле.

В PKO-турнире динамика изменения стратегии несколько иная. В ранней фазе мы примерно так же заинтересованы в выбивании оппонентов, как и в KO-турнирах, поскольку в PKO баунти пул обычно составляет 50%, а в большинстве KO-турниров он меньше (примерно 20%). Поэтому, учитывая меньшую заинтересованность в PKO, из-за большего размера баунти-части их роль в ранней стадии МТТ турнира примерно равная и довольно высокая.

Здесь стоит заметить, что многие игроки ошибаются, играя интуитивно, и играют на ранней стадии более тайтово, чем нужно. Хотя именно на ранней стадии выбивание оппонента и в KO, и в PKO дает очень большую выгоду.

В поздней стадии PKO-турнира средний размер баунти за игрока сильно возрастает. поэтому роль получения баунти за оппонента в поздней стадии таких турниров выше, чем в KO. А из-за того, что баунти за разных игроков с одинаковыми стеками в поздней фазе может отличаться в несколько раз, в некоторых ситуациях стратегия в PKO-турнире будет очень сильно отличаться от стратегии в аналогичном не прогрессивном KO-турнире. Этот принцип действует, даже если вся разница заключается только в расположении и размере баунти.

И здесь, на поздней стадии, играя интуитивно, многие игроки ошибаются и делают слишком лузовые коллы, пытаясь получить нокаут за выбивание игрока. Такой ход может стать катастрофически дорогой ошибкой в KO-турнире. Это относится и к PKO, если выплата за конкретного игрока не слишком сильно изменилась с начала турнира.

За первое место игрок в PKO-турнире получает свой баунти целиком и баунти за второго игрока, поэтому в финальной стадии PKO-турнира возрастает важность игры на первое место. Победитель гарантированно получит несколько крупных баунти, а также баунти за себя.

Для того чтобы точно учитывать все факторы, влияющие на наше решение в турнире, необходима помощь программных средств, то есть ICMIZER. Интуитивно понять, как именно нужно играть в той или иной ситуации, в PKO-турнире просто невозможно. Конечно, интуицию можно развить, но для этого понадобится проанализировать не одну сотню раздач с использованием модели IKCM.

Как анализировать раздачи из PKO-турниров в ICMIZER

Для того чтобы выработать правильную стратегию прогрессивных нокаут-турниров, необходимо правильно задавать в ICMIZER два параметра: PKO-турнир и раздачу с баунти за игроков.

Рассмотрим ситуацию, когда в списке доступных турниров ICMIZER нет того PKO-турнира, раздачу из которого вы разбираете. В таком случае первый шаг перед разбором раздачи – это правильное создание нового PKO-турнира в ICMIZER, а второй шаг – загрузка раздачи с баунти, назначение диапазонов и получение пуш/фолд-чартов для героя.

После того как PKO-турнир будет создан, напротив каждого игрока появится поле для ввода баунти. Их можно заполнять вручную, но проще загрузить раздачу из PKO-турнира в виде текста, и тогда все стеки и баунти будут заполнены автоматически.

Рассмотрим оба шага анализа раздачи из PKO-турнира более подробно.

Шаг 1: Создаем новый PKO-турнир в ICMIZER на основе реального турнира

При создании PKO-турнира важно правильно задать число игроков, изначальный размер нокаута и девять первых выплат. Помимо этого, очень важно обеспечить правильное соотношение призового фонда и нокаут-фонда турнира. В большинстве турниров PokerStars они соотносятся примерно 50 на 50.

Рассмотрим процесс создания PKO-турнира по шагам, например, турнир Bounty Builder за $22 (приведенный на скриншоте).

Открываем диалог создания нового турнира. Сначала заполняем следующие поля: число игроков 895, размер нокаута 10 и выплаты с первой по 9.

После того как мы заполнили эти поля, мы распределили $14,485.94 призового фонда, хотя реальный призовой фонд в нем $17,900.

Дальше у нас есть два варианта заполнения оставшихся выплат PKO-турнира:

  • Полное заполнение, то есть точный ввод всех призов за все места. Если заполнить все выплаты, результаты расчетов, безусловно, будут корректными. Но полный вариант потребует больше времени. Единственное, на что влияют все выплаты после десятой с точки зрения расчетов, – общий размер призового фонда. Но есть и более простой способ его правильно задать.

На скриншоте видно, как заполнены все выплаты в соответствии с турниром. Видно также, что призовой фонд в диалоге создания турнира совпадает с реальными $17900. Можно нажимать кнопку Create и разбирать раздачи с финального стола.

  • Упрощенный вариант. Все те точные данные по выплатам с 10 по 108 место при расчетах будут нужны только для выяснения размера призового фонда, точнее, того его процента, который не относится к баунти-части. Поэтому можно воспользоваться упрощенным способом.

Мы вводим в 10 выплату, например, $100. А затем меняем размер зоны с 10 места так, чтобы итоговый призовой фонд составил примерно $17,900 (небольшая погрешность в пределах $20 здесь на результаты расчетов принципиально не повлияет).

Как видно на скриншоте, мы создали зону с выплатами в $100 за финиш на местах с 10 по 43, и призовой фонд составил примерно $17900. Можно нажимать Create и разбирать раздачи. При этом мы получим практически такие же результаты, как и при полном заполнении всех выплат.

Внимание: если не воспользоваться ни первым, ни вторым способом и оставить лишь 9 выплат с неправильным призовым фондом турнира, то и результаты расчетов будут неправильными.

После создания PKO-турнира рядом с ним будет отображаться соответствующая иконка.

Шаг 2: Загружаем раздачу и находим оптимальную стратегию игры в турнире с прогрессивными нокаутами

После того как вы выберете в списке турниров PKO-турнир, появится новый столбец для ввода баунти для игроков.

Баунти можно вводить вручную, но проще всего загружать раздачи PokerStars в виде текста (с недавнего времени они добавили размер нокаут-премии в текст раздачи). Загрузка, таким образом, стала намного удобнее.

Когда в турнире осталось меньше 9 игроков, ICMIZER позволяет использовать для расчетов все преимущества модели FGS в комбинации с моделью IKCM для PKO-турниров.

На данный момент ICMIZER — единственный калькулятор в мире, который позволяет производить расчеты в PKO-турнирах с использованием FGS.

После создания турнира PKO процесс разбора раздач в ICMIZER ничем не отличается от разбора раздач в обычных турнирах. Единственное исключение – необходимость точно задать размеры баунти за каждого игрока.

Процесс анализа раздачи в ICMIZER состоит из трех шагов:

  1. Ввод раздачи, например с помощью загрузки текста этой раздачи с помощью кнопки Paste hand history.
  2. Назначение диапазонов оппонентов, например с помощью кнопки Calculate Nash equilibrium, ручного ввода или комбинации двух этих способов.
  3. Получение результатов — Calculate для получения пуш/фолд-чартов героя или Charts для получения зависимостей нашего решения от диапазона одного из оппонентов.

Видео: Стратегия в МТТ турнирах с Прогрессивными Нокаутами с ICMIZER 3

В данном видео уроке мы демонстрируем, как анализировать и строить пуш/фолд чарты для ситуаций в турнирах с прогрессивными нокаутами в МТТ задолго до финального стола – в ранней, средней и поздней стадиях.

Также в видео разобран целый PKO турнир, где игроку удалось занять первое место, с использованием автоматического анализа раздач и подробными комментариями по самым дорогим ошибкам.

Выводы

ICMIZER — первый в мире калькулятор, позволяющий анализировать PKO-турниры c использованием FGS. Мы потратили много сил, оптимизируя производительность алгоритмов, и теперь вы можете легко и быстро находить математически выверенные оптимальные решения в этих непростых турнирах.

Стратегия в турнирах с прогрессивными нокаутами может довольно сильно меняться в зависимости от стадии турнира и обладает интересной и сложной динамикой – как для новичков, так и для более опытных игроков. За счет обучения в ICMIZER вы сможете получить над вашими ничего не подозревающими оппонентами значительное преимущество, принимая выгодные контринтуитивные решения на каждой стадии этих турниров.