Бетаматика: победите букмекеров

Стратегии

Футбол под капотом

Стратегии

Футбол - это игра, основанная на навыках, в которой результат игры зависит от множества факторов, и его можно рассматривать как случайную величину. Таким образом, ставки без какой-либо стратегии не являются возможным способом получить прибыль от такой высококонкурентной игры. Одной из таких стратегий может быть размещение ставок в соответствии с пониманием ситуации на соревнованиях и хорошим знанием игры. Альтернативной стратегией могло бы стать построение математической модели на основе статистики. Мы решили построить стратегию на математической основе, и в этом разделе мы объясним наши модели.

Были созданы и проверены три разные модели: модель на основе ранжирования, модель ожидаемой цели и модель, которая использует систематические ошибки в шансах.

Проверка

Прежде чем вдаваться в подробности, давайте посмотрим, как работают модели. Чтобы выяснить, что мы делали фальшивые ставки в соответствии с предложениями моделей, результат показан на следующем рисунке.

Мы видим, что наша модель ожидаемых целей довольно плохая и теряет все деньги в течение нескольких недель. Модель Эло приносит деньги в этом году, но в другие годы - нет, и колебания велики по сравнению с моделью смещения вероятностей. Модель, которую мы считаем лучшей, - это модель смещения вероятностей, потому что она имеет небольшие колебания и приносит деньги с 2013 года. Именно эту модель мы используем на этой веб-странице.

Модель Эло

Наша модель Эло основана на рейтинговой системе Эло, широко используемой как в шахматах, так и в футболе аккаунт в 1 win. Короче говоря, система присваивает каждой команде балл в зависимости от того, насколько они хороши, и награждает команды-победители за счет увеличения их баллов. Если команда с большим количеством очков играет с командой с меньшим количеством очков, ожидается, что лучшая команда, то есть команда с большим количеством очков, выиграет и, таким образом, не повысит свой рейтинг намного в случае победы. Однако от команды с меньшим количеством очков, так сказать аутсайдера, не ожидается, что она выиграет, и в этом случае ей будет начислено много очков. Математически это можно контролировать с помощью следующих уравнений: $$ ELO_ = ELO_ + 40 \ влево (1 - \ frac _W- _L>>>\ right) $$ $$ ELO_ = ELO_ + ELO_ - ELO_ $$, где $ W $ означает выигрыш, а $ L $ - проигрыш.

Если мы предположим, что рейтинг Эло является хорошим приближением уровня навыков каждой команды в лиге, тогда вероятность ($ P $) того, что команда хозяев выиграет, может быть записана как: $$ P_ = 1- \ frac -ELO_ >>>$$ а за команду гостей получаем $ P_ = 1-P_ $.

Обратите внимание, что $ P_ + P_ = 1 $, откуда следует, что $ P_ = 0 $. Эта проблема возникает, когда для шахмат была разработана модель Эло, которая имеет двоичный результат. Однако можно расширить модель, чтобы она могла обрабатывать три результата, но поскольку все станет немного запутанным, это не будет здесь рассматриваться, но не стесняйтесь загружать нашу статью, которая охватывает этот вопрос.

Модель ожидаемых целей

Модель ожидаемых целей - это тип модели, который пытается предсказать, сколько голов каждая команда забьет во время встречи, и оценить вероятности исхода на основе этого. Вот краткий обзор того, как работает наша модель ожидаемых целей, более полную информацию см. В нашем документе.

Прежде чем обсуждать, как работает модель, необходимо объяснить, зачем она нужна. Например, мы могли бы просто взять среднее количество голов, забитых командой за определенный период времени, и использовать этот результат для оценки ожидаемого значения количества голов, которые команда забьет. Что ж, если использовать среднее значение за прошлый год, тогда будет достигнуто хорошее приближение к количеству голов, забитых командой, но этот результат бесполезен для улавливания быстрых изменений в работе команды. Чтобы решить эту проблему, простое решение может заключаться в том, чтобы взять среднее значение за гораздо более короткий период времени, например, 3-5 игр. Модель определенно быстро адаптируется к тенденциям, но точность, к сожалению, слишком сильно пострадает, чтобы ее можно было использовать. Таким образом, очевидно, что необходимо найти компромисс между точностью и чувствительностью к тренду, если для прогнозирования результата используется среднее значение.Модель ожидаемых целей может решить проблему.

Недостаток точности связан с тем, что разброс забитых мячей может быть довольно большим, если мы просто рассмотрим от трех до пяти игр. Однако, если для оценки ожидаемого значения использовать другую переменную, которая не так сильно меняется, проблема может быть уменьшена. Вместо этого в модели «Ожидаемое количество голов» используется «количество бросков по воротам».

Так как же оценить ожидаемое количество голов? Представьте, что футбольное поле разделено на большое количество ящиков. Затем записывается количество забитых мячей из каждого бокса для очень большого количества сыгранных игр. Количество бросков, которые превратились в настоящие голы, затем можно разделить на количество бросков по воротам для каждого бокса, и можно оценить вероятность забитого гола из этого бокса. Это будет выглядеть примерно так.

Вместо того, чтобы смотреть на количество забитых мячей, давайте посмотрим на количество бросков по воротам в последних 3-5 играх. Отметим, из какого ящика были сделаны выстрелы, умножим их на соответствующие вероятности гола и просуммируем. Теперь мы достигли нашей цели (без каламбура) и, надеюсь, у нас есть ожидаемое количество целей, которые являются точными и чувствительными к тенденциям.

Модель смещения вероятностей

Согласно критерию Келли, оптимальная доля банкролла $ f $, которую можно разместить на ставке, определяется выражением $$ f = \ frac $$, где $ p $ - это «истинная вероятность» выигрыша, а $ b $ - коэффициент, полученный по ставке. (Эта формулировка немного отличается от той, к которой вы, возможно, привыкли, поскольку у нас есть коэффициенты в формате ЕС, так что $ b>1 $.) Поскольку коэффициенты $ b $ будут предоставлены букмекерами, остается только одно: найти хорошее приближение к $ p $, которое мы называем $ p ^ * $.

Букмекеры попытаются установить такие коэффициенты, чтобы в средней игре они зарабатывали деньги. Представьте, что вы букмекерская контора, и ваши эксперты и модели предсказывают, что в одном матче исход игры $ A $ произойдет с вероятностью $ p_A $. Если у вас затем есть коэффициент $ b_A $, а ваши клиенты поставили на игру в общей сложности $ M_A $, ваш ожидаемый чистый выигрыш составит $$ G = M_A - p_AM_Ab_A = M_A (1-p_Ab_A), $$, который исходит от вас всегда "выигрывают" $ M_A $, но с вероятностью $ p_A $ вы должны вернуть $ M_Ab_A $ своим клиентам. Ставка будет "честной", если $ p_A = \ frac $, так как это делает $ G = 0 $. Букмекеры тогда установят $ b = \ frac

-m $ для каждого из трех исходов в игре, где $ m $ - это небольшая маржа, на которой они рассчитывают заработать свои деньги.

В других моделях мы использовали ранжирование и ожидаемые цели, чтобы получить $ p ^ * $, но что, если мы используем шансы для приблизительного вычисления $ p $? Мы можем сделать это, используя $ p = \ frac$, а затем нормализовав $ p $ так, чтобы вероятности трех исходов в сумме равнялись 1. Непосредственное применение критерия Келли к этой вероятности будет из-за маржи $ m $ , имеют неутешительный результат, заключающийся в том, что ни одна ставка не ожидается прибыльной. Но прежде чем делать поспешные выводы, давайте подробнее рассмотрим, как выглядят эти вероятности.

Пусть $ p_H $, $ p_D $ и $ p_A $ будут вероятностями выигрыша дома, вничью и на выезде, полученными из шансов как $ \ frac$. На рисунке выше мы построили график зависимости $ p_H-p_A $ (преимущество домашней команды) от $ p_D $ (вероятность ничьей) для игр Premier Leauge за последние 10 лет. Синие точки представляют собой шансы-вероятности, а синяя линия - соответствующая линия тренда. (Думайте об этом как о $ \ frac$). Красная линия - это линия тренда для полиномиальной логистической регрессии результатов игры. (Думайте об этой строке как об истинной вероятности $ p $). Несмотря на то, что эти линии расположены близко друг к другу, они не идентичны, что означает, что $ \ frac$ не является идеальной оценкой $ p $. Однако мы можем измерить разницу между красной и синей линиями для каждой точки, которую мы называем $ \ Delta_b $. Если мы теперь сформируем $ p ^ * $ как $$ p ^ * = \ frac+ \ Delta_b $$, мы будем надеяться, что в конечном итоге получим еще лучший $ p ^ * $. Хотя модель, которую мы используем на этой странице, немного сложнее, чем эта, за ней стоит эта концепция.

Отказ от ответственности

Мы не даем никаких гарантий правильности любой информации, представленной на этом сайте. Вы должны использовать ее под свою ответственность, и мы советуем вам понять идею, лежащую в основе модели, и то, как вы можете воспроизвести наши результаты, прежде чем пытаться ее использовать. Мы не виноваты, если вы потеряете свои деньги, но мы с радостью возьмем кредиты, если вы выиграете.

Популярные слоты

Автор: Ирина Акимова
Дата публикации: 05.27.2021
Рейтинг:
2.4