MENU
运彩实战策略Sports lottery tactics
Sports lottery tactics
运彩实战策略

仲博平台游戏攻略秘籍网>运彩实战策略>运彩模型的设计:第二类模型

运彩模型的设计:第二类模型

2017-12-23 17:05:50

接下来我们将讨论第二类模型,也就是先以球场数据为主,推算出比赛结果之后再依其推算赔率,最后佐以定性数据进行细部调整。就像交易员可以推算出参赛双方在比赛中能各得几分,取得两队的预估分数后,开盘就简单了:两队的分数和就是大小盘的分值,两队的分数差就是让分值。有了让分盘跟大小盘,只要经过不同选项的转换,就可以得出其他玩法。以下将用一个棒球模型来说明。笔者会先阐述此模型历经发想、逐步修改乃至建构完成的过程;接着讨论身为一位玩家,该如何选择要攻击的彩池。我刚入行的时候,藉菜鸟的身分跟着许多资深前辈学习到各种业内知识。然而,有关如何制作模型来开盘一事,向来是每个人私藏的秘密;每当讨论到此话题,很多人都语焉不详。不过,也不能说大家都故意留一手,毕竟这是交易员最核心的价值,江湖一点诀,说破就不灵了。因此,那时候的我,成觉就像是在凤寿司的将太,每天试着靠眼睛来偷师前辈们的压箱宝。这里并不是说我每天在偷看别人的计算机,这么做只会让人更不愿意与我分享。每个人开盘的过程都是隐私,但是开盘的结果得公开在部门内讨论,只要长时间观察某位前辈的开盘,或多或少可以发现一些端倪。但是,即使如此,仍未能满足我求知的欲望。后来只好先向前辈请教自己设计模型的概念,看看前辈有没有什么意见,并且趁机询问前辈的开盘观念,从中找出与自己相同或是可以互补的地方。

经过一段时间的研究,惊觉每个人的想法都回然不同。也许是因为这个行业里的交易员或职业玩家,都有着不同的背景,所学领域可能是经济、财务、物理、化学和统计,所以每个人对于如何架构一个模型亦有不同的看法。我见过最神奇的,莫过于一位前辈试着利用化学的概念修正足球模型。那个化学概念是说,我们通常只看得到原子架构的其中一面,至于另外一面则可以透过模拟推算出来。这位前辈进行回测之后,发现此方法相当有助于改进足球盘的准确度。说真的,直到现在我还是搞不懂他到底在说什么,这个例子旨在与读者分享一件事:不管你的背景、所学为何,只要有办法回测出具有足够准确度的模型,就有发财机会。接下来让我分享本书即将提到之棒球模型的启发过程。笔者在工作期间,也正准备财务风险管理( FRM )证照的考试。我从中学习到股票、基金、选择权等估价模型及风险控管。就在我认识其中一个估价模型的当下,脑海中好像闪出道闪电:这个模型非常适合拿来推算棒球比赛的结果!而这个估价模型就是蒙地卡罗模拟法( Monte Carlo Simulation )。

蒙地卡罗( Monte-Carlo )位于北非的摩纳哥,那里有许多赌场,为当地特色之一。不论是哪种赌博,都离不开机率的讨论,这也是本书不断重复讨论的主题,而计算随机性的数学研究,即被称为蒙地卡罗模拟。Phelim P. Boyle 率先以蒙地卡罗模拟法来估算选择权的价值。

我不会花太多时间讨论Boyle 的故事,其与运动彩券也没有太多关连,但是我的棒球模型之雏形确实提取自其中计算股价的部分。股票价格从总体角度来看受大盘波动影响,若从个体角度来看,则股票价格乃是无规则的布朗运动,其变动过程有以下三个主要的特征:随机性、不为负值、向上漂移。这几个特征与某支球队在棒球比赛的得分,有许多雷同之处。

例如,我们虽然可以预期某支球队的长期得分数,却无法精准预测该球队在下一场比赛的分数。就算是打击火力相当强大的队伍,依旧非常有可能在一场球赛中1分未得。而「随机性」正是单纯以过去历史资料很难推算出单场比赛得分的原因。看见股价与大盘的连动关系,使我真正下定决心藉由蒙地卡罗仿真法来研发模型。我们都知道,大盘的走向对于每支股票多少会有影响。

在牛市中,许多股票会联袂上涨;在熊市里,除了少部分蓝筹股之外,大部分股票都会下跌。此种连动关系就好像同一支球队,会被不同的球场影响其得分能力,我们称之为球场因素( park factors )。会产生这样的影响,主要是因为棒球比赛在室外举行,将无可避免的受到气候影响。比方说旧金山巨人队的AT&T 球场因为邻近海边,在雨季时湿度较高,对长打球员较为不利;科罗拉多洛矶队(Colorado Rockies ) 的库尔斯球场( Coors Field )是唯一位于高海拔的MLB球场,其气压低、空气较为干燥稀薄,所以打者击出的球会因为空阻较小而飞得较远,使该球场有「投手坟场」之称。

除了气候之外,波士顿红袜队( Boston Red Sox ) 的芬威球场( Fenway Park )左外野有着俗称「绿色怪物」的高墙,让右打的打击者相当难以发挥实力。广大的球迷早已熟知美国的球场因素,这些因素甚至成为各球场的特殊卖点;此外,许多棒球分析师也已经成功用数据证实其影响力。

当两者的比例相同,意昧着该球场并没有特别的因素会影响得分,此时球场因素就是1. 000 ;当主场比例较大的时候,球场因素会大于1.000,此时意味着球队作客这个球场的时候,得分会比往常还多。详细公式如下:

球场因素= ( (主场得分+主场失分) / (主场数) ) /( (客场得分+客场失分) / (客场数) )

虽然ESPN已经免费提供了球场因素供我们使用,但是我个人认为其计算方式不太符合我的模型需求,缺乏代表性。再者, ESPN计算出来的球场因素,其高低跨度太大,以2016年MLB的球场因素为例,最高为1.593,最低为0.771 ;这么一来,反而会过分强调球场因素对比赛得分的影响,似乎有些本末倒置。经过比较各方研究的数据后,我最后选择采用Baseball-Reference网站提供的球场调整方法来模拟比分。这套计算过程非常繁杂,有兴趣的读者可以自行参考:

不过,MLB投手的分工非常细腻,先发投手通常投5~7局就会下场,后续由牛棚的长中继投手或是救援投手消化局数。若将整场比赛的九个局数都以对上Zack Greinke 去模拟,肯定会低估球队的得分,因为在Greinke下去休息的第8~9 局,打者面对牛棚投手的表现,可能会比第1~7局来得好。所以在模拟的时候还须考虑先发投手的平均投球局数,如果某位A级投手平均只投6局,那么球队平均得分的这一项,我就改用:

如此一来就算都碰上同等级的投手,因应对方投手的投球局数不同,也会有不一样的模拟结果。说到这里,模型已经搭建得差不多了。惟仍须解决球队得分的随机性问题,故而在模拟公式的最后面加上Boyle 公式的后半部,即变异数模拟的部分。这时候我们的公式变成:

当我想要精算球队的单场得分时,先取一个随机因子进行模拟,因为每次取的随机因子不一样,所以每次模拟的得分都会有些不同。运用大数法则贴近现实就是蒙地卡罗模拟法的精神所在,因此我决定用Excel口气给它模拟个5000次,再加以平均得出精算值。所以,最后一个小问题,这个随机因子该如何决定呢?

所以他可以单纯从平均为0、变异数为1的标准分配中随机取一个值进行模拟。由于我没有考虑到时间因素,如果用一样的方式提取随机值,那么模拟的结果就跟没有模拟一样,不相信的读者可以自行计算看看。为了更好的模拟出比赛结果,在第一阶段我选择先不做随机因子,单纯根据前一年的比赛数据,以现有模型进行简单回测,看看计算出来的结果如何再进行修改。

这部分用讲的很简单,但是不管作任何分析,肯定会花最多时间在数据撷取上。一般人不会有预算建置个人专用的数据库,所以全部的数据多来自公开网站,例如ESPN 、Baseball - Reference、Fangraphs。惟使用这些免费数据会产生另一个问题,就是各家的格式大不相同,光是球队名字就有三、四种缩写法,要花很大的心力去重新梳理后,才能用来回测。

第一次回测完成之后,不幸发现目前模型的准确度落于B1的区间,也就是当前模型的有效程度还无法提供稳定的获益(关于准确度的区间,读者可以回顾「赔率模型的搭建」一节的内容) 。这结果一点也不意外,就好比盖房子一样,现在只是把毛胚搭建好,没有经过装修, 当然很难卖给客人。进一步分析回测的结果,发现球队若是对上C级或D级的先发投手,所预测出的球队比分常常会高于实际结果。这种高估的现象在对上其他等级的投手时并不显着。而且,若两队先发投手都派出C级、D级的中段班选手,高估的情况愈加显着。为了妥善的解决这种高估的情况,必须了解不同等级的投手会不会有不一样的失分分布。首先是把所有A级投手每一场的失分,一个点一个点绘制在图上。我发现失分的分布虽然没有呈现常态分配,仍然以平均值为中心呈现正态。同样类似的正态也出现在B级、E级、F级,但是C级跟D级投手的失分图却约略呈现正偏态的情形,以统计的术语来说,就是skew to left(偏度向左) 。

从分布结果来解释,防御率4 左右的投手在大部分的比赛场次,都能缴出较平均表现优异的投球内容。不过在少部分的场次,偶尔会控制不住场面而大量失分,因此防御率会有偏高的情形。若是每场都用平均表现来仿真,的确会有高估得分的情况,这样的结论还算真有说服力。因此在第二次的回测时,笔者决定把随机因子加入模拟有C级、D级投手的比赛,以正偏态分布进行随机抽取。而剩下的A级、B级、D级、E级的投手依旧维持采用常态分布进行随机抽取。至此终于完成了球队得分的模拟公式,假设现在有甲队作客到乙队进行比赛,那么甲队预测的得分计算如下:

公式1.甲队的得分:甲队碰上不同等级的乙队先发投手平均可以获得的分数×该先发的平均局数/9+甲队的平均得分×剩余局数/9 之后再把甲队的得分带入公式2。

公式2.甲队的下一场得分:球场因素×甲队的得分+甲队平均得分的标准偏差×随机因子 完成甲队后,接下来我们模拟Z队的下一场得分。因为Z队并不是在客场作战,因此表现应该与平常的成绩不会相去太多,所以我们预测的时候将球场因素设定为1 :

公式1. 乙队的得分:乙队碰上不同等级的甲队先发投手平均可以获得的分数×该先发的平均局数/9 +乙队的平均得分×剩余局数/9 之后再把乙队的得分带入公式2 。

公式2 . 乙队的下一场得分:1 X 乙队的得分+乙队平均得分的标准偏差×随机因子

至目前为止,不论是交易员或职业玩家都是利用自己的模型试着精算比赛的结果,但接下来就不同了。交易员会把精算的结果转换成开盘赔率开卖,而职业玩家则会将开盘赔率传换成精算结果,并与自己的精算结果作比较。假设交易员预测华盛顿国民的得分为4分、旧金山巨人的得分为4分,那么此场比赛的不让分赔率就是平盘,而大小盘的分值就是8分、赔率也是平盘。我们假设开盘赔比率为1. 024,那么赔率如下表:

职业玩家看到交易员开卖的赔率后,经过赔率换算得知庄家认为两队卖力相当,赢的机率都是1/1.952/1.024 = 0.5 ,即50% 。除此之外,交易员认为此场比赛的最终得分,在8分以上和以下的机率也都是50% 。惟根据玩家自己模型的精算,预测华盛顿国民的得分为6分、旧金山巨人的得分为5分,华盛顿国民比旧金山巨人略强一些,而且最终比赛得分应该是在11分。因此玩家在这场比赛应该选择投注华盛顿国民以及大分。

运彩技巧

返回顶部