书籍连载 | 小额GTO锦标赛策略–殿堂级算法 第八章:各种各样的话题(3)

第五节:平衡

GTO打法的话题通常会激发关于平衡的讨论。专家学者可能会说“为平衡我们的打法,跟注这个河牌圈全压的1/3手牌都该是抓诈牌”。对于平衡的意思而言这是一个模糊的描述。这样的一个跟注不是为了平衡;我们的跟注是为了自己不被博弈论剥削。

对于平衡一个更好的定义是:“我们所采取的打法是为了让自己从统计学上而言不那么容易被剥削或被人看透”。

设想在一场线上现金局中,你有单挑辅助软件并且看见对手的数据非常优秀。你在庄位拿着T2s开池,对手在大盲位跟注。翻牌为彩虹牌953,对手过牌。你撇了一眼对手的HUD数据,发现对手在没有位置优势的情况下跟注一个翻牌圈C-Bet的概率只有40%;他似乎是一名激进或者弃牌的玩家。你下注半个底池,所以他只需要满足1/3的赢率就可以让自己的诈唬盈利。但因为对手弃牌的概率超过了一半,所以从统计学上来看你的下注是有利可图的。

对手有着一个不稳定的C-Bet跟注频率,这会被注意到这种不平衡的对手所利用。没有位置优势时他可以通过降低在翻前跟注一个加注来提升自己的平衡,所以他的翻后范围是非常强劲的。但是他也可以减少弃牌于自动C-Bet的频率。于对手来说平衡这种不足可能会很困难,尤其是当他的对手会他的偏爱打法进行深挖时。

这种不平衡问题在线下扑克赛事中通常不那么严重,特别是当我们面对的对手不太可能知道我们不平衡的情况下。其实,我们的线下赛事对手很少会发现我们的不平衡,除非我们让他们注意到。

假设我们在单挑翻牌圈有位置优势时C-Bet的概率为90%。这明显高于只被允许下注成手牌和强听牌的时候;我们是在大量C-Bet诈唬。一名有意识的对手可能能够利用这个,所以平衡理论告诉我们要降低我们的下注频率,可能不是通过下注我们的一些最强成手牌和停牌。

只有当我们期望被一名有意识的对手剥削时这才有意义。但是,平衡会在我们面临一位不知名选手时失去价值;他们根本没有关于我们行动的大数据库来得出一个可信的结论。既然他们不能剥削我们的不平衡,那么我们就不该为了统计学上的平衡而进行这种打法。换言之:忽视平衡你的打法,除非你能被数据化或面临着一位知道你不平衡的选手。

关于这一点有个注意事项。我们的对手可能会对我们进行常规剖析,比如基于一个刻板印象或一些小动作判定我们是弱势还是强势玩家。如果从某种方式上让他们相信我们是不平衡的,那么我们就必须调整。但这并不意味着我们需要平衡自己打法的各个方面。

当我们的牌桌上只有一名有意识的玩家时这尤为正确。为了平衡我们的打法,要让这位玩家无法忽略我们从其他7名玩家哪里剥削来的价值。也没有必要去平衡对抗较弱的玩家,因为他们几乎不会注意到我们的打法并且当他们注意到的时候也不会调整。

我的偏爱打法一般都是剥削性的打法。但当面对一名聪明选手时,我的回应是要比对手想得更远一步。当他认为我是迂回时,我就迂回。我一般偏爱这种调整,因为只有一小部分对手能够判断出我们的不平衡。

第六节:实践

殿堂级系统需要一些学习和实践。你应该研究这本书直到你理解并相信这个系统的实用性。随后你应该有足够的练习来让这成为你在锦标赛赛事中的第二天性。

我最喜欢的实践方法就是参加低成本的线上多桌锦标赛。我建议大家在最后阶段报名参加$10-$20线上锦标赛。晚一点报名的好处就是那些只想搏一把和一味重购的玩家早已出局。

同时也能很快让我们进入实操殿堂级系统的低效力牌况中。后期报名入赛允许我们大多数人在有限的时间内进行有效的练习。一旦再买入阶段结束,我们能够更好的依靠对手的“诚实”打法。

由于“计时器”的存在,线上赛事需要快速抉择。所以初期练习殿堂级算法可能会有点困难。因此,使用开池机遇算法开始比赛是合理的:全压或者开池。

当我们比赛时,我们可以将殿堂级全压和开池算法放在一旁,我们参考它们有助于决策的制定,并且随着时间的推移我们会铭记于心。

一旦这些算法成为我们的第二天性,我们就可以在我们实践计划中添加再全压算法。这是一个优秀的下一步选择,因为我们通常会面临一次我们必须回应的开池。

最后,我们能够添加跟注算法,这只有在我们面临一个全压自己时才需要。

这种实践不仅仅是需要我们记忆系统模式。我们还需要基于当时的情况养成如何修正我们决策的意识。具体来说,我们需要学会如何调整自己的殿堂级基线来做出一个剥削决策。这种“剥削”实践是很重要的,而且也很花时间。这就是我们需要远离电脑刻苦学习的东西,也许可以使用SimpleNash或ICMIZER3。

一旦我们的线上策略成为了第二天性,那么在一场线下锦标赛中使用殿堂级系统就是很容易的一件事了。

第七节:殿堂级算法总结

这个板块对殿堂级算法在某一个位置进行了总结。一旦你完全理解并相信这个系统,你在这里就能进行快速回顾。

组合牌力指数

在某种程度上CPI指的是每组起手牌的组合点数,而这些值刚好与GTO全压价值相呼应。

1.首先我们给每一张牌一个面值(PN):A(17),K(13),Q(12),J(11),T(10) 等等,这是一个简单的牌值排列,但A除外。

2.大牌的PN乘以2,然后加上我们小牌的PN。比如,T3o的CPI为23点(2×10+3)。

3.最后,特殊组合会有更多的点值叠加:

对子=36点

同花=5点

连牌=5点

1、2或3隔牌=3点

所有点的总和就是CPI。

位置指数(PI)

位置指数就是指每一个牌桌位置对应GTO开池全压的值,除了大盲位的位置指数PI = 28外,其他位置指数如下图。这是殿堂级系统最级别的一些数据。

殿堂级算法

殿堂级算法对于非盲位的行动算法如下:

全压=PI+0.5X筹码量

开池=PI+8

跟注=全压+8+R1

再全压=PI+14+R1

“R1”表示位于我们右侧跟注或再全压的位置指数,这些玩家离我们有几个位置就添加几个积分。

位于盲位的全压和开池算法和其他位置是一样的。只不过跟注和再全压的算法使用的是“15”和“20”这两个常数:

跟注*= 全压 + 15 +R1

再全压*= PI + 20 + R1

殿堂级算法的简明摘要显示在第九章的头页。

一些额外的考虑事项:

n 如果我们的CPI优于我们的行动指数,那么这个行动就是一个GTO打法。

n 一俩名平跟玩家并不会过多的改变我们的全压指数。保守来说,我们可以通过假设自己比实际位置更靠右来对一名平跟者全压。

n 持有一手GTO全压手牌并不意味着我们应该全压。

n 没有拿到一手GTO全压手牌并不意味着我们应该弃牌。

n 保守来说,针对我们基本决策所使用的有效筹码尺度是我们冒险的筹码量数量。

n 对于左侧的紧张选手,我们能够扩大自己的范围来剥削他们。

n 我们的全压范围对变化无常的底注并不敏感,但在没有底注的时候我们必须添加4个指数积分。

n 我们的标准GTO开池是2.5BB。我们可以将自己的范围稍微拓宽到2.1BB开池和紧缩到3BB开池。

n 用一个GTO范围再全压的前提是我们的对手能够进行GTO回应。如果不是,我们就使用间隔原则来调整我们的行动。

Share:

Author: news, news

其他文章

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注