アドバンスト
CFR
CFR(反事实遗憾最小化)
カウンターファクチュアル・レグレット最小化は、ポーカーのような不完全情報ゲームを反復的に解くアルゴリズムです。これはハンドをシミュレートし、各意思決定ポイントで最適な行動を取らなかったことに対する「レグレット」を計算し、将来の戦略を調整して総レグレットを最小化することで動作します。数百万回の反復を経て、CFRはナッシュ均衡に収束します。
例
TexasSolverはCFRを使用してGTO戦略を計算し、通常数秒以内に0.5%の精度に達します。
CFR(反事实遗憾最小化)
カウンターファクチュアル・レグレット最小化は、ポーカーのような不完全情報ゲームを反復的に解くアルゴリズムです。これはハンドをシミュレートし、各意思決定ポイントで最適な行動を取らなかったことに対する「レグレット」を計算し、将来の戦略を調整して総レグレットを最小化することで動作します。数百万回の反復を経て、CFRはナッシュ均衡に収束します。
TexasSolverはCFRを使用してGTO戦略を計算し、通常数秒以内に0.5%の精度に達します。