Polymarket アービトラージバイブル：真の差異は数学的インフラにある

Mr.RC｜0xU

この記事を読むのに必要な時間は 46 分

アービトラージュは「私もやればできる」の取引モデルではありません。この記事では、自分自身のアービトラージュシステムを理解し開発する方法について詳しく説明しています。

原文タイトル：Polymarket での取引に必要な数学（完全なロードマップ）

原著者：Roan、暗号分析家

翻訳、注釈：MrRyanChi、insiders.bot

@insidersdotbot の立ち上げの過程で、私は多くのハイフリークエンシー・メイカー・チームやアービトラージ・チームと深い対話を交わしました。その中で最大のニーズは、アービトラージ戦略の取り方でした。

私たちのユーザー、友人、パートナーは、Polymarket のアービトラージという複雑で多次元の取引経路を模索しています。もしあなたが Twitter のアクティブなユーザーであれば、XX のアービトラージ戦略で予測市場からどれだけ稼いだかというツイートを見たことがあると信じています。

しかしながら、ほとんどの記事はアービトラージの基本的なロジックを過度に単純化し、アービトラージを「私も上がれる」とか「Clawdbot を使えば解決できる」という取引モデルにしてしまい、自分自身のアービトラージシステムを体系的に理解して開発する方法を詳しく説明していません。

Polymarket 上のアービトラージツールがどのように利益を上げているかを理解したい場合、この記事は私が現時点で見た中で最も包括的な解説です。

英文原文には技術的すぎてさらなる研究が必要な部分が多くありますので、私はそれを再構築し補足しました。これにより、ひとつの記事だけで全ての要点を理解でき、資料を調べなくても済むようになります。

Polymarket のアービトラージは単純な数学問題ではありません

Polymarket で市場を見た場合：

YES 価格 $0.62、NO 価格 $0.33。

あなたは考えます：0.62 + 0.33 = 0.95、1 ドル未満、アービトラージの余地がある！ YES と NO の両方を買い、$0.95 を使い、結果に関わらず $1.00 を受け取り、純利益 $0.05。

あなたは正しいのです。

しかし問題は―あなたがこの足し算問題を手動で計算しているとき、量子化システムはまったく別のことをしているということです。

それらは同時に 17,218 の条件をスキャンし、2^63 の可能な結果の組み合わせを横断し、ミリ秒の単位ですべての定価の矛盾を見つけています。あなたが2つの注文を入れ終える頃には、価格差は既に消えています。システムはすでに数十の関連市場で同じような欠陥を見つけ、注文ブックの深さや手数料を考慮した最適なポジションサイズを計算し、すべての取引を並行して実行し、そして資金を次の機会に回しています。[1]

差異は速度だけではありません。それは数学の基盤です。

第1章: なぜ「加法」だけでは不十分なのか — マージナル・ポリトープ問題

単一市場の誤解

まずは単純な例を見てみましょう。

市場 A: 「トランプ氏はペンシルベニア州の選挙に勝利しますか？」

YES 価格 $0.48、NO 価格 $0.52。合計はちょうど $1.00 です。

完璧そうですね、アービトラージの余地はなさそうですね？

違います。

もう1つ市場を追加すると問題が発生します

次は市場 B: 「共和党はペンシルベニア州で対抗馬を5ポイント以上抑えますか？」

YES 価格 $0.32、NO 価格 $0.68。合計もまた $1.00 です。

それぞれの市場はそれぞれ「正常」です。しかし、ここには論理的依存関係があります：

アメリカ合衆国大統領選挙は全国的な獲得票数ではなく、各州ごとの投票結果によって決まります。各州は独立した「戦場」となり、どの候補がその州でより多くの票を獲得すれば、その候補はその州の全ての選挙人票を獲得します（勝者総取り）。トランプ氏は共和党候補です。それゆえ、「共和党がペンシルベニアで勝利する」と「トランプ氏がペンシルベニアで勝利する」とは同義です。対抗馬を5ポイント以上抑える場合、トランプ氏がペンシルベニアで勝利するだけでなく、大差で勝利することを意味します。

言い換えれば、市場 B のYES（共和党の大差勝利）は市場 A のYES（トランプの勝利）のサブセットです——大差勝利は必ずしも勝利を意味しますが、勝利が大差勝利を意味するわけではありません。

このような論理的依存関係がアービトラージの機会を生み出します。

これはまるで二つの賭けをするようなものです——「明日は雨が降りますか」と「明日は雷雨がありますか」。

雷雨がある場合、それは必ず雨が降ることを意味します（雷雨は雨のサブセットです）。ですので、「雷雨 YES」の価格は「雨 YES」の価格より高くなるはずがありません。市場の価格決定がこの論理に違反している場合、同時に売買することで、「リスクフリーの利益」を得ることができ、これがアービトラージです。

指数爆発: なぜ brute force 検索が機能しないのか

市場が n 個の条件を持つ場合、理論上は 2^n 通りの価格組み合わせが考えられます。

それほど複雑に聞こえるでしょうか？実際のケースを見てみましょう。

2010 年 NCAA トーナメント市場 [2]：63 試合、各試合で勝ち負けの 2 つの結果があります。可能な結果の組み合わせは 2^63 = 9,223,372,036,854,775,808 通りであり、つまり 9 百億兆通り以上になります。市場には 5000 を超えるベットがあります。

2^63 とはどのくらいの数か？ 10 億通り/秒をチェックする場合、すべてをチェックするには約 292 年かかります。これが、「brute force」がまったく機能しない理由です。

すべての組み合わせを1つずつチェックすることは計算上不可能です。

次に、2024 年米国大統領選を見てみましょう。ある研究チームが、依存関係がありそうな市場のペアが 1,576 組あることを発見しました。各市場のペアには 10 個の条件があるとして、各ペアには 2^20 = 1,048,576 通りの組み合わせが必要です。これを 1,576 組分かけると、あなたのノートパソコンが計算し終わるころには、選挙結果が出ています。

整数プログラミング: Enumerate の代わりに制約を利用する

量子システムのソリューションは「より高速な列挙」ではなく、根本的に列挙しないことにあります。

それらは整数プログラミング（Integer Programming）を使用して、「どの結果が有効か」を表現します。

実例を見てみましょう。Duke vs Cornell の試合市場：各チームには 7 つのベットがあります（0 から 6 勝）。合計条件は 14 個で、2^14 = 16,384 通りの可能な組み合わせがあります。

ただし、1 つの制約があります。両チームが 5 勝以上することは不可能です。なぜならそれでは準決勝で対戦することになるため（1 チームだけが勝ち残ることができます）。

整数プログラミングはどのように対処するのか？ 3 つの制約だけで十分です：

· 制約1: Duke の 7 つのベットのうち、正確に 1 つが真である（Duke は最終的に 1 回だけ勝利することができます）。

· 制約2： Cornell 的 7 個筹碼中，恰好有一個為真。

· 制約3：杜克贏得 5 場比賽 + 杜克贏得 6 場比賽 + 康奈爾贏得 5 場比賽 + 康奈爾贏得 6 場比賽 ≤ 1（它們不能同時贏得那麼多場比賽）。

三個線性約束，取代了 16,384 次暴力檢查。

暴力搜索 vs 整數規劃

換言之，暴力搜索就像是把字典裡的每個單詞都讀一遍來找一個詞。整數規劃就像是直接翻到那個字母開頭的頁面。你不需要檢查所有可能性，你只需要描述「合法答案長什麼樣」，然後讓演算法去找違反規則的定價。

真實數據：41% 的市場存在套利 [2]

原文中提到，研究團隊分析了 2024 年 4 月到 2025 年 4 月的數據：

• 檢查了 17,218 個條件

• 其中 7,051 個條件存在單一市場套利（占 41%）

• 中位數定價偏差：$0.60（應該是 $1.00）

• 13 對確認的跨市場可利用套利

中位數偏差 $0.60 意味著市場經常性地偏離 40%。這不是「接近有效」，這是「大規模可利用」。

第二章：Bregman 投影——怎麼算出最優套利交易

發現套利是一個問題。算出最優的套利交易是另一個問題。

你不能簡單地「取個平均」或者「微調一下價格」。你需要把當前的市場狀態投影到無套利的合法空間上，同時保留價格裡的信息結構。

為什麼「直線距離」不行

最直覺的想法是：找到离当前价格最近的「合法价格」，然后交易差价。

数学的観点から言うと、ユークリッド距離を最小にすることを意味します：||μ - θ||²

しかしこれには致命的な問題があります：すべての価格変動を同じだと見なしてしまいます。

$0.50 から $0.60 に上昇することと、$0.05 から $0.15 に上昇することは、どちらも10セントの上昇です。しかし、それらの情報量はまったく異なります。

なぜでしょうか？なぜなら、価格は暗黙の確率を表しているからです。50% から 60% になることは、穏やかな観点の調整です。5% から 15% になることは、信念の大きな転換です — ほぼ不可能な出来事が突然「少し可能性がある」状態になりました。

体重計に乗っていると想像してみてください。70kg から 80kg になると、「少し太った」と言うかもしれません。しかし、30kg から 40kg になると（大人の場合）、それは「死にかけから深刻な栄養失調に変わる」と言います。同じ10kgの変化でも、意味はまったく異なります。価格も同様です — 0または1に近い価格変動ほど、情報量が多いです。

Bregman Divergence: 正しい「距離」

Polymarketの市場メーカーは、LMSR（対数市場スコア規則）[4]を使用しており、価格は本質的に確率分布を表しています。

この構造では、正しい距離尺度はユークリッド距離ではなく、Bregmanダイバージェンス[5]となります。

LMSRの場合、BregmanダイバージェンスはKLダイバージェンス（Kullback-Leiblerダイバージェンス）[6]になります — 2つの確率分布間の「情報理論的距離」を測定する指標です。

数式を覚える必要はありません。理解する必要があるのは1つだけです：

KLダイバージェンスは、「極端な価格の周辺変動」に自動的により高い重みを付けます。$0.05 から $0.15 への変動は、KLダイバージェンスによると $0.50 から $0.60 への変動よりも「遠い」です。これは私たちの直感に完全に合致しています — 極端な価格の変動は、より大きな情報インパクトを意味します。

良い例として、@zachxbt氏の予測市場で、Axiomが最後にMetoraを逆転した際も、極端な価格変動がすべての変化の根底にありました。

Bregman プロジェクション vs ユークリッドプロジェクション

アービトラージ利益 = Bregman プロジェクション距離

これは原著者が論文全体で最も中心的な結論として参照したものです：

取引で得られる最大の保証された利益は、現在の市場状況からアービトラージスペースまでの Bregman プロジェクション距離と等しい。

言い換えると：市場価格が「合法スペース」から離れるほど、稼げるお金が増えます。そして、Bregman プロジェクションはあなたに以下を教えてくれます：

1. 何を売買するか（プロジェクションの方向が取引の方向を教えてくれます）

2. どのくらい取引するか（オーダーブックの深さを考慮）

3. どれだけ稼げるか（プロジェクション距離は最大利益です）

トップのアービトラージャーは1年で $2,009,631.76 を稼ぎました。[2]彼の戦略は、他の誰よりもこの最適化問題をより速く、より正確に解くことです。

Margin 多面体とアービトラージ

たとえば、山の上に立っていると想像してみてください。山のふもとには川が流れています（アービトラージスペースがない）。現在の位置（現在の市場価格）から川までの距離があります。

Bregman プロジェクションは、「あなたの位置から川への最短経路」を見つけるのに役立ちます — ただし、直線距離ではなく、地形（市場構造）を考慮した最短経路。

Chapter 3: Frank-Wolfe Algorithm — 理論を実行可能なコードに

さて、これでわかりました：最適なアービトラージを計算するには、Bregman プロジェクションを行う必要があります。

しかし問題は、Bregman プロジェクションを直接計算することは不可能であることです。

なぜでしょうか？アービトラージスペース（Margin 多面体 M）には指数関数的に多くの頂点があるからです。標準的な凸最適化手法では、完全な制約集合にアクセスする必要があり、つまりすべての合法的な結果を列挙する必要があります。さきほど述べたように、これはスケーラビリティのあるシナリオでは不可能です。

Frank-Wolfe のコアアイデア

Frank-Wolfe アルゴリズム [7] の天才的な点は：問題全体を一度に解こうとせず、段階的に答えに近づいていく点です。

その動作は次のとおりです：

ステップ1：小さな既知の許容解の集合から始めます。

ステップ2：この小さな集合で最適化を行い、現在の最適解を見つけます。

ステップ3：整数計画を使って新しい許容解を見つけ、集合に追加します。

ステップ4：十分に最適解に近づいているかどうかを確認します。不十分な場合は、ステップ2に戻ります。

各イテレーションでは、集合には1つの頂点しか追加されません。100回実行しても、追跡するのは100個の頂点だけであり、2^63個ではありません。

Frank-Wolfe イテレーションプロセス

出口を見つけるために巨大な迷路を進むイメージをしてください。

徒力的な方法はすべての道を試すことです。Frank-Wolfe の方法は：まず適当に1本の道を進み、次に各分岐点で1つの「案内人」（整数計画ソルバー）に尋ねます：「ここから始めた場合、どの方向が出口に最も近づいている可能性が高いですか？」そしてその方向に1歩進みます。迷路全体を探索する必要はありません。各重要なノードで正しい選択をするだけです。

整数計画ソルバー：各ステップの「案内人」

Frank-Wolfe の各イテレーションでは、整数線形計画問題を解く必要があります。これは理論上 NP 困難です（つまり、「既知の高速汎用アルゴリズムが存在しない」ことを意味します）。

しかし、Gurobi[8] のようなモダンなソルバーは、構造がよく整備された問題に対しては効率的に解を見つけることができます。

研究チームは Gurobi 5.5 を使用しました。実際のソルバー時間：

• 初期イテレーション（少数の試合が終了）：1秒未満

• 中間（30-40試合が終了）：10-30秒

• レイトステージ（50回以上の試合が終了）：5秒未満

なぜレイトステージが逆に速くなるのか？試合結果が確定するにつれ、解の空間が狭まるためです。変数が少なくなり、制約がより厳しくなり、解がより速くなります。

勾配爆発問題と Barrier Frank-Wolfe

標準のFrank-Wolfeには1つの技術的な問題があります：価格が0に近づくと、LMSRの勾配がマイナス無限に近づく傾向があります。これはアルゴリズムが不安定になる原因となります。

解決策はBarrier Frank-Wolfeです：完全な多面体Mではなく、やや「収縮」したバージョンMで最適化します。収縮パラメータεは反復ごとに自動的に減少し、最初は境界から遠い場所から始め（安定）、後で真の境界に徐々に近づきます（精度）。

研究によると、実際の運用では50〜150回の反復が収束するのに十分だとされています。

実績

論文には重要な発見があります[2]：

NCAAトーナメントの最初の16試合では、Frank-Wolfeメーカー（FWMM）と単純な線形制約メーカー（LCMM）のパフォーマンスはほとんど同等でした——整数計画のソルバーがまだ遅すぎたからです。

しかし、45試合が終了すると、初めての成功裏な30分の投影が完了しました。

その後、FWMMはLCMMよりも盤口の価格設定で38％優れていました。

転機は：結果の空間が整数計画がトレード時間ウィンドウ内に解決できるサイズに縮小された時です。

FWMMは試験前半はウォームアップしていますが、一度本格的になると圧倒します。LCMMは、常に安定した成績を収めていますが、天井が低い学生です。主な違いは、FWMMがより強力な「武器」（Bregman投影）を持っていることで、ただし「装弾」するために時間が必要です（ソルバーの完了を待つ）。

第4章：実行——計算された場合でも損失が発生する理由

あなたはアービトラージを検出しました。Bregman投影を使用して最適な取引を計算しました。

今、実行する必要があります。

これがほとんどの戦略が失敗する場所です。

非原子実行の問題

Polymarket は CLOB（中央限界オーダーブック）[9] を使用しています。分散型取引所とは異なり、CLOB 上の取引は順次実行されます — すべての注文が同時に成立することは保証されません。

あなたの裁定計画：

YES を $0.30 で購入。NO を $0.30 で購入。総コスト $0.60。結果に関わらず、$1.00 を回収。利益 $0.40。

実際：

・ YES 注文を出す → 約定価格 $0.30 ✓

・あなたの注文が市場価格を変えました。

・ NO 注文を出す → 約定価格 $0.78 ✗

・総コスト：$1.08。回収：$1.00。実際の結果：損失 $0.08。

片方の足が約定したが、もう片方はしていません。あなたがリスクにさらされています。

これは論文が利益空間が $0.05 を超える機会しか記録しなかった理由です。より小さな価格差は実行リスクを飲み込んでしまいます。

非原子実行リスク

VWAP: 実際の取引価格

提示価格で成約できるとは仮定しないでください。取引量加重平均価格（VWAP）[10] を計算する必要があります。

研究チームの手法は次のとおりです：Polygon チェーン上の各ブロック（約 2 秒）について、そのブロック内のすべての YES 取引の VWAP とすべての NO 取引の VWAP を計算します。もし |VWAP_yes + VWAP_no - 1.0| > 0.02 の場合、それを1回の機会として記録します [2]。

VWAP は「実際に支払った平均価格」です。10,000 個のトークンを購入したいと思っても、オーダーブックに $0.30 で2,000 個、$0.32 で3,000 個、$0.35 で5,000 個しか存在しない場合、あなたの VWAP は (2000×0.30 + 3000×0.32 + 5000×0.35) / 10000 = $0.326 となります。あなたが見る「最適価格」$0.30 よりもかなり高くなります。

流動性制約：利益率はオーダーブックの深さに依存

価格に偏りがあっても、利益率は利用可能な流動性に制約されます。

実際の例 [2]：

市場のアービトラージ: YES 価格総和 = $0.85。潜在的な利益: 1ドルあたり$0.15。しかし、これらの価格のオーダーブックの深さはたったの$234。最大利益は: $234 × 0.15 = $35.10。

クロスマーケットアービトラージでは、全てのポジションで同時に流動性を持つ必要があります。最も少ないものが上限を定めます。

これはまた、既存の量化プラットフォームにおいて、オーダー価格が約定価格に及ぼす影響が非常に重要である理由でもあります。

第5章：完全なシステム——実際に展開されたもの

理論はクリーンです。プロダクション環境は混沌です。

これが実際に稼働しているアービトラージシステムの姿 [2] です。

データパイプライン

リアルタイムデータ：PolymarketのAPIへのWebSocket接続 [9] を介して、オーダーブックの更新（価格/数量の変更）、取引のプッシュ、市場の作成/決済イベントを受信します。

過去のデータ： Alchemy PolygonノードAPIを介して契約イベントをクエリ——OrderFilled（取引実行）、PositionSplit（新しいトークンの発行）、PositionsMerge（トークンの破棄）。

チームは8600万取引を分析しました [2]。この規模はスクリプトでは処理できず、インフラが必要です。

現在、高速取引APIをオープンソース化する計画もあります。同様の取引モデルを使用する予定がある場合は、APIをすぐに体験したい場合は、いつでもDMしてください。

依存関係検出レイヤー

米国の大統領選挙市場 305 市場について、46,360 種類の組み合わせがチェックされる必要があります。手動で分析することは不可能です。

研究チームは賢い方法を使いました：DeepSeek-R1-Distill-Qwen-32B 大言語モデルを使用して最初のスクリーニングを行いました。

入力：2 つの市場の条件説明。出力：JSON 形式の有効な結果の組み合わせ。

その後、3 層の検証を行います：各市場には正確に 1 つの真の条件がありますか？有効な組み合わせの数は n × m 未満ですか（依存関係が存在します）？依存関係の部分集合はアービトラージ条件を満たしていますか？

結果：40,057 対の独立（アービトラージなし）→ 1,576 対の依存関係あり（潜在的なアービトラージ）→ 374 対の厳密な条件を満たす → 13 対の人手による検証可能 [2]。

LLM は複雑な多条件市場での精度が 81.45% です。これは最初のスクリーニングに使用するのに十分ですが、実行する前に人手による検証が必要です。

3 層の最適化エンジン

· 第 1 層：単純な線形制約（LCMM）。基本ルールを素早くチェックします —「確率の合計が 1 に等しい」、「A が B を含む場合、P(A) は P(B) を超えてはいけない」。ミリ秒で完了し、明白な価格設定エラーを除去します。

· 第 2 層：整数計画の投影（Frank-Wolfe + Gurobi）。これが中心です。パラメータ：Alpha = 0.9（少なくとも 90% の利用可能なアービトラージを抽出）、初期 ε = 0.1（10% 収縮）、収束閾値 = 1e-6、時間制限 = 30 分。典型的な反復回数：50-150 回。各反復の解決時間：1-30 秒。

· 第 3 層：検証を実行。注文を送信する前に、現在のオーダーブックで取引をシミュレートします。確認：流動性は十分ですか？予想されるスリッページはどれくらいですか？スリッページを差し引いた利益保証はいくらですか？利益が最低限度（$0.05）を上回っていますか？すべて合格した場合のみ実行します。

ポジション管理：改良版ケリー公式

標準のケリー公式 [11] は、取引にどれだけの資金比率を投入すべきかを示しています。しかし、アービトラージシナリオでは、実行リスクの調整が必要です：

f = (b×p - q) / b × √p

ここで、b はアービトラージ利益率、p は完全実行確率（オーダーブックの深さに基づいて推定）、q = 1 - p です。

上限：オーダーブックの深さの 50%。この割合を超えると、あなたの注文自体が市場を大きく動かすことになります。

最終結果

2024年4月から2025年4月までの総引き出し利益：

単一条件アービトラージ： ローバイ 2辺 $5,899,287 + ハイセル 2辺 $4,682,075 = $10,581,362

市場リバランス： YESをすべてローバイ $11,092,286 + YESをすべてハイセル $612,189 + NOをすべてバイ $17,307,114 = $29,011,589

クロスマーケット組み合わせアービトラージ： $95,634

合計：$39,688,585

トップ10のアービトラージャーは$8,127,849を手にしました（総額の20.5%）。トップのアービトラージャー：$2,009,632、4,049取引から、1取引あたり平均$496[2]。

宝くじじゃない。運でもない。数学的精度の体系的実行です。

最終的な現実

トレーダーが「予測市場の10のテクニック」を読んでいる間、量化システムは何をしているでしょうか？

それらは17,218の条件間の依存関係を整数計画法を使用して検出しています。Bregman投影を使用して最適なアービトラージ取引を計算しています。Frank-Wolfeアルゴリズムを実行して勾配爆発を処理しています。VWAPを使用してスリッページを推定し、オーダーを並行して実行しています。体系的に4000万ドルの保証利益を抽出しています。

ギャップは運ではなく、数学的な基盤です。

論文は公開されています [1]。アルゴリズムは既知です。利益は実際のものです。

問題は：次の4000万ドルが引き出される前に、あなたがそれを構築できるかどうかですか？

Concept Quick Lookup

• Marginal Polytope → A space comprising all "feasible prices." Prices must be within this space to avoid arbitrage. It can be understood as the "valid region of prices."

• Integer Programming → Describing valid outcomes with linear constraints to avoid brute-force enumeration. Compressing 2^63 checks into a few constraints [3]

• Bregman Divergence / KL Divergence → A method to measure the "distance" between two probability distributions, more suitable for pricing/probability scenarios than Euclidean distance. Weighted changes near extreme prices carry more significance [5][6]

• LMSR (Logarithmic Market Scoring Rule) → Pricing mechanism used by Polymarket market makers, where prices represent implied probabilities [4]

• Frank-Wolfe Algorithm → An iterative optimization algorithm that adds only one new vertex per round, avoiding enumerating exponentially many valid outcomes [7]

• Gurobi → A leading industry Integer Programming solver, the "guide" for each Frank-Wolfe iteration [8]

• CLOB (Central Limit Order Book) → Polymarket's trade matching mechanism, orders are executed in sequence, atomicity not guaranteed [9]

• VWAP (Volume-Weighted Average Price) → The actual average price you pay, considering order book depth. More realistic than "best price" [10]

• Kelly Criterion → Tells you what proportion of funds to put into a trade, balancing return and risk [11]

• Non-Atomic Execution → The problem where multiple orders cannot be guaranteed to execute simultaneously. One leg executes, the other doesn't = exposure risk

• DeepSeek → A large language model used for initial market dependency screening, with an accuracy of 81.45%

References

[1] Original Tweet: https://x.com/RohOnChain/status/2017314080395296995

[2] Research Paper "Unravelling the Probabilistic Forest: Arbitrage in Prediction Markets": https://arxiv.org/abs/2508.03474

[3] Foundational Paper "Arbitrage-Free Combinatorial Market Making via Integer Programming": https://arxiv.org/abs/1606.02825

[4] Explanation of LMSR Logarithmic Market Scoring Rule: https://www.cultivatelabs.com/crowdsourced-forecasting-guide/how-does-logarithmic-market-scoring-rule-lmsr-work