原文タイトル:AIが予測市場を拡大する方法:最難関の契約を解決するためにLLMをブロックチェーンにロックする理由
原著者:Andrew Hall,a16z
原文翻訳:佳欢,ChainCatcher
去年、ベネズエラ大統領選挙の結果予測市場の取引額は600万ドルを超えました。しかし、開票が終了すると市場は不可能な状況に直面しました:政府はニコラス・マドゥロが勝利したと発表しましたが、野党と国際監視団は不正があったと主張しました。予測市場の決定は、「公式情報」(マドゥロの勝利)に従うべきか、「信頼できる報道の合意」(野党の勝利)に従うべきか?
ベネズエラの選挙のケースでは、監視団の主張は段階的にエスカレートしました:ますますルールの無視、ユーザーの資金が「盗まれた」と非難し、さらにはこの決定メカニズムが政治的な駆け引きで権力を握ることを激しく非難しました—「裁判官、陪審員、そして死刑執行人」が一身に収まっており、さらには重大な操縦を受けたとまで言及しています。
これは単なる小さな出来事ではありません。これは私が予測市場がスケーリングする際に直面する最大のボトルネックだと考えているものです:契約の決定
ここには非常に高いリスクが伴います。適切に処理された審判の場合、人々はあなたの市場に信頼し、そこで取引しようとします。価格は社会にとって意味のあるシグナルになります。しかし、決定が誤った場合、取引は失望と予測不能さをもたらします。参加者は離れ、流動性が枯渇するリスクに直面します。価格ももはや安定したターゲットの正確な予測を反映しません。その代わりに、価格は、実際の結果の発生確率と、取引者がゆがんだ判決メカニズムがどのように判決するかに対する信念が含まれる曖昧な混合物を反映し始めます。
ベネズエラの論争は比較的大々的ですが、さまざまなプラットフォームで、もっと隠れた失敗が頻繁に発生しています:
・ ウクライナの地図操作事件は、対戦相手がゲーム理論の決定メカニズムを直接利用している様子を示しています。特定のオンライン地図に基づいて決着をつける地位の契約があり、契約の結果に影響を与えるために地図が改変されたと報告されています。あなたの「真実の情報源」が操作される可能性がある場合、あなたの市場も操作される可能性があります。
・ 政府シャットダウン契約は、決着ソースが不正確または少なくとも予測不能な結果につながる方法を示しています。解決規則では、市場は米国人事管理局のウェブサイトがシャットダウンの終了時刻を表示した時に支払われるとされています。トランプ大統領は11月12日に予算法案に署名しましたが、理由は明らかではありませんが、OPMのウェブサイトは11月13日まで更新されませんでした。シャットダウンが12日に終了すると正確に予測した取引者は、ウェブサイト管理者の遅れのために賭け金を失いました。
· ゼレンスキースーツ市場 は利益相反の懸念を引き起こしました。 この契約は、ウクライナ大統領のゼレンスキーが特定のイベントでスーツを着用するかどうか尋ねました — これは取るに足らない問題のように見えましたが、2 億ドルを超える賭けを引き付けました。ゼレンスキーが BBC、ニューヨーク・ポスト などのメディアによってスーツとして説明される服を着て NATO サミットに出席する際、市場は最初は「はい」に決定しました。しかし、UMA トークン保有者はその結果に異議を唱え、その後、「いいえ」に転じました。
この記事では、大規模な裁定方式を作成するために大規模な言語モデル(LLM)と暗号技術を巧みに組み合わせる方法について探っていきます。これにより、操作が難しく、正確で完全透明で信頼性と中立性を備えた予測市場が生まれます。
同様の問題は金融市場でも常にありました。 ISDA(国際スワップデリバティブ協会)は、数年にわたり、クレジットデフォルトスワップ(CDS)市場における決定の難しさと対峙してきました。 CDS は、企業や国の債務不履行時に支払いを行う契約です。彼らの2024年の審査報告書は、これらの困難さについて率直に議論したものでした。彼らの裁定委員会は、主要な市場参加者から構成され、クレジットイベントが発生したかどうかを投票で決定します。しかし、このプロセスは不透明で、潜在的な利益相反、そして一貫性のない結果によって批判を受け、UMAのプロセスと同様になります。
根本的な問題は同じです:曖昧な状況の判断に大金が依存する場合、各裁定メカニズムは攻防の的となり、各曖昧な点が潜在的な火種となります。
どんな解決策も、同時に複数の主要な特性を実現する必要があります:
1. 操作防止性
対抗者が裁定を操作できる場合、たとえばウィキペディアを編集したり、偽ニュースを植え付けたり、オラクルを買収したり、プログラムの欠陥を悪用したりすることができる場合、市場は予測する能力よりも操作する能力を競うゲームになってしまいます。
2. 妥当な精度
メカニズムはほとんどの場合正しい裁定を下さなければなりません。現実の曖昧性に満ちた世界では、完全な正確性は不可能ですが、システム的エラーや明白なミスが信頼性を破壊します。
3. 事前の透明性
取引参加者は賭けをする前に裁定がどのように行われるかを正確に知る必要があります。途中でルールを変更することは、プラットフォームと参加者の間の基本契約に反します。
4.信頼できる中立性
参加者は、このメカニズムが特定の取引者または結果に偏ることがないことを信頼する必要があります。これは、UMAを大量に保有する人々が彼らが賭けた契約を解決することが問題とされる理由です:彼らが公正に行動していても、利益相反の印象は信頼を傷つける可能性があります。
人為的な審査団はこれらの属性のいくつかを満たすことができますが、スケーリングすると、特に操縦耐性と信頼できる中立性を実現することが困難です。UMAのようなトークンベースの投票システムには、クジラに支配されたり利益相反の問題があることがよく記録されています。
これがAIが関与するポイントです。
これは予測市場コミュニティ内で注目されている提案です:大規模言語モデルを裁定者として使用し、契約作成時に特定のモデルとプロンプトワードをブロックチェーンにロックする。
基本的なアーキテクチャは以下の通りです:契約作成時に、メーカーは裁定基準を自然言語で指定するだけでなく、正確なLLM(タイムスタンプ付きモデルバージョンで識別)および結果を決定するために使用される正確なプロンプトワードを指定する必要があります。
この仕様は暗号化されてブロックチェーンに提出されます。取引が開始されると、参加者は完全な決定メカニズムを確認でき、正確にどのAIモデルが結果を裁定し、それがどのようなプロンプトワードを受信し、どの情報源にアクセスできるかを正確に知ることができます。
この設定が気に入らない場合、取引は行われません。
判決時に、提出されたLLMが提出されたプロンプトワードを使用して実行され、指定された情報源にアクセスし、判決を生成します。出力結果が支払いを受け取る人を決定します。
この方法はいくつかの主要な制約を同時に解決します:
· 操縦に強い(絶対ではないが) ウィキペディアのページや小さなニュースサイトとは異なり、主要なLLMの出力を簡単に編集することはできません。モデルのウェイトは提出時に固定されます。決定を操作するには、対戦相手はモデルに依存する情報源を破壊したり、過去にモデルのトレーニングデータをある方法で破損させたりする必要があります。予言者への贈賄や地図の編集と比較して、これら2つの攻撃方法はコストが高く、不確実性が高いです。
· 正確性を提供する 推論モデルの迅速な進歩と、驚くほど幅広い知的タスクを処理できるようになり、特に新しい情報を調査して見つけることができるようになると、LLM裁判官は多くの市場を正確に判断できるはずです。その正確性を理解する実験が進行中です。
· 組み込み透明性 どんな賭けも行われる前に、全体の決定メカニズムが見える化および監査可能です。途中でルールが変更されたり、自由裁量の判断が下されたり、密室での協議があったりしません。あなたが署名したものが何であるかを正確に把握できます。
· 信頼性の高い中立性の著しい向上 LLM には結果に経済的利益がありません。贿賂を受けることはありません。UMA トークンを所持していません。偏見は、その属性が利害関係者による一時的な決定ではなく、モデル自体の属性であるため、どんな場合でもあなたと関係ありません。
· モデルは間違う可能性があります LLM はニュース記事を誤読したり、事実の錯覚を生じたり、一貫性のない基準を適用したりする可能性があります。しかし、取引者がどのモデルを使用しているかを把握していれば、これらの欠陥を価格に反映させることができます。特定のモデルにおいて曖昧なケースを特定の方法で処理する傾向が既知であれば、経験豊富な取引者はこれを考慮に入れます。モデルは完璧である必要はありません。予測可能である必要があります。
· 操作される可能性は否定できません 特定の単語または句が特定のニュースソースを指定している場合、対戦相手はそのソースにストーリーを挿入しようとするかもしれません。このような攻撃は主要メディアにとっては高額ですが、小規模メディアにとっては実行可能かもしれません。これは地図の編集問題の別の形です。ここで、ヒントワードの設計が非常に重要です。多様で冗長な情報源に依存する決定メカニズムは、単一障害に依存するメカニズムよりも堅牢です。
· 理論上は中毒攻撃が可能です 十分なリソースを持つ対戦相手は、LLM のトレーニングデータに影響を与えて将来の判断を歪める試みをするかもしれません。しかし、これには契約の前に長い時間がかかり、リターンは不確定であり、コストは莫大です。これは、委員会メンバーに贿賂を行うよりもはるかに高いハードルです。
· LLM モデレーターの拡散は調整問題を引き起こす可能性があります 異なる市場メイカーが異なるヒントワードを使用して異なる LLM に取り組む場合、流動性が分散します。取引者は、契約を簡単に比較したり、市場間の情報を集約したりすることができません。標準化は価値がありますが、どのヒントワードと組み合わせた LLM が最も適切かをマーケットが見つけることも価値があります。適切な答えは、いくつかの組み合わせである可能性があります:実験を行いつつ、時間とともにコミュニティがテストされたデフォルト設定に収束するメカニズムを構築することです。
要約すると、AI に基づく裁定は基本的に一連の問題(人間の偏見、利益相反、不透明性)を別の問題(モデルの制約、ヒントワードのエンジニアリング上の課題、情報源の欠陥)と交換します。そして、後者の問題の方がより扱いやすい可能性があります。では、どのように前進すべきですか?プラットフォームは:
1. 実験:
低リスクの契約でLLM決議をテストし、過去の記録を確立します。どのモデルが最も優れているか?どのヒントワード構造が最も堅牢か?実際にはどのような障害モードが発生するか?
2. 標準化:
最良の実践が現れるにつれ、コミュニティは、LLMとヒントワードの標準化組み合わせをデフォルト設定として確立することに取り組むべきです。これは革新を排除するものではありませんが、流動性がよく理解された市場に集中するのに役立ちます。
3. 透明なツールの構築:
たとえば、インターフェースを構築して、トレーダーが取引前に決議メカニズムの完全な検討を容易にできるようにします。決議ルールは詳細に隠されるべきではありません。
4. 持続的なガバナンスの実施:
AI裁判官がいても、人間は依然としてトップレベルのルール作りに責任を持つ必要があります:どのモデルを信頼するか、モデルが明らかに誤った回答を出した場合の対処方法、デフォルト設定をいつ更新するか。目標は、人間をループから完全に取り除くことではなく、人間をケースバイケースの判断からシステムのルール作りに移行させることです。
予測市場には非凡な潜在能力があり、私たちが騒々しい、複雑な世界を理解するのに役立ちます。ただし、この潜在能力は信頼に依存し、信頼は公平な契約の決議に依存します。私たちはすでに決議メカニズムの失敗の結果を目撃しています:混乱、怒り、そしてトレーダーの退場。私は、かつて自分の賭け精神に背いたような結果に失望し、予測市場から完全に離れることを誓った人々を見てきました。これは、予測市場の利点やより広範な応用を開放する上での逃した機会です。
LLM裁判官は完璧ではありません。しかし、暗号技術と組み合わされると、それらは透明で中立的であり、人類のシステムに常に存在してきた操作に抵抗できます。予測市場が私たちのガバナンスメカニズムを超える速さで規模化する世界では、これが必要なものかもしれません。
BlockBeats の公式コミュニティに参加しよう:
Telegram 公式チャンネル:https://t.me/theblockbeats
Telegram 交流グループ:https://t.me/BlockBeats_App
Twitter 公式アカウント:https://twitter.com/BlockBeatsAsia