GNN、Transformer、RLによるアービトラージ：ニューラルネットワークがトレードを学ぶとき

シリーズ「先物とスポット間の複雑なアービトラージチェーン」第5部

チェスのグランドマスターが、盤面の代わりに10の取引所と数百の取引ペアを見て、32の駒の代わりに毎ミリ秒更新される数千の注文を見ている状況を想像してみてください。Bellman-Fordのような古典的アルゴリズムは忠実にグラフを探索しますが、収益性のあるサイクルを見つける頃には、機会の窓はすでに閉じています。別のアプローチが必要です—単にアルゴリズム的ではなく、学習するアプローチです。

この記事では、最新のML手法が混沌としたマルチ取引所市場を構造化されたタスクに変換する方法を探ります。グラフニューラルネットワーク（GNN）、Transformer、強化学習（RL）エージェントが、アービトラージの世界で可能なことを再定義しています。

アービトラージのためのML手法の概要 アービトラージの検出と実行のためのMLアプローチのランドスケープ：グラフニューラルネットワークから進化的アルゴリズムまで。

金融市場分析のためのグラフニューラルネットワークアーキテクチャ

1. グラフニューラルネットワーク：市場がグラフであるとき

マルチ取引所の暗号通貨市場は、その本質からしてグラフです。ノードはアセット（BTC、ETH、SOL）または「アセット-取引所」ペアです。エッジはスプレッド、ボリューム、手数料、レイテンシで重み付けされた取引リンクです。

古典的なBellman-Fordは $O(V \times E)$ でタスクを解きます。**グラフニューラルネットワーク（GNN）**は、タクシー運転手が渋滞の場所を「直感」するように、アービトラージ機会に先行するパターンを認識することを学びます。

1.1 Edge FusionモジュールによるGraphSAGE

GraphSAGEとカスタムEdge Fusionモジュールを使用して、研究者たちは以下を達成しました：

F1スコア：0.90—予測された機会の10中9が実際のものです。
推論：CPUで78ms—多くのアービトラージウィンドウに十分な速度です。

use burn::prelude::*;
use burn::nn::{Linear, LinearConfig, Relu};

#[derive(Module, Debug)]
pub struct EdgeFusionModule<B: Backend> {
    fc1: Linear<B>,
    fc2: Linear<B>,
    fc_out: Linear<B>,
    relu: Relu,
}

2. Transformer：Attention Is All You Need

GNNが市場の構造で作業するのに対し、Transformerはデータストリームで作業します。マルチヘッド自己注意機構は、誰が誰に影響を与えるかを明示的に定義することなく、アセットと取引所間の依存関係をキャプチャします。

2.1 マルチ取引所融合のためのMulti-Head Attention

注意機構の重みは、ターゲット取引所の価格予測にどの取引所が最も情報量が多いかを示します。2つの取引所間の注意重みの急上昇は、しばしばアービトラージ機会が近いシグナルです。

取引のための強化学習エージェント-環境ループ

3. 強化学習：トレードを学ぶエージェント

**強化学習（RL）**はアービトラージ問題に自然に適合します。状態はオーダーブック、ポジション、残高です。行動は何を、どこで、どのボリュームで取引するかです。報酬は利益または損失です。

3.1 年間142%のリターン

最も印象的な成果は、DEXでの競争的アービトラージのためのマルチエージェントRLです。専門化されたエージェント（CEX-DEX、クロスチェーン、三角）を連携させることで、研究者たちはルールベースボットの12%に対して年間142%のリターンを達成しました。

4. ベイズ手法：不確実性を強みに

**ベイズオンライン変化点検出（BOCPD）**は、リアルタイムでレジームの変化を検出します。市場の「ルール」が変わると、モデルがそれを認識し、戦略に一時停止と再キャリブレーションを指示します。

/// Regime change detector based on BOCPD
pub struct BocpdDetector {
    lambda: f64,                         // P(changepoint) = 1/lambda
    run_length_probs: Vec<f64>,          // run length distribution
}

統合MLパイプライン：GNN → Transformer → RL → 実行

5. 統合アーキテクチャ：すべてを組み合わせる

真の力は統合から生まれます。Rustでの統合パイプラインは次のようになります：

特徴量エンジニアリング： オーダーブック特徴量、スプレッド、CUSUM/EWMAモニタリング。
検出： GNNとオートエンコーダによる異常検出。
シグナル融合： Transformerによるクロス取引所およびスポット-先物データの統合。
実行： RLエージェントによる最適なサイズとタイミングの決定。
リスク： ベイズサイジングとガウス過程の境界。

総レイテンシ予算： RustとONNX Runtimeにより、パイプライン全体のレイテンシは7.5ms未満が達成可能です。

6. まとめ

アービトラージにおけるMLは万能薬ではありませんが、ツールの武器庫です。GNNが構造を捉え、Transformerがデータを統合し、RLが実行し、ベイズ手法が不確実性を管理します。

このシリーズの最終パートでは、ナノ秒精度とアトミックなマルチレッグ実行に焦点を当てた、このようなシステムのRust実装の詳細を見ていきます。

独自のエージェントをトレーニング中ですか？Rust ML取引フレームワーク on GitHubをご覧ください。

GNN、Transformer、RLによるアービトラージ：ニューラルネットワークがトレードを学ぶとき