GNN, Transformers và RL cho Arbitrage: Khi Mạng Nơ-ron Học Cách Giao Dịch
Phần 5 của loạt bài "Chuỗi Arbitrage Phức Tạp Giữa Hợp Đồng Tương Lai và Giao Ngay"
Hãy tưởng tượng một đại kiện tướng cờ vua, thay vì nhìn vào bàn cờ, lại nhìn vào mười sàn giao dịch với hàng trăm cặp giao dịch, và thay vì 32 quân cờ, lại thấy hàng nghìn lệnh được cập nhật mỗi mili giây. Các thuật toán cổ điển như Bellman-Ford trung thực duyệt qua đồ thị, nhưng đến khi tìm được chu trình có lợi thì cửa sổ cơ hội đã đóng lại. Chúng ta cần một cách tiếp cận khác—không chỉ thuần thuật toán mà là có học.
Trong bài viết này, chúng ta khám phá cách các phương pháp ML hiện đại biến thị trường đa sàn hỗn loạn thành một bài toán có cấu trúc. Mạng Nơ-ron Đồ Thị (GNN), Transformers và các tác nhân Học Tăng Cường (RL) đang định nghĩa lại những gì có thể trong thế giới arbitrage.
Toàn cảnh các phương pháp ML để phát hiện và thực thi arbitrage: từ mạng nơ-ron đồ thị đến thuật toán tiến hóa.

1. Mạng Nơ-ron Đồ Thị: Khi Thị Trường là Một Đồ Thị
Thị trường crypto đa sàn vốn dĩ là một đồ thị theo bản chất. Các nút là các tài sản (BTC, ETH, SOL) hoặc các cặp "tài sản-sàn giao dịch". Các cạnh là các liên kết giao dịch được đánh trọng số bởi spread, khối lượng, phí và độ trễ.
Bellman-Ford cổ điển giải bài toán trong . Mạng Nơ-ron Đồ Thị (GNN) học cách nhận biết các mẫu đứng trước cơ hội arbitrage, tương tự như "trực giác" của tài xế taxi về nơi sẽ xảy ra ùn tắc.
1.1 GraphSAGE với Edge Fusion
Sử dụng GraphSAGE với mô-đun edge fusion tùy chỉnh, các nhà nghiên cứu đạt được:
- F1-score: 0.90—9 trong 10 cơ hội được dự đoán là thật.
- Suy luận: 78 ms trên CPU—đủ nhanh cho nhiều cửa sổ arbitrage.
use burn::prelude::*;
use burn::nn::{Linear, LinearConfig, Relu};
#[derive(Module, Debug)]
pub struct EdgeFusionModule<B: Backend> {
fc1: Linear<B>,
fc2: Linear<B>,
fc_out: Linear<B>,
relu: Relu,
}
2. Transformers: Attention is All You Need
Nếu GNN làm việc với cấu trúc của thị trường, thì Transformers làm việc với luồng dữ liệu. Multi-head self-attention nắm bắt các phụ thuộc giữa các tài sản và sàn giao dịch mà không cần phải xác định rõ ràng ai ảnh hưởng đến ai.
2.1 Multi-Head Attention cho Tổng hợp Đa Sàn
Trọng số của cơ chế attention cho thấy sàn giao dịch nào có thông tin quan trọng nhất để dự đoán giá trên sàn mục tiêu. Sự tăng vọt trong trọng số attention giữa hai sàn giao dịch thường là tín hiệu của một cơ hội arbitrage sắp xảy ra.

3. Học Tăng Cường: Tác Nhân Học Cách Giao Dịch
Học Tăng Cường (RL) phù hợp tự nhiên với bài toán arbitrage. Trạng thái là sổ lệnh, vị thế và số dư. Hành động là giao dịch gì, ở đâu và với khối lượng bao nhiêu. Phần thưởng là lợi nhuận hoặc thua lỗ.
3.1 Lợi Nhuận Hàng Năm 142%
Kết quả ấn tượng nhất là Multi-Agent RL cho arbitrage cạnh tranh trên các DEX. Bằng cách phối hợp các tác nhân chuyên biệt (CEX-DEX, Cross-Chain và Triangular), các nhà nghiên cứu đạt được lợi nhuận hàng năm 142% so với 12% của các bot dựa trên quy tắc.
4. Phương Pháp Bayesian: Sự Không Chắc Chắn như Một Lợi Thế
Bayesian Online Changepoint Detection (BOCPD) phát hiện sự thay đổi chế độ theo thời gian thực. Khi "quy tắc" của thị trường thay đổi, mô hình nhận ra điều đó và yêu cầu chiến lược tạm dừng và hiệu chỉnh lại.
/// Bộ phát hiện thay đổi chế độ dựa trên BOCPD
pub struct BocpdDetector {
lambda: f64, // P(changepoint) = 1/lambda
run_length_probs: Vec<f64>, // phân phối độ dài chuỗi
}

5. Kiến Trúc Tích Hợp: Kết Hợp Tất Cả Lại
Sức mạnh thực sự đến từ sự tích hợp. Một pipeline tích hợp trên Rust trông như sau:
- Kỹ thuật Đặc Trưng: Các đặc trưng sổ lệnh, spread, giám sát CUSUM/EWMA.
- Phát hiện: GNN và Autoencoder tìm các bất thường.
- Tổng hợp Tín hiệu: Transformers hợp nhất dữ liệu đa sàn và spot-futures.
- Thực thi: Các tác nhân RL xác định kích thước và thời điểm tối ưu.
- Rủi ro: Định cỡ Bayesian và ranh giới Quá trình Gaussian.
Tổng Ngân Sách Độ Trễ: Với Rust và ONNX Runtime, có thể đạt được tổng độ trễ pipeline < 7,5 ms.
6. Kết Luận
ML trong arbitrage không phải là viên đạn bạc, mà là một kho vũ khí. GNN nhìn thấy cấu trúc, Transformers hợp nhất dữ liệu, RL thực thi và các phương pháp Bayesian quản lý sự không chắc chắn.
Trong phần cuối của loạt bài này, chúng ta sẽ xem xét chi tiết Triển khai Rust của hệ thống như vậy, tập trung vào độ chính xác nano giây và thực thi đa chân nguyên tử.
Đang huấn luyện các tác nhân của riêng bạn? Hãy xem Rust ML Trading Framework trên GitHub của chúng tôi.
Tác Giả
Trading-systems engineer
Trading-systems engineer building bots since 2017: cross-exchange arbitrage (connected up to 30 venues), cointegration-based pairs arbitrage across spot and futures, scalping, news and sentiment-driven strategies, trend algorithms, and portfolio management and balancing algorithms. Also builds sub-millisecond order execution, big-data warehouses, backtesting engines, AI agents, and trading interfaces (incl. open-source profitmaker.cc). Stack: JS/TS, Python, Rust/Zig/Go, DevOps, backend, frontend, architecture.