GNN و Transformer و RL للمراجحة: عندما تتعلم الشبكات العصبية التداول
الجزء الخامس من سلسلة "سلاسل المراجحة المعقدة بين العقود الآجلة والفورية"
تخيل أستاذاً كبيراً في الشطرنج يرى، بدلاً من الرقعة، عشر بورصات بمئات أزواج التداول، وبدلاً من 32 قطعة، يرى آلاف الأوامر المحدثة كل مللي ثانية. الخوارزميات الكلاسيكية مثل Bellman-Ford تستكشف الرسم البياني بأمانة، لكن بحلول الوقت الذي تجد فيه دورة مربحة، تكون نافذة الفرصة قد أُغلقت بالفعل. نحتاج نهجاً آخر — ليس مجرد خوارزمي، بل متعلم.
في هذه المقالة، نستكشف كيف تحول أساليب التعلم الآلي الحديثة السوق الفوضوي متعدد البورصات إلى مهمة منظمة. شبكات الرسوم البيانية العصبية (GNN) والمحولات (Transformer) والتعلم المعزز (RL) تعيد تعريف ما هو ممكن في عالم المراجحة.
مشهد أساليب التعلم الآلي لاكتشاف وتنفيذ المراجحة: من شبكات الرسوم البيانية العصبية إلى الخوارزميات التطورية.

1. شبكات الرسوم البيانية العصبية: عندما يكون السوق رسماً بيانياً
سوق العملات المشفرة متعدد البورصات هو رسم بياني بطبيعته. العقد هي الأصول (BTC، ETH، SOL) أو أزواج "أصل-بورصة". الحواف هي روابط تداول مرجحة بالفروقات والأحجام والرسوم والتأخيرات.
خوارزمية Bellman-Ford الكلاسيكية تحل المهمة بتعقيد . شبكات الرسوم البيانية العصبية (GNN) تتعلم التعرف على الأنماط التي تسبق فرص المراجحة، مثل "حدس" سائق التاكسي لمكان الازدحام المروري.
1.1 GraphSAGE مع دمج الحواف
باستخدام GraphSAGE مع وحدة دمج حواف مخصصة، حقق الباحثون:
- درجة F1: 0.90 — 9 من أصل 10 فرص متوقعة حقيقية.
- الاستدلال: 78 مللي ثانية على CPU — سريع بما يكفي للعديد من نوافذ المراجحة.
use burn::prelude::*;
use burn::nn::{Linear, LinearConfig, Relu};
#[derive(Module, Debug)]
pub struct EdgeFusionModule<B: Backend> {
fc1: Linear<B>,
fc2: Linear<B>,
fc_out: Linear<B>,
relu: Relu,
}
2. Transformer: الانتباه هو كل ما تحتاجه
إذا كانت GNN تعمل مع بنية السوق، فإن Transformer تعمل مع تدفقات البيانات. الانتباه الذاتي متعدد الرؤوس يلتقط التبعيات عبر الأصول والبورصات دون الحاجة لتحديد من يؤثر على من بشكل صريح.
2.1 انتباه متعدد الرؤوس لدمج البورصات المتعددة
تُظهر أوزان آلية الانتباه أي البورصات أكثر إفادة للتنبؤ بالسعر على البورصة المستهدفة. الارتفاع المفاجئ في وزن الانتباه بين بورصتين غالباً ما يكون إشارة لفرصة مراجحة وشيكة.

3. التعلم المعزز: الوكيل الذي يتعلم التداول
التعلم المعزز (RL) يتناسب بشكل طبيعي مع مشكلة المراجحة. الحالة هي دفاتر الأوامر والمراكز والأرصدة. الإجراء هو ماذا نتداول، وأين، وبأي حجم. المكافأة هي الربح أو الخسارة.
3.1 عوائد سنوية 142%
النتيجة الأكثر إثارة للإعجاب هي التعلم المعزز متعدد الوكلاء للمراجحة التنافسية على DEX. من خلال تنسيق وكلاء متخصصين (CEX-DEX، عبر السلاسل، وثلاثي)، حقق الباحثون عوائد سنوية 142% مقابل 12% للبوتات القائمة على القواعد.
4. الأساليب البايزية: عدم اليقين كميزة
اكتشاف نقاط التغيير البايزي عبر الإنترنت (BOCPD) يكتشف تغييرات النظام في الوقت الفعلي. عندما تتغير "قواعد" السوق، يتعرف النموذج على ذلك ويخبر الاستراتيجية بالتوقف وإعادة المعايرة.
/// Regime change detector based on BOCPD
pub struct BocpdDetector {
lambda: f64, // P(changepoint) = 1/lambda
run_length_probs: Vec<f64>, // run length distribution
}

5. البنية المتكاملة: تجميع كل شيء معاً
القوة الحقيقية تأتي من التكامل. خط أنابيب متكامل في Rust يبدو هكذا:
- هندسة الميزات: ميزات دفتر الأوامر، الفروقات، مراقبة CUSUM/EWMA.
- الاكتشاف: GNN والمشفرات التلقائية لإيجاد الشذوذ.
- دمج الإشارات: Transformer لدمج بيانات البورصات المتقاطعة والفورية-الآجلة.
- التنفيذ: وكلاء RL لتحديد الحجم والتوقيت الأمثل.
- المخاطر: تحجيم بايزي وحدود العمليات الغاوسية.
ميزانية التأخير الإجمالية: مع Rust و ONNX Runtime، يمكن تحقيق تأخير إجمالي لخط الأنابيب أقل من 7.5 مللي ثانية.
6. الخلاصة
التعلم الآلي في المراجحة ليس حلاً سحرياً، بل ترسانة من الأدوات. GNN ترى البنية، Transformer تدمج البيانات، RL ينفذ، والأساليب البايزية تدير عدم اليقين.
في الجزء الأخير من هذه السلسلة، سننظر في تفاصيل تنفيذ Rust لنظام كهذا، مع التركيز على دقة النانوثانية والتنفيذ الذري متعدد الأرجل.
تدرب وكلاءك الخاصين؟ تفقد إطار عمل Rust ML للتداول على GitHub.
MarketMaker.cc Team
البحوث والاستراتيجيات الكمية