Kronos: Model Asas yang Mengajar Carta Candlestick Berbicara dalam Bahasa Transformer

Jika pasaran adalah hingar-bingar, maka sebarang usaha untuk meramalkan lilin seterusnya adalah seperti menghuraikan statik radio. Para penulis Kronos mencadangkan pendekatan radikal: tukar lilin bursa kepada token diskret (seperti kata-kata dalam bahasa) dan latih transformer untuk meramalkan "kata seterusnya" — iaitu lilin berikutnya.
Ini bukan transformer siri masa sejagat "untuk semua keadaan" tetapi sebuah model khusus untuk K-line multidimensi (OHLCV) dengan ciri-ciri kalendar. Repositori shiyu-coder/Kronos terbuka di bawah MIT, berat model di Hugging Face, kertas diterima di AAAI 2026.
Idea Teras: Lilin = Bahasa
Sama seperti ChatGPT belajar meramalkan kata seterusnya dalam teks, Kronos belajar meramalkan lilin seterusnya dalam siri harga. Namun pertama sekali, anda perlu menyelesaikan masalah utama: lilin adalah vektor berterusan (buka, tinggi, rendah, tutup, isipadu), manakala transformer berfungsi dengan token diskret.
Penyelesaiannya — seni bina dua peringkat:
- Tokenizer (BSQ) — memampatkan lilin berterusan kepada kod diskret
- Dekoder (transformer) — meramalkan kod seterusnya secara autoregresi
Tokenizer BSQ: Cara Memampatkan Lilin kepada Dua Nombor

Modul utama — Binary Spherical Quantizer (BSQ):
- Vektor lilin berterusan diunjurkan ke atas sfera (
F.normalize) - Kemudian dikuantisasi kepada kod binari
- Kod dibahagikan kepada dua peringkat: kasar (S1) dan terperinci (S2)
Ini adalah pemfaktoran perbendaharaan kata: berbanding satu kamus besar bersaiz S1 × S2, model menggunakan dua jadual pembenaman kecil — jauh lebih cekap.
Dekoder Hierarki: Dahulu Senario, Kemudian Butiran
Kepala dwi (DualHead) berfungsi secara berurutan:
- Pertama model meramalkan S1 — "senario kasar" (naik? turun? lebih kurang berapa?)
- Kemudian dengan S1 tetap, menghalusi S2 — butiran (harga tepat, isipadu)
Pautan
- 💻 GitHub: shiyu-coder/Kronos
- 📄 Kertas: arXiv:2508.02739
- 📄 Lesen: MIT
Kesimpulan
Kronos bukan "sekadar transformer lain untuk siri masa" tetapi sebuah saluran paip yang koheren: tokenizer BSQ dengan kawalan codebook, model bahasa hierarki dengan dua peringkat diskretisasi, autoregresi dengan pensampelan dua peringkat, normalisasi tetingkap tempatan. Ini adalah pelaksanaan terbuka idea "lilin = bahasa".
Pengarang
Trading-systems engineer
Trading-systems engineer building bots since 2017: cross-exchange arbitrage (connected up to 30 venues), cointegration-based pairs arbitrage across spot and futures, scalping, news and sentiment-driven strategies, trend algorithms, and portfolio management and balancing algorithms. Also builds sub-millisecond order execution, big-data warehouses, backtesting engines, AI agents, and trading interfaces (incl. open-source profitmaker.cc). Stack: JS/TS, Python, Rust/Zig/Go, DevOps, backend, frontend, architecture.