Kronos: Model Fondasi yang Mengajarkan Grafik Candlestick Berbicara dalam Bahasa Transformer

Jika pasar adalah kebisingan, maka setiap upaya untuk memprediksi candle berikutnya ibarat menguraikan statis radio. Para penulis Kronos mengusulkan pendekatan radikal: mengonversi candle bursa menjadi token diskret (seperti kata-kata dalam bahasa) dan melatih transformer untuk memprediksi "kata berikutnya" — yaitu, candle berikutnya.
Ini bukan transformer deret waktu universal "untuk semua keperluan", melainkan sebuah model khusus untuk K-line multidimensi (OHLCV) dengan fitur kalender. Repositori shiyu-coder/Kronos terbuka di bawah lisensi MIT, bobot model tersedia di Hugging Face, dan makalahnya diterima di AAAI 2026.
Ide Inti: Candle = Bahasa
Sama seperti ChatGPT belajar memprediksi kata berikutnya dalam teks, Kronos belajar memprediksi candle berikutnya dalam rangkaian harga. Namun pertama-tama, perlu diselesaikan masalah utama: sebuah candle adalah vektor kontinu (open, high, low, close, volume), sementara transformer bekerja dengan token diskret.
Solusinya — arsitektur dua tingkat:
- Tokenizer (BSQ) — mengompresi candle kontinu menjadi kode diskret
- Decoder (transformer) — memprediksi kode berikutnya secara autoregressif
Tokenizer BSQ: Cara Mengompresi Candle Menjadi Dua Angka

Modul kunci — Binary Spherical Quantizer (BSQ):
- Vektor candle kontinu diproyeksikan ke sebuah bola (
F.normalize) - Kemudian dikuantisasi menjadi kode biner
- Kode dibagi menjadi dua level: kasar (S1) dan detail (S2)
Ini adalah faktorisasi kosakata: alih-alih satu kamus besar berukuran S1 × S2, model menggunakan dua tabel embedding kecil — jauh lebih efisien.
Decoder Hierarkis: Pertama Skenario, Baru Detail
Head ganda (DualHead) bekerja secara berurutan:
- Pertama model memprediksi S1 — "skenario kasar" (naik? turun? kira-kira berapa banyak?)
- Kemudian dengan S1 tetap, menyempurnakan S2 — detail (harga tepat, volume)
Tautan
- 💻 GitHub: shiyu-coder/Kronos
- 📄 Makalah: arXiv:2508.02739
- 📄 Lisensi: MIT
Kesimpulan
Kronos bukan "transformer deret waktu yang lain" melainkan sebuah pipeline yang koheren: tokenizer BSQ dengan kontrol codebook, model bahasa hierarkis dengan dua tingkat diskretisasi, autoregresi dengan sampling dua tahap, normalisasi jendela lokal. Ini adalah implementasi terbuka dari ide "candle = bahasa".
Penulis
Trading-systems engineer
Trading-systems engineer building bots since 2017: cross-exchange arbitrage (connected up to 30 venues), cointegration-based pairs arbitrage across spot and futures, scalping, news and sentiment-driven strategies, trend algorithms, and portfolio management and balancing algorithms. Also builds sub-millisecond order execution, big-data warehouses, backtesting engines, AI agents, and trading interfaces (incl. open-source profitmaker.cc). Stack: JS/TS, Python, Rust/Zig/Go, DevOps, backend, frontend, architecture.