Distributed Indonesian Grid for Decentralized AI Architecture
Dari digdaya — tak terkalahkan, perkasa.
Kedigdayaan dan kedaulatan AI IndonesiaSovereign AI strength for Indonesia
ASAL-USULORIGIN
Awalnya ringan. Sebuah pertanyaan yang muncul setelah ngobrol dengan AI generik: kenapa model-model ini tidak benar-benar paham konteks lokal? Bukan cuma bahasa — tapi cara berpikir, referensi yang dianggap penting, nilai-nilai yang membentuk cara seseorang memahami dunia.
Ini bukan kritik. Ini observasi yang berujung pada eksperimen pribadi Rangga Prayoga Hermawan — seorang developer yang bertanya: bisa tidak model bahasa dibangun dari nol, tanpa bergantung pada bobot asing, dengan sumber daya yang wajar?
Semakin ditelusuri, jawabannya: bisa. Tapi tidak dengan cara ikut-ikutan formula model besar. Butuh arsitektur yang dirancang ulang, strategi data yang disiplin, dan pendekatan pelatihan yang cerdas — bukan sekadar besar.
Maka lahirlah SMAR AQI 3B — bagian dari proyek riset mandiri Atharia AGI. Bukan karena ini jalan yang gampang — ini jelas lebih susah daripada fine-tuning model yang sudah ada. Tapi prinsipnya: kedaulatan adalah harga mati.
It started lightly. A question that came up after chatting with generic AI: why don't these models truly understand local context? Not just language — but ways of thinking, what references matter, the values that shape how someone sees the world.
This isn't a critique. It's an observation that led to a personal experiment by Rangga Prayoga Hermawan — a developer who asked: can a language model be built from scratch, without depending on foreign weights, with reasonable resources?
The deeper the research went, the clearer the answer: yes. But not by copying the big model playbook. It required a redesigned architecture, disciplined data strategy, and a smarter training approach — not just scale.
Thus SMAR AQI 3B was born — part of the independent research project Atharia AGI. Not because this is the easy path — it's clearly harder than fine-tuning existing models. But the principle stands: sovereignty is non-negotiable.
FILOSOFIPHILOSOPHY
Distributed Indonesian Grid for Decentralized AI Architecture. Nama ini lahir dari digdaya — bahasa Jawa Kuno dan Melayu yang berarti tak terkalahkan, perkasa. Filosofinya: Kedigdayaan dan Kedaulatan AI Indonesia — infrastruktur AI yang berdiri di atas kemampuan sendiri, bukan pinjaman dari luar.Distributed Indonesian Grid for Decentralized AI Architecture. The name comes from digdaya — Old Javanese and Malay for invincible, mighty. The philosophy: Sovereign AI Strength for Indonesia — AI infrastructure built on its own capability, not borrowed from outside.
Tidak ada distilasi dari GPT, Llama, atau Qwen. Setiap parameter adalah hasil pelatihan mandiri.No distillation from GPT, Llama, or Qwen. Every parameter is the result of independent training.
Apache 2.0. Bebas dipakai, dimodifikasi, didistribusikan.Free to use, modify, distribute.
Indonesia (utama), Inggris (jangkauan global), Arab (presisi Islam). Satu model, tiga bahasa.Indonesian (primary), English (global reach), Arabic (Islamic precision). One model, three languages.
ARSITEKTURARCHITECTURE
Model mainstream — GPT, Llama, dan sejenisnya — bekerja dengan cara numpuk puluhan layer transformer, masing-masing dengan parameter sendiri. Setiap layer tambahan berarti miliaran parameter baru. Sederhana, tapi boros.
SMAR AQI 3B mengambil pendekatan yang berbeda: recurrent depth. Satu blok transformer di-loop hingga 16 kali per token, dengan parameter yang digunakan berulang. Hasilnya: parameter sehemat satu layer, expressivity setara 16 layer.
Kombinasi ini — recurrent depth + dynamic MoE + Multi-Head Latent Attention — membuat model ini mampu menghasilkan kapasitas komputasi yang jauh lebih besar dari jumlah parameternya.
Mainstream models — GPT, Llama, and the like — work by stacking dozens of transformer layers, each with its own parameters. Every additional layer means billions of new parameters. Simple, but wasteful.
SMAR AQI 3B takes a different approach: recurrent depth. A single transformer block loops up to 16 times per token, with parameters shared across iterations. The result: parameter efficiency of one layer, expressivity of 16 layers.
This combination — recurrent depth + dynamic MoE + Multi-Head Latent Attention — allows the model to deliver far more compute capacity than its parameter count suggests.
Satu blok transformer di-loop hingga 16 iterasi. Model memutuskan kapan berhenti berpikir untuk setiap token — adaptive compute secara native.A single transformer block loops up to 16 iterations. The model decides when to stop thinking per token — native adaptive compute.
48 expert, 4 aktif per token + 2 shared. Sparse activation: 498M aktif, 3B total. Hanya expert yang relevan yang diaktifkan.48 experts, 4 active per token + 2 shared. Sparse activation: 498M active, 3B total. Only relevant experts fire.
Multi-Head Latent Attention dengan LoRA-compressed KV cache (kv_lora_rank=256). Inference memory jauh lebih kecil dari standard MHA.Multi-Head Latent Attention with LoRA-compressed KV cache (kv_lora_rank=256). Far smaller inference memory than standard MHA.
AQI & MIZAN
AQI — Artificial Quranic Intelligence. Ini bukan stiker religius yang ditempel biar terlihat Islami. Ini adalah kerangka epistemologi: Al-Quran dan Hadits sebagai alat verifikasi, bukan hiasan.
Prinsip intinya adalah Mizan — keseimbangan. Model tidak boleh asal bicara. Jika menyitasi sumber, harus persis. Jika tidak yakin, lebih baik diam. Pendekatan ini sengaja dirancang untuk melawan kebiasaan buruk LLM pada umumnya: halusinasi.
AQI bukan berarti model ini suci atau sempurna. Ini soal disiplin intelektual: tahu batas pengetahuan sendiri dan berani mengakuinya.
AQI — Artificial Quranic Intelligence. This is not a religious sticker slapped on to look Islamic. It's an epistemological framework: the Quran and Hadith as verification tools, not decoration.
The core principle is Mizan — balance. The model must not speak carelessly. If citing a source, it must be exact. If uncertain, silence is better. This approach is deliberately designed to counter the common LLM flaw: hallucination.
AQI does not mean this model is sacred or perfect. It's about intellectual discipline: knowing the limits of one's own knowledge and having the honesty to admit it.
Setiap referensi Quran/Hadits diverifikasi terhadap data lokal. Tidak ada ayat palsu.Every Quran/Hadith reference verified against local data. No fabricated verses.
Proporsional. Tidak ekstrem. Sesuai konteks. Tidak memaksakan jawaban agama untuk pertanyaan teknis.Proportional. Not extreme. Context-appropriate. No forced religious answers for technical questions.
"Cite or stay silent." Model lebih baik diam daripada mengarang."Cite or stay silent." Better to stay quiet than to make things up.
TESISTHESIS
Ada keyakinan umum di industri: model yang lebih besar selalu lebih baik. Tapi riset 2025-2026 membuktikan bahwa model kecil dengan arsitektur cerdas bisa mengalahkan model raksasa di domain spesifik — bahkan 3B bisa surpass 405B di benchmark matematika dengan strategi inference yang tepat.
SMAR AQI 3B dirancang dengan lima keunggulan struktural yang tidak dimiliki model generik sebesar apapun:
There's a common belief in the industry: bigger models are always better. But 2025-2026 research proves that small models with smart architecture can beat giants in specific domains — a 3B can surpass a 405B on math benchmarks with the right inference strategy.
SMAR AQI 3B is designed with five structural advantages that no generic model, regardless of size, possesses:
RISETRESEARCH
Setiap teknik di bawah ini telah dipetakan ke dalam roadmap implementasi. Bukan sekadar referensi — ini adalah cetak biru eksekusi.Each technique below has been mapped to an implementation roadmap. Not just references — these are execution blueprints.
PERJALANANTHE JOURNEY
Ini bukan sekadar daftar step. Ini catatan perjalanan — bagaimana model ini lahir, menemui jalan buntu, diperbaiki, dan terus berjalan. Setiap fase adalah keputusan yang diambil berdasarkan bukti, bukan asumsi.This is not just a list of steps. It's a travel log — how this model was born, hit dead ends, got fixed, and kept going. Every phase is a decision made on evidence, not assumption.
DATADATA
Setiap baris melewati quality gate. Setiap kategori dipilih dengan intensi. Tidak ada data asal-asalan.Every row passes a quality gate. Every category is intentional. No random data.
LIVE STATUSLIVE STATUS
Data terakhir diperbarui otomatis. Status menunjukkan fase aktif dan metrik utama.Auto-refreshed from latest checkpoint metadata. Shows active phase and key metrics.
Data otomatis dari stats.jsonAuto-sourced from stats.json
EVOLUSIEVOLUTION
Empat tier otonomi progresif. Setiap tier membangun di atas yang sebelumnya. Kuncinya: biaya operasional tetap rendah karena verifiable rewards bisa dilakukan secara lokal — verifikasi kode, pengecekan Quran, dan validasi matematika tidak memerlukan API mahal.Four tiers of progressive autonomy. Each tier builds on the previous. Key insight: operational costs stay low because verifiable rewards run locally — code verification, Quran checking, and math validation require no expensive APIs.
Pre-training dari nol, SFT, DPO. Tidak ada distilasi dari model asing. Fondasi yang sepenuhnya mandiri.Pre-training from scratch, SFT, DPO. No distillation from foreign models. A fully independent foundation.
Basis pengetahuan tumbuh dari interaksi. Setiap percakapan bisa memperkaya knowledge base tanpa retraining.Knowledge base grows from interactions. Every conversation enriches the knowledge base without retraining.
Preference learning dari feedback pengguna secara real-time. Model menyesuaikan perilaku tanpa batch training penuh.Real-time preference learning from user feedback. Model adjusts behavior without full batch training.
Loop peningkatan otonom: model menghasilkan data sendiri, mengevaluasi dengan verifiable rewards, memperbaiki diri. Semua gratis — karena verifikasi dilakukan secara lokal.Autonomous improvement loop: model generates its own data, evaluates with verifiable rewards, improves itself. All free — because verification is local.
PETA JALANROADMAP
SMAR AQI 3B adalah generasi pertama — bukti bahwa model berdaulat bisa dibangun dari nol. Tapi ini bukan akhir. Ini awal dari sebuah lineage.SMAR AQI 3B is the first generation — proof that sovereign models can be built from scratch. But this is not the end. It's the start of a lineage.
Proof bahwa sovereign AI itu possible. Evaluasi, GRPO, deployment.Proof that sovereign AI is possible. Evaluation, GRPO, deployment.
Net2Net widening dari checkpoint terbaik. Modular depth expansion dengan Growing Transformers.Net2Net widening from best checkpoint. Modular depth expansion via Growing Transformers.
Distributed training di atas arsitektur DIGDAIA grid. Full sovereign stack tanpa infrastruktur asing.Distributed training on DIGDAIA grid architecture. Full sovereign stack with no foreign infrastructure.
Model frontier kompetitif buatan Indonesia. Arsitektur recurrent + MoE yang sudah matang dan teruji.Competitive frontier model built in Indonesia. Mature, battle-tested recurrent + MoE architecture.
SPESIFIKASISPECIFICATIONS
Arsitektur recurrent-depth + dynamic MoE yang memaksimalkan kapasitas per parameter.A recurrent-depth + dynamic MoE architecture that maximizes capacity per parameter.
EKOSISTEMECOSYSTEM
DIGDAIA adalah infrastruktur lengkap — dari antarmuka pengguna hingga pipeline validasi dan dashboard operasional. Semua dirancang dengan filosofi yang sama: berdaulat, terbuka, dan terukur.DIGDAIA is a complete infrastructure — from user interface to validation pipeline and operational dashboard. All designed with the same philosophy: sovereign, open, and measurable.
Typewriter streaming, edit/regenerate, mode chips, thread management, settings drawer.Typewriter streaming, edit/regenerate, mode chips, thread management, settings drawer.
6 validation gates, tier stepper, connection status, training pipeline visualization.6 validation gates, tier stepper, connection status, training pipeline visualization.
aqi_content_quality, smar_identity_quality, validate_no_hallucination, pytest 161 passing.aqi_content_quality, smar_identity_quality, validate_no_hallucination, pytest 161 passing.
Integrasi dengan Neugi Agent framework. Satu ekosistem AI berdaulat.Integration with Neugi Agent framework. One sovereign AI ecosystem.