Perang harga AI China makin panas. Setelah DeepSeek membuat diskon API 75% menjadi permanen, Xiaomi MiMo ikut menekan harga dengan klaim pemangkasan biaya API hingga 99% untuk seri MiMo-V2.5.
Buat developer, ini bukan sekadar kabar diskon biasa. Harga API yang makin murah bisa mengubah cara orang membangun agent, chatbot, workflow automation, sampai aplikasi dengan context panjang. Biaya yang dulu terasa mahal untuk eksperimen harian sekarang mulai masuk akal untuk dipakai lebih agresif.
Yang menarik, perang harga ini terjadi di antara dua pemain China yang sama-sama ingin merebut hati developer global. DeepSeek datang dengan reputasi model reasoning dan coding yang kuat, sementara Xiaomi MiMo membawa nama besar Xiaomi plus integrasi ekosistem yang lebih luas.
Perang harga AI China dimulai dari DeepSeek
DeepSeek lebih dulu menarik perhatian setelah menurunkan harga API untuk model deepseek-v4-pro. Dalam halaman pricing resminya, DeepSeek menampilkan harga baru dengan label diskon 75% untuk beberapa komponen utama.
Harga DeepSeek V4-Pro kini berada di kisaran:
- $0.003625 per 1 juta input token untuk cache hit
- $0.435 per 1 juta input token untuk cache miss
- $0.87 per 1 juta output token
Sebelumnya, harga yang dibandingkan DeepSeek adalah $0.0145 untuk cache hit, $1.74 untuk cache miss, dan $3.48 untuk output. Kalau dihitung, harga baru itu memang turun menjadi seperempat harga lama alias diskon 75%.
Efeknya cukup besar. Untuk aplikasi yang banyak melakukan reasoning, coding assistance, summarization, atau agentic workflow, biaya output biasanya menjadi salah satu komponen paling terasa. Ketika output turun ke bawah $1 per 1 juta token, developer punya ruang lebih besar untuk bereksperimen.
Xiaomi MiMo membalas dengan diskon hingga 99%
Tak lama setelah itu, Xiaomi MiMo ikut masuk ke percakapan. Seri MiMo-V2.5 diposisikan sebagai model agentic dan multimodal dengan dukungan context panjang, termasuk MiMo-V2.5 dan MiMo-V2.5-Pro.
Untuk MiMo-V2.5-Pro, harga yang beredar dibuat sangat dekat dengan DeepSeek V4-Pro:
- $0.0036 per 1 juta input token untuk cache hit
- $0.435 per 1 juta input token untuk cache miss
- $0.87 per 1 juta output token
Dengan angka ini, Xiaomi terlihat jelas ingin menempel DeepSeek di level harga flagship. Namun MiMo-V2.5 versi non-Pro justru lebih agresif. Angkanya berada di sekitar $0.14 untuk input cache miss dan $0.28 untuk output per 1 juta token.
Artinya, MiMo-V2.5 biasa bisa sekitar 3 kali lebih murah dibanding model Pro untuk input miss dan output. Ini menarik untuk workload yang tidak selalu butuh model flagship, misalnya klasifikasi, ekstraksi data, draft awal, routing agent, atau pekerjaan repetitif dengan toleransi kualitas yang masih bisa diterima.
Kenapa klaim 99% perlu dibaca hati-hati?
Klaim “hingga 99%” dari Xiaomi bukan berarti semua jenis token otomatis turun 99%. Angka itu lebih masuk akal jika dibandingkan dengan beberapa skenario lama, terutama cache hit dan context panjang.
Contohnya, jika harga cache hit lama untuk MiMo-V2.5-Pro berada di $0.20 lalu turun menjadi $0.0036, penurunannya sekitar 98,2%. Jika dibandingkan dengan skenario lama $0.40, penurunannya bisa sekitar 99,1%.
Namun untuk output, penurunannya tidak selalu sebesar itu. Karena itu, developer tetap perlu melihat detail penggunaan: apakah aplikasinya lebih banyak input, output, cache hit, cache miss, atau context panjang.
Bagian lain yang perlu diperhatikan adalah sistem paket Xiaomi MiMo yang menggunakan credits. Credits tidak selalu sama dengan token mentah. Nilai akhirnya bergantung pada model dan jenis pemakaian. Jadi, angka seperti miliaran credits terdengar besar, tetapi harus diterjemahkan dulu ke kebutuhan token nyata.
Apa artinya buat developer dan startup?
Buat developer, perang harga ini jelas kabar baik. Biaya inference yang lebih murah membuat banyak ide yang sebelumnya mahal jadi lebih realistis. Misalnya, aplikasi customer support dengan agent multi-step, AI coding assistant internal, sistem analisis dokumen panjang, sampai workflow otomasi yang memanggil model berkali-kali.
Namun ada satu pelajaran penting: jangan memilih model hanya karena headline harga. Harga murah memang menggoda, tapi kualitas, latency, stabilitas API, rate limit, ekosistem SDK, keamanan data, dan konsistensi output tetap harus diuji.
Untuk startup, strategi paling masuk akal adalah memakai beberapa model sekaligus. Model mahal bisa dipakai untuk tugas yang benar-benar butuh kualitas tinggi, sementara model murah seperti MiMo-V2.5 atau DeepSeek yang sedang diskon bisa dipakai untuk workload volume besar.
Di sinilah konsep model routing makin penting. Aplikasi modern tidak harus bergantung pada satu provider saja. Request sederhana bisa diarahkan ke model murah, sedangkan request kompleks baru dinaikkan ke model yang lebih kuat.
Baca juga: X Premium, OpenClaw, dan Grok: Saat Agent Lokal Mulai Jadi Workflow Serius
Tekanan untuk OpenAI, Anthropic, dan Google
Kalau tren ini berlanjut, tekanan terbesar bukan hanya ke sesama pemain China. Model Barat seperti OpenAI, Anthropic, dan Google juga akan ikut terdampak dari sisi persepsi harga.
Developer yang membangun produk akan mulai bertanya: apakah semua request harus memakai model premium Barat? Atau sebagian besar workload bisa dipindahkan ke model China yang lebih murah, lalu model premium hanya dipakai untuk lapisan final?
Jawaban tiap tim tentu berbeda. Untuk sektor yang sensitif, isu privasi dan regulasi bisa menjadi pertimbangan besar. Tapi untuk eksperimen, internal tooling, prototyping, atau workload non-sensitif, harga murah seperti ini sulit diabaikan.
Kesimpulan
Perang harga AI China antara DeepSeek dan Xiaomi MiMo menunjukkan bahwa kompetisi API AI sudah masuk fase baru. Bukan hanya siapa yang paling pintar, tetapi siapa yang bisa menawarkan performa cukup bagus dengan biaya paling efisien.
DeepSeek membuat diskon 75% menjadi permanen untuk V4-Pro. Xiaomi MiMo membalas dengan pemangkasan hingga 99% pada beberapa skenario, sambil menawarkan MiMo-V2.5 yang lebih murah untuk workload harian.
Bagi developer, ini momentum menarik. Biaya turun, pilihan model bertambah, dan eksperimen AI agent jadi makin terjangkau. Tapi tetap ada catatan penting: pahami struktur harga, baca detail credits, dan uji kualitas model di workload nyata sebelum memindahkan sistem produksi.
Sumber
- DeepSeek API Pricing
- Xiaomi MiMo Home
- Xiaomi MiMo-V2.5 Release Page
- XiaomiMiMo/MiMo-V2.5 di Hugging Face