Huawei Ungkap CloudMatrix AI Ungguli Nvidia H800
- Rita Puspita Sari
- •
- 15 jam yang lalu

Ilustrasi Huawei
Persaingan di ranah teknologi kecerdasan buatan (AI) kian memanas. Dalam pernyataan mengejutkan, Huawei mengklaim bahwa sistem CloudMatrix AI mereka berhasil melampaui performa salah satu unit pemrosesan grafis (GPU) terkuat dari Nvidia, yaitu H800. Klaim ini dituangkan dalam makalah teknis terperinci yang dirilis Huawei pekan ini, hasil kerja sama dengan startup AI asal Tiongkok, SiliconFlow.
Di tengah tekanan geopolitik dan sanksi dari Amerika Serikat, Huawei tampak berusaha keras menunjukkan bahwa mereka masih memiliki taring di dunia teknologi. Namun, seberapa kuat dasar dari klaim tersebut? Apakah benar Huawei telah menciptakan lompatan teknologi yang bisa menyaingi dominasi Nvidia, ataukah ini hanya strategi branding di tengah blokade dagang global?
Langkah Berani Huawei: CloudMatrix AI dalam Sorotan
Dalam laporan resmi Huawei, disebutkan bahwa CloudMatrix AI dengan arsitektur terbarunya, CloudMatrix384 mampu melampaui performa GPU Nvidia H800 saat menjalankan model AI canggih DeepSeek-R1. Ini merupakan pertama kalinya Huawei merilis data performa secara terbuka dari arsitektur ini, menjadikannya langkah penting untuk menarik perhatian dunia teknologi.
Namun, ada catatan penting: seluruh pengujian dilakukan secara internal oleh Huawei sendiri. Hal ini menimbulkan pertanyaan di kalangan pengamat teknologi mengenai objektivitas dan keabsahan klaim tersebut, apalagi dalam konteks persaingan strategis antara Tiongkok dan Amerika Serikat di bidang teknologi tinggi.
Membedah Arsitektur CloudMatrix384: Apa yang Membuatnya Istimewa?
CloudMatrix384 adalah sistem yang dirancang sebagai “arsitektur pusat data AI generasi berikutnya”. Di dalamnya, Huawei menggabungkan 384 Ascend 910C Neural Processing Unit (NPU) dan 192 CPU Kunpeng ke dalam satu "supernode". Supernode ini menggunakan teknologi Unified Bus (UB)—jalur komunikasi internal dengan kecepatan tinggi dan latensi rendah.
Tidak seperti desain konvensional yang bersifat hirarkis, CloudMatrix menggunakan pendekatan peer-to-peer. Ini berarti semua komponen dapat berkomunikasi langsung satu sama lain (all-to-all communication), memungkinkan fleksibilitas dan efisiensi yang lebih tinggi dalam berbagi sumber daya komputasi dan memori.
Pendekatan ini diklaim sangat cocok untuk kebutuhan komputasi masa depan, termasuk dalam arsitektur mixture-of-experts (MoE), di mana bagian-bagian dari model AI dapat diaktifkan secara selektif untuk meningkatkan efisiensi dan kecepatan.
Klaim Performa: Huawei Tunjukkan Angka yang Menarik
Menurut hasil pengujian internal Huawei, sistem CloudMatrix mampu mencapai angka throughput yang sangat tinggi:
- Prefill (tahap pemrosesan pertanyaan): 6.688 token/detik per unit
- Decode (tahap menjawab pertanyaan): 1.943 token/detik per unit
Untuk memberikan konteks, satu token bisa diibaratkan sebagai satu kata atau bagian kata. Jadi, sistem ini dapat memproses ribuan kata dalam hitungan detik.
Tak hanya itu, Huawei mengklaim bahwa waktu per token output (TPOT) berada di bawah 50 milidetik. Artinya, AI mereka mampu menghasilkan satu kata dalam waktu kurang dari 1/20 detik—angka yang sangat kompetitif dalam industri AI.
Dari sisi efisiensi komputasi (compute efficiency), Huawei juga mencatat hasil:
- 4,45 token/detik/TFLOPS untuk tahap prefill
- 1,29 token/detik/TFLOPS untuk tahap decode
Sebagai catatan, TFLOPS adalah satuan pengukuran daya komputasi (triliun operasi floating-point per detik), mirip seperti tenaga kuda pada mesin mobil. Klaim ini berarti bahwa chip Huawei mampu menghasilkan lebih banyak hasil kerja AI per unit energi dibanding Nvidia H800 atau bahkan H100.
Inovasi Teknis di Balik CloudMatrix: Bukan Sekadar Angka
Angka-angka impresif tadi tidak berdiri sendiri. Dalam makalahnya, Huawei menjelaskan tiga pilar inovasi teknis yang menjadi fondasi CloudMatrix384:
- Arsitektur Layanan Peer-to-Peer
Dengan memecah inferensi AI menjadi tiga bagian—prefill, decode, dan cache—sistem ini dapat diskalakan secara modular dan efisien. - Paralelisme Pakar Skala Besar
Sistem ini mendukung konfigurasi EP320, di mana setiap chip NPU bisa menjadi satu "pakar" tersendiri, mempercepat proses pelatihan dan inferensi model AI besar. - Optimasi Berbasis Perangkat Keras
Termasuk di dalamnya teknik kuantisasi INT8, pemrosesan mikro-batch, dan penggunaan operator yang dioptimalkan untuk meningkatkan kecepatan sekaligus menghemat daya.
Huawei juga mengklaim bahwa teknik kuantisasi mereka mampu mempertahankan akurasi model yang sebanding dengan versi asli DeepSeek-R1, berdasarkan 16 benchmark internal.
Namun, Tanpa Verifikasi Independen, Akankah Dunia Percaya?
Semua pencapaian tersebut terdengar mengesankan. Tetapi satu hal krusial belum dilakukan: verifikasi pihak ketiga.
Dalam dunia teknologi tinggi, khususnya AI dan komputasi, validasi dari badan atau lembaga independen adalah standar emas. Tanpanya, publik dan komunitas ilmiah tidak bisa menilai dengan objektif seberapa valid atau dapat dipercaya hasil tersebut.
Huawei tentu menyadari hal ini. Namun, dalam kondisi politik dan ekonomi global saat ini, perusahaan asal Tiongkok itu tampaknya ingin mengambil inisiatif untuk membangun kepercayaan dalam negeri terlebih dahulu sebelum merambah lebih jauh ke kancah global.
Geopolitik dan Perang Teknologi: Di Balik Layar Teknologi Canggih
Penting untuk melihat klaim Huawei ini dalam konteks geopolitik. Hubungan antara Tiongkok dan Amerika Serikat di bidang teknologi semakin memanas, terutama setelah sanksi yang membatasi akses Huawei terhadap teknologi chip mutakhir dari perusahaan-perusahaan AS seperti Nvidia.
Pendiri Huawei, Ren Zhengfei, pernah mengakui bahwa produk chip buatan dalam negeri masih tertinggal satu generasi. Namun, ia percaya bahwa dengan strategi clustering—menggabungkan banyak chip dalam satu sistem—mereka bisa menandingi performa sistem paling canggih dunia.
CEO Nvidia, Jensen Huang, juga mengakui bahwa AI adalah masalah paralelisme. Dkutip dalam wawancara dengan CNBC, ia menyebut, “Kalau satu komputer tidak cukup kuat, tambahkan yang lain. Di Tiongkok, mereka punya sumber daya yang cukup untuk melakukannya.”
Pernyataan ini, meski diplomatis, memberi sinyal bahwa pendekatan Huawei bukanlah mimpi kosong, melainkan solusi teknis yang bisa relevan dalam konteks keterbatasan akses teknologi barat.