Perkembangan kecerdasan buatan (AI) semakin pesat, dan DeepSeek, salah satu perusahaan AI asal China, berhasil menarik perhatian dunia dengan pendekatan efisiennya. Mereka menggunakan 2.048 GPU Nvidia H800 untuk melatih model terbarunya, DeepSeek-V3, dengan biaya lebih rendah dibandingkan kompetitor seperti OpenAI.
DeepSeek-V3: Efisiensi Pelatihan AI dengan GPU Nvidia H800
Menurut laporan pendiri DeepSeek, Liang Wenfeng, pelatihan model DeepSeek-V3 dilakukan menggunakan 2.048 unit GPU Nvidia H800—chip yang dirancang khusus untuk pasar China akibat pembatasan ekspor AS.
“DeepSeek-V3 yang dilatih dengan 2.048 GPU Nvidia H800 menunjukkan bagaimana optimasi hardware dapat membuat pelatihan dan inferensi AI lebih efisien,” tulis Liang.
Dibandingkan dengan OpenAI yang membutuhkan sumber daya komputasi jauh lebih besar, DeepSeek berhasil mencapai performa setara dengan biaya lebih rendah.
Optimasi Teknis DeepSeek untuk Efisiensi AI
DeepSeek tidak hanya mengandalkan hardware canggih, tetapi juga melakukan berbagai optimasi, seperti:
✔ Peningkatan efisiensi memori
✔ Optimasi komunikasi antar-chip
✔ Penyempurnaan infrastruktur AI
Metode ini diklaim mampu mengurangi biaya komputasi sekaligus mempercepat proses inferensi (pengambilan keputusan AI).
Dampak DeepSeek pada Industri AI China
Keberhasilan DeepSeek memicu percepatan pengembangan AI di China. Beberapa perusahaan besar seperti Alibaba dan Baidu kini mengadopsi pendekatan serupa.
- Alibaba meluncurkan Qwen3, model open source yang mengalahkan popularitas DeepSeek-V3.
- Baidu merilis Ernie 4.5 Turbo dengan kemampuan multimodal reasoning dan harga 40% lebih murah.
Masa Depan DeepSeek: Lebih Banyak Inovasi AI?
Meskipun DeepSeek sempat “terdiam” setelah merilis DeepSeek-R1, perusahaan ini tetap aktif mempublikasikan penelitiannya. Industri AI China terus berkembang pesat, dan DeepSeek diprediksi akan meluncurkan model lebih canggih di masa depan.
Tinggalkan Balasan