Microsoft Maia 200, akselerator kecerdasan buatan (AI) generasi kedua buatan Microsoft. | Microsoft


Microsoft meluncurkan Maia 200, chip kecerdasan buatan (artificial intelligence/AI) in-house generasi kedua, pada Senin (26/1). Akselerator ini dirancang untuk mempercepat kemandirian perangkat keras Microsoft sekaligus mengurangi ketergantungan pada Nvidia, di tengah lonjakan permintaan komputasi AI global.

Maia 200 mulai dioperasikan di pusat data Microsoft di Iowa, dengan rencana penerapan lanjutan di fasilitas Arizona, sebagaimana dilaporkan Reuters. Chip tersebut difokuskan untuk beban kerja inferensi AI dan diklaim menawarkan performa FP4 hingga tiga kali lipat dibandingkan prosesor Trainium generasi ketiga milik Amazon serta TPU Alphabet.

Pengembangan akselerator ini ditempatkan sebagai bagian dari strategi Microsoft memperkuat kendali atas rantai pasok komputasi AI, seiring meningkatnya kebutuhan kapasitas dari layanan cloud dan produk berbasis kecerdasan buatan. 

Langkah ini juga berlangsung ketika perusahaan teknologi global berlomba mengembangkan akselerator khusus guna menekan biaya dan mengurangi dominasi Nvidia, yang masih menguasai sekitar 85% pasar akselerator AI, menurut sejumlah analis industri.

Menyasar keunggulan software Nvidia

Di luar sisi perangkat keras, Microsoft membidik keunggulan utama Nvidia pada ranah perangkat lunak, yakni platform CUDA. Perusahaan mengumumkan akan menyediakan Triton, tool pemrograman open-source yang dikembangkan dengan kontribusi besar dari OpenAI, untuk mempermudah pengembangan aplikasi di atas Maia 200.

Triton pertama kali dirilis OpenAI pada 2021 dan dirancang agar peneliti maupun pengembang tanpa pengalaman CUDA tetap dapat menulis kode GPU dengan performa mendekati tingkat ahli. Menurut OpenAI, pendekatan ini ditujukan memangkas hambatan teknis yang selama ini membatasi adopsi alternatif di luar ekosistem Nvidia.

Penyediaan lapisan perangkat lunak tersebut diposisikan untuk menurunkan switching costs yang membuat banyak pengembang bertahan pada platform Nvidia. Dengan pendekatan ini, Microsoft berharap Maia 200 dapat lebih cepat diterima oleh ekosistem pengembang cloud dan AI.

Maia 200 diproduksi oleh Taiwan Semiconductor Manufacturing Co menggunakan teknologi fabrikasi 3-nanometer dan dilengkapi memori high-bandwidth. Namun, generasi memori yang digunakan disebut lebih lama dan lebih lambat dibandingkan chip “Vera Rubin” milik Nvidia yang diumumkan awal bulan ini, menurut laporan Reuters.

Raksasa cloud membangun chip mereka sendiri

Peluncuran Maia 200 mencerminkan tren lebih luas di industri cloud, di mana penyedia besar mengembangkan chip khusus untuk menyaingi Nvidia. Google, misalnya, terus mendorong adopsi TPU internalnya dan menarik minat pelanggan utama Nvidia seperti Meta Platforms, yang tengah berupaya memperkecil kesenjangan perangkat lunak antara TPU Google dan platform Nvidia.

Microsoft sendiri mengadopsi pendekatan desain yang juga digunakan sejumlah pesaing baru Nvidia. Maia 200 dikemas dengan SRAM dalam jumlah besar, jenis memori berkecepatan tinggi yang digunakan untuk chatbot dan sistem AI dengan volume permintaan pengguna yang padat. Strategi ini serupa dengan pendekatan Cerebras Systems dan Groq, dua pemain yang belakangan mendapat perhatian melalui kesepakatan bernilai besar dengan OpenAI dan Nvidia.

Maia 200 merupakan generasi lanjutan dari Maia 100 yang diperkenalkan Microsoft pada akhir 2023. Proses pengembangannya sempat mengalami penundaan akibat perubahan desain yang diminta OpenAI serta pergantian staf internal. Produksi massal chip ini dijadwalkan berlangsung pada 2026, meskipun pengoperasian awal di pusat data Microsoft telah dimulai tahun ini.