![]() |
LMArena, yang bermula dari proyek riset di UC Berkeley, berhasil berkembang menjadi startup AI bernilai hampir Rp10 triliun. (iStockphoto) |
Dalam kurun waktu yang luar biasa singkat—kurang dari dua bulan—sebuah proyek akademis yang bermula di laboratorium riset kini menjelma menjadi startup dengan valuasi menembus $600 juta. Nama perusahaannya: LMArena, dan mereka baru saja mengamankan pendanaan awal sebesar $100 juta dari sejumlah investor papan atas seperti Andreessen Horowitz (a16z), UC Investments, serta Lightspeed, Felicis Ventures, dan Kleiner Perkins.
Namun kisah LMArena bukan sekadar cerita tentang uang dan valuasi tinggi. Ini adalah tentang bagaimana sebuah ide sederhana namun berdampak berhasil mengisi celah krusial dalam ekosistem AI global.
Berawal dari Laboratorium UC Berkeley
Segalanya dimulai pada awal 2023 di Sky Computing Lab, UC Berkeley. Proyek bernama Chatbot Arena ini dirancang oleh dua peneliti muda, Anastasios Angelopoulos dan Wei-Lin Chiang, di bawah bimbingan profesor kenamaan, Ion Stoica.
Tujuannya: menciptakan platform terbuka untuk mengevaluasi performa model AI melalui crowdsourcing—sebuah pendekatan yang kala itu masih jarang terdengar di dunia benchmarking kecerdasan buatan.
Berbeda dari uji coba internal yang tertutup, Chatbot Arena memungkinkan publik memberikan suara atas respons dari berbagai chatbot AI, secara anonim dan langsung berdampingan. Hasilnya? Sebuah leaderboard yang merepresentasikan preferensi pengguna nyata, bukan sekadar skor teknis.
Transformasi Menjadi Entitas Bisnis
Pada April 2025, proyek ini resmi berevolusi menjadi entitas komersial bernama LMArena. Dalam waktu singkat, mereka mencetak prestasi besar: mengumpulkan 100 juta dolar dari investor global dan menyentuh valuasi fantastis $600 juta.
Model bisnisnya cukup sederhana namun kuat. Dengan mengandalkan komunitas pengguna global, LMArena telah mengumpulkan lebih dari 3 juta voting terhadap lebih dari 400 model AI dari pemain besar seperti OpenAI, Google, DeepSeek, dan lainnya.
Platform ini bukan hanya sekadar kompetisi AI, melainkan telah menjadi barometer industri untuk mengukur kualitas model sebelum peluncuran resmi—contohnya, OpenAI menguji GPT-4o di platform ini sebelum diluncurkan ke publik.
Apa yang Membuat LMArena Berbeda?
LMArena tidak menggunakan sistem evaluasi AI konvensional. Mereka menerapkan metode crowdsourcing, di mana pengguna menilai respons berdasarkan kriteria subjektif seperti relevansi, kreativitas, dan bias—hal-hal yang sering kali luput dalam metrik teknis standar.
Sistem ini juga mengedepankan netralitas: platform tidak memihak model tertentu dan memberikan ruang yang sama bagi seluruh peserta, baik pemain besar maupun kecil. Ini membuat LMArena dianggap sebagai sumber evaluasi independen paling kredibel di tengah maraknya klaim performa AI yang belum tervalidasi.
Menuai Sorotan dan Kritik
Tentu, keberhasilan tidak datang tanpa tantangan. Sebuah studi dari tim peneliti Cohere, Stanford, dan MIT sempat menyuarakan kekhawatiran bahwa leaderboard LMArena bisa dimanipulasi oleh perusahaan besar.
Namun, Ion Stoica dengan tegas membantahnya, menyatakan bahwa sistem voting terbuka justru menjadi alat kontrol yang efektif terhadap bias.
“Setiap model punya peluang yang sama di platform kami,” ujar Stoica, seraya menegaskan komitmen mereka terhadap transparansi.
Angelopoulos menambahkan, "Kami percaya bahwa keterlibatan komunitas adalah cara terbaik untuk memastikan objektivitas—AI untuk semua, bukan hanya untuk korporasi besar."
Dengan 60% pengguna saat ini berasal dari industri teknologi, LMArena berencana memperluas jangkauan ke audiens yang lebih beragam. Pendanaan terbaru akan digunakan untuk mengembangkan fitur evaluasi domain-spesifik, memperluas kolaborasi internasional, dan meningkatkan inklusi pengguna non-teknisi agar hasil voting lebih representatif terhadap masyarakat luas.
Dalam roadmap jangka menengah, LMArena juga mempertahankan model akses gratis bagi komunitas sembari merancang fitur premium untuk perusahaan yang ingin pengujian mendalam, mendekatkan mereka pada impian menciptakan “standar emas” dalam benchmarking AI global.
Dari ruang kelas ke ruang rapat investor, LMArena menunjukkan bahwa kombinasi antara visi riset dan momentum pasar bisa menghasilkan dampak nyata.
Di tengah derasnya inovasi AI, mereka hadir bukan sebagai pembuat model, tetapi sebagai juri yang dipercaya banyak pihak. Dan di dunia yang makin dikendalikan algoritma, siapa yang menghakimi AI justru menjadi lebih penting dari AI itu sendiri.
0Komentar