![]() |
(KOMPAS.com/Yudha Pratomo) |
Pada 2024, dua pakar terkemuka di bidang komputer, Rich Sutton dan Andrew Barto, dianugerahi Turing Award, penghargaan tertinggi untuk kontribusi luar biasa di dunia teknologi. Salah satu karya penting Sutton, esai The Bitter Lesson (2019), menyoroti bagaimana pendekatan berbasis komputasi intensif terbukti jauh lebih efektif dalam pengembangan kecerdasan buatan (AI) dibandingkan metode berbasis pengetahuan manusia.
Seiring waktu, pelajaran serupa kembali terlihat dalam sejarah AI, termasuk lewat kemajuan model bahasa besar (Large Language Models atau LLM) seperti ChatGPT dan DeepSeek. Model ini bekerja dengan memprediksi kata-kata berikutnya berdasarkan probabilitas, setelah dilatih menggunakan data dalam jumlah yang sangat besar.
Awal mula model bahasa berbasis probabilitas bisa ditelusuri ke tahun 1948 melalui penelitian Claude Shannon, pelopor di bidang informasi. Model serupa sempat digunakan dalam teknologi penerjemahan mesin dan pengenalan suara pada 1970-an dan 1980-an. Versi awal LLM dengan pelatihan skala besar mulai muncul pada 2007 dan menjadi bagian penting dari layanan Google Translate yang baru diluncurkan saat itu.
Model bahasa pada masa itu masih mengandalkan statistik sederhana, berbeda dengan teknologi transformers yang diperkenalkan pada 2017. Transformers membawa perubahan besar dengan memungkinkan pemahaman konteks yang lebih mendalam dalam setiap kalimat, memicu lahirnya generasi LLM modern.
Perkembangan dan Tantangan Google Translate
Selama dua dekade terakhir, penerjemahan mesin (MT) berkembang pesat, berkat teknologi yang makin canggih dan ketersediaan data yang melimpah. Pada awalnya, Google Translate hanya mendukung tiga bahasa: Inggris, Mandarin, dan Arab. Kini, layanan ini sudah mencakup 249 bahasa — meski jumlah itu masih jauh dari total sekitar 7.000 bahasa yang ada di dunia.
Untuk bahasa-bahasa besar seperti Inggris dan Spanyol, hasil terjemahan Google Translate tergolong baik. Namun, untuk banyak bahasa lainnya, kualitas terjemahan masih sering kurang akurat, terutama dalam menangani ungkapan, istilah teknis, dan perbedaan makna halus.
Evaluasi rutin terhadap layanan MT menunjukkan bahwa penerjemahan mesin masih memiliki banyak kekurangan. Walaupun aplikasinya telah mencapai lebih dari 1 miliar unduhan pada 2021, banyak pengguna sadar untuk menggunakannya hanya dalam konteks santai, bukan untuk kebutuhan penting seperti komunikasi medis atau hukum.
Penelitian menunjukkan bahwa kesalahan terjemahan dalam situasi kritis, seperti pelayanan kesehatan atau proses hukum suaka, dapat membawa konsekuensi serius. Meski teknologi ini memudahkan banyak hal, industri tetap bergantung pada penerjemah manusia untuk urusan yang membutuhkan akurasi tinggi.
Ironisnya, meski teknologi MT memangkas banyak pekerjaan, penerjemah profesional justru harus tetap turun tangan untuk memperbaiki hasil kerja mesin. Para pekerja ini menghadapi tekanan ekonomi, ketidakpastian pekerjaan, dan kecemasan terhadap kemungkinan digantikan sepenuhnya oleh teknologi — sebuah kondisi yang dikenal sebagai automation anxiety.
Apa yang Bisa Dipelajari untuk LLM
Fenomena yang kini melanda dunia penerjemahan mesin tampaknya akan terulang dalam dunia LLM. Kemunculan DeepSeek, LLM buatan Tiongkok yang menyaingi GPT keluaran OpenAI dengan harga jauh lebih murah, menandai tren bahwa LLM akan menjadi layanan komoditas yang terjangkau dan luas penggunaannya.
Namun, LLM juga menghadapi tantangan besar, terutama soal keterbatasan data. Data dari internet, yang menjadi sumber pelatihan utama, sudah mulai habis dikuras. Seperti penerjemahan mesin yang dibatasi oleh ketersediaan bahasa, LLM akan mengalami kesulitan ketika dihadapkan pada tugas-tugas baru yang tidak cukup terwakili dalam data pelatihan mereka.
Meskipun ada upaya memperkaya data dengan membuat data sintesis atau melibatkan pengguna dalam pelatihan melalui interaksi, efektivitas metode ini masih dipertanyakan.
Ke depan, kita mungkin hanya akan menggunakan LLM untuk tugas-tugas dengan risiko rendah, sementara untuk konteks kritis, ketelitian manusia tetap dibutuhkan. LLM bisa menjadi alat bantu hebat di bidang seperti pemrograman komputer — bidang yang sudah terbiasa melakukan pengecekan kualitas. Namun di sisi lain, ancaman terhadap profesi kreatif dan masalah lingkungan dari penggunaan energi AI tetap menjadi kekhawatiran besar.