JAKARTA, PARLE.CO.ID —- Dalam diskusi terbaru tentang kecerdasan buatan (AI), Elon Musk, CEO Tesla dan pendiri xAI, menyoroti isu kritis yang mulai mengemuka: kelangkaan data dunia nyata untuk melatih model AI. Fenomena ini, yang disebut “data puncak”, mengindikasikan bahwa hampir seluruh pengetahuan manusia yang tersedia telah dimanfaatkan oleh AI. Pernyataan ini mendapat perhatian luas, termasuk dari pakar AI lainnya yang memperingatkan dampak dari ketergantungan pada data sintetis.
Data Puncak dan Tantangannya
Menurut Musk, dunia telah mencapai “data puncak”, di mana data manusia yang tersedia telah hampir habis digunakan untuk melatih model AI. Dalam siaran langsung di media sosial X (sebelumnya Twitter), Musk mengungkapkan, “Kami telah menghabiskan jumlah kumulatif pengetahuan manusia … dalam pelatihan AI.” Ia menambahkan bahwa transisi ke data sintetis akan menjadi langkah berikutnya untuk melengkapi kebutuhan pelatihan model AI.
Definisi Data Sintetis
Data sintetis adalah informasi yang dihasilkan oleh AI sendiri, yang kemudian digunakan untuk melatih model lebih lanjut. Musk menjelaskan bahwa data sintetis memungkinkan model AI untuk membuat esai, menilai dirinya sendiri, dan menjalani proses pembelajaran mandiri. Namun, ia mengingatkan bahwa penggunaan data sintetis membawa risiko tersendiri, seperti munculnya halusinasi atau keluaran yang tidak akurat.
Kritik dan Kekhawatiran
Musk bukan satu-satunya yang memperingatkan dampak “data puncak”. Andrew Duncan, Direktur AI Dasar di Alan Turing Institute, mengacu pada makalah akademis yang memproyeksikan data dunia nyata untuk model AI akan habis pada tahun 2026. Duncan menyebutkan bahwa ketergantungan pada data sintetis dapat menurunkan kualitas keluaran model AI.
Risiko Halusinasi dan Bias
Halusinasi dalam AI, yaitu keluaran yang tidak sesuai dengan kenyataan, menjadi tantangan utama dalam penggunaan data sintetis. Musk menggarisbawahi bahwa tanpa mekanisme evaluasi yang akurat, sulit untuk membedakan antara jawaban nyata dan hasil halusinasi. Duncan menambahkan bahwa data sintetis juga rentan menciptakan bias dan mengurangi kreativitas AI, terutama jika konten yang dihasilkan AI dimasukkan kembali ke dalam data pelatihan.
Dampak Terhadap Ekosistem AI
Peningkatan konten yang dihasilkan oleh AI secara daring berpotensi memperburuk situasi, karena data ini dapat kembali dimasukkan ke dalam pelatihan AI. Duncan memperingatkan bahwa ini dapat menyebabkan “keruntuhan model,” di mana performa AI menurun akibat akumulasi data yang kurang berkualitas.
Implikasi Masa Depan
- Kreativitas dan Kualitas AI: Ketergantungan pada data sintetis dapat menurunkan kemampuan AI untuk memberikan hasil kreatif dan inovatif.
- Regulasi Data AI: Diperlukan upaya global untuk memastikan data yang digunakan dalam pelatihan AI memiliki kualitas tinggi dan bebas dari bias.
- Riset dan Inovasi Baru: Dibutuhkan pendekatan baru dalam pengumpulan dan pengelolaan data dunia nyata untuk memperpanjang keberlanjutan pengembangan AI.
Diskusi tentang “data puncak” yang diungkapkan Elon Musk membuka wawasan baru tentang tantangan yang dihadapi teknologi AI. Meskipun data sintetis menawarkan solusi sementara, risiko seperti halusinasi, bias, dan penurunan kualitas tetap menjadi perhatian utama. Dalam konteks ini, kolaborasi antara pakar teknologi, regulator, dan masyarakat menjadi penting untuk memastikan AI berkembang dengan bertanggung jawab dan berkelanjutan. (P-01)