ChatGPT Sering Ngaco? OpenAI Temukan Biang Keroknya dan Janjikan Perubahan Besar!

Genvoice.id | 13 Sep 2025

JAKARTA, GENVOICE.ID - Gen, kamu pasti sering dengar cerita soal chatbot AI yang jawabannya suka ngaco tapi kelihatan meyakinkan, kan? Nah, masalah yang sering disebut sebagai "halusinasi" ini ternyata bukan sekadar kelemahan desain model. OpenAI bareng peneliti dari Georgia Tech akhirnya buka suara soal akar masalahnya, sekaligus kasih usulan solusi biar teknologi ini makin bisa dipercaya.

Dalam makalah riset setebal 36 halaman, OpenAI menilai penyebab utamanya justru ada di cara sistem AI diuji dan diperingkat. Jadi gini, Gen: selama ini chatbot AI "dipaksa" untuk menjawab semua pertanyaan. Kalau mereka memilih diam atau bilang tidak tahu, malah dihukum di tolok ukur penilaian. Analogi gampangnya kayak ujian pilihan ganda, di mana nebak dapat nilai, sementara kalau nggak jawab malah rugi.

Nah, pola penilaian kayak gitu yang bikin AI sering nekat kasih jawaban salah tapi dibungkus dengan percaya diri. Padahal, jawaban ngaco inilah yang bikin pengguna jadi repot karena harus terus ngecek ulang kebenarannya.

OpenAI pun kasih usulan sistem baru: model AI bakal dihukum berat kalau kasih jawaban salah tapi yakin banget, sebaliknya bakal dapat poin lebih kalau berani hati-hati atau jujur mengakui "saya tidak tahu". Dari uji coba, pendekatan ini kelihatan menjanjikan. Model yang lebih berhati-hati memang cuma jawab setengah dari total pertanyaan, tapi akurasinya tembus 74 persen. Bandingin sama model lain yang jawab hampir semua tapi banyak salahnya.

Kalau sistem ini benar-benar diterapkan, jangan kaget kalau di masa depan asisten AI lebih sering bilang "nggak tahu" daripada ngawur. Mungkin terdengar kurang keren, tapi langkah ini bikin pengguna lebih aman karena nggak perlu repot-repot verifikasi jawaban yang ternyata salah.

Bagi OpenAI, riset ini dianggap sebagai lompatan besar menuju AI yang lebih mengutamakan keakuratan informasi dan kepercayaan publik, bukan sekadar tampil percaya diri tapi menyesatkan. Kalau benar terwujud, bisa jadi era baru chatbot AI yang lebih bisa diandalkan segera hadir.