Terungkap! Begini Kisah di Balik AI OpenAI yang Mampu Menang Olimpiade Matematika

Terungkap! Begini Kisah di Balik AI OpenAI yang Mampu Menang Olimpiade Matematika
- (Dok. Istimewa).

JAKARTA, GENVOICE.ID - Tak banyak yang tahu bahwa di balik kesuksesan ChatGPT sebagai salah satu produk teknologi dengan pertumbuhan tercepat dalam sejarah, OpenAI secara diam-diam tengah membangun fondasi teknologi yang jauh lebih ambisius, yaitu menciptakan kecerdasan buatan (AI) yang benar-benar mampu "berpikir" dan menyelesaikan tugas seperti manusia.

Dilansir dari Tech Crunch, salah satu kunci utama dari ambisi ini berasal dari sebuah tim internal bernama MathGen, yang sejak 2022 bekerja melatih model AI untuk memecahkan soal-soal olimpiade matematika tingkat SMA. Tim ini termasuk Hunter Lightman, peneliti OpenAI yang menyaksikan langsung bagaimana ChatGPT meledak, sementara ia dan timnya diam-diam mengembangkan kemampuan penalaran matematis AI yang saat itu masih sangat lemah.

Kini, hasil kerja keras mereka membuahkan hasil luar biasa. Salah satu model OpenAI berhasil memenangkan medali emas di International Math Olympiad (IMO), sebuah kompetisi matematika paling prestisius di dunia. Pencapaian ini bukan sekadar soal angka, tetapi menandai kemajuan besar dalam pengembangan AI yang bisa menalar, fondasi penting untuk membangun agen AI yang mampu menyelesaikan tugas-tugas kompleks layaknya manusia di komputer.

ChatGPT mungkin lahir secara tak sengaja dari eksperimen kecil, namun upaya untuk menciptakan AI agents adalah proyek yang disengaja dan telah dikerjakan selama bertahun-tahun. CEO OpenAI Sam Altman pernah mengatakan dalam konferensi developer pertama mereka tahun 2023 bahwa masa depan adalah saat kita bisa cukup meminta komputer melakukan sesuatu, dan itu langsung dikerjakan. Impian ini perlahan menjadi nyata dengan diperkenalkannya model penalaran pertama OpenAI, yang diberi nama o1, pada akhir 2024.

Keberhasilan o1 menjadi tonggak baru yang menjadikan 21 peneliti OpenAI yang mengembangkan model ini sebagai talenta paling diburu di Silicon Valley. Bahkan, CEO Meta Mark Zuckerberg dilaporkan merekrut lima dari mereka ke tim superintelligence baru Meta, dengan tawaran kompensasi fantastis mencapai lebih dari $100 juta.

Keunggulan model seperti o1 terletak pada teknik pelatihan berbasis reinforcement learning (RL), yang memungkinkan AI belajar dari umpan balik mengenai benar atau salah dalam lingkungan simulasi. Kombinasi RL dengan model bahasa besar (LLM) dan teknik test-time computation, yang memungkinkan AI menggunakan lebih banyak waktu dan komputasi saat menyelesaikan soal, menghasilkan model revolusioner yang disebut Strawberry. Model ini memperkenalkan pendekatan baru bernama chain-of-thought (CoT), di mana AI mampu menelusuri dan memverifikasi langkah-langkah logis sebelum memberikan jawaban.

Menurut peneliti OpenAI El Kishky, proses berpikir model ini menyerupai manusia, dapat menyadari kesalahan, mundur, bahkan tampak "frustrasi". Meskipun teknik-teknik tersebut bukan hal baru, kemampuan OpenAI dalam menggabungkannya secara unik menjadikan Strawberry dan o1 sebagai tonggak yang membentuk masa depan AI reasoning.

Setelah keberhasilan ini, OpenAI membentuk tim khusus bernama Agents di bawah pimpinan Daniel Selsam. Tim ini didedikasikan untuk membuat model AI mampu menyelesaikan tugas-tugas yang lebih kompleks dan bernuansa subjektif. Visi besarnya adalah menghadirkan AI agents yang benar-benar dapat menggantikan kerja manusia dalam berbagai aktivitas digital.

Namun, tantangan masih banyak. Saat ini, agen-agen AI seperti ChatGPT Agent dan Comet dari Perplexity masih kesulitan menangani tugas-tugas subjektif seperti belanja online atau mencari tempat parkir jangka panjang. Kecepatan dan akurasinya belum cukup memuaskan. Peneliti seperti Hunter Lightman menyebut bahwa masalah ini pada dasarnya adalah persoalan data, bagaimana melatih model untuk menyelesaikan tugas-tugas yang hasilnya tidak selalu bisa diverifikasi dengan jelas.

Untuk itu, OpenAI mengembangkan teknik baru berbasis RL yang memungkinkan pelatihan model pada tugas-tugas tidak terverifikasi. Model IMO terbaru milik mereka bahkan bekerja dengan cara melibatkan banyak agen AI yang saling berkompetisi mencari solusi terbaik. Teknik ini mulai banyak diadopsi oleh perusahaan AI besar lainnya seperti Google dan xAI.

Para peneliti OpenAI percaya bahwa kemampuan penalaran ini akan terus berkembang, tak hanya di bidang matematika tetapi juga di ranah lainnya. Kemajuan ini sangat cepat, dan mereka yakin tak akan melambat dalam waktu dekat. Semua inovasi ini dipersiapkan untuk peluncuran besar berikutnya: GPT-5, yang diharapkan bisa menjadi model AI terbaik untuk konsumen dan pengembang, sekaligus fondasi dari agen AI masa depan.

Tak hanya itu, OpenAI juga berencana menjadikan agen AI-nya jauh lebih mudah digunakan-tanpa perlu pengaturan rumit. Sistemnya akan dirancang agar mampu memahami maksud pengguna secara intuitif, tahu kapan harus memanggil alat tertentu, dan berapa lama waktu yang dibutuhkan untuk menalar.

Masa depan ChatGPT, menurut visi OpenAI, bukan sekadar chatbot, melainkan asisten digital serba bisa yang dapat mengerjakan apapun di internet sesuai keinginan pengguna, bahkan tanpa perlu diberi petunjuk terlalu rinci. Dan dengan langkah-langkah besar yang telah diambil oleh tim riset OpenAI, visi futuristik ini tampaknya bukan lagi sekadar mimpi.

M
M Ihsan
Penulis

0 Comments

Belum ada komentar. Jadilah yang pertama berkomentar!

Kirim
Isi komentar sepenuhnya adalah tanggung jawab pengguna dan diatur dalam UU ITE