OpenAI pada hari Kamis mengumumkan peluncuran model AI seri Strawberry yang dirancang untuk menghabiskan lebih banyak waktu memproses jawaban atas pertanyaan guna memecahkan masalah sulit.
Model tersebut dapat memberikan alasan tentang tugas-tugas kompleks dan memecahkan masalah yang lebih sulit daripada model sebelumnya dalam sains, pengkodean, dan matematika, kata perusahaan AI dalam sebuah posting blog.
OpenAI menggunakan nama kode Strawberry secara internal untuk merujuk pada proyek dan memberi nama model yang diumumkan pada hari Kamis o1 dan o1-mini. o1 akan tersedia di ChatGPT dan API-nya mulai Kamis, kata perusahaan itu. ChatGPT punya Saya kesulitan mengenalinya Anda dapat melihat bahwa kata “strawberry” mengandung tiga huruf R.
Peneliti OpenAI Noam Brown, yang fokus pada peningkatan inferensi dalam model perusahaannya, mengakui dalam postingannya di X bahwa model tersebut sama dengan proyek Strawberry.
“Kami sangat bersemangat untuk berbagi dengan Anda hasil kerja kami di OpenAI untuk menciptakan model AI yang benar-benar mampu melakukan inferensi umum,” tulis Brown.
OpenAI mengatakan dalam postingan blognya bahwa model o1 mendapat skor 83% pada ujian kualifikasi Olimpiade Matematika Internasional, dibandingkan dengan 13% untuk model sebelumnya, GPT-4o.
Model ini juga meningkatkan kinerja pada masalah pemrograman kompetitif dan melampaui akurasi tingkat PhD pada masalah ilmiah acuan, kata perusahaan itu.
Brown mengatakan model tersebut mampu mencapai skor dengan menggabungkan teknik yang dikenal sebagai penalaran “rantai pemikiran”, yang memecah masalah kompleks menjadi langkah-langkah logis yang lebih kecil.
Para peneliti mencatat bahwa menggunakan pendekatan ini sebagai teknik dorongan cenderung meningkatkan kinerja model AI pada masalah yang kompleks. OpenAI kini telah mengotomatiskan fungsi ini, memungkinkan model untuk menyelesaikan masalahnya sendiri tanpa instruksi pengguna, klaim perusahaan dalam sebuah posting blog.
“Kami melatih model-model ini untuk menghabiskan lebih banyak waktu memikirkan suatu masalah sebelum merespons, seperti yang dilakukan manusia. Melalui pelatihan, mereka mengasah proses berpikir mereka, mencoba berbagai strategi, dan mengenali kesalahan. Belajar melakukan sesuatu,” kata OpenAI.