New York | EGINDO.co – Pemilik Facebook Meta mengatakan pada hari Jumat bahwa mereka merilis sejumlah model AI baru dari divisi penelitiannya, termasuk “Self-Taught Evaluator” yang dapat menawarkan jalan menuju keterlibatan manusia yang lebih sedikit dalam proses pengembangan AI.
Rilis ini mengikuti pengenalan alat tersebut oleh Meta dalam sebuah makalah bulan Agustus, yang merinci bagaimana alat tersebut bergantung pada teknik “rantai pemikiran” yang sama yang digunakan oleh model o1 OpenAI yang baru-baru ini dirilis untuk membuatnya membuat penilaian yang andal tentang respons model.
Teknik tersebut melibatkan pemecahan masalah yang kompleks menjadi langkah-langkah logis yang lebih kecil dan tampaknya meningkatkan akurasi respons pada masalah yang menantang dalam mata pelajaran seperti sains, pengodean, dan matematika.
Para peneliti Meta menggunakan data yang sepenuhnya dihasilkan AI untuk melatih model evaluator, menghilangkan input manusia pada tahap itu juga.
Kemampuan untuk menggunakan AI untuk mengevaluasi AI secara andal menawarkan sekilas kemungkinan jalur menuju pembangunan agen AI otonom yang dapat belajar dari kesalahan mereka sendiri, dua peneliti Meta di balik proyek tersebut mengatakan kepada Reuters.
Banyak orang di bidang AI membayangkan agen semacam itu sebagai asisten digital yang cukup cerdas untuk menjalankan berbagai tugas tanpa campur tangan manusia.
Model yang dapat ditingkatkan sendiri dapat menghilangkan kebutuhan akan proses yang sering kali mahal dan tidak efisien yang digunakan saat ini yang disebut Reinforcement Learning from Human Feedback, yang memerlukan masukan dari pencatat manusia yang harus memiliki keahlian khusus untuk memberi label data secara akurat dan memverifikasi bahwa jawaban atas matematika yang rumit dan pertanyaan tertulis sudah benar.
“Kami berharap, seiring AI menjadi semakin manusiawi, AI akan menjadi semakin baik dalam memeriksa pekerjaannya, sehingga AI benar-benar akan lebih baik daripada manusia pada umumnya,” kata Jason Weston, salah satu peneliti.
“Gagasan untuk belajar sendiri dan mampu mengevaluasi diri sendiri pada dasarnya penting bagi gagasan untuk mencapai tingkat AI yang supermanusia ini,” katanya.
Perusahaan lain termasuk Google dan Anthropic juga telah menerbitkan penelitian tentang konsep RLAIF, atau Reinforcement Learning from AI Feedback. Namun, tidak seperti Meta, perusahaan-perusahaan tersebut cenderung tidak merilis model mereka untuk penggunaan publik.
Alat AI lainnya yang dirilis oleh Meta pada hari Jumat termasuk pembaruan pada model identifikasi gambar Segment Anything milik perusahaan, sebuah alat yang mempercepat waktu pembuatan respons LLM dan kumpulan data yang dapat digunakan untuk membantu penemuan bahan anorganik baru.
Sumber : CNA/SL