back to top

Meta Meluncurkan AI yang Dapat Memantau AI Lain Saat Keterlibatan Manusia Berkurang

Share

New York:

Pemilik Facebook, Meta, mengatakan pada hari Jumat bahwa pihaknya akan merilis sejumlah model AI baru dari divisi penelitiannya, termasuk “Evaluator Otodidak” yang mungkin menawarkan jalan menuju pengurangan keterlibatan manusia dalam proses pengembangan AI.

Peluncuran ini mengikuti perkenalan alat ini oleh Meta dalam sebuah makalah pada bulan Agustus, yang merinci bagaimana alat ini bergantung pada teknik “rantai pemikiran” yang sama yang digunakan oleh model o1 yang baru-baru ini dirilis OpenAI agar dapat membuat penilaian yang andal tentang respons model.

Teknik tersebut melibatkan pemecahan masalah kompleks menjadi langkah-langkah logis yang lebih kecil dan tampaknya meningkatkan keakuratan respons terhadap masalah-masalah menantang dalam mata pelajaran seperti sains, pengkodean, dan matematika.

Para peneliti Meta menggunakan seluruh data yang dihasilkan AI untuk melatih model evaluator, dan juga menghilangkan masukan manusia pada tahap tersebut.

Kemampuan menggunakan AI untuk mengevaluasi AI secara andal memberikan gambaran sekilas tentang kemungkinan jalur menuju pembangunan agen AI otonom yang dapat belajar dari kesalahan mereka sendiri, kata dua peneliti Meta di balik proyek tersebut kepada Reuters.

Banyak orang di bidang AI membayangkan agen seperti asisten digital yang cukup cerdas untuk melaksanakan beragam tugas tanpa campur tangan manusia.

Model yang dapat dikembangkan sendiri dapat menghilangkan kebutuhan akan proses yang seringkali mahal dan tidak efisien yang digunakan saat ini yang disebut Pembelajaran Penguatan dari Umpan Balik Manusia, yang memerlukan masukan dari anotator manusia yang harus memiliki keahlian khusus untuk memberi label pada data secara akurat dan memverifikasi jawaban atas pertanyaan matematika dan penulisan yang rumit. benar.

“Kami berharap, ketika AI semakin menjadi manusia super, ia akan semakin baik dalam memeriksa pekerjaannya, sehingga ia benar-benar lebih baik daripada manusia pada umumnya,” kata Jason Weston, salah satu peneliti.

“Gagasan untuk belajar secara otodidak dan mampu mengevaluasi diri pada dasarnya sangat penting untuk mencapai tingkat kecerdasan buatan manusia super,” katanya.

Perusahaan lain termasuk Google dan Anthropic juga telah menerbitkan penelitian tentang konsep RLAIF, atau Reinforcement Learning from AI Feedback. Berbeda dengan Meta, perusahaan-perusahaan tersebut cenderung tidak merilis model mereka untuk kepentingan umum.

Alat AI lainnya yang dirilis oleh Meta pada hari Jumat termasuk pembaruan pada model identifikasi gambar Segmen Apapun milik perusahaan, alat yang mempercepat waktu pembuatan respons LLM dan kumpulan data yang dapat digunakan untuk membantu penemuan bahan anorganik baru.

(Kecuali judulnya, cerita ini belum diedit oleh staf NDTV dan diterbitkan dari feed sindikasi.)

demonstrasi

demo

info demonstrasi

Baca selengkapnya

Berita Terkait