GadgetDIVA - Penelitian terbaru dari tim Machine Learning Research Apple mengungkap bahwa kemampuan penalaran AI tingkat lanjut masih memiliki keterbatasan mendasar. Studi ini dilakukan dengan menguji empat model AI terkenal termasuk yang berasal dari OpenAI, DeepSeek, Claude, dan Google Gemini menggunakan serangkaian teka-teki logika yang dirancang khusus untuk mengukur kemampuan berpikir logis mesin.
Teka-teki yang digunakan dalam pengujian disusun dengan berbagai tingkat kesulitan, mulai dari yang mudah hingga sangat kompleks. Metode ini memungkinkan peneliti mengevaluasi bagaimana AI memproses informasi dan menyelesaikan masalah secara bertahap, mulai dari tantangan dasar hingga yang membutuhkan analisis mendalam.
Pada level awal, performa keempat model AI tersebut cukup mengesankan. Mereka mampu menjawab teka-teki sederhana dengan akurat, menggunakan jumlah token yang efisien, dan menunjukkan pola kerja yang logis. Di tahap ini, sistem tampak bekerja secara konsisten dan mampu menyelesaikan masalah tanpa hambatan berarti.
Baca Juga
Advertisement
Namun, perbedaan kinerja mulai terlihat ketika teka-teki berada pada tingkat menengah. Model yang dibekali dengan mekanisme penalaran internal tampak lebih unggul dibandingkan model LLM standar yang cenderung hanya mengandalkan pola data dari pelatihan sebelumnya. Ini menunjukkan bahwa strategi berpikir bawaan memberi dampak pada hasil akhir.
Tantangan terbesar muncul saat tingkat kesulitan mencapai level tinggi. Meski sudah diberikan sumber daya komputasi yang cukup, banyak model AI justru gagal menyelesaikan soal tersebut. Mereka mulai proses pemecahan masalah, menghabiskan token dalam jumlah besar, lalu berhenti secara tiba-tiba, seakan “menyerah” pada kompleksitas permasalahan.
Bahkan ketika petunjuk atau strategi penyelesaian disediakan dalam prompt, AI tetap kesulitan menyelesaikannya dengan konsisten. Hal ini menunjukkan adanya batasan dalam skala pemrosesan logika yang bisa dilakukan oleh model, terutama ketika berhadapan dengan persoalan yang tidak bisa hanya dipecahkan dengan pola atau hafalan.
Baca Juga
Advertisement
Selain itu, sebagian model juga menunjukkan gejala “berpikir berlebihan”. Meskipun mereka kadang menemukan jawaban yang benar, proses berpikir mereka terus berjalan ke arah yang tidak perlu, menghabiskan sumber daya tanpa meningkatkan akurasi. Ini menunjukkan bahwa AI masih belum memiliki kontrol yang matang atas strategi berpikir yang efisien.
Kesimpulan dari penelitian ini menekankan bahwa meskipun AI telah berkembang pesat dalam tugas-tugas sederhana, masih dibutuhkan upaya lebih lanjut untuk mengembangkan kemampuan penalaran kompleks. Dengan memahami batasan-batasan ini, para peneliti berharap dapat menciptakan sistem AI yang lebih cerdas dan andal dalam menghadapi permasalahan yang memerlukan pemikiran mendalam.
Baca Juga
Advertisement
Cek berita teknologi, review gadget dan video Gadgetdiva.id di Google News. Baca berita otomotif untuk perempuan di Otodiva.id, kalau butuh in-depth review gadget terkini kunjungi Gizmologi.id. Bagi yang suka jalan-jalan, wajib baca Traveldiva.id.