OpenAI Cekal “Goblin” di GPT-5.5: Misteri Perilaku Aneh AI Terbongkap!

04.05.2026
OpenAI Cekal "Goblin" di GPT-5.5: Misteri Perilaku Aneh AI Terbongkap!
OpenAI Cekal "Goblin" di GPT-5.5: Misteri Perilaku Aneh AI Terbongkap!

Dunia teknologi dikejutkan oleh temuan instruksi sistem rahasia pada pembaruan GPT-5.5 yang secara eksplisit melarang penyebutan makhluk mitologi seperti goblin, gremlin, hingga rakun. OpenAI sengaja menanamkan perintah pada aplikasi pengkodean Codex agar AI tersebut menghindari kata-kata “makhluk aneh” kecuali jika benar-benar relevan dengan pertanyaan teknis dari pengguna.

Dikutip dari Engadget, Senin (4/5/2026), langkah ini diambil setelah komunitas pengguna menyadari adanya anomali verbal di mana ChatGPT menjadi sangat terobsesi membicarakan entitas fantasi dalam berbagai konteks jawaban. Investigasi internal menunjukkan bahwa frekuensi penggunaan kata “goblin” melonjak drastis hingga 175 persen, sementara kata “gremlin” meningkat 52 persen sejak peluncuran versi sebelumnya.

Akar Masalah: “Kepribadian Nerdy” yang Terlalu Ekspresif

OpenAI menjelaskan melalui unggahan blog resminya bahwa fenomena unik ini bermula dari fitur kustomisasi kepribadian “Nerdy” atau kutu buku yang sempat tersedia bagi pengguna. Instruksi awal untuk kepribadian ini memang mendorong AI untuk merayakan keanehan dunia, namun tanpa sengaja memicu penggunaan kosakata yang tidak biasa secara berlebihan.

Meskipun kepribadian kutu buku ini hanya digunakan dalam sebagian kecil interaksi, ia bertanggung jawab atas hampir 67 persen total penyebutan makhluk mitologi di seluruh sistem. Hal ini menunjukkan bahwa sebuah instruksi gaya bahasa yang spesifik dapat memberikan dampak yang sangat tidak proporsional terhadap keseluruhan perilaku model bahasa besar.

Kegagalan Mekanisme Hadiah pada Reinforcement Learning

Setelah penelusuran lebih mendalam, para peneliti menemukan bahwa sistem reinforcement learning (pembelajaran penguatan) secara keliru memberikan “hadiah” atau skor tinggi pada jawaban yang mengandung kata-kata unik tersebut. Algoritma internal secara konsisten memberikan sentimen positif pada data yang menyertakan istilah “goblin,” sehingga model menganggap penggunaan kata itu sebagai sebuah keberhasilan.

Masalah menjadi semakin kompleks ketika perilaku “haus goblin” ini mulai merembes ke bagian model lain yang seharusnya bersifat netral atau profesional. Dalam dunia kecerdasan buatan, perilaku yang dipelajari pada satu kondisi tertentu seringkali menyebar ke area pelatihan lain, menciptakan kebiasaan yang sulit untuk dihilangkan secara otomatis.

Upaya Pembersihan dan Masa Depan Integritas AI

Karena pelatihan GPT-5.5 sudah berjalan sebelum penyebab utama teridentifikasi, OpenAI terpaksa menggunakan “perintah paksa” dalam pesan sistem untuk menekan penyebaran istilah tersebut. Perusahaan teknologi raksasa ini mengakui bahwa Codex memiliki kecenderungan sifat yang sangat teknis namun sedikit “eksentrik,” mirip dengan karakter kutu buku yang mereka ciptakan.

Sebagai solusi jangka panjang, OpenAI kini tengah mengembangkan perangkat audit terbaru yang dirancang khusus untuk mendeteksi dan memperbaiki perilaku model yang menyimpang secara real-time. Meski banyak pengguna menganggap keanehan ini sebagai bumbu yang menghibur, bagi pengembang, menjaga akurasi dan profesionalisme AI tetap menjadi prioritas utama di atas estetika humor digital.

Scr/Mashable




Don't Miss