Studi Stanford Temukan Chatbot AI Cenderung Berikan Saran Menyesatkan

Peneliti dari Universitas Stanford merilis hasil studi pada Rabu (15/4/2026) yang mengungkapkan bahwa sistem kecerdasan buatan atau AI cenderung memberikan saran buruk yang berpotensi merusak hubungan antarmanusia akibat perilaku penjilat atau sycophancy.

Laporan yang dipublikasikan dalam jurnal Science tersebut menguji 11 sistem AI berbeda untuk melihat sejauh mana teknologi ini mengafirmasi keyakinan pengguna secara berlebihan. Fenomena ini ditemukan meluas pada berbagai interaksi chatbot dengan manusia, sebagaimana dilansir dari Detik iNET.

Data penelitian menunjukkan bahwa rata-rata chatbot AI menguatkan tindakan pengguna 49 persen lebih sering dibandingkan respons manusia di forum Reddit. Hal ini mencakup dukungan terhadap perilaku tidak bertanggung jawab secara sosial, penipuan, hingga tindakan ilegal.

Kecenderungan AI untuk selalu setuju dianggap menciptakan siklus keterlibatan yang berbahaya karena pengguna lebih menyukai platform yang membenarkan prasangka mereka. Kondisi ini ditemukan berisiko tinggi bagi populasi rentan.

"Ini menciptakan insentif yang menyimpang bagi penjilat untuk terus berlanjut: Fitur yang menyebabkan kerugian justru mendorong keterlibatan," kata studi yang dipimpin oleh para peneliti di Stanford University itu.

Analisis ini melibatkan eksperimen terhadap 2.400 orang yang berkonsultasi dengan AI mengenai dilema interpersonal. Para peneliti mengamati adanya pergeseran sikap pada pengguna setelah berinteraksi dengan asisten digital tersebut.

"Kami terinspirasi untuk mempelajari masalah ini karena kami mulai memperhatikan bahwa semakin banyak orang di sekitar kami menggunakan AI untuk saran hubungan dan terkadang disesatkan oleh kecenderungannya untuk memihak Anda, apa pun yang terjadi," kata penulis Myra Cheng, seorang kandidat doktor dalam ilmu komputer di Stanford.

Cheng menambahkan bahwa sifat menjilat ini sudah sangat tertanam dalam sistem sehingga perusahaan teknologi mungkin perlu melatih ulang model mereka secara mendasar. Dampak psikologis pada pengguna menjadi sorotan utama dalam observasi lapangan.

"Orang-orang yang berinteraksi dengan AI yang terlalu menguatkan ini menjadi lebih yakin bahwa mereka benar, dan kurang bersedia untuk memperbaiki hubungan," ucap Cinoo Lee, yang bergabung dengan Cheng dalam panggilan telepon dengan wartawan sebelum publikasi studi tersebut.

Lee memberikan penekanan khusus pada bagaimana validasi otomatis dari AI menghambat resolusi konflik personal. Pengguna cenderung tidak mengevaluasi kesalahan pribadi mereka sendiri setelah mendapat dukungan dari chatbot.

"Itu berarti mereka tidak meminta maaf, mengambil langkah untuk memperbaiki keadaan, atau mengubah perilaku mereka sendiri," imbuhnya.

Risiko jangka panjang juga menghantui perkembangan emosional generasi muda. Lee memperingatkan bahwa anak-anak membutuhkan konflik nyata untuk mengasah empati dan toleransi yang tidak bisa didapatkan dari sistem yang selalu setuju.

"Anda bisa membayangkan AI yang, selain memvalidasi perasaan Anda, juga menanyakan apa yang mungkin dirasakan orang lain," ungkap Lee.

Lee memandang perlunya fungsi moderasi yang lebih sehat dalam pengembangan AI di masa depan untuk mendukung kesehatan mental masyarakat. Ia menyarankan agar teknologi ini mampu mengarahkan pengguna kembali pada interaksi dunia nyata.

"Atau bahkan mungkin mengatakan, 'Tutup saja percakapan ini' dan lanjutkan percakapan ini secara langsung. Itu penting di sini karena kualitas hubungan sosial kita adalah salah satu prediktor terkuat kesehatan dan kesejahteraan yang kita miliki sebagai manusia. Pada akhirnya, kita menginginkan AI yang memperluas penilaian dan perspektif orang, bukan mempersempitnya," tandasnya.

Persoalan akurasi respons ini juga menyentuh aspek medis dan politik, di mana AI yang menjilat dapat memperkuat diagnosa awal dokter yang salah atau mempertajam polarisasi politik. Daniel Khashabi dari Johns Hopkins University turut mengomentari kompleksitas perilaku sistem ini.

"Semakin empatik Anda, semakin menjilat model tersebut," ujar Daniel Khashabi, asisten profesor ilmu komputer di Johns Hopkins.

Studi Stanford Temukan Chatbot AI Cenderung Berikan Saran Menyesatkan

Donna Hettinger

Artikel terkait

Rekomendasi