Google mengumumkan keberhasilan mereka dalam mendeteksi dan menggagalkan sebuah eksploitasi zero-day yang dikembangkan menggunakan bantuan kecerdasan buatan (AI). Keberhasilan ini mencegah potensi serangan siber berskala besar.
Seperti dilansir dari Detik iNET, laporan terbaru dari Google Threat Intelligence Group (GTIG) mengungkapkan bahwa eksploitasi berbahaya tersebut sedianya akan diluncurkan oleh kelompok penjahat siber terkemuka untuk melancarkan aksi massal.
Para peretas mengarahkan target utama mereka untuk membobol sistem autentikasi dua faktor (2FA). Serangan ini menyasar sebuah alat administrasi sistem berbasis web open-source yang identitasnya dirahasiakan.
Tim peneliti dari Google menemukan sejumlah kejanggalan pada skrip pemrograman Python yang dipakai oleh kelompok peretas tersebut. Jejak digital yang ditemukan mengindikasikan kuat adanya andil AI dalam proses penulisan kode.
Beberapa bukti yang ditemukan tim peneliti meliputi penulisan skor CVSS yang mengalami halusinasi. Selain itu, format penulisan kode terlihat sangat rapi dan terstruktur, sebuah ciri khas yang sangat lekat dengan gaya keluaran data pelatihan Large Language Model (LLM).
Eksploitasi tersebut dirancang untuk memanfaatkan kelemahan logika semantik tingkat tinggi. Pada kasus ini, pengembang alat open-source tersebut secara tidak sengaja menanamkan asumsi kepercayaan yang di-hardcode ke dalam sistem 2FA mereka.
Walaupun Google memastikan adanya keterlibatan AI dalam aktivitas peretasan ini, para peneliti menegaskan satu hal penting. Mereka tidak menemukan bukti bahwa model AI Gemini milik Google digunakan oleh para peretas tersebut.
Mekanisme Persona-Driven Jailbreaking
Laporan GTIG juga membeberkan cara para peretas yang kini semakin lihai dalam memanipulasi sistem AI demi memetakan celah keamanan. Salah satu metode yang sedang marak diterapkan adalah taktik persona-driven jailbreaking.
Melalui metode tersebut, peretas memasukkan perintah atau prompt khusus yang memaksa sistem AI untuk memanipulasi diri. AI kemudian akan berpura-pura bertindak sebagai seorang pakar keamanan siber tingkat tinggi.
Para penjahat siber juga dilaporkan mulai memasukkan seluruh repositori data kerentanan keamanan secara utuh ke dalam model AI. Mereka memanfaatkan alat bantu seperti OpenClaw di dalam lingkungan simulasi yang terkontrol.
Langkah simulasi ini dilakukan untuk menyempurnakan muatan siber buatan AI. Dengan demikian, serangan yang dirancang dapat berjalan lebih akurat sebelum benar-benar diluncurkan ke target yang nyata.
Ekosistem AI Mulai Menjadi Sasaran Peretas
Temuan dari Google ini sekaligus menjawab kecemasan industri teknologi dalam beberapa pekan terakhir mengenai risiko model AI yang difokuskan pada sistem keamanan siber, salah satunya adalah AI Mythos dari Anthropic. Sebelumnya, sebuah celah keamanan pada sistem operasi Linux juga berhasil diidentifikasi berkat bantuan AI.
Saat ini, tren ancaman siber memperlihatkan pergerakan dua arah yang saling berkaitan. Selain dimanfaatkan sebagai alat pertahanan maupun senjata untuk mencari celah, ekosistem AI itu sendiri kini mulai menjadi sasaran empuk para peretas.
"GTIG mengamati bahwa musuh makin sering menargetkan komponen terintegrasi yang memberikan kegunaan pada sistem AI, seperti keterampilan otonom dan konektor data pihak ketiga," kata laporan Google.