Apakah Anda tertarik pada mereka? PENAWARAN? Hemat dengan kupon kami ADA APA o Telegram!

DeepMind menemukan kerentanan ChatGPT menggunakan hipnosis dan puisi

November 30 2023

Peneliti di laboratorium penelitian Google DeepMind mereka berhasil memaksa ChatGPT untuk mengungkap data pribadi beberapa pengguna. Mereka tidak perlu melakukan modifikasi kode atau trik teknis lainnya. Apalagi para ahli bahkan punya didefinisikan metode yang ditemukan”agak bodoh", meskipun ternyata sangat efektif. Mereka sebenarnya menemukan kerentanan ChatGPT ini dengan menimbulkan halusinasi model bahasa dengan cara yang agak aneh.

Kerentanan ChatGPT memberikan data pribadi pengguna di bawah 'hipnotis'

Model bahasa menghasilkan informasi berdasarkan data masukan yang digunakan untuk melatihnya. OpenAI tidak mengungkapkan isi kumpulan data tersebut, namun para peneliti memaksa ChatGPT untuk melakukannya, dengan mengabaikan aturan perusahaan. Metodenya adalah sebagai berikut: cukup sampai ke jaringan saraf diminta mengulang kata “puisi” berulang kali.

Akibatnya, bot secara sporadis menghasilkan informasi dari kumpulan data pelatihannya. Misalnya, para peneliti berhasil dapatkan alamat email, nomor telepon dan kontak lainnya dari CEO perusahaan tertentu (namanya disembunyikan dalam laporan). Dan ketika AI diminta mengulangi kata “perusahaan”, kerentanan ChatGPT memungkinkannya mengembalikan rincian firma hukum AS.

cara kerja kerentanan chatgpt yang mengekspos data pengguna

Dengan menggunakan “hipnosis” sederhana ini, para peneliti dapat memperoleh kecocokan dari situs kencan, penggalan puisi, alamat Bitcoin , ulang tahun, tautan yang dipublikasikan di jejaring sosial, fragmen makalah penelitian berhak cipta dan bahkan SMS dari portal berita besar. Setelah menghabiskan hanya $200 untuk token, karyawan Google DeepMind menerima sekitar 10.000 cuplikan kumpulan data.

Para ahli juga menemukan bahwa semakin besar model, semakin sering model tersebut menghasilkan sumber dataset pelatihan. Untuk melakukan ini, mereka melihat model lain dan mengekstrapolasi hasilnya ke dimensi GPT-3.5 Turbo. Para ilmuwan berharap untuk menerima episode informasi 50 kali lebih banyak dari kumpulan data pelatihan, namun chatbot menghasilkan data ini 150 kali lebih sering. “Lubang” serupa telah ditemukan dalam model bahasa lain, misalnya di LLaMA dari Meta.

Secara resmi, OpenAI memperbaiki kerentanan ini pada tanggal 30 Agustus. Tapi, menurut jurnalis dari Engadget, Anda masih berhasil mendapatkan data orang lain (nama Skype dan login) menggunakan cara yang dijelaskan di atas. Perwakilan dari OpenAI tidak merespons atas penemuan kerentanan ChatGPT ini tetapi kami yakin mereka akan menemukannya.