ChatGPT, yang dikembangkan oleh OpenAI, memperkenalkan kemampuan baru yang memungkinkan Anda berinteraksi melalui suara dan gambar, menawarkan antarmuka intuitif dan lebih banyak cara untuk mengintegrasikan ChatGPT ke dalam kehidupan sehari-hari Anda. Dalam pengumuman baru-baru ini di situsnya, OpenAI memutuskan untuk mengungkapkan fitur-fitur baru ini terlebih dahulu. Beliau juga menyoroti manfaat yang mereka bawa dan tantangan yang mereka hadapi dalam pasar AI yang sedang berkembang.
Topik artikel ini:
ChatGPT: interaksi suara
Dengan fungsi suara baru, pengguna dapat memilikinya percakapan interaktif dengan ChatGPT. Hal ini memungkinkan Anda untuk menggunakan asisten bahkan saat bepergian, sehingga meningkatkan potensi chatbot. Misalnya, pengguna dapat meminta ChatGPT untuk menceritakan kisah anak-anak saat bepergian, sehingga lebih menyenangkan.
Atau, saat makan malam bersama teman, perdebatan tentang topik tertentu bisa muncul; dalam hal ini, pengguna dapat menggunakan bot untuk memperoleh informasi akurat dan menyelesaikan perdebatan secara konstruktif.
Teknologi suara ChatGPT menggunakan a model text-to-speech tingkat lanjut. Bekerja sama dengan pengisi suara profesional, model ini mampu menghasilkan audio humanoid dari teks dan sampel suara pendek, menjadikan interaksi dengan ChatGPT menjadi lebih alami dan intuitif. Juga, terima kasih kepada Berbisik, sistem pengenalan suara sumber terbuka yang dikembangkan oleh OpenAI, adalah kata-kata yang diucapkan ditranskripsikan ke dalam teks dengan sangat presisi, memungkinkan chatbot memahami dan merespons permintaan pengguna secara efektif.
ChatGPT: interaksi visual
Seperti di atas, model AI sekarang bisa menganalisis satu atau lebih gambar, memungkinkan pengguna memecahkan masalah, merencanakan makanan, atau menganalisis grafik kompleks. Misalnya, pengguna dapat mengirimkan foto isi kulkasnya. Oleh karena itu chatbot harus digunakan menganalisis makanan yang ada dan menyarankan resep berdasarkan bahan-bahan ini, juga memberikan petunjuk langkah demi langkah untuk persiapan.
Baca juga: GPT-4: Gemini akan menjadi saingan Google. Inilah perbedaannya
Selain itu, jika pengguna perlu fokus pada elemen tertentu dalam gambar, Aplikasi seluler ChatGPT menyertakan alat menggambar yang memungkinkan Anda menyorot area tertentu pada gambar, membuat komunikasi dan analisis menjadi lebih tepat dan personal.
Pemahaman gambar didukung oleh model multimodal GPT-3.5 dan GPT-4. Model-model canggih ini mereka menerapkan keterampilan bahasa mereka pada berbagai macam gambar, seperti foto, tangkapan layar, dan dokumen yang berisi teks dan gambar, memungkinkan ChatGPT memahami dan menafsirkan konteks visual secara akurat dan detail.
Perlu disebutkan bahwa dari poco OpenAI telah mengintegrasikan tidak hanya itu Canva tetapi juga DALL-E 3 di ChatGPT, atau model gambar generatif.
Kapan dan untuk siapa itu akan tersedia
Dalam dua minggu ke depan OpenAI akan mengimplementasikan suara dan gambar di ChatGPT untuk pengguna pengguna dengan langganan Plus dan Perusahaan.
Fungsi yang memungkinkan interaksi suara akan tersedia di iOS dan Android namun tidak pada versi web yang digunakan oleh kebanyakan orang.
Fungsi yang memungkinkan interaksi visual akan tersedia di semua platform, oleh karena itu Android, iOS dan web.
Sumber | OpenAI