Apakah Anda tertarik pada mereka? PENAWARAN? Hemat dengan kupon kami ADA APA o Telegram!

Ada masalah besar yang menghambat pelatihan jaringan saraf

Di dunia yang dinamisintelijen buatan, perusahaan teknologi terkemuka menghadapi tantangan tak terduga yang dapat memperlambat laju inovasi: pertumbuhan kesulitan dalam mencari data berkualitas untuk melatih model mereka. Kekurangan data ini mempengaruhi perkembangan teknologi maju seperti GPT-5, sementara perusahaan sekaliber Microsoft dan OpenAI mencari solusi inovatif untuk mengatasi kendala ini.

Tantangan pelatihan AI: Adanya kebutuhan akan data dan hal ini memperlambat kemajuan

Di era yang ditandai dengan peningkatan daya komputasi dan kemajuan teknik pembelajaran mesin yang belum pernah terjadi sebelumnya, OpenAI dan sejenisnya menghadapi tantangan. paradoks: Kelimpahan data online tidak secara otomatis menghasilkan sumber daya yang dapat digunakan untuk pelatihan AI. Itu membutuhkan data yang akurat, relevan dan terkini menjadi hal yang sangat penting dibandingkan sebelumnya, terutama ketika menyangkut pelatihan model yang semakin kompleks seperti GPT-5 yang direncanakan.

Transisi dari GPT-4 ke GPT-5 menggambarkan pertumbuhan eksponensial dalam permintaan data: meskipun GPT-12 membutuhkan “hanya” XNUMX triliun token, perkiraan untuk penerusnya diperkirakan sekitar 60-100 triliun. Kesenjangan antara ketersediaan dan kebutuhan akan data berkualitas tinggi menjadi kendala yang signifikan dalam memperkirakan a kekurangan yang bisa berkisar antara 10 dan 20 triliun token.

logo openai di ponsel pintar dengan latar belakang putih

Defisit data berkualitas ini menjadi hambatan nyata bagi kemajuan AI. Data yang seringkali usang atau berkualitas rendah yang ada di web menunjukkan masalah yang serius batas efektivitas pembelajaran mesin. Selain itu, pembatasan akses data oleh platform besar hanya akan memperburuk masalah dan semakin membatasi sumber daya yang tersedia untuk pelatihan. model linguistik.

Menanggapi tantangan ini, strategi yang diterapkan bervariasi mulai dari inovasi teknis hingga kemitraan strategis. OpenAI, misalnya, bertujuan untuk meningkatkanmenggunakan data audio dan video melalui alat pengenalan suara Whisper, untuk memperluas kumpulan data yang tersedia. Secara paralel, perusahaan menjajaki kemungkinan tersebut menghasilkan data sintetis kualitas yang dapat berfungsi untuk mengisi kesenjangan yang ada.

Gianluca Cobucci
Gianluca Cobucci

Bergairah tentang kode, bahasa dan bahasa, antarmuka manusia-mesin. Segala sesuatu tentang evolusi teknologi menarik bagi saya. Saya mencoba untuk mengungkapkan hasrat saya dengan sangat jelas, mengandalkan sumber yang dapat dipercaya dan bukan "on the first pass".

berlangganan
memberitahu
tamu

0 komentar
Masukan Inline
Lihat semua komentar
XiaomiToday.it
logo