Apakah Anda tertarik pada mereka? PENAWARAN? Hemat dengan kupon kami ADA APA o Telegram!

Llama 3 menantang para raksasa: inilah model AI baru Meta

April 18 2024

Meta telah menambahkan dua yang baru model linguistik ke serialnya: Lama 3 8B e Lama 3 70B. Ini menjanjikan kinerja yang unggul dalam dunia kecerdasan buatan. Berita yang paling mengejutkan? Kehadiran 8 miliar dan 70 miliar parameter masing-masing. Angka-angka ini mewakili kompleksitas dan kemampuan model untuk menangani dan proses informasi.

Llama 3 bukan hanya dua model: lebih banyak material yang akan diproduksi

Meta tidak berhenti di situ; berencana untuk merilis lebih banyak model di seri Llama 3, tetapi tanpa menentukan tanggal. Strategi ini menciptakan antisipasi dan juga menunjukkan komitmen perusahaan untuk terus meningkatkan penawarannya.

I model Llama baru mereka digambarkan sebagai lompatan dari model sebelumnya. Peningkatan ini sebagian disebabkan oleh penggunaan dua cluster GPU khusus, masing-masing dengan 24.000 unit, yang memungkinkan model dilatih dengan lebih efektif dan akurat. Meta mengklaim bahwa, karena jumlah parameter yang mereka miliki, model-model ini memang demikian di antara yang terbaik yang tersedia hari ini untuk kecerdasan buatan generatif.

Performa Llama 3 diukur melalui berbagai tolok ukur AI, yang merupakan pengujian standar yang digunakan untuk mengevaluasi kemampuan model AI. Ini termasuk MMLU untuk pengetahuan, ARC untuk perolehan keterampilan, e DROP untuk penalaran tentang blok teks. Meskipun ada perbedaan pendapat mengenai kegunaan tolok ukur ini, tolok ukur ini tetap menjadi metode umum untuk mengevaluasi dan membandingkan kemampuan model AI.

Secara khusus, Llama 3 8B mengungguli model open source serupa dengan parameter lebih sedikit, seperti Mistral dan Google Permata, setidaknya dalam sembilan tolok ukur yang berbeda. Ini mencakup tes pengetahuan umum, penalaran, dan keterampilan khusus di berbagai bidang seperti biologi, fisika, kimia, dan bahkan pembuatan kode dan soal matematika. GPT-4 yang mana, misalnya, tidak dapat bekerja dengan baik.

Model terbesar, Llama 3 70B, tidak hanya bersaing tetapi dalam beberapa hal mengungguli model andalan seperti Gemini 1.5 Pro dari Google dalam berbagai pengujian, menunjukkan bahwa meskipun terdapat persaingan yang ketat, produk ini mampu bertahan bahkan dibandingkan para raksasa di sektor ini. Namun, penting untuk dicatat bahwa meskipun kinerjanya mengungguli beberapa model andalan seperti Claude 3 Soneta oleh Anthropic dalam beberapa pengujian, tidak mencapai performa model Claude 3 Opus yang lebih canggih.