هجوم متا به بازار مدل‌های هوش مصنوعی؛ Llama 4 بازی را عوض می‌کند؟

متا با انتشار بخشی از خانواده مدل‌های Llama 4، نشان داد که در رقابت غول‌های هوش مصنوعی چیزی برای از دست دادن ندارد؛ جاه‌طلبی زاکربرگ حالا معادلات قدرت را در بازار LLMها به چالش کشیده است.

کد خبر: ۲۰۴۸۵۰۱

به گزارش اقتصادآنلاین، متا، غول فناوری مالک اینستاگرام و واتس‌اپ، با معرفی دو مدل جدید از سری Llama ۴ بار دیگر نگاه‌ها را به خود جلب کرد. این شرکت در گامی تازه، مدل‌های Scout و Maverick را عرضه کرده و وعده داده دو مدل قدرتمندتر به نام‌های Behemoth و Reasoning نیز در راه هستند. هدف متا از این حرکت، رقابت جدی با شرکت‌هایی مانند OpenAI، گوگل و آنتروپیک در تولید مدل‌های زبانی بزرگ و مولد است.

مدل Scout با ۱۰۹ میلیارد پارامتر، به‌گونه‌ای طراحی شده که روی کارت گرافیک‌های قدرتمند مانند NVIDIA H۱۰۰ اجرا شود. این مدل پنجره زمینه ۱۰ میلیون توکن دارد و طبق ادعای متا، از رقبای متن‌باز مانند Mistral ۳.۱ و Gemini Flash-Lite عملکرد بهتری دارد. مدل Maverick با ۴۰۰ میلیارد پارامتر، رده‌ای بالاتر است و توان رقابت با GPT-۴o و Gemini ۲.۰ را دارد.

استراتژی متا، از معماری MoE تا رقابت با GPT

متا در نسل چهارم مدل‌های خود به سمت استفاده از معماری MoE یا «ترکیبی از متخصصان» رفته است؛ مدلی که تنها بخشی از شبکه عصبی را متناسب با وظیفه فعال می‌کند. این کار باعث افزایش بهره‌وری، کاهش مصرف منابع و در عین حال حفظ کیفیت پاسخ‌دهی می‌شود. Llama ۴ نخستین خانواده از مدل‌های متا است که این معماری را به‌طور کامل به‌کار گرفته و همین موضوع یکی از نقاط تمایز آن نسبت به مدل‌های پیشین محسوب می‌شود.

مدل Behemoth هنوز منتشر نشده، اما زاکربرگ آن را «قوی‌ترین مدل پایه جهان» نامیده است. این مدل ۲۸۸ میلیارد پارامتر فعال دارد و درمجموع از ۲ تریلیون پارامتر استفاده می‌کند. متا ادعا می‌کند Behemoth در آزمون‌های حوزه STEM، از رقبایی، چون GPT-۴.۵ و Claude Sonnet ۳.۷ پیشی می‌گیرد و فصل جدیدی در هوش مصنوعی رقم خواهد زد.

مدل چهارم نیز با عنوان Llama ۴ Reasoning در حال آماده‌سازی است و به‌زودی معرفی خواهد شد. گفته می‌شود این مدل تمرکز ویژه‌ای بر استدلال منطقی و پاسخ‌دهی دقیق در مکالمات پیچیده دارد.

متا و نقد‌های پیرامون متن‌باز بودن مدل‌ها

با اینکه متا مدل‌های Llama را «متن‌باز» می‌نامد، اما محدودیت‌هایی که در مجوز استفاده آنها وجود دارد، انتقادات زیادی به‌دنبال داشته است. برای مثال، سازمان‌هایی که بیش از ۷۰۰ میلیون کاربر فعال ماهانه دارند، باید برای استفاده از مدل‌های متا مجوز دریافت کنند. همین مسئله باعث شده سازمان پیشگامان متن‌باز (OSI) اعلام کند که این مدل‌ها از تعریف واقعی متن‌باز خارج‌اند.

متا اعلام کرده که در کنفرانس اختصاصی LlamaCon که قرار است ۹ اردیبهشت برگزار شود، جزئیات بیشتری درباره نقشه راه مدل‌های هوش مصنوعی خود منتشر خواهد کرد. آنچه مشخص است، متا به‌دنبال تثبیت موقعیت خود به‌عنوان بازیگر اصلی در میدان مدل‌های زبانی است؛ میدانی که رقابت در آن نه‌تنها علمی، بلکه ژئوپلیتیکی شده است.

برچسب ها:

متا هوش مصنوعی

ارسال نظرات