
هجوم متا به بازار مدلهای هوش مصنوعی؛ Llama 4 بازی را عوض میکند؟

متا با انتشار بخشی از خانواده مدلهای Llama 4، نشان داد که در رقابت غولهای هوش مصنوعی چیزی برای از دست دادن ندارد؛ جاهطلبی زاکربرگ حالا معادلات قدرت را در بازار LLMها به چالش کشیده است.
به گزارش اقتصادآنلاین، متا، غول فناوری مالک اینستاگرام و واتساپ، با معرفی دو مدل جدید از سری Llama ۴ بار دیگر نگاهها را به خود جلب کرد. این شرکت در گامی تازه، مدلهای Scout و Maverick را عرضه کرده و وعده داده دو مدل قدرتمندتر به نامهای Behemoth و Reasoning نیز در راه هستند. هدف متا از این حرکت، رقابت جدی با شرکتهایی مانند OpenAI، گوگل و آنتروپیک در تولید مدلهای زبانی بزرگ و مولد است.
مدل Scout با ۱۰۹ میلیارد پارامتر، بهگونهای طراحی شده که روی کارت گرافیکهای قدرتمند مانند NVIDIA H۱۰۰ اجرا شود. این مدل پنجره زمینه ۱۰ میلیون توکن دارد و طبق ادعای متا، از رقبای متنباز مانند Mistral ۳.۱ و Gemini Flash-Lite عملکرد بهتری دارد. مدل Maverick با ۴۰۰ میلیارد پارامتر، ردهای بالاتر است و توان رقابت با GPT-۴o و Gemini ۲.۰ را دارد.
استراتژی متا، از معماری MoE تا رقابت با GPT
متا در نسل چهارم مدلهای خود به سمت استفاده از معماری MoE یا «ترکیبی از متخصصان» رفته است؛ مدلی که تنها بخشی از شبکه عصبی را متناسب با وظیفه فعال میکند. این کار باعث افزایش بهرهوری، کاهش مصرف منابع و در عین حال حفظ کیفیت پاسخدهی میشود. Llama ۴ نخستین خانواده از مدلهای متا است که این معماری را بهطور کامل بهکار گرفته و همین موضوع یکی از نقاط تمایز آن نسبت به مدلهای پیشین محسوب میشود.
مدل Behemoth هنوز منتشر نشده، اما زاکربرگ آن را «قویترین مدل پایه جهان» نامیده است. این مدل ۲۸۸ میلیارد پارامتر فعال دارد و درمجموع از ۲ تریلیون پارامتر استفاده میکند. متا ادعا میکند Behemoth در آزمونهای حوزه STEM، از رقبایی، چون GPT-۴.۵ و Claude Sonnet ۳.۷ پیشی میگیرد و فصل جدیدی در هوش مصنوعی رقم خواهد زد.
مدل چهارم نیز با عنوان Llama ۴ Reasoning در حال آمادهسازی است و بهزودی معرفی خواهد شد. گفته میشود این مدل تمرکز ویژهای بر استدلال منطقی و پاسخدهی دقیق در مکالمات پیچیده دارد.
متا و نقدهای پیرامون متنباز بودن مدلها
با اینکه متا مدلهای Llama را «متنباز» مینامد، اما محدودیتهایی که در مجوز استفاده آنها وجود دارد، انتقادات زیادی بهدنبال داشته است. برای مثال، سازمانهایی که بیش از ۷۰۰ میلیون کاربر فعال ماهانه دارند، باید برای استفاده از مدلهای متا مجوز دریافت کنند. همین مسئله باعث شده سازمان پیشگامان متنباز (OSI) اعلام کند که این مدلها از تعریف واقعی متنباز خارجاند.
متا اعلام کرده که در کنفرانس اختصاصی LlamaCon که قرار است ۹ اردیبهشت برگزار شود، جزئیات بیشتری درباره نقشه راه مدلهای هوش مصنوعی خود منتشر خواهد کرد. آنچه مشخص است، متا بهدنبال تثبیت موقعیت خود بهعنوان بازیگر اصلی در میدان مدلهای زبانی است؛ میدانی که رقابت در آن نهتنها علمی، بلکه ژئوپلیتیکی شده است.