
دیپسیک و رقابت بر سر استدلال؛ هوش مصنوعی به مرحله بعدی میرسد؟

دیپسیک با معرفی رویکرد تازهای برای بهبود استدلال مدلهای زبانی، نشان داده که رقابت در حوزه هوش مصنوعی دیگر صرفاً بر سر اندازه مدلها نیست، بلکه بر سر دقت، تطبیق با ترجیحات انسانی و نحوه یادگیری است.
به گزارش اقتصادآنلاین، در شرایطی که شرکتهای بزرگ دنیا در حال رقابت برای توسعه مدلهای زبانی بزرگ (LLM) هستند، استارتاپ چینی دیپسیک (DeepSeek) با همکاری دانشگاه تسینگهوا، رویکردی متفاوت و نوآورانه را معرفی کرده که ممکن است قواعد بازی را تغییر دهد. این روش ترکیبی از دو تکنیک به نامهای «مدلسازی پاداش مولد» (GRM) و «تنظیم انتقادی مبتنی بر اصول درونی» است که هدف آن، بهبود توانایی استدلال مدلهای هوش مصنوعی در مواجهه با پرسشهای عمومی و پیچیده است.
مطابق با مقالهای که جمعه گذشته در پایگاه arXiv منتشر شد، این دو تکنیک مکمل باعث شدهاند که مدلهای DeepSeek-GRM به سطحی از عملکرد برسند که با مدلهای پیشرفته فعلی مبتنی بر پاداش انسانی قابلمقایسه است. در واقع، GRM بهجای آموزش صرفاً بر اساس داده، تلاش میکند مدل را با آنچه کاربران ترجیح میدهند، همسو کند؛ روشی که از دیدگاه بسیاری، آینده آموزش مدلهای هوش مصنوعی محسوب میشود.
دیپسیک در آستانه عرضه R۲، سکوت یا غافلگیری؟
در پس این مقاله، نگاهی به زمانبندی احتمالی معرفی نسل بعدی مدلهای دیپسیک هم اهمیت پیدا میکند. این شرکت پیشتر با مدل پایه V۳ و مدل R۱ توانست سهم قابلتوجهی در بازار جهانی کسب کند. مدل R۱ با تمرکز بر استدلال دقیق و هزینه پایین، در زمان عرضهاش توجه رسانهها و توسعهدهندگان را جلب کرد و بهعنوان یکی از رقبای جدی GPT-۴ و Claude مطرح شد.
اکنون، همه نگاهها به مدل R۲ است؛ مدلی که طبق گزارش رویترز قرار بود همین ماه معرفی شود. اگرچه دیپسیک هنوز بهصورت رسمی تاریخ مشخصی را اعلام نکرده، اما این تأخیر ابهاماتی را در میان تحلیلگران و کاربران حرفهای هوش مصنوعی بهوجود آورده است. برخی رسانههای چینی نیز گزارش دادهاند که نماینده خدمات مشتریان این شرکت، شایعه زمان عرضه را در گفتوگویی گروهی با مشتریان تجاری تکذیب کرده است.
با این حال، سابقه دیپسیک در ایجاد غافلگیریهای استراتژیک نشان میدهد که این سکوت ممکن است بخشی از سیاست معرفی قدرتمندتر باشد؛ حرکتی که میتواند موقعیت این استارتاپ را در برابر غولهایی مانند گوگل، OpenAI و Meta مستحکمتر کند.
چین و مسیر بومیسازی هوش مصنوعی با دیپسیک
در سطحی کلانتر، فعالیتهای دیپسیک را نمیتوان جدا از استراتژی کلان چین در حوزه هوش مصنوعی تحلیل کرد. در شرایطی که رقابت جهانی بر سر توسعه مدلهای پایه شدت گرفته، چین با سرمایهگذاری روی استارتاپهایی مانند دیپسیک، بهدنبال خلق اکوسیستمی مستقل و بومی است؛ اکوسیستمی که نهتنها از نظر عملکرد با مدلهای غربی رقابت کند، بلکه استانداردها و اصول خود را در آموزش مدلها تعریف کند.
دیپسیک با GRM و سیستم انتقادی خودمحور، نهتنها به بهبود پاسخدهی مدلهایش میاندیشد، بلکه تلاش دارد مفهومی از «اخلاق هوش مصنوعی» را نیز در چارچوبهای محلی خود پیاده کند. در این مسیر، بومیسازی و بازتعریف تعامل میان مدل و انسان، به یکی از مؤلفههای کلیدی تبدیل شده است.
در مجموع، مسیر دیپسیک نهتنها ادامه حرکت در میدان رقابت جهانی است، بلکه نوعی اظهارنظر روشن درباره آینده هوش مصنوعی نیز است، آیندهای که در آن، کیفیت تعامل و توانایی استدلال، جای کمیت پارامترها را خواهد گرفت.