هوش مصنوعی

نسخه به‌روزشده Gemini 3 Deep Think گوگل عملکرد بهتری نسبت به GPT-5.2 و Claude Opus 4.6 دارد

گوگل اعلام کرد Gemini 3 Deep Think با همکاری دانشمندان و پژوهشگران برای مقابله با مسائل تحقیقاتی چالش‌برانگیز ارتقا یافته است.

گوگل روز پنج‌شنبه مدل هوش مصنوعی Gemini 3 Deep Think خود را به‌روزرسانی کرد. این مدل پیشرفته زمانی که در دسامبر ۲۰۲۵ عرضه شد، هوشمندترین مدل شرکت بود. اکنون با این به‌روزرسانی، گوگل می‌گوید این مدل می‌تواند به دانشمندان در پژوهش مسائل پیچیده کمک کند. این غول فناوری مستقر در مانتین ویو تأکید کرد که این به‌روزرسانی عملکرد مدل را در تمام معیارهای اصلی بهبود می‌بخشد، اما به‌طور خاص، مدل رکورد جدیدی در ARC-AGI-2 و Humanity’s Last Exam ثبت کرده و از هر دو مدل GPT-5.2 شرکت OpenAI و Claude Opus 4.6 شرکت Anthropic پیشی گرفته است.

در یک پست وبلاگی، این غول فناوری اعلام کرد که یک به‌روزرسانی بزرگ برای Gemini 3 Deep Think منتشر می‌کند که به آن اجازه می‌دهد چالش‌های مدرن در حوزه‌های علم، پژوهش و مهندسی را حل کند. این مدل همچنان برای مشترکان Google AI Ultra در دسترس است، اما اکنون گروه منتخب پژوهشگران و شرکت‌ها نیز می‌توانند از طریق رابط برنامه‌نویسی کاربردی (API) شرکت به آن دسترسی داشته باشند.

مدیرعامل گوگل سوندار پیچای گفت: «Gemini 3 Deep Think یک ارتقاء قابل توجه دریافت می‌کند. ما Deep Think را در همکاری نزدیک با دانشمندان و پژوهشگران بهبود داده‌ایم تا به چالش‌های سخت و واقعی جهان پاسخ دهیم.» ایلان ماسک این پیشرفت را «تحسین‌برانگیز» خواند و به این پست واکنش نشان داد.

با این بهبود، ادعا شده است که مدل هوش مصنوعی توانسته در معیار ARC-AGI-2 که قابلیت استدلال مدل‌های پیشرفته را می‌سنجد، امتیاز ۸۴.۶ درصد را کسب کند. گوگل اعلام کرد که این امتیاز همچنین توسط بنیاد جایزه ARC تأیید شده است. این مدل همچنین رکورد جدیدی با کسب امتیاز ۴۸.۴ درصد (بدون استفاده از ابزار) در آزمون Humanity’s Last Exam که به عنوان سخت‌ترین آزمون معیار موجود شناخته می‌شود، ثبت کرد.

علاوه بر این، شرکت ادعا کرد که Gemini 3 Deep Think همچنین امتیاز Elo برابر با ۳۴۵۵ را در Codeforces کسب کرده است. در هر یک از این آزمون‌ها، گفته می‌شود مدل گوگل عملکرد بهتری نسبت به مدل‌های پیشرفته OpenAI و Anthropic داشته است.

گوگل همچنین توضیح داد که چگونه برخی پژوهشگران از این مدل هوش مصنوعی در مسائل علمی واقعی استفاده می‌کنند. این شرکت به ویژه اشاره کرد که لیزا کاربونه، ریاضیدان دانشگاه راتگرز، از Gemini 3 Deep Think برای بررسی یک مقاله ریاضی بسیار تخصصی استفاده کرده است. او مشاهده کرد که مدل به‌طور موفقیت‌آمیزی یک نقص منطقی ظریف را شناسایی کرد که پیش‌تر در بازبینی همتا توسط انسان‌ها نادیده گرفته شده بود.

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا