گوگل عمیق‌ترین نماینده تحقیقاتی هوش مصنوعی خود را راه‌اندازی کرد — در همان روزی که اوپن‌ ای‌آی GPT‑5.2 را منتشر کرد

مدیر عامل گوگل سوندار پیچای
اعتبار تصویر:جاستین سالیوان / گتی ایمیجز

گوگل در روز پنجشنبه نسخه‌ای «بازطراحی‌شده» از نماینده تحقیقاتی Gemini Deep Research خود را که بر پایه مدل پایه‌ای پیشرفته و پر سر و صدا Gemini 3 Pro ساخته شده است، منتشر کرد.

این نماینده جدید تنها برای تولید گزارش‌های تحقیقاتی طراحی نشده است — اگرچه هنوز قادر به انجام این کار است. اکنون به توسعه‌دهندگان امکان می‌دهد تا قابلیت‌های تحقیقاتی مدل SATA گوگل را در برنامه‌های خود ادغام کنند. این قابلیت از طریق API جدید Interthings گوگل فراهم می‌شود که برای دادن کنترل بیشتر به توسعه‌دهندگان در عصر هوش مصنوعی عامل‌محور آینده طراحی شده است.

ابزار جدید Gemini Deep Research یک نماینده است که توانایی ترکیب انبوهی از اطلاعات و پردازش حجم بزرگی از زمینه (context) را در فرمان (prompt) دارد. گوگل می‌گوید مشتریان از آن برای وظایفی از بررسی دقیق (due diligence) تا تحقیق در زمینه ایمنی سمّیت داروها استفاده می‌کنند.

گوگل همچنین اعلام کرد که به‌زودی این نماینده تحقیق عمیق جدید را در سرویس‌هایی مانند جستجوی گوگل، گوگل فاینانس، برنامه Gemini و NotebookLM محبوب خود ادغام خواهد کرد. این گامی دیگر به سمت آمادگی برای دنیایی است که در آن انسان‌ها دیگر چیزی را گوگل نمی‌کنند — بلکه نمایندگان هوش مصنوعی آنها این کار را انجام می‌دهند.

این غول فناوری می‌گوید که Deep Research از وضعیت مدل Gemini 3 Pro به‌عنوان «دقیق‌ترین» مدل خود بهره می‌برد؛ مدلی که برای کاهش توهمات (hallucinations) در وظایف پیچیده آموزش دیده است.

توهمات هوش مصنوعی — جایی که مدل زبان بزرگ (LLM) به‌صورت خودسرانه اطلاعاتی را اختراع می‌کند — مسأله‌ای به‌ویژه مهم برای وظایف طولانی‌مدت و استدلالی عمیق عامل‌محور است که در آن تصمیمات خودمختار فراوانی در طول دقیقه‌ها، ساعت‌ها یا بیش از آن اتخاذ می‌شود. هر چه تعداد گزینه‌های یک LLM بیشتر باشد، احتمال اینکه حتی یک گزینه توهمی کل خروجی را نامعتبر سازد، بیشتر می‌شود.

برای اثبات ادعاهای پیشرفت خود، گوگل همچنین معیاری دیگر (گویا دنیای هوش مصنوعی به معیار دیگری نیاز دارد) ایجاد کرده است. این معیار جدید با نام بی‌خلاقیت DeepSearchQA شناخته می‌شود و برای آزمون نمایندگان در وظایف جستجوی اطلاعاتی چندمرحله‌ای و پیچیده طراحی شده است. گوگل این معیار را به‌صورت منبع باز منتشر کرده است.

همچنین Deep Research را بر روی «آزمون نهایی بشریت» (Humanity’s Last Exam)، یک معیار مستقل با نام جذاب‌تر که شامل مجموعه‌ای از وظایف خاص و نایاب در حوزه دانش عمومی است، و همچنین بر روی BrowserComp، معیاری برای وظایف عامل‌محور مبتنی بر مرورگر، آزمایش کرد.

همان‌طور که می‌توانید انتظار داشته باشید، نماینده جدید گوگل در معیار خودش و در آزمون نهایی بشریت برتری پیدا کرد. با این حال، ChatGPT 5 Pro شرکت اوپن‌ ای‌آی به‌صورت شگفت‌انگیزی دوم نزدیک شد و در مقایسه با گوگل، در BrowserComp کمی پیشی گرفت.

اما این مقایسه‌های معیار تقریباً به محض انتشار توسط گوگل منسوخ شدند. چون در همان روز، اوپن‌ ای‌آی نسخه مورد انتظار GPT 5.2 را با نام رمزی «سیر» (Garlic) معرفی کرد. اوپن‌ ای‌آی می‌گوید مدل جدیدشان رقبای خود — به‌ویژه گوگل — را در مجموعه‌ای از معیارهای معمول، از جمله معیار داخلی اوپن‌ ای‌آی، پیشی می‌گیرد.

شاید جذاب‌ترین بخش این اعلامیه زمان‌بندی آن بود. با دانستن این‌که جهان منتظر عرضه سیر (Garlic) بود، گوگل خبرهای هوش مصنوعی خود را هم‌زمان اعلام کرد.

دیدگاه‌ها

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *