
گوگل در روز پنجشنبه نسخهای «بازطراحیشده» از نماینده تحقیقاتی Gemini Deep Research خود را که بر پایه مدل پایهای پیشرفته و پر سر و صدا Gemini 3 Pro ساخته شده است، منتشر کرد.
این نماینده جدید تنها برای تولید گزارشهای تحقیقاتی طراحی نشده است — اگرچه هنوز قادر به انجام این کار است. اکنون به توسعهدهندگان امکان میدهد تا قابلیتهای تحقیقاتی مدل SATA گوگل را در برنامههای خود ادغام کنند. این قابلیت از طریق API جدید Interthings گوگل فراهم میشود که برای دادن کنترل بیشتر به توسعهدهندگان در عصر هوش مصنوعی عاملمحور آینده طراحی شده است.
ابزار جدید Gemini Deep Research یک نماینده است که توانایی ترکیب انبوهی از اطلاعات و پردازش حجم بزرگی از زمینه (context) را در فرمان (prompt) دارد. گوگل میگوید مشتریان از آن برای وظایفی از بررسی دقیق (due diligence) تا تحقیق در زمینه ایمنی سمّیت داروها استفاده میکنند.
گوگل همچنین اعلام کرد که بهزودی این نماینده تحقیق عمیق جدید را در سرویسهایی مانند جستجوی گوگل، گوگل فاینانس، برنامه Gemini و NotebookLM محبوب خود ادغام خواهد کرد. این گامی دیگر به سمت آمادگی برای دنیایی است که در آن انسانها دیگر چیزی را گوگل نمیکنند — بلکه نمایندگان هوش مصنوعی آنها این کار را انجام میدهند.
این غول فناوری میگوید که Deep Research از وضعیت مدل Gemini 3 Pro بهعنوان «دقیقترین» مدل خود بهره میبرد؛ مدلی که برای کاهش توهمات (hallucinations) در وظایف پیچیده آموزش دیده است.
توهمات هوش مصنوعی — جایی که مدل زبان بزرگ (LLM) بهصورت خودسرانه اطلاعاتی را اختراع میکند — مسألهای بهویژه مهم برای وظایف طولانیمدت و استدلالی عمیق عاملمحور است که در آن تصمیمات خودمختار فراوانی در طول دقیقهها، ساعتها یا بیش از آن اتخاذ میشود. هر چه تعداد گزینههای یک LLM بیشتر باشد، احتمال اینکه حتی یک گزینه توهمی کل خروجی را نامعتبر سازد، بیشتر میشود.
برای اثبات ادعاهای پیشرفت خود، گوگل همچنین معیاری دیگر (گویا دنیای هوش مصنوعی به معیار دیگری نیاز دارد) ایجاد کرده است. این معیار جدید با نام بیخلاقیت DeepSearchQA شناخته میشود و برای آزمون نمایندگان در وظایف جستجوی اطلاعاتی چندمرحلهای و پیچیده طراحی شده است. گوگل این معیار را بهصورت منبع باز منتشر کرده است.
همچنین Deep Research را بر روی «آزمون نهایی بشریت» (Humanity’s Last Exam)، یک معیار مستقل با نام جذابتر که شامل مجموعهای از وظایف خاص و نایاب در حوزه دانش عمومی است، و همچنین بر روی BrowserComp، معیاری برای وظایف عاملمحور مبتنی بر مرورگر، آزمایش کرد.
همانطور که میتوانید انتظار داشته باشید، نماینده جدید گوگل در معیار خودش و در آزمون نهایی بشریت برتری پیدا کرد. با این حال، ChatGPT 5 Pro شرکت اوپن ایآی بهصورت شگفتانگیزی دوم نزدیک شد و در مقایسه با گوگل، در BrowserComp کمی پیشی گرفت.
اما این مقایسههای معیار تقریباً به محض انتشار توسط گوگل منسوخ شدند. چون در همان روز، اوپن ایآی نسخه مورد انتظار GPT 5.2 را با نام رمزی «سیر» (Garlic) معرفی کرد. اوپن ایآی میگوید مدل جدیدشان رقبای خود — بهویژه گوگل — را در مجموعهای از معیارهای معمول، از جمله معیار داخلی اوپن ایآی، پیشی میگیرد.
شاید جذابترین بخش این اعلامیه زمانبندی آن بود. با دانستن اینکه جهان منتظر عرضه سیر (Garlic) بود، گوگل خبرهای هوش مصنوعی خود را همزمان اعلام کرد.
دیدگاهتان را بنویسید