تحقیقات هوش مصنوعی با مشکل بی‌کیفیتی مواجه است؛ محققان می‌گویند: «وضعیت هرج‌ومرج است»

تحقیقات هوش مصنوعی زیر سؤال قرار گرفته است؛ چرا که نویسنده ادعا می‌کند بیش از ۱۰۰ مقاله درباره هوش مصنوعی نوشته است؛ که یک کارشناس آن را «فاجعه» می‌نامد.

یک فرد ادعا می‌کند که در این سال ۱۱۳ مقاله علمی در حوزه هوش مصنوعی منتشر کرده است؛ ۸۹ مقاله از اینها امشب در یکی از برترین همایش‌های جهان در زمینه هوش مصنوعی و یادگیری ماشین ارائه می‌شود؛ که این موضوع سؤالاتی را در میان محققان علوم کامپیوتر درباره وضعیت پژوهش‌های هوش مصنوعی برانگیخته است.

نویسنده، کوین ژو، به‌تازگی مدرک لیسانس علوم کامپیوتر خود را از دانشگاه کالیفرنیا، برکلی دریافت کرده و اکنون شرکت Algoverse را که یک شرکت تحقیق و مشاوره هوش مصنوعی برای دانش‌آموزان دبیرستانی است – بسیاری از این دانش‌آموزان هم‌نویسندگان او در مقالات می‌باشند – اداره می‌کند. ژو خود در سال ۲۰۱۸ دیپلم دبیرستان خود را به‌دست آورد.

مقالاتی که او در دو سال گذشته منتشر کرده است، شامل موضوعاتی مانند به‌کارگیری هوش مصنوعی برای شناسایی چوپانان کوچ‌نشین در جنوب صحرای آفریقا، ارزیابی ضایعات پوستی، و ترجمه گویش‌های اندونزیایی می‌شود. در صفحهٔ لینکدین‌اش، او ادعا می‌کند که «بیش از ۱۰۰ مقاله در کنفرانس‌های برتر در سال گذشته» منتشر کرده و این مقالات «توسط OpenAI، مایکروسافت، گوگل، استنفورد، MIT، آکسفورد و دیگران» ارجاع داده شده‌اند.

پپ‌های ژو یک «فاجعه» است، هانی فرید، استاد علوم کامپیوتر در برکلی، در مصاحبه‌ای گفت. «من تقریباً مطمئن هستم که تمام این کار، از بالا تا پایین، صرفاً کدنویسی با هوش مصنوعی است»، او افزود، که به معنای استفاده از هوش مصنوعی برای ایجاد نرم‌افزار است.

فرید در یک پست اخیر در لینکدین به انتشار پراکندهای مقالات ژو اشاره کرد؛ این موضوع بحثی درباره موارد مشابه دیگر در میان پژوهشگران هوش مصنوعی برانگیخت، که گفته‌اند این رشته‌ای که به‌تازگی پرطرفدار شده، با سیلابی از مقالات کم‌کیفیت مواجه است؛ این مسأله ناشی از فشارهای دانشگاهی و، در برخی موارد، ابزارهای هوش مصنوعی است.

در پاسخ به سؤال گاردین، ژو اعلام کرد که بر ۱۳۱ مقاله نظارت داشته است؛ این مقالات «پروژه‌های تیمی» هستند که توسط شرکتش Algoverse اجرا می‌شوند. این شرکت برای دانش‌آموزان دبیرستانی و دوره‌های کارشناسی مبلغ ۳,۳۲۵ دلار بابت برنامهٔ انتخابی ۱۲ هفته‌ای مشاورهٔ آنلاین دریافت می‌کند – برنامه‌ای که شامل کمک برای ارسال کارها به همایش‌ها می‌شود.

«در حداقل، من به بررسی روش‌شناسی و طراحی آزمایشی در پیشنهادها کمک می‌کنم و پیش‌نویس‌های کامل مقاله‌ها را پیش از ارسال می‌خوانم و نظراتم را اعلام می‌کنم»، او گفت و افزود که پروژه‌های مرتبط با حوزه‌های زبان‌شناسی، بهداشت یا آموزش شامل «پژوهشگر اصلی یا مربی با تخصص مرتبط» می‌شوند.

تیم‌ها از «ابزارهای استاندارد بهره‌وری نظیر مدیران ارجاع، بررسی‌کنندهٔ املایی، و گاهی مدل‌های زبانی برای ویرایش متن یا بهبود وضوح» استفاده کردند، او در پاسخ به این سؤال که آیا مقالات با هوش مصنوعی نوشته شده‌اند، گفت.

ناظران ربات‌ها در آشفتگی

استانداردهای بازبینی مقالات در حوزه هوش مصنوعی با بیشتر حوزه‌های علمی دیگر متفاوت است. بیشتر کارهای هوش مصنوعی و یادگیری ماشین تحت فرآیند دقیق بررسی همتاهای علمی مانند در شیمی یا زیست‌شناسی قرار نمی‌گیرند؛ در عوض، مقالات اغلب به‌صورت غیررسمی‌تر در همایش‌های بزرگی چون NeurIPS – یکی از معتبرترین همایش‌های جهانی یادگیری ماشین و هوش مصنوعی – که ژو قرار است در آن ارائه دهد، ارائه می‌شوند.

موارد ژو به یک مسألهٔ بزرگ‌تر در پژوهش هوش مصنوعی اشاره می‌کند، فرید گفت. همایش‌هایی از جمله NeurIPS با افزایش قابل توجهی در تعداد مقالات دریافتی مواجه هستند: این همایش در سال جاری ۲۱٬۵۷۵ مقاله دریافت کرده است که در سال ۲۰۲۰ کمتر از ۱۰٬۰۰۰ مقاله دریافت می‌کرد. یک همایش برتر دیگر هوش مصنوعی، International Conference on Learning Representations (ICLR)، گزارش داد که تعداد مقالات سالانهٔ خود برای همایش ۲۰۲۶، ۷۰٪ افزایش یافته است و به‌حدی نزدیک به ۲۰٬۰۰۰ مقاله رسیده؛ در مقایسه با بیش از ۱۱٬۰۰۰ مقاله در همایش ۲۰۲۵.

«نقادان از کیفیت پایین مقالات شکایت می‌کنند، حتی گمان می‌دارند که برخی به‌وسیلۀ هوش مصنوعی تولید شده‌اند. چرا این جشنوارهٔ علمی طعم خود را از دست داده؟» این سؤال توسط وبلاگ فناوری چینی ۳۶Kr در یک پست نوامبر درباره ICLR مطرح شد و به این نکته اشاره کرد که میانگین امتیازهای داده‌شده به مقالات توسط بازبین‌ها سال به سال کاهش یافته است.

در این میان، دانشجویان و پژوهشگران تحت فشار روزافزون برای افزایش تعداد مقالات و هم‌سطحی شدن با همتایانشان قرار دارند. تولید دو رقمی (و حتی سه رقمی) مقالهٔ علمی با کیفیت بالا در زمینهٔ علوم کامپیوتری در یک سال، امری نادر است؛ محققان اظهار داشتند. فرید می‌گوید که گاهی دانش‌آموزان او برای افزایش شمار مقالات خود، مقالاتی را با کدنویسی هوش مصنوعی تهیه می‌کنند.

«بسیاری از جوانان می‌خواهند وارد هوش مصنوعی شوند. در حال حاضر یک هوس بزرگ وجود دارد»، فرید گفت.

NeurIPS مقالات ارسالی را بازبینی می‌کند، اما فرایند آن بسیار سریع‌تر و کمتر دقیق نسبت به ارزیابی همتاهای علمی استاندارد است، جفری والینگ، استادیار دانشگاه ویرجینیای تک، گفت. در سال جاری، این همایش از تعداد زیادی دانشجوی دکترا برای ارزیابی مقالات بهره گرفته است؛ که یک رئیس بخش NeurIPS اعلام کرد این أمر فرایند را به‌خطر انداخته است.

«واقعیت این است که بسیاری از ارزیابان همایش‌ها مجبورند در مدت زمان کوتاهی ده‌ها مقاله را بررسی کنند و معمولاً امکان اصلاح یا بازنگری وجود ندارد»، والینگ گفت.

والینگ با فرید موافقت کرد که در حال حاضر تعداد زیادی مقاله منتشر می‌شود و گفت که با نویسندگانی که بیش از ۱۰۰ مقاله در یک سال منتشر کرده‌اند، مواجه شده است. «در دنیای آکادمیک، بیشتر برای حجم انتشار مقالات پاداش می‌دهند نه برای کیفیت… همه به افسانهٔ بهره‌وری فوق‌العاده علاقه‌مندند»، او افزود.

در صفحهٔ پرسش‌های متداول (FAQ) Algoverse متعلق به ژو، توضیح داده می‌شود که چگونه برنامهٔ این شرکت می‌تواند افق‌های تحصیلی یا شغلی درخواست‌کنندگان را ارتقا بخشد. او می‌گوید: «مهارت‌ها، دستاوردها و انتشاراتی که اینجا به‌دست می‌آورید، در جامعهٔ علمی بسیار مورد احترام است و می‌تواند به‌طرز چشمگیری پروندهٔ پذیرش دانشگاه یا رزومهٔ شما را تقویت کند. این امر به‌ویژه در صورتی صادق است که پژوهش شما در یک همایش برتر پذیرفته شود – دستاوردی معتبر حتی برای پژوهشگران حرفه‌ای.»

فرید می‌گوید که اکنون به دانش‌آموزان توصیه می‌کند از ورود به پژوهش‌های هوش مصنوعی خودداری کنند، زیرا «هوس» موجود در این حوزه و حجم بالای کارهای کم‌کیفیت که افراد برای بهبود چشم‌انداز شغلی خود منتشر می‌کنند، در حال گسترش است.

سیل بی‌کیفیتی

کارهای برجسته‌ای همچنان از این روند به‌دست آمده است. به‌عنوان مثال، مقالهٔ گوگل دربارهٔ ترانسفورمرها با عنوان «Attention Is All You Need» — که پایهٔ نظری پیشرفت‌های هوش مصنوعی منجر به ChatGPT است — در سال ۲۰۱۷ در NeurIPS ارائه شد.

سازمان‌دهندگان NeurIPS تصدیق کردند که این همایش تحت فشار است. در اظهار نظری به گاردین، یک سخنگوی این همایش گفت که رشد هوش مصنوعی به‌عنوان حوزه‌ای، «افزایش قابل‌توجهی در تعداد مقالات ارسالی و ارزش افزوده در پذیرش‌های بازبینی همتا در NeurIPS» را به همراه داشته است؛ که «بار سنگینی بر سیستم ارزیابی ما وارد کرده است».

مقالات ارسالی ژو عمدتاً در کارگاه‌های NeurIPS بوده‌اند، که فرآیند انتخاب متفاوتی نسبت به همایش اصلی دارند و معمولاً محلی برای ارائهٔ کارهای تازه‌کارانه هستند، به‌نظر برگزار‌کنندگان NeurIPS. فرید افزود که این توجیهی قانع‌کننده برای اینکه یک نفر نام خود را بر بیش از ۱۰۰ مقاله بگذارد، به‌نظر نمی‌رسد.

«این توجیه برای افزودن نام خود بر ۱۰۰ مقاله که به‌طور معنا‌داری نمی‌توانستید در آن‌ها مشارکت کنید، برایم قانع‌کننده نیست»، فرید گفت.

این مشکل بزرگ‌تر از سیل مقالات در NeurIPS است. ICLR برای بررسی حجم زیادی از ارسال‌ها از هوش مصنوعی بهره برد؛ که به‌نظر می‌رسید منجر به ارجاعاتی «تخیلی» و بازخوردی «بسیار پرحرف با تعداد زیادی نکته‌نامه» شده است، طبق مقاله‌ای اخیر در Nature.

احساس کاهش کیفیت به حدی گسترده شد که یافتن راه‌حل برای این بحران خود به‌عنوان موضوعی برای مقالات بدل گشت. مقالهٔ موضعی‌ای که در ماه می ۲۰۲۵ منتشر شد — نسخهٔ علمی و مبتنی بر شواهدی از یک مقالهٔ سرخط روزنامه — توسط سه دانشمند کامپیوتر کرهٔ جنوبی تألیف شد که راه‌حلی برای «چالش‌های بی‌سابقهٔ رشدی که در ارسال مقالات رخ داده، به‌همراه نگرانی‌های فزاینده درباره کیفیت ارزیابی و مسئولیت داوران» ارائه داد؛ این مقاله جوایز کار برتر را در همایش بین‌المللی یادگیری ماشین ۲۰۲۵ به خود اختصاص داد.

در همین حال، به گفته فرید، شرکت‌های بزرگ فناوری و سازمان‌های کوچک ایمنی هوش مصنوعی کارهای خود را در arXiv بارگذاری می‌کنند؛ سایتی که پیش‌تر فقط برای پیش‌چاپ‌های با بازدید کم در حوزهٔ ریاضیات و فیزیک استفاده می‌شد، و این امر اینترنت را با کارهایی که به‌عنوان علم ارائه می‌شوند پر کرده است — اما تحت استانداردهای بازبینی قرار ندارند.

هزینهٔ این وضعیت، به گفته فرید، این است که برای خبرنگاران، عموم مردم و حتی کارشناسان این حوزه تقریباً غیرممکن است بفهمند در هوش مصنوعی چه اتفاقی می‌افتد. «به‌عنوان خوانندهٔ متوسط، شما شانس ندارید که بفهمید چه‌ می‌گذرد در ادبیات علمی. نسبت سیگنال به نویز شما تقریباً یک است. من به سختی می‌توانم به این همایش‌ها بروم و بفهمم چه جهنمی در جریان است.»

«چیزی که به دانشجویان می‌گویم این است که اگر هدف شما انتشار مقالات است، صادقانه بگویم کار خیلی سختی نیست. فقط کارهای بسیار ضعیف و کم‌کیفیت انجام دهید و آنها را به‌صورت انبوه به کنفرانس‌ها بفرستید. اما اگر می‌خواهید کارهای دقیق و اندیشمندانه انجام دهید، در یک موقعیت نامساعد هستید، زیرا عملاً به‌تنهایی سلاح ندارید»، او افزود.

دیدگاه‌ها

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *