تحقیقات هوش مصنوعی زیر سؤال قرار گرفته است؛ چرا که نویسنده ادعا میکند بیش از ۱۰۰ مقاله درباره هوش مصنوعی نوشته است؛ که یک کارشناس آن را «فاجعه» مینامد.
یک فرد ادعا میکند که در این سال ۱۱۳ مقاله علمی در حوزه هوش مصنوعی منتشر کرده است؛ ۸۹ مقاله از اینها امشب در یکی از برترین همایشهای جهان در زمینه هوش مصنوعی و یادگیری ماشین ارائه میشود؛ که این موضوع سؤالاتی را در میان محققان علوم کامپیوتر درباره وضعیت پژوهشهای هوش مصنوعی برانگیخته است.
نویسنده، کوین ژو، بهتازگی مدرک لیسانس علوم کامپیوتر خود را از دانشگاه کالیفرنیا، برکلی دریافت کرده و اکنون شرکت Algoverse را که یک شرکت تحقیق و مشاوره هوش مصنوعی برای دانشآموزان دبیرستانی است – بسیاری از این دانشآموزان همنویسندگان او در مقالات میباشند – اداره میکند. ژو خود در سال ۲۰۱۸ دیپلم دبیرستان خود را بهدست آورد.
مقالاتی که او در دو سال گذشته منتشر کرده است، شامل موضوعاتی مانند بهکارگیری هوش مصنوعی برای شناسایی چوپانان کوچنشین در جنوب صحرای آفریقا، ارزیابی ضایعات پوستی، و ترجمه گویشهای اندونزیایی میشود. در صفحهٔ لینکدیناش، او ادعا میکند که «بیش از ۱۰۰ مقاله در کنفرانسهای برتر در سال گذشته» منتشر کرده و این مقالات «توسط OpenAI، مایکروسافت، گوگل، استنفورد، MIT، آکسفورد و دیگران» ارجاع داده شدهاند.
پپهای ژو یک «فاجعه» است، هانی فرید، استاد علوم کامپیوتر در برکلی، در مصاحبهای گفت. «من تقریباً مطمئن هستم که تمام این کار، از بالا تا پایین، صرفاً کدنویسی با هوش مصنوعی است»، او افزود، که به معنای استفاده از هوش مصنوعی برای ایجاد نرمافزار است.
فرید در یک پست اخیر در لینکدین به انتشار پراکندهای مقالات ژو اشاره کرد؛ این موضوع بحثی درباره موارد مشابه دیگر در میان پژوهشگران هوش مصنوعی برانگیخت، که گفتهاند این رشتهای که بهتازگی پرطرفدار شده، با سیلابی از مقالات کمکیفیت مواجه است؛ این مسأله ناشی از فشارهای دانشگاهی و، در برخی موارد، ابزارهای هوش مصنوعی است.
در پاسخ به سؤال گاردین، ژو اعلام کرد که بر ۱۳۱ مقاله نظارت داشته است؛ این مقالات «پروژههای تیمی» هستند که توسط شرکتش Algoverse اجرا میشوند. این شرکت برای دانشآموزان دبیرستانی و دورههای کارشناسی مبلغ ۳,۳۲۵ دلار بابت برنامهٔ انتخابی ۱۲ هفتهای مشاورهٔ آنلاین دریافت میکند – برنامهای که شامل کمک برای ارسال کارها به همایشها میشود.
«در حداقل، من به بررسی روششناسی و طراحی آزمایشی در پیشنهادها کمک میکنم و پیشنویسهای کامل مقالهها را پیش از ارسال میخوانم و نظراتم را اعلام میکنم»، او گفت و افزود که پروژههای مرتبط با حوزههای زبانشناسی، بهداشت یا آموزش شامل «پژوهشگر اصلی یا مربی با تخصص مرتبط» میشوند.
تیمها از «ابزارهای استاندارد بهرهوری نظیر مدیران ارجاع، بررسیکنندهٔ املایی، و گاهی مدلهای زبانی برای ویرایش متن یا بهبود وضوح» استفاده کردند، او در پاسخ به این سؤال که آیا مقالات با هوش مصنوعی نوشته شدهاند، گفت.
ناظران رباتها در آشفتگی
استانداردهای بازبینی مقالات در حوزه هوش مصنوعی با بیشتر حوزههای علمی دیگر متفاوت است. بیشتر کارهای هوش مصنوعی و یادگیری ماشین تحت فرآیند دقیق بررسی همتاهای علمی مانند در شیمی یا زیستشناسی قرار نمیگیرند؛ در عوض، مقالات اغلب بهصورت غیررسمیتر در همایشهای بزرگی چون NeurIPS – یکی از معتبرترین همایشهای جهانی یادگیری ماشین و هوش مصنوعی – که ژو قرار است در آن ارائه دهد، ارائه میشوند.
موارد ژو به یک مسألهٔ بزرگتر در پژوهش هوش مصنوعی اشاره میکند، فرید گفت. همایشهایی از جمله NeurIPS با افزایش قابل توجهی در تعداد مقالات دریافتی مواجه هستند: این همایش در سال جاری ۲۱٬۵۷۵ مقاله دریافت کرده است که در سال ۲۰۲۰ کمتر از ۱۰٬۰۰۰ مقاله دریافت میکرد. یک همایش برتر دیگر هوش مصنوعی، International Conference on Learning Representations (ICLR)، گزارش داد که تعداد مقالات سالانهٔ خود برای همایش ۲۰۲۶، ۷۰٪ افزایش یافته است و بهحدی نزدیک به ۲۰٬۰۰۰ مقاله رسیده؛ در مقایسه با بیش از ۱۱٬۰۰۰ مقاله در همایش ۲۰۲۵.
«نقادان از کیفیت پایین مقالات شکایت میکنند، حتی گمان میدارند که برخی بهوسیلۀ هوش مصنوعی تولید شدهاند. چرا این جشنوارهٔ علمی طعم خود را از دست داده؟» این سؤال توسط وبلاگ فناوری چینی ۳۶Kr در یک پست نوامبر درباره ICLR مطرح شد و به این نکته اشاره کرد که میانگین امتیازهای دادهشده به مقالات توسط بازبینها سال به سال کاهش یافته است.
در این میان، دانشجویان و پژوهشگران تحت فشار روزافزون برای افزایش تعداد مقالات و همسطحی شدن با همتایانشان قرار دارند. تولید دو رقمی (و حتی سه رقمی) مقالهٔ علمی با کیفیت بالا در زمینهٔ علوم کامپیوتری در یک سال، امری نادر است؛ محققان اظهار داشتند. فرید میگوید که گاهی دانشآموزان او برای افزایش شمار مقالات خود، مقالاتی را با کدنویسی هوش مصنوعی تهیه میکنند.
«بسیاری از جوانان میخواهند وارد هوش مصنوعی شوند. در حال حاضر یک هوس بزرگ وجود دارد»، فرید گفت.
NeurIPS مقالات ارسالی را بازبینی میکند، اما فرایند آن بسیار سریعتر و کمتر دقیق نسبت به ارزیابی همتاهای علمی استاندارد است، جفری والینگ، استادیار دانشگاه ویرجینیای تک، گفت. در سال جاری، این همایش از تعداد زیادی دانشجوی دکترا برای ارزیابی مقالات بهره گرفته است؛ که یک رئیس بخش NeurIPS اعلام کرد این أمر فرایند را بهخطر انداخته است.
«واقعیت این است که بسیاری از ارزیابان همایشها مجبورند در مدت زمان کوتاهی دهها مقاله را بررسی کنند و معمولاً امکان اصلاح یا بازنگری وجود ندارد»، والینگ گفت.
والینگ با فرید موافقت کرد که در حال حاضر تعداد زیادی مقاله منتشر میشود و گفت که با نویسندگانی که بیش از ۱۰۰ مقاله در یک سال منتشر کردهاند، مواجه شده است. «در دنیای آکادمیک، بیشتر برای حجم انتشار مقالات پاداش میدهند نه برای کیفیت… همه به افسانهٔ بهرهوری فوقالعاده علاقهمندند»، او افزود.
در صفحهٔ پرسشهای متداول (FAQ) Algoverse متعلق به ژو، توضیح داده میشود که چگونه برنامهٔ این شرکت میتواند افقهای تحصیلی یا شغلی درخواستکنندگان را ارتقا بخشد. او میگوید: «مهارتها، دستاوردها و انتشاراتی که اینجا بهدست میآورید، در جامعهٔ علمی بسیار مورد احترام است و میتواند بهطرز چشمگیری پروندهٔ پذیرش دانشگاه یا رزومهٔ شما را تقویت کند. این امر بهویژه در صورتی صادق است که پژوهش شما در یک همایش برتر پذیرفته شود – دستاوردی معتبر حتی برای پژوهشگران حرفهای.»
فرید میگوید که اکنون به دانشآموزان توصیه میکند از ورود به پژوهشهای هوش مصنوعی خودداری کنند، زیرا «هوس» موجود در این حوزه و حجم بالای کارهای کمکیفیت که افراد برای بهبود چشمانداز شغلی خود منتشر میکنند، در حال گسترش است.
سیل بیکیفیتی
کارهای برجستهای همچنان از این روند بهدست آمده است. بهعنوان مثال، مقالهٔ گوگل دربارهٔ ترانسفورمرها با عنوان «Attention Is All You Need» — که پایهٔ نظری پیشرفتهای هوش مصنوعی منجر به ChatGPT است — در سال ۲۰۱۷ در NeurIPS ارائه شد.
سازماندهندگان NeurIPS تصدیق کردند که این همایش تحت فشار است. در اظهار نظری به گاردین، یک سخنگوی این همایش گفت که رشد هوش مصنوعی بهعنوان حوزهای، «افزایش قابلتوجهی در تعداد مقالات ارسالی و ارزش افزوده در پذیرشهای بازبینی همتا در NeurIPS» را به همراه داشته است؛ که «بار سنگینی بر سیستم ارزیابی ما وارد کرده است».
مقالات ارسالی ژو عمدتاً در کارگاههای NeurIPS بودهاند، که فرآیند انتخاب متفاوتی نسبت به همایش اصلی دارند و معمولاً محلی برای ارائهٔ کارهای تازهکارانه هستند، بهنظر برگزارکنندگان NeurIPS. فرید افزود که این توجیهی قانعکننده برای اینکه یک نفر نام خود را بر بیش از ۱۰۰ مقاله بگذارد، بهنظر نمیرسد.
«این توجیه برای افزودن نام خود بر ۱۰۰ مقاله که بهطور معناداری نمیتوانستید در آنها مشارکت کنید، برایم قانعکننده نیست»، فرید گفت.
این مشکل بزرگتر از سیل مقالات در NeurIPS است. ICLR برای بررسی حجم زیادی از ارسالها از هوش مصنوعی بهره برد؛ که بهنظر میرسید منجر به ارجاعاتی «تخیلی» و بازخوردی «بسیار پرحرف با تعداد زیادی نکتهنامه» شده است، طبق مقالهای اخیر در Nature.
احساس کاهش کیفیت به حدی گسترده شد که یافتن راهحل برای این بحران خود بهعنوان موضوعی برای مقالات بدل گشت. مقالهٔ موضعیای که در ماه می ۲۰۲۵ منتشر شد — نسخهٔ علمی و مبتنی بر شواهدی از یک مقالهٔ سرخط روزنامه — توسط سه دانشمند کامپیوتر کرهٔ جنوبی تألیف شد که راهحلی برای «چالشهای بیسابقهٔ رشدی که در ارسال مقالات رخ داده، بههمراه نگرانیهای فزاینده درباره کیفیت ارزیابی و مسئولیت داوران» ارائه داد؛ این مقاله جوایز کار برتر را در همایش بینالمللی یادگیری ماشین ۲۰۲۵ به خود اختصاص داد.
در همین حال، به گفته فرید، شرکتهای بزرگ فناوری و سازمانهای کوچک ایمنی هوش مصنوعی کارهای خود را در arXiv بارگذاری میکنند؛ سایتی که پیشتر فقط برای پیشچاپهای با بازدید کم در حوزهٔ ریاضیات و فیزیک استفاده میشد، و این امر اینترنت را با کارهایی که بهعنوان علم ارائه میشوند پر کرده است — اما تحت استانداردهای بازبینی قرار ندارند.
هزینهٔ این وضعیت، به گفته فرید، این است که برای خبرنگاران، عموم مردم و حتی کارشناسان این حوزه تقریباً غیرممکن است بفهمند در هوش مصنوعی چه اتفاقی میافتد. «بهعنوان خوانندهٔ متوسط، شما شانس ندارید که بفهمید چه میگذرد در ادبیات علمی. نسبت سیگنال به نویز شما تقریباً یک است. من به سختی میتوانم به این همایشها بروم و بفهمم چه جهنمی در جریان است.»
«چیزی که به دانشجویان میگویم این است که اگر هدف شما انتشار مقالات است، صادقانه بگویم کار خیلی سختی نیست. فقط کارهای بسیار ضعیف و کمکیفیت انجام دهید و آنها را بهصورت انبوه به کنفرانسها بفرستید. اما اگر میخواهید کارهای دقیق و اندیشمندانه انجام دهید، در یک موقعیت نامساعد هستید، زیرا عملاً بهتنهایی سلاح ندارید»، او افزود.
دیدگاهتان را بنویسید