پژوهشگران به هوش مصنوعی اجازه دادند تا هزاران تصویر را بدون دخالت انسانی تولید کند. فقدان اصالت، «هشداردهنده‌ای برای خلاقیت محاسباتی» بود؛ چرا که این تصاویر صرفاً در ۱۲ سبک کلیشه‌ای قرار می‌گرفتند

یک گروه از پژوهشگران از یک هوش مصنوعی برای نوشتن دستور (prompt) و یک هوش مصنوعی دیگر برای تولید تصویر استفاده کردند و دریافتند که تنها ۱۲ الگوی مشترک در هزاران تصویر تکرار می‌شوند

جدولی از تصاویر تولیدشده توسط هوش مصنوعی در ۱۲ تم رایج

(اعتبار تصویر: هینتز، آرند و همکاران / Patterns، جلد ۰، شماره ۰، 101451)

پیشرفت هوش مصنوعی مولد همزمان با بحث‌های فراوانی دربارهٔ میزان «خلاقیت»ی که یک ماشین می‌تواند داشته باشد، به‌وجود آمده است؛ اما گروهی از پژوهشگران به‌تازگی مطالعه‌ای منتشر کردند که نشان می‌دهد سازندگان تصویر مبتنی بر هوش مصنوعی مولد عمدتاً به‌صورت پیش‌فرض تنها به دوازده الگوی کلی یا موضوع عمومی متمایل می‌شوند.

در این مطالعه که نویسندگان آن را «هشداردهنده‌ای برای خلاقیت محاسباتی» توصیف می‌کنند، دو سامانهٔ هوش مصنوعی تنظیم شدند تا بدون دخالت انسانی ۱۰۰ تصویر تولید کنند. با تکرار این آزمون برای تولید هزاران تصویر، پژوهشگران دریافتند که تمام خروجی‌ها تمایل دارند به یکی از دوازده الگوی رایج مثل یک پل، درخت تنهایی، عکس پرحرکت یا صحنهٔ فانوس دریایی متمایل شوند.

پژوهشگران مجموعهٔ به‌دست‌آمدهٔ تصاویر را به‌عنوان «موسیقی آسانسور بصری» عمومی توصیف کردند. این مطالعه از تحقیقات انجام شده در بخش تجزیه‌وتحلیل داده‌ها دانشگاه دارالنا در سوئد و مرکز BEACON برای مطالعهٔ تکامل در عمل در دانشگاه ایالتی میشیگان در آمریکا نشأت می‌گیرد.

برای این پژوهش، گروه می‌خواست یک هوش مصنوعی را طوری تنظیم کند که بدون دخالت انسانی تصاویر تولید کند. برای این منظور، تیم به یک مولد تصویر هوش مصنوعی یک دستور (prompt) داد تا تصویری بسازد. سپس یک هوش مصنوعی دیگر از آن تصویر توصیف خواست. این توصیف به‌عنوان ورودی به مولد تصویر بازگردانده شد تا تصویری بر پایهٔ این دستور نوشته‌شده توسط هوش مصنوعی، ایجاد کند. این چرخه برای ۱۰۰ دور ادامه یافت. پژوهشگران این آزمایش را ۴۰ بار تکرار کردند و سپس آن را با چهار مولد تصویر متفاوت امتحان کردند.

وقتی پژوهشگران نتایج را بررسی کردند، مشاهده کردند که تصاویر تمایل دارند به یکی از دوازده الگو یا سبک مختلف متمایل شوند. همان‌طور که پژوهشگران بیان کردند: «… این سیستم‌ها به‌صورت سیستماتیک به سمت نقاط انتهایی تقریباً یکسان معنایی و بصری پیشرفت می‌کردند — فانوس‌های دریایی طوفانی، صحنه‌های شبانه شهری، کلیساهای گوتیک و داخلی‌های کاخ‌مانند. به‌جای کشف امکانات خلاقانه، حلقه‌های مستقل هوش مصنوعی به چیزی شبیه «موسیقی آسانسور بصری» تمایل نشان می‌دهند.»

«این نتایج برای خلاقیت محاسباتی هشداردهنده‌اند»، پژوهشگران نوشتند. «اگر سامانه‌های هوش مصنوعی به‌طور مستمر به خروجی‌های عمومی متمایل شوند زمانی که بدون مداخلهٔ انسانی عمل می‌کنند، این سؤال می‌پرسد که آیا رویکردهای فعلی می‌توانند خلاقیت واقعی ماشین را به‌دست آورند یا نه. تمایل به کلیشه‌های «ایمن» بصری نشان می‌دهد که برای حفظ تنوع خلاقانه ممکن است نیاز به مکانیزم‌های صریح ضد‑همگرایی یا نظارت مستمر انسانی باشد.»

سازگاری‌ای که مولدهای تصویر متعدد در بازگشت به همان ۱۲ موضوع یا تم عمومی نشان دادند، «این سامانه‌ها خروجی‌های با احتمال بالا را نسبت به نوآوری واقعی ترجیح می‌دهند» را نشان می‌دهد، پژوهشگران نتیجه‌گیری کردند.

پژوهشگران هشدار دادند که «استفادهٔ گسترده از چنین سامانه‌هایی می‌تواند به‌طور ناخواسته فرهنگ بصری را همگن‌سازی کند.»

اما پژوهشگران اشاره می‌کنند که پژوهش در زمینه انتقال فرهنگ انسانی نیز تمایل دارد تم‌های رایج را تکرار کند؛ تم‌هایی که در روایت‌های داستانی و همچنین هنرهای بصری در فرهنگ‌های مختلف و در دوره‌های زمانی گوناگون مشاهده می‌شوند. «تفاوت نه در وجود همگرایی، بلکه در جذاب‌سازهای خاص آن است: جایی که انسان‌ها به اسطوره‌های سیلاب و الگوهای مارپیچ شکل‌گرفته توسط ادراک بدنی می‌پیوندند، سامانه‌های هوش مصنوعی به زیبایی‌های عکاسی استوک شکل‌گرفته توسط داده‌های مقیاس اینترنتی همگرا می‌شوند»، پژوهشگران توضیح دادند.

سیستم‌های هوش مصنوعی مولد بر پایهٔ داده‌های تولیدشده توسط انسان آموزش می‌بینند، نویسندگان این مطالعه می‌پرسند: «همگرایی بر الگوهای هنری مشترک چه پیامی دربارهٔ ما دارد؟»

این پژوهش در Patterns در دسترس است.

دیدگاه‌ها

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *