یک گروه از پژوهشگران از یک هوش مصنوعی برای نوشتن دستور (prompt) و یک هوش مصنوعی دیگر برای تولید تصویر استفاده کردند و دریافتند که تنها ۱۲ الگوی مشترک در هزاران تصویر تکرار میشوند

پیشرفت هوش مصنوعی مولد همزمان با بحثهای فراوانی دربارهٔ میزان «خلاقیت»ی که یک ماشین میتواند داشته باشد، بهوجود آمده است؛ اما گروهی از پژوهشگران بهتازگی مطالعهای منتشر کردند که نشان میدهد سازندگان تصویر مبتنی بر هوش مصنوعی مولد عمدتاً بهصورت پیشفرض تنها به دوازده الگوی کلی یا موضوع عمومی متمایل میشوند.
در این مطالعه که نویسندگان آن را «هشداردهندهای برای خلاقیت محاسباتی» توصیف میکنند، دو سامانهٔ هوش مصنوعی تنظیم شدند تا بدون دخالت انسانی ۱۰۰ تصویر تولید کنند. با تکرار این آزمون برای تولید هزاران تصویر، پژوهشگران دریافتند که تمام خروجیها تمایل دارند به یکی از دوازده الگوی رایج مثل یک پل، درخت تنهایی، عکس پرحرکت یا صحنهٔ فانوس دریایی متمایل شوند.
پژوهشگران مجموعهٔ بهدستآمدهٔ تصاویر را بهعنوان «موسیقی آسانسور بصری» عمومی توصیف کردند. این مطالعه از تحقیقات انجام شده در بخش تجزیهوتحلیل دادهها دانشگاه دارالنا در سوئد و مرکز BEACON برای مطالعهٔ تکامل در عمل در دانشگاه ایالتی میشیگان در آمریکا نشأت میگیرد.
برای این پژوهش، گروه میخواست یک هوش مصنوعی را طوری تنظیم کند که بدون دخالت انسانی تصاویر تولید کند. برای این منظور، تیم به یک مولد تصویر هوش مصنوعی یک دستور (prompt) داد تا تصویری بسازد. سپس یک هوش مصنوعی دیگر از آن تصویر توصیف خواست. این توصیف بهعنوان ورودی به مولد تصویر بازگردانده شد تا تصویری بر پایهٔ این دستور نوشتهشده توسط هوش مصنوعی، ایجاد کند. این چرخه برای ۱۰۰ دور ادامه یافت. پژوهشگران این آزمایش را ۴۰ بار تکرار کردند و سپس آن را با چهار مولد تصویر متفاوت امتحان کردند.
وقتی پژوهشگران نتایج را بررسی کردند، مشاهده کردند که تصاویر تمایل دارند به یکی از دوازده الگو یا سبک مختلف متمایل شوند. همانطور که پژوهشگران بیان کردند: «… این سیستمها بهصورت سیستماتیک به سمت نقاط انتهایی تقریباً یکسان معنایی و بصری پیشرفت میکردند — فانوسهای دریایی طوفانی، صحنههای شبانه شهری، کلیساهای گوتیک و داخلیهای کاخمانند. بهجای کشف امکانات خلاقانه، حلقههای مستقل هوش مصنوعی به چیزی شبیه «موسیقی آسانسور بصری» تمایل نشان میدهند.»
«این نتایج برای خلاقیت محاسباتی هشداردهندهاند»، پژوهشگران نوشتند. «اگر سامانههای هوش مصنوعی بهطور مستمر به خروجیهای عمومی متمایل شوند زمانی که بدون مداخلهٔ انسانی عمل میکنند، این سؤال میپرسد که آیا رویکردهای فعلی میتوانند خلاقیت واقعی ماشین را بهدست آورند یا نه. تمایل به کلیشههای «ایمن» بصری نشان میدهد که برای حفظ تنوع خلاقانه ممکن است نیاز به مکانیزمهای صریح ضد‑همگرایی یا نظارت مستمر انسانی باشد.»
سازگاریای که مولدهای تصویر متعدد در بازگشت به همان ۱۲ موضوع یا تم عمومی نشان دادند، «این سامانهها خروجیهای با احتمال بالا را نسبت به نوآوری واقعی ترجیح میدهند» را نشان میدهد، پژوهشگران نتیجهگیری کردند.
پژوهشگران هشدار دادند که «استفادهٔ گسترده از چنین سامانههایی میتواند بهطور ناخواسته فرهنگ بصری را همگنسازی کند.»
اما پژوهشگران اشاره میکنند که پژوهش در زمینه انتقال فرهنگ انسانی نیز تمایل دارد تمهای رایج را تکرار کند؛ تمهایی که در روایتهای داستانی و همچنین هنرهای بصری در فرهنگهای مختلف و در دورههای زمانی گوناگون مشاهده میشوند. «تفاوت نه در وجود همگرایی، بلکه در جذابسازهای خاص آن است: جایی که انسانها به اسطورههای سیلاب و الگوهای مارپیچ شکلگرفته توسط ادراک بدنی میپیوندند، سامانههای هوش مصنوعی به زیباییهای عکاسی استوک شکلگرفته توسط دادههای مقیاس اینترنتی همگرا میشوند»، پژوهشگران توضیح دادند.
سیستمهای هوش مصنوعی مولد بر پایهٔ دادههای تولیدشده توسط انسان آموزش میبینند، نویسندگان این مطالعه میپرسند: «همگرایی بر الگوهای هنری مشترک چه پیامی دربارهٔ ما دارد؟»
این پژوهش در Patterns در دسترس است.
دیدگاهتان را بنویسید