Mixup یک برنامه جدید به سبک Mad Libs برای ساخت تصاویر هوش مصنوعی از عکس‌ها، متون و دودل‌هاست

تیم پیشین گوگل که پشت برنامهٔ طراحی سه‌بعدی Rooms از شرکت Things, Inc. قرار دارد، پروژهٔ جدید خود را معرفی کرد: یک ویرایشگر عکس هوش مصنوعی سرگرم‌کننده به نام Mixup. این برنامهٔ ویژهٔ iOS به هر کسی اجازه می‌دهد تا با استفاده از «دستورالعمل‌ها» که شبیه پرکن‌های خالی به سبک Mad Lib برای عکس‌ها، متون یا طرح‌های شما هستند، عکس‌های جدید هوش مصنوعی‌ساز بسازد.

به‌عنوان مثال، می‌توانید از Mixup بخواهید تا طرح دست‌نویس خود را به یک نقاشی زیبا از دورهٔ رنسانس تبدیل کند، یا حیوان خانگی‌تان را در یک لباس خنده‌دار هالووین بازآفرینی کند. می‌توانید از یک سلفی استفاده کنید تا ببینید با یک مدل مو متفاوت چگونه خواهید به‌نظر آمد، یا حتی چیزی احمقانه‌تر بسازید — مانند تجسم دوستی که به شکل یک شخصیت ایتالیایی دیوانه درآشته است.

منبع تصویر:Mixup

این برنامه بر پایهٔ Nano Banana گوگل ساخته شده است، اما قالب «دستورالعمل» روش جدیدی برای تعامل با مدل فراهم می‌کند — ابزار تولیدی را به یک بازی آنلاین تبدیل می‌کند.

«چیزی که Nano Banana انجام داد و هیچ مدل قبلی قادر به انجامش نبود این بود که بتواند تصویر شما را به شکلی قانع‌کننده حفظ کند بدون اینکه ترسناک به‌نظر برسد»، جیسون توف، بنیانگذار و مدیرعامل شرکت Things, Inc. که پیشینه‌اش شامل کار بر روی برنامه‌های آزمایشی در شرکت‌های فناوری بزرگ مانند گوگل و متا، و همچنین مدت‌زمانی که در توییتر به مدیریت محصول مشغول بوده، گفت.

اما آنچه Mixup را به‌ویژه سرگرم‌کننده می‌کند این است که «دستورالعمل‌های» این برنامه — درخواست‌های هوش مصنوعی تولیدشده توسط کاربر — قابل اشتراک‌گذاری هستند.

منبع تصویر:Mixup

«هوش مصنوعی مولد بسیار قدرتمند است، اما اکثر اوقات وقتی به این ابزارها مراجعه می‌کنید، فقط یک جعبهٔ متن به شما می‌دهد — از شما می‌خواهد خلاق باشید. پس چه می‌نویسید؟» توف در مورد کاستی‌هایی که تیمش در چشم‌انداز فعلی هوش مصنوعی مشاهده کرده بود، اظهار کرد.

«به‌این‌سان، به‌جای اینکه مجبور باشید خلاق باشید و به‌دنبال این باشید که چه چیزی بسازید، چیزی که کار می‌کند را می‌بینید و می‌توانید فقط جاهای خالی را پر کنید»، او گفت.

منبع تصویر:Mixup

پس از اینکه کاربران یک پرامپت جدید در Mixup ایجاد کردند، می‌توانند آن را همراه با عکسی که به دست آمده در یک فید عمومی منتشر کنند یا فقط برای استفاده شخصی دانلود نمایند. از فید، کاربران دیگر می‌توانند تصویر را مشاهده کرده و دکمهٔ کنار آن را بزنند تا «دستورالعمل را امتحان کنند». این امکان به هر کسی در اپ اجازه می‌دهد تا از همان دستورالعمل برای تولید تصویر با استفاده از عکس، متن یا دودل‌های خود استفاده کند. (دودل‌ها می‌توانند با یک ویژگی سادهٔ رسم داخل برنامه ساخته شوند.)

دیدن یک عکس در کنار دستورالعملی که آن را ایجاد کرده، می‌تواند به‌نظر تیم، به رفع طبیعت غیرقابل پیش‌بینی تصاویر هوش مصنوعی مولد کمک کند.

«مشکل دیگری که در هوش مصنوعی مولد وجود دارد، همان مسأله‌ای است که ما به‌صورت داخلی «دستگاه اسلات» می‌نامیم؛ یعنی وقتی دکمه را می‌زنید، چیزی بیرون می‌آید، دوباره فشار می‌دهید، چیز دیگری بیرون می‌آید، و حس می‌کنید که کنترلی بر خروجی ندارید»، توف توضیح داد.

منبع تصویر:Mixup

اما در Mixup، کاربران می‌توانند هم تصویر و هم پرامپتی که آن را ایجاد کرده در یک مکان ببینند، که به آن‌ها ایده‌ای از ظاهر خروجی می‌دهد. همچنین می‌توانند دکمه‌ای را فعال کنند تا تصویر قبل و بعد را مشاهده کنند، به شرطی که سازنده این تنظیم را فعال کرده باشد.

علاوه بر این، مشابه برنامهٔ ویدئویی هوش مصنوعی OpenAI به نام Sora، کاربران می‌توانند عکس‌های خود را به Mixup بارگذاری کنند تا در تصاویر هوش مصنوعی خود استفاده کنند. اگر این کار را انجام دهید، هر شخصی که در برنامه دنبال‌اش می‌کنید می‌تواند با چهرهٔ شما تصاویر هوش مصنوعی بسازد — ویژگی‌ای که «mixables» نامیده می‌شود.

شرکت تصور می‌کند که گروه‌های دوستان برای بهره‌برداری از این ویژگی یکدیگر را دنبال کنند، اما ممکن است یک دستهٔ سازندگان نیز در این پلتفرم شکل بگیرد — به‌شرط آن‌که مخالف ترکیب شدن خودشان به‌طرز عجیبی نباشند. (البته، اگر نمی‌خواهید تصویر خود را در دسترس دیگران بگذارید، یا عکس را آپلود نکنید یا کسی را دنبال نکنید.)

منبع تصویر:Mixup

این برنامه همچنین از فناوری OpenAI برای رسیدگی به برخی از نگرانی‌های پیش‌بینی‌شده در مورد نظارت بر تصاویر هوش مصنوعی استفاده می‌کند، اما توف اعتراف می‌کند که Mixup به‌طور قابل‌توجهی بر کنترل‌های داخلی گوگل در مدل تصویر خود برای محدود کردن محتوای جنسی یا خشونت متکی است.

در زمان عرضه، Mixup برای iOS 26 بهینه‌سازی شده است، اما از iOS 18 به بالا پشتیبانی می‌کند. اگر موفق شود، نسخهٔ وب یا برنامهٔ اندروید می‌تواند در آینده اضافه شود.

کاربران رایگان ۱۰۰ امتیاز دریافت می‌کنند که معادل ۴ دلار است. در عین حال، هزینهٔ تولید هر تصویر تقریباً ۴ سنت است. وقتی امتیازها تمام شوند، کاربران می‌توانند به سطوح مختلف اشتراک‌گذاری که ۱۰۰، ۲۵۰ یا ۵۰۰ امتیاز در ماه ارائه می‌دهد، مشترک شوند.

برنامه در ساعت نیمه‌شب ۲۱ نوامبر در فروشگاه App Store به‌صورت جهانی عرضه می‌شود، اما برای دسترسی به آن به دعوتنامه نیاز است. خوانندگان TechCrunch می‌توانند از کد TCHCRH (تا زمانی که موجود باشد) برای ورود استفاده کنند. Mixup برای پیش‌سفارش قبل از عرضه در دسترس است.

این پست پس از انتشار بروز شد تا اعلام کند که برنامه در ۲۱ نوامبر، نه ۲۰ نوامبر همان‌طور که پیش‌تر گفته شد، عرضه می‌شود.

دیدگاه‌ها

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *