برنامه فیلمسازی هوش مصنوعی گوگل، فلو، به یک نقطه عطف بزرگ دست یافت!
در یک جهش بزرگ برای خلاقیت به کمک هوش مصنوعی، گوگل تأیید کرده است که برنامه فیلمسازی هوش مصنوعی مولد آن، فلو (Flow)، برای ساخت بیش از ۱۰۰ میلیون ویدیو استفاده شده است. این دستاورد چشمگیر که تنها ۹۰ روز پس از رونمایی در کنفرانس Google I/O به دست آمده، نشاندهنده آغاز دورهای جدید برای خلق محتوای دیجیتال است که توسط مدلهای پیشرفتهای مانند Veo 3 قدرت گرفته است.

فلو چیست و چه چیزی آن را متمایز میکند؟
برخلاف ابزارهای قبلی، فلو برای سازندگان و فیلمسازان حرفهای طراحی شده است. نقطه قوت اصلی آن در حل مشکلی است که الیاس رومن، مدیر ارشد مدیریت محصول، آن را «پاشنه آشیل ویدیوی هوش مصنوعی» مینامد: ثبات و یکپارچگی (consistency). فلو تضمین میکند که ظاهر یک شخصیت، مانند طول مو یا رنگ چشم، در صحنهها و کلیپهای مختلف ثابت باقی بماند؛ عنصری حیاتی برای پروژههای حرفهای.
این برنامه چندین مدل از قدرتمندترین مدلهای هوش مصنوعی گوگل را با هم ادغام میکند:
- Veo 3: یک مدل ویدیویی نوآورانه که کلیپهایی با صدای همگامسازیشده و تولیدشده توسط هوش مصنوعی تولید میکند—از دیالوگ و جلوههای صوتی گرفته تا صداهای محیطی (Foley) و موسیقی متن. این رویکرد یکپارچه، فرآیند خلاقیت را به شدت ساده میکند.
- Imagen: خانواده مدلهای تصویر هوش مصنوعی گوگل برای تولید تصاویر با کیفیت بالا.
- Gemini: چتبات قدرتمندی که «اساساً به زبان Veo صحبت میکند» و به آموزش مدل و کمک به فرآیند ساخت کمک میکند.
پیمایش در چشمانداز خلاقانه و اخلاقی
ظهور هوش مصنوعی مولد بدون چالش نیست. سازندگان نگرانیهای معتبری در مورد نقض حق نسخهبرداری، امنیت شغلی و نحوه آموزش مدلهای هوش مصنوعی مطرح کردهاند. سال گذشته، گوگل با انتقاداتی مواجه شد که مدل جمینای آن تصاویر تاریخی نادرستی تولید میکرد. این شرکت از آن زمان متعهد به بهبود سیاستهای ایمنی و اجرای آنها شده و اذعان کرده است که استفاده در دنیای واقعی و گزارشهای کاربران برای اصلاح و بهبود حیاتی است.
هدف فلو این است که ابزاری برای توانمندسازی خلاقیت انسان باشد، نه جایگزینی آن. رومن هدف این پروژه را «کاهش موانعی که مانع از داستانگویی افراد بسیار بیشتری از طریق ویدیو میشود و بالا بردن سقف داستانهایی که میتوان تعریف کرد» بیان میکند.
چگونه از فلو گوگل برای ویدیوهای هوش مصنوعی خود استفاده کنیم؟
آمادهاید خودتان امتحان کنید؟ فلو برای مشترکین طرحهای پولی هوش مصنوعی گوگل در دسترس است. در اینجا برخی از ویژگیهای منحصر به فردی که میتوانید کشف کنید، آورده شده است:
- تبدیل اجزا به ویدیو (Ingredients-to-video): تصاویر خاصی را بارگذاری کنید—یک شخص، یک لباس، یک پسزمینه—و با یک فرمان متنی از فلو بخواهید آنها را ترکیب کرده و به یک ویدیوی متحرک تبدیل کند.
- افزایش طول کلیپها و انتقالهای نرم: به راحتی طول کلیپهای ویدیویی خود را در تایملاین افزایش دهید. برای اطمینان از یک انتقال یکپارچه، میتوانید فریم پایانی یک کلیپ را ذخیره کرده و از آن به عنوان نقطه شروع کلیپ بعدی استفاده کنید.
- طراحی و ویرایشهای درون ویدیو: با علامتگذاری روی یک تصویر یا فریم، بارگذاری آن و دستور دادن به فلو برای اعمال تغییرات، ویرایشهای مستقیم انجام دهید. حتی میتوانید طرحهای خود را زنده کنید!
- فرماننویسی با جمینای: اگرچه هنوز به طور مستقیم ادغام نشده است، میتوانید از چتبات جمینای برای ایدهپردازی و اصلاح فرمانهای دقیق و مؤثر برای ایدههای ویدیویی خود کمک بگیرید.
آینده فلو شامل گسترش قابلیتهای Veo 3، بهبود بیشتر ثبات و افزودن ویژگیهای جدیدی مانند صداهای سفارشی برای شخصیتها است. واضح است که سفر فیلمسازی به کمک هوش مصنوعی تازه آغاز شده است.
منبع: CNET