فلو، ابزار هوش مصنوعی گوگل، به ۱۰۰ میلیون ویدیو رسید

برنامه فیلم‌سازی هوش مصنوعی گوگل، فلو، به یک نقطه عطف بزرگ دست یافت!

در یک جهش بزرگ برای خلاقیت به کمک هوش مصنوعی، گوگل تأیید کرده است که برنامه فیلم‌سازی هوش مصنوعی مولد آن، فلو (Flow)، برای ساخت بیش از ۱۰۰ میلیون ویدیو استفاده شده است. این دستاورد چشمگیر که تنها ۹۰ روز پس از رونمایی در کنفرانس Google I/O به دست آمده، نشان‌دهنده آغاز دوره‌ای جدید برای خلق محتوای دیجیتال است که توسط مدل‌های پیشرفته‌ای مانند Veo 3 قدرت گرفته است.
دستی در حال لمس دکمه تولید ویدیوی هوش مصنوعی.

فلو چیست و چه چیزی آن را متمایز می‌کند؟

برخلاف ابزارهای قبلی، فلو برای سازندگان و فیلم‌سازان حرفه‌ای طراحی شده است. نقطه قوت اصلی آن در حل مشکلی است که الیاس رومن، مدیر ارشد مدیریت محصول، آن را «پاشنه آشیل ویدیوی هوش مصنوعی» می‌نامد: ثبات و یکپارچگی (consistency). فلو تضمین می‌کند که ظاهر یک شخصیت، مانند طول مو یا رنگ چشم، در صحنه‌ها و کلیپ‌های مختلف ثابت باقی بماند؛ عنصری حیاتی برای پروژه‌های حرفه‌ای.

این برنامه چندین مدل از قدرتمندترین مدل‌های هوش مصنوعی گوگل را با هم ادغام می‌کند:

  • Veo 3: یک مدل ویدیویی نوآورانه که کلیپ‌هایی با صدای همگام‌سازی‌شده و تولیدشده توسط هوش مصنوعی تولید می‌کند—از دیالوگ و جلوه‌های صوتی گرفته تا صداهای محیطی (Foley) و موسیقی متن. این رویکرد یکپارچه، فرآیند خلاقیت را به شدت ساده می‌کند.
  • Imagen: خانواده مدل‌های تصویر هوش مصنوعی گوگل برای تولید تصاویر با کیفیت بالا.
  • Gemini: چت‌بات قدرتمندی که «اساساً به زبان Veo صحبت می‌کند» و به آموزش مدل و کمک به فرآیند ساخت کمک می‌کند.

پیمایش در چشم‌انداز خلاقانه و اخلاقی

ظهور هوش مصنوعی مولد بدون چالش نیست. سازندگان نگرانی‌های معتبری در مورد نقض حق نسخه‌برداری، امنیت شغلی و نحوه آموزش مدل‌های هوش مصنوعی مطرح کرده‌اند. سال گذشته، گوگل با انتقاداتی مواجه شد که مدل جمینای آن تصاویر تاریخی نادرستی تولید می‌کرد. این شرکت از آن زمان متعهد به بهبود سیاست‌های ایمنی و اجرای آن‌ها شده و اذعان کرده است که استفاده در دنیای واقعی و گزارش‌های کاربران برای اصلاح و بهبود حیاتی است.

هدف فلو این است که ابزاری برای توانمندسازی خلاقیت انسان باشد، نه جایگزینی آن. رومن هدف این پروژه را «کاهش موانعی که مانع از داستان‌گویی افراد بسیار بیشتری از طریق ویدیو می‌شود و بالا بردن سقف داستان‌هایی که می‌توان تعریف کرد» بیان می‌کند.

چگونه از فلو گوگل برای ویدیوهای هوش مصنوعی خود استفاده کنیم؟

آماده‌اید خودتان امتحان کنید؟ فلو برای مشترکین طرح‌های پولی هوش مصنوعی گوگل در دسترس است. در اینجا برخی از ویژگی‌های منحصر به فردی که می‌توانید کشف کنید، آورده شده است:

  • تبدیل اجزا به ویدیو (Ingredients-to-video): تصاویر خاصی را بارگذاری کنید—یک شخص، یک لباس، یک پس‌زمینه—و با یک فرمان متنی از فلو بخواهید آن‌ها را ترکیب کرده و به یک ویدیوی متحرک تبدیل کند.
  • افزایش طول کلیپ‌ها و انتقال‌های نرم: به راحتی طول کلیپ‌های ویدیویی خود را در تایم‌لاین افزایش دهید. برای اطمینان از یک انتقال یکپارچه، می‌توانید فریم پایانی یک کلیپ را ذخیره کرده و از آن به عنوان نقطه شروع کلیپ بعدی استفاده کنید.
  • طراحی و ویرایش‌های درون ویدیو: با علامت‌گذاری روی یک تصویر یا فریم، بارگذاری آن و دستور دادن به فلو برای اعمال تغییرات، ویرایش‌های مستقیم انجام دهید. حتی می‌توانید طرح‌های خود را زنده کنید!
  • فرمان‌نویسی با جمینای: اگرچه هنوز به طور مستقیم ادغام نشده است، می‌توانید از چت‌بات جمینای برای ایده‌پردازی و اصلاح فرمان‌های دقیق و مؤثر برای ایده‌های ویدیویی خود کمک بگیرید.

آینده فلو شامل گسترش قابلیت‌های Veo 3، بهبود بیشتر ثبات و افزودن ویژگی‌های جدیدی مانند صداهای سفارشی برای شخصیت‌ها است. واضح است که سفر فیلم‌سازی به کمک هوش مصنوعی تازه آغاز شده است.

منبع: CNET

Leave a Comment