گوگل در مدل Veo 3.1 با معرفی قابلیت‌های تولید صوت هماهنگ با تصویر، کنترل سبک بصری و گسترش خودکار صحنه‌ها، گامی بلند در تولید ویدیوهای سینمایی با هوش مصنوعی برداشته است. این مدل که از طریق Gemini API و ابزار Flow در دسترس است، امکان ویرایش پیشرفته و ساخت روایت‌های منسجم بصری را برای تولیدکنندگان محتوا فراهم می‌کند.

گوگل در گامی جسورانه برای آینده‌ی فیلم‌سازی با هوش مصنوعی، نسخه‌ی جدید مدل تولید ویدیوی خود یعنی Veo 3.1 را معرفی کرده است. این نسخه از طریق Gemini API، پلتفرم Vertex AI و ابزار Google Flow Video در دسترس توسعه‌دهندگان و تولیدکنندگان محتوا قرار گرفته است.

Veo 3.1 نسبت به نسخه‌ی قبلی، سریع‌تر، دقیق‌تر و خلاقانه‌تر عمل می‌کند و با هدف ارائه‌ی کیفیت سینمایی و کنترل بیشتر به فیلم‌سازان، تولیدکنندگان محتوا و توسعه‌دهندگان طراحی شده است.

در حالی که نسخه‌های پیشین توانایی گوگل در ساخت کلیپ‌های کوتاه باکیفیت از روی متن را نشان داده بودند، Veo 3.1 تمرکز خود را بر داستان‌گویی، هماهنگی صوت و تصویر، و کنترل سینمایی بیشتر گذاشته است. در ادامه، با پنج قابلیت کلیدی این نسخه‌ی جدید آشنا می‌شویم.


۱. تولید صدای طبیعی و هماهنگ با تصویر

برای نخستین‌بار، گوگل در Veo 3.1 امکان تولید صوت بومی و هم‌زمان با ویدیو را فراهم کرده است.
این مدل می‌تواند دیالوگ‌ها، صدای محیط و افکت‌های صوتی را بر اساس حس و حرکت صحنه بسازد؛ از صدای آرام خیابان گرفته تا لحظه‌های پرتنش سینمایی.
به لطف این قابلیت، کاربران می‌توانند تنها با یک پرامپت، ویدیویی تقریباً کامل همراه با صدا تولید کنند — قابلیتی که در تمام حالت‌های ابزار Flow در دسترس است.


۲. قابلیت «Ingredients to Video» برای کنترل سبک بصری

ویژگی جدید Ingredients to Video به کاربران اجازه می‌دهد تا حداکثر سه تصویر مرجع برای هدایت تولید ویدیو آپلود کنند.
این تصاویر به‌عنوان طرح اولیه‌ی بصری (Blueprint) عمل می‌کنند تا Veo 3.1 بتواند سبک، کاراکتر یا شیء خاصی را در طول کلیپ حفظ کند.
این ویژگی برای پروژه‌هایی که به تداوم شخصیت‌ها، نمایش محصولات یا روایت‌های سبک‌دار نیاز دارند، تحول‌برانگیز است.


۳. تولید ویدیو بین دو فریم ثابت (First-and-Last-Frame Transitions)

این قابلیت امکان تعریف فریم آغاز و پایان را برای ویدیو فراهم می‌کند تا Veo 3.1 صحنه‌ای پیوسته بین آن‌ها بسازد.
نتیجه، انتقالی سینمایی و نرم از آغاز تا پایان است؛ ابزاری ایده‌آل برای فیلم‌سازانی که می‌خواهند با تغییر زمان، متافورهای بصری یا گذارهای روایی بازی کنند.


۴. گسترش خودکار صحنه‌ها برای ساخت ویدیوهای بلندتر

قابلیت جدید Scene Extension به Veo 3.1 اجازه می‌دهد تا ویدیوهای کوتاه را به‌طور طبیعی ادامه دهد.
مدل با تحلیل آخرین فریم‌ها، حرکات و اتمسفر صحنه را شناسایی کرده و فریم‌های جدیدی تولید می‌کند که تداوم طبیعی داستان را حفظ می‌کنند.
این ویژگی به سازندگان کمک می‌کند ویدیوهایی طولانی‌تر و منسجم‌تر بدون نیاز به ادیت دستی بسازند.


۵. ویرایش پیشرفته در Flow با قابلیت حذف و اضافه عناصر

گوگل در کنار Veo 3.1، ابزار Flow را نیز ارتقا داده است. حالا کاربران می‌توانند با قابلیت‌های Insert و Remove، عناصر خاصی را به صحنه اضافه یا از آن حذف کنند — بدون اینکه نور، پرسپکتیو یا حرکت طبیعی تصویر از بین برود.
این قابلیت هنوز در حال انتشار تدریجی است، اما چشم‌انداز گوگل را برای ویرایش حرفه‌ای ویدیوهای تولیدشده با هوش مصنوعی نشان می‌دهد.


آینده‌ای سینمایی و قابل‌کنترل برای هوش مصنوعی

Veo 3.1 فقط کیفیت تصویر را افزایش نمی‌دهد؛ بلکه نحوه‌ی کارگردانی با هوش مصنوعی را تغییر می‌دهد.
از کنترل صدا و سبک تا حفظ تداوم روایی، این نسخه نشان می‌دهد که ویدیوهای تولیدی با AI دیگر صرفاً یک دموی فنی نیستند، بلکه ابزاری واقعی برای خلاقان به‌شمار می‌آیند.

در حال حاضر، استودیوهایی مانند Promise Studios و Latitude از Veo 3.1 برای ساخت استوری‌بوردها و روایت‌های کاربرمحور استفاده می‌کنند — نشانه‌ای از اینکه این فناوری به‌زودی وارد جریان اصلی تولید محتوا خواهد شد.

گوگل با گسترش دسترسی به Flow و API، استاندارد جدیدی برای فیلم‌سازی با کمک هوش مصنوعی تعریف کرده است؛ جایی که خلاقیت انسان و هوش ماشین در یک قاب حرکت می‌کنند.

source

توسط postbin.ir