字节跳动发布了豆包视频生成模型，支持10秒视频、多镜头生成

资讯6个月前发布优优

3,183 0 0

火山引擎发布豆包视频生成模型，视频生成更灵动多变

火山引擎在2024年AI创新巡展上宣布推出豆包·视频生成模型，作为大模型家族的新成员。这一模型在视频生成领域表现出色，拥有精准的语义理解、多动作多主体交互、强大的动态效果和一致性多镜头生成能力。

豆包·视频生成模型能够理解并执行复杂的指令，实现多个主体间的交互，并在视频中实现大动态和多镜头之间的炫酷切换。同时，该模型能够保持多镜头切换的一致性，10秒内讲述一个完整的故事，支持多种风格和比例，如黑白、3D动画、国画等。

模型支持多种风格，并适配不同比例，包括黑白、3D动画、2D动画、国画等，以适配不同终端和画幅。

豆包·视频生成模型不仅提升视频画质的高保真度，还在大动态与镜头中展现炫酷切换，具备丰富的镜头语言能力，如变焦、环绕、平摇、缩放、目标跟随等。

PixelDance V1.4是ByteDance Research团队开发的视频生成大模型，支持文生视频和图生视频，能够生成长达10秒的精彩视频片段。用户可以输入文本、图片生成视频，模型具备出色的语义理解能力，适用于影视创作、广告传媒等多个场景。

PixelDance V1.4支持精准的语义理解，一致性多镜头生成，多种风格、多比例兼容等功能。

Seaweed版本支持文生视频和图生视频，基于Transformer结构，支持多分辨率生成，适配横屏、竖屏，并根据高清图像分辨率进行适配和保真。默认输出为720p分辨率、24fps、时长5秒，并可动态延长至20-30秒。

豆包·视频生成模型的推出，将为电商营销、动画教育、城市文旅等领域带来创新和效率提升。火山引擎表示，发布此模型将全面加速AIGC应用创新。

火山引擎承诺继续推进模型能力的升级和迭代，探索模型在更多场合的应用，并为企业实现云上智能化提供动力。

数据显示，豆包大模型的日均 tokens 使用量已超过1.3万亿，4个月内 tokens 整体增长超过了10倍。豆包·文生图模型日均生成图片5000万张，处理语音85万小时。

文章版权归作者所有，未经允许请勿转载。

花花

3,921

优优

2,052

花花

3,602

花花

6,738

优优

673

优优

1,584