字节跳动发布了豆包视频生成模型,支持10秒视频、多镜头生成

资讯2个月前发布 优优
1,650 0 0

火山引擎发布豆包视频生成模型,视频生成更灵动多变

火山引擎在2024年AI创新巡展上宣布推出豆包·视频生成模型,作为大模型家族的新成员。这一模型在视频生成领域表现出色,拥有精准的语义理解、多动作多主体交互、强大的动态效果和一致性多镜头生成能力。

豆包·视频生成模型能够 理解并执行复杂的指令,实现多个主体间的交互,并在视频中实现大动态和多镜头之间的炫酷切换。同时,该模型能够保持多镜头切换的一致性,10秒内讲述一个 完整的故事,支持多种风格和比例,如黑白、3D动画、国画等。

模型支持多种风格,并适配不同比例,包括黑白、3D动画、2D动画、国画等,以适配不同终端和画幅。

豆包·视频生成模型不仅提升视频画质的高保真度,还在大动态与镜头中展现炫酷切换,具备丰富的镜头语言能力,如变焦、环绕、平摇、缩放 、目标跟随等。

字节跳动发布了豆包视频生成模型,支持10秒视频、多镜头生成

Doubao-视频生成PixelDance

PixelDance V1.4是ByteDance Research团队开发的视频生成大模型,支持文生视频和图生视频,能 够生成长达10秒的精彩视频片段。用户可以输入文本、图片生成视频,模型具备出色的语义理解能力,适用于影视创作、广告传媒等多个场景。

PixelDance V1.4支持精准的语义理解,一致性多镜头生成,多种风格、多比例兼容等功能。

Doubao-视频生成-Seaweed

Seaweed版本支持文生视频和图生视频,基于Transformer结构,支持多分辨率生成,适配横屏、竖屏,并根据高清图像分辨率进行适配和保真。默认输出为720p分辨率、24fps、时长5秒,并可动态延长至20-30秒。

豆包·视频生成模型的推出,将为电商营销、动画教育、城市文旅等领域带来创新和效率提升。火山引擎表示,发布此模型将全面加速AIGC应用创新。

火山引擎承诺继续推进模型能力的升级和迭代,探索模型在更多场合的应用,并为企业实现云上智能化提供动力。

数据显示,豆包大模型的 日均 tokens 使用量已超过1.3万亿,4个月内 tokens 整体增长超过了10倍。豆包·文生图模型日均生成图片5000万张,处理语音85万小时。

想了 解更多关于豆包·视频生成模型以及火山引擎科技的信息,请访问:AI万花筒官网

© 版权声明

相关文章

分享