字节跳动推出新一代多模态创作工具 视频图片生成技术实现突破性升级

生成式人工智能内容创作领域的应用持续深入。字节跳动即梦AI平台最新发布的两款模型——Seedance 2.0和Seedream 5.0 Lite,在视频和图片生成技术上取得新突破,实现了从单模态到多模态融合的重要跨越。 视频生成模型Seedance 2.0支持图像、视频、音频和文本四种输入方式,最多可接收12个文件(包括9张图片、3段视频、3段音频及自然语言指令)。这种多模态输入设计突破了传统文字提示的限制,让创作者能更灵活地表达创意。 该模型的创新主要体现在三个上: 1. 参考能力提升:可精确捕捉参考图像的构图和角色细节,复刻参考视频的镜头语言、动作节奏和特效; 2. 视频编辑功能:支持延长现有视频、角色替换、片段删减等操作; 3. 生成时长:最长可生成15秒视频,满足短视频创作需求。 图片生成模型Seedream 5.0 Lite则具备两大特色: 1. 联网实时检索:生成的图片能与热点资讯有关联; 2. 行业知识库:内置生物科学、建筑设计等专业知识,确保专业领域内容的准确性。模型影视海报、营销设计等场景表现优异。 为推广新产品,即梦AI推出限时免费活动:2K分辨率图片生成向所有用户开放——4K分辨率对会员免费——活动将持续至2月28日。 在隐私保护上,平台暂不支持以真人照片或视频作为创作参考。但用户可通过实名认证创建数字分身,在保障隐私的同时拓展创作可能性。

AI技术的进步正在改变内容生产的方式,但行业发展不仅取决于技术参数,更需要建立可控、可信的规范体系;在提升创作效率的同时,维护真实性、版权和安全同样重要,这需要技术创新与行业治理并重。