大家好!200亿个YouTube视频片段、40万订阅者、Face和Gemini、Hugging和OpenAI、Seedance还有Seedance2.0,这些关键词是怎么让全球沸腾的呢?影视飓风的Tim潘天鸿最近放了个大招。Seedance2.0,这个字节跳动刚发布的AI视频模型,简直太牛了。Tim在视频里吹得天花乱坠,说它的精细度、流畅度还有音画匹配度都拉满了,“改变视频行业的AI”,这话不夸张。 咱们国内《黑神话:悟空》的制作人冯骥也在微博上表达了震惊。他说Seedance2.0现在就是地表最强,没有之一!它理解多模态信息的能力简直是飞跃,让人惊叹。海外那边也炸了锅,好多帖子阅读量都过百万。彭博社说Seedance2.0让分析师印象深刻,连传媒和AI公司的股价都被带飞了。 Hugging Face亚太生态负责人Wang Tiezhen还转发了演示视频,夸效果极棒。YouTube上有位40万粉的创作者看完后也说,这是真正的技术突破。那到底怎么回事呢?这个视频模型的能力确实很强,但也有点吓人。 Tim体验Seedance2.0的时候偶然发现一个很恐怖的事。他把自己的脸照片上传到模型里,结果系统自动生成了跟他说话声音高度相似的声音。大家要知道,Tim的影视飓风账号可是顶流,影响力不亚于影视明星。他的视频素材早就公开了,很可能早就被用去训练大模型了。 实际上这是个普遍现象。谷歌的Gemini多模态模型和Veo3视频生成模型,就用了超过200亿个YouTube视频片段。北京航空航天大学的沙磊教授说:国内外大模型训练都在使用公开数据。之前谷歌Veo3刚出的时候,大家就发现它生成的视频像某些知名创作者的作品。 OpenAI推出Sora的时候也是一样,外媒测试发现它能高度模仿一些经典电影和剧集的片段。张立波研究员也提到:为了效果好必须要公开数据来训练普通人别太焦虑。不过声音和视频比文字更具个人和场景特定性现在数据责任边界问题更明显了训练过程中的版权关联也是个挑战。 现在Seedance2.0还在小范围测试阶段,字节也对功能做了限制比如只有活体认证才能生成真人视频防止被滥用张立波强调要保护隐私确保内容安全大家得一起推动解决这个问题大家觉得这技术是福还是祸呢?