视频平台成为重要信息来源 内容生态改变知识获取方式

大语言模型的训练数据来源呈现多元化特征。行业普遍观察到,这些模型主要依赖五类内容:百科、政府和科研网站等权威资料;Reddit、Quora、StackOverflow等社区讨论;YouTube、TikTok等视频平台;主流和垂直媒体;以及电商平台的商品详情和评价。这种多层次的信息结构为模型提供了丰富的训练基础。

信息获取方式的变化正在推动内容生态从"流量竞争"转向"可引用的可信信息竞争"。无论是平台、内容生产者还是品牌机构,都应把握一个共同方向:用更透明的来源、更可验证的事实和更及时的更新,支撑生成式AI时代的公众认知与消费决策,推动网络信息环境朝着更可靠、更有序的方向发展。