法院判赔1500万元 百科词条抓取案再现同业竞争纠纷 数据保护成互联网平台治理新课题

问题——同业竞争中“拿来就用”的内容抓取触碰规则底线。 近年来,围绕网络内容、数据与流量的竞争日益激烈,百科类产品因覆盖面广、检索需求稳定,成为平台竞争的重要入口。本案中,权利方主张其运营的百科产品长期投入人力、资金进行词条编辑与维护,而竞争方在未获授权情况下对外公示内容进行大规模抓取并直接使用,用以支撑自身百科产品的供给与增长。法院经审理认为,该行为不仅改变了正常竞争的成本结构,也对原有产品形成实质性的市场替代,属于以不正当方式获取竞争优势。 原因——流量压力与“低成本扩张”冲动叠加,规则意识不足。 百科词条属于典型的“高投入、慢积累”内容形态:需要持续采集、校验、更新并进行质量控制,形成相对稳定的内容体系与用户信任。部分市场主体为缩短冷启动周期、降低运营成本,选择通过自动化工具对外部词条进行抓取,快速补齐内容供给,以此换取搜索入口、用户停留与广告变现等收益。此外,部分企业对robots协议等行业通行的网络爬取规则认识不足,或抱有“技术可行即可以做”的侥幸心理,忽视了其所表达的权利边界与商业意愿。法院在裁判中强调对robots协议的尊重,反映出司法对互联网运营基本规则的明确态度:竞争可以激烈,但不能以破坏他人既有投入和市场秩序为代价。 影响——对创新投入、市场秩序与公共利益形成多重冲击。 其一,直接抓取并使用他方词条,实质上把内容建设成本转嫁给原创投入者,挤压其流量收益空间,削弱持续投入的动力。其二,内容被无差别搬运,会导致同质化竞争加剧,平台之间比拼的不再是编辑能力、审核能力和服务质量,而是“谁搬得快、谁搬得多”,不利于形成良性生态。其三,大规模抓取还可能带来内容更新不及时、来源不透明、纠错机制缺位等问题,影响用户获取信息的准确性与可追溯性。不容忽视的是,近年来涉百科词条数据竞争纠纷不断出现,有关裁判逐步形成共识:对内容与数据的利用应当遵循合法、正当、必要原则,不能以技术手段绕开交易与授权机制。 对策——企业守规则、平台强治理、监管与司法协同完善边界。 从企业层面看,应把合规纳入产品设计与运营流程:明确爬取策略的合法性审查,尊重robots协议、访问频次限制及权利声明;对内容来源建立授权、引用与标注机制,形成可审计链条;在不可避免使用公开信息时,应通过合理引用、增量加工、原创补充等方式形成实质性差异化,避免对他方产品构成替代。 从平台治理层面看,内容提供方可更完善技术防护与证据留存:对异常访问进行识别和拦截,完善日志、指纹水印等取证手段;通过开放API、合作授权等方式提供合规渠道,以降低市场主体“走捷径”的诱因。 从制度供给层面看,司法裁判对“同业竞争场景下的抓取使用”持续给出明确预期,有助于市场形成稳定规则。监管部门、行业协会也可推动形成更统一的技术规范与合规指引,推动建立合理的数据开放与使用机制,在保护投入与促进流通之间取得平衡。 前景——规则明确将促进行业从“抢搬运”转向“拼质量”“比创新”。 本案判赔金额的确定采用“成本替代法”,即以原创方对每一词条的平均投入成本为基础,测算被告因抓取而节省的经营成本,并据此确定赔偿数额。这种思路传递出清晰信号:不正当获取竞争优势的“成本套利”难以成为可持续模式。随着相关案例的累积,企业对内容与数据权益边界的理解将更趋一致,行业竞争有望从单纯追求规模和速度,转向更重视内容治理能力、知识服务能力和用户体验的高质量发展。可以预期,未来百科类产品将更加注重原创建设、事实核验、动态更新与权威来源整合,同时在合规授权、数据合作、技术标准等探索更成熟的商业路径。

这起标的额达1500万元的侵权案件——不仅是知识产权纠纷——更是我国数字经济法治化的重要里程碑;它提醒所有市场参与者:在信息爆炸时代,尊重原创、保护知识产权不仅是法律要求,更是企业可持续发展的基石。唯有切实保护创新成果,数字经济的活力才能持续释放,最终惠及全社会。