大模型随机生成微信号竟能添加真人 个人信息保护面临新挑战

问题——“虚拟账号”何以加到真人 春节假期期间,多地用户反映收到陌生人好友申请,对方称其联系方式来自某大模型应用的“推荐”或“生成”。有受访者表示,自己未主动公开对应的信息的情况下被陌生人精准添加,给日常生活带来打扰。记者测试发现,当以“生成几个账号”之类表述提问时,多家大模型应用往往会先提示账号属于个人隐私、不应提供真实信息,但随后仍可能给出若干“示例账号”。在一定概率下,这些示例账号可在社交平台被检索到对应真实用户,出现“示例输出—现实可用”的错位现象。 原因——三类可能路径交织叠加 业内人士分析,此类“撞上真人”的情况大致存在三种路径:其一,相关账号曾在网页、论坛、招聘信息、二手交易评论等公开场景出现,被联网检索后在回答中被不当带出;其二,训练数据或增量语料中夹带包含账号的文本片段,模型在生成时发生“记忆性复现”,虽非定向检索,却可能输出近似或相同字符串;其三,模型依据常见命名规则(如字母数字组合、姓名拼写、生日缩写等)拼接生成,看似“随机”,实则与真实账号空间存在重叠,从而产生概率性“撞号”。有一点是,模型在对话中作出隐私提醒,并不能自动阻断风险输出;一旦缺少对敏感字段的强校验与拦截,提示语容易沦为“软约束”。 影响——从个体困扰到平台信任与合规风险 对个人而言,陌生人凭借“生成结果”添加好友,可能引发持续骚扰、诈骗引流、精准营销等连锁风险,尤其对女性、未成年人等群体更具侵扰性。对平台而言,此类事件会削弱用户对产品“安全可靠”的基础信任,并可能触及个人信息保护相关法律法规的合规红线:即便平台主观上并非提供真实信息,只要客观上造成可识别个人的联系方式泄露或可被利用,也应承担相应的安全管理责任。对行业生态而言,若“示例账号可用”被灰产利用,极易形成批量添加、社工钓鱼、账号买卖等黑链条,放大社会治理成本。 对策——“数据源头+生成出口+责任闭环”同步加固 专家与业内人士建议,治理应从三上发力: 一是强化数据源头治理。对训练与检索语料开展敏感信息清洗,建立“账号、手机号、邮箱、地址”等字段的高风险样本库与规则库,严格控制含敏感字段内容进入训练与更新流程,并对外部抓取数据的合规性、可追溯性进行审计。 二是完善生成端安全护栏。对疑似账号字符串实施强制脱敏或替换策略,例如输出统一不可用的占位符,或在社交平台常见账号格式上设置“不可命中”机制,避免生成结果可被直接检索使用。同时,针对诱导性提示、变体话术与“创作场景包装”等绕过方式,持续迭代对抗策略。 三是建立快速处置与反馈机制。对用户投诉应提供明确的工单编号、处理时限与结果告知方式;对确认存在风险的输出样式及时热修复,并对外公布改进说明,形成“发现—修复—复盘—再防”的闭环。必要时可引入第三方测评与安全红队演练,常态化检验拦截效果。 前景——从“能用”走向“可信”,规则需跑在技术前面 随着生成式技术加速进入搜索、客服、内容创作等高频场景,“偶然撞号”不应被视为小概率事件而忽略。其背后折射的是新型信息生产方式对隐私边界的再定义:模型既可能“看见”公开网络,也可能“复述”历史语料,还可能“拼接”出可被现实利用的结果。未来,行业需要在技术创新与合规底线之间建立更清晰的可操作标准,包括敏感信息识别规范、输出不可用设计、联网检索的权限边界与留痕机制等,让平台责任从事后补救转向事前预防。

当技术便利与隐私安全发生冲突时,不能只靠单方承诺或事后修补来化解;此次事件既拷问智能工具的伦理底线,也为完善数字时代治理提供了切入口——只有建立贯穿研发、应用、监管全链条的责任体系,才能更有效守住亿万网民的信息安全底线。(完)