openai 现在在做个双向语音模型,以后就算你打断它也不会影响接下来的对话了。

据说OpenAI现在在做个双向语音模型,以后就算你打断它也不会影响接下来的对话了。IT之家那边的消息是,今天晚上The Information 报道了这事。OpenAI想让大家和ChatGPT聊天变得更自然。现在要是你在它说话的时候插嘴说个“okay”或者“mm-hm”,它通常就直接停了,不像真人那样接着聊。这个叫BiDi的新模型可以一直听着你说,要是被打断就能立马调整回答。和现在的模型不一样,现在一旦开始回复就不能再变了。 这个技术还在弄呢,一个知道内幕的人说,那个原型用了几分钟就容易出岔子,有时候声音还挺奇怪。本来他们想今年第一季度推出来,但现在估计得拖到第二季度或者更晚。 他们觉得要是语音效果能赶上文字模型,用起来的人肯定更多,毕竟大多数人更喜欢说话交流。BiDi在客服这块应该挺好用的。比如你打电话找AI客服退货的时候,要是你突然想换货了,BiDi能让客服顺利换个话题接下去。 那个知情人士还说了,BiDi在调用其他工具和应用方面也更灵活。我之前听说OpenAI打算做个主要靠说话操作的AI设备,或者搞个智能音箱,你叫一声它就能帮你查邮件或订服务。