苹果研究团队正致力于开发无需唤醒词即可激活Siri的技术,提高用户体验。
近日,一项研究表明,苹果研究人员正尝试通过人工智能技术识别用户与iPhone等设备交流的时机,以省去类似“Siri”这样的唤醒词。这项研究尚在初期阶段,上传至Arxiv平台,但尚未经过同行评审。研究中,团队利用智能手机收集的语音和背景噪音数据,训练了一个大型语言模型,旨在发现可能表明用户需要设备辅助的模式。
该模型部分基于OpenAI的GPT-2构建,因其轻量级特性,适用于智能手机等设备。论文中详细介绍了用于训练模型的超过129小时的数据和额外文本数据,但未说明录音来源。六位参与研究的作者中,有五位表明与苹果公司有关联,其中三位在Siri团队工作。研究结果令人鼓舞,显示该模型在预测准确性上优于纯音频或纯文本模型,并有望随着模型规模的扩大而进一步提高。
最新评论