GPT-4o 语音功能开启灰度测试,输出 token 暴涨 16 倍至 64K,功能多样,价格上涨,引发全网实测。
【GPT-4o 语音功能与长输出模型来袭!】
GPT-4o 语音功能终于推出,进行灰度测试,部分 ChatGPT Plus 用户已尝鲜。OpenAI 只提供 4 种预设语音,新模型输出 token 暴涨 16 倍至 64K。 OpenAI 称,高级语音模式更自然、能实时对话、可随意打断,还能感知回应情绪。预计秋季所有 ChatGPT Plus 用户可用此功能,视频和屏幕共享功能稍后推出。 为推出语音功能,OpenAI 过去数月进行安全性、质量测试,与 100 多红队人员就 45 种语言进行测试,训练模型只用 4 种预设声音说话,并创建系统阻止其他声音输出,还采取内容过滤措施。 OpenAI 计划 8 月初发布关于 GPT-4o 能力、局限性、安全评估的详细报告。 网友分享 GPT-4o 语音模式诸多案例,如表演节奏口技、讲笑话、模仿声音等,其回答几乎无延迟,能真实复刻声音和模仿不同口音。 支持更大 token 输出的 GPT-4o 已来,OpenAI 正式宣布向测试者提供 GPT-4o 版本,每次请求最多输出 64K token,相当于 200 页小说,但新模型价格上涨。 长输出主要用于数据转换用例,如语言翻译、提取结构化数据等。更长输出可让 GPT-4o 提供更全面细致响应,基于用户反馈 OpenAI 做出调整。 GPT-4o 自推出以来提供最大 128K 上下文窗口,GPT-4o LongOutput 最大上下文窗口仍为 128K,OpenAI 通过限制输出 token 数量实现输出增长。
最新评论