智通财经APP获悉,平安证券发布研究报告称,Kimi无损长文本模型的出现,解决了很多大模型在应用中的痛点,打开了大模型的应用空间。AIGC最终的落地,还是要找到合适的场景,Kimi作为千亿大模型,能够支持复杂运算,同时还能接受和处理大文本,解决了很多大模型实际应用中的难题,后续商业化潜力将凸显。目前,Kimi智能助手已在苹果iOS应用、Android应用、小程序、网页Web等多端平台上线。继续看好AIGC产业链,尤其是大模型的应用潜力。
事件:近日,国内人工智能公司月之暗面(Moonshot AI)在其微信公众号“Moonshot AI”宣布,该公司的Kimi 智能助手在长上下文窗口技术上取得突破,无损上下文长度可以到 200 万字。此前,在2023年10月公司的智能助手可以实现20万无损上下文长度,最新能力提升了一个数量级。
平安证券观点如下:
Kimi智能助手短期内能力得到了大幅提升,在国内热度快速提高。
此次发布的无损上下文长度达到200万字,较此前的20万字,中间仅相隔了5个月左右。而公司月之暗面也是在2023年4月份才成立,成立时间也不足一年。Kimi 智能助手又称Kimi Chat,是月之暗面基于自研千亿参数大模型打造的对话式 AI 助手产品,于2023年11月正式面向市场应用。该产品最强的能力在于长上下文处理,包括长文总结和生成、联网搜索、数据处理、编写代码、用户交互和翻译等。上线之后,该工具的热度快速提升。根据Similarweb数据显示,近几周Kimi的访问量上升趋势非常明显,该网站统计的最近四周(2.20-2.26、2.27-3.4、3.5-3.11、3.12-3.18)的访问量分别是100.3万、112.8万、152.0万和225.0万。虽然公司对服务器持续进行了扩容,但是面对快速的用户增长,压力已经开始显现。
大模型的参数量决定了其能够支持多复杂的“计算”,而能够接收多少文本输入(即长文本技术)则决定了大模型有多大的“内存”,两者共同决定模型的应用效果。当前大模型输入长度普遍较低的现状对其技术落地产生了极大制约,比如虚拟角色会“忘记”部分重要信息,Agent无法获得全面的输入信息可能出现运行失败,部分游戏产品由于无法处理长文本能力而被迫简化剧情等。Kimi支持更长的上下文意味着大模型拥有更大的“内存”,从而使得大模型的应用更加深入和广泛,公司官方公众号显示,Kimi可以通过多篇财报进行市场分析、处理超长的法务合同、快速梳理多篇文章或多个网页的关键信息、基于长篇小说设定进行角色扮演等等。大模型无损上下文长度的数量级提升,未来会帮助用户打开对AI应用场景的想象力,包括完整代码库的分析理解、可以自主完成多步骤复杂任务的智能体Agent、不会遗忘关键信息的终身助理、真正统一架构的多模态模型等。
“无损压缩”和文本长度提升是长文本技术需要兼顾的要求。
公司创始人表示,如果要实现通用人工智能,无损的长上下文将会是一个很关键的基础技术。历史上所有的模型架构演进,本质上都是在提升有效的、无损的上下文长度。上下文长度在提升的过程中,需要兼顾长度和无损压缩水平两个指标,这样才能有意义的规模化。从此次升级的间隔来看,时间非常短,可见公司并没有走渐进式的迭代路线,当然面临的技术难度应该也更大。公司的研发和技术团队从模型预训练到对齐、推理环节均进行了原生的重新设计和开发,在千亿参数下实现了无损的长程注意力机制,不依赖于滑动窗口、降采样、小模型等对性能损害较大的“捷径”方案,兼顾了对长度和“无损”的两项指标。
标的方面:
1)算力方面,推荐浪潮信息(000977)(000977.SZ)、中科曙光(603019)(603019.SH)、紫光股份(000938)(000938.SZ)等,建议关注工业富联(601138)(601138.SH)、寒武纪(688256.SH)、景嘉微(300474)(300474.SZ)、高新发展(000628)(000628.SZ)等;
2)算法方面,推荐科大讯飞(002230)(002230.SZ);
3)应用场景方面,强烈推荐中科创达(300496.SZ)、恒生电子(600570)(600570.SH)、盛视科技(002990.SZ)等;
4)网络安全方面,强烈推荐启明星辰(002439)(002439.SZ)。
风险提示:1)国内算力提升速度不及预期的风险;2)版权等合规监管风险;3)技术演进风险。
最新评论