谷歌发布多模态大模型Gemini,具有强大的理解和推理能力,使用图像、音频、视频和文字等数据进行预训练,支持32k 上下文长度,先发版本包括Ultra、Pro 和Nano 三种规格。Gemini 能够无缝地理解...
谷歌发布多模态大模型Gemini,具有强大的理解和推理能力,使用图像、音频、视频和文字等数据进行预训练,支持32k 上下文长度,先发版本包括Ultra、Pro 和Nano 三种规格。Gemini 能够无缝地理解和推理各种输入,在各种领域都具有强大的理解和推理能力。测试结果或超越GPT-4。Gemini 使用大量的TPU 资源进行训练,包括TPUv4 和TPUv5e。规模最小的Gemini Nano 的参数分别为18 亿(Nano-1) 和32.5 亿 (Nano-2) 。TPUv5e 的大型语言模型提供的训练性能提高了2 倍、推理性能提高了2.5 倍,成本却不到TPUv4 一半。Gemini 原生支持多模态,具有强大的理解和推理能力,TPUv5e 实现成本降低与更强的训练能力。该技术突破或超市场预期,有望推动AI 应用端的使用场景与内容创新。建议重点关注:有相关多模态产品布局且产品有望近期上线的公司,核心业务的应用场景有望受益的公司。风险提示:AI技术发展不及预期、行业竞争加剧等。
最新评论