谷歌发布多模态大模型Gemini,具有强大的理解和推理能力。Gemini原生支持多模态,使用图像、音频、视频和文字等数据进行预训练,能够无缝地理解和推理各种输入,在各种领域都具有强大的理解和推...
谷歌发布多模态大模型Gemini,具有强大的理解和推理能力。Gemini原生支持多模态,使用图像、音频、视频和文字等数据进行预训练,能够无缝地理解和推理各种输入,在各种领域都具有强大的理解和推理能力。Gemini支持32k上下文长度,先发版本包括Ultra、Pro和Nano三种规格。Gemini多模态理解推理能力极强,测试结果或超越GPT-4。谷歌使用大量的TPU资源对Gemini进行训练,包括TPUv4和TPUv5e,TPUv5e的大型语言模型提供的训练性能提高了2倍、推理性能提高了2.5倍,成本不到TPUv4的一半。建议重点关注有相关多模态产品布局且产品有望近期上线的公司,以及核心业务的应用场景有望受益的公司。风险提示:AI技术发展不及预期、行业竞争加剧等。
最新评论