格隆汇5月10日丨Meta公司宣布了一个新的开源人工智能模型ImageBind,该模型是第一个将六种类型的数据结合到一个单一的嵌入空间的模型。六种数据包括视觉(图像和视频形式);热能(红外图像);文本;音频;深度信息;以及最有趣的--由惯性测量单元或IMU产生的运动读数。
该模型目前只是一个研究项目,没有直接的消费者或实际应用,但它指出了生成性人工智能系统的未来,可以创造沉浸式多感官体验。
最新评论