互联网传媒行业周报:国内首款AI音乐生成大模型启动内测 谷歌发布GEMINI1.5PRO

2024-04-17 18:25:06 和讯  上海证券陈旻
  主要观点
  4 月2 日,昆仑万维打造的国内首款AI 音乐生成大模型“天工SkyMusic”开启邀请测试,该模型拥有流畅的编配、好听的旋律,逼真且充满情感的人声。除歌曲整体的音乐品质之外, “ 天工SkyMusic”拥有清晰逼真的人声,模型的AI 人声合成能够产生中文水平极高、发音清晰的歌声,展现出卓越的音频质量和逼真的演唱效果,在中文发音上优于国外大模型。与市面上Suno 等AI 音乐工具相比,AI 音乐生成大模型“天工SkyMusic”采用的是基于MoE 架构的4000 亿级参数多模态超级大模型“天工3.0”,在逻辑推理、语义理解和泛化能力的加持下,“天工SkyMusic”的响应速度和训练推理效率较高。
  4 月10 日,谷歌在官网正式发布了Gemini 1.5 Pro,现在可在180 多个国家/地区使用。Gemini 1.5 Pro 除了能生成创意文本、代码之外,能根据用户输入的文本提示,理解、总结上传的视频、音频内容进行深度总结,并且支持100 万tokens 上下文,目前可以在Google AIStudio 开发平台中免费试用。谷歌对API 进行三个优化:1)系统指令方面,可以在Google AI Studio 和 Gemini API 中使用系统指令功能,可指导模型的响应输出,让用户根据其特定需求和用例控制模型的行为;2)JSON 模式方面,Gemini API 提供了用于请求 JSON 格式的配置参数,可以帮助开发者从文本或图像中提取结构化数据;3)函数调用优化方面,开发者可使用自定义函数并将其提供给AI 模型。
  “天工SkyMusic”在情感表达的准确性、多样性,以及歌词段落情绪变化的敏感捕捉较准确,我们认为AI 在音乐生成领域已取得实质性进展,AI 也在持续创新探索写作、绘画、动画等领域。在大语言模型百花齐放阶段,我们认为国内大厂持续投入大语言模型,有望打造出更适合中国的AI 生产力工具。目前AIGC 行情已有所分化,未来主题性机会有望逐步切换向案例兑现、甚至基本面兑现,龙头及龙头板块需重点关注,持续推荐具备基本面优势的【游戏】板块。
  投资建议
  基于我们“大模型+小模型+应用及内容”的研究框架,我们认为从基本面受益的角度上看,需沿着目前成熟大模型模态输出的范围选择标的,重点关注AI+文本/虚拟人板块,其次关注AI+图片(大模型+小模型);从价值重估的角度上看,需沿着掌握优质数据或内容(多模态数据)的范围选择标的,重点关注AI+内容/IP/版权板块。
  AI行情分化趋势下,建议重点关注基本面优异的【游戏】及【出版】板块:
  1、AI:关注【昆仑万维】;推荐【创业黑马】。
  2、MR:推荐【风语筑】;关注【宝通科技】。
  3、游戏新模式:推荐【盛天网络】、【完美世界】、【三七互娱】。
  4、影视新模式:关注【中文在线】、【上海电影】、【光线传媒】、【华策影视】。
  风险提示
  政策边际优化的程度不及预期、AI推进进度不及预期、AIGC商业模式或落地场景效果不及预期、内容监管趋严。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

      和讯特稿

        推荐阅读

          【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。