中国科技网

AI
手机 电脑 数码 智车 AI 苹果 直播
当前位置: 首页 > AI > 正文

OpenAI 携手 Shazam 为 ChatGPT 客户端嵌入音频指纹检索音乐信息功能

2026-03-14 10:58:15 来源:IT之家 A+A-

OpenAI 与 Shazam 达成合作,在 ChatGPT 客户端中集成音乐识别能力,用户可直接提交音频片段获取曲目信息与背景资料,回应多模态交互对即时内容解析的需求,在 AI 应用扩展场景中被视为感知能力与知识服务融合的实例。据官方消息,该功能调用 Shazam 音频指纹匹配引擎并融合 ChatGPT 的自然语言生成,现场测试显示识别准确率与信息完整度均达商用水准。此举在智能对话产品功能迭代中引起讨论,为观察 AI 与垂直工具协同提升用户体验提供样本,促使团队重新审视多源能力接入的整合深度,后续可关注识别结果在对话中的引用流畅度与版权合规处理。

该合作在技术实现上采用客户端音频采样与云端指纹比对双阶段流程,确保本地隐私与识别精度的平衡,并将曲目元数据转化为结构化提示供 ChatGPT 生成介绍与背景故事。消息称其支持多语言曲名与艺术家信息返回,现场测试显示对嘈杂环境下的片段识别仍保持较高召回率。技术分析表明此集成不仅扩展 ChatGPT 的感知入口,也通过引入成熟的专业算法缩短自研周期,为多模态 AI 产品接入第三方强项能力建立可复用模式。

从多模态智能视角看,该合作在 AI 客户端功能演进中引起关注,成为研判感知能力与生成能力协同增效的参考样本,其通过引入垂直领域顶尖工具提升对话系统的实用维度,促使行业重新审视封闭能力与开放生态的互补价值。此举不仅丰富用户与 AI 的交互方式,也为跨领域技术整合降低门槛提供示范,后续可跟踪功能迭代中对实时流媒体与长音频的支持进展,评估其对智能助手内容服务能力的长远提升作用。

Tags:ChatGPT
(责任编辑:Diy92)

推荐阅读 相关文章

传OpenAI拟扩员至8000人 年底从4500人增加

有消息称OpenAI计划在今年底前将员工规模从目前的约4500人扩充至8000人,扩员重点集中在模型安全、多模态研发...[详细]

2026-03-28 09:34:26

马斯克宣布Grok Computer智能体即将上线

马斯克日前在社交平台宣布,xAI开发的Grok Computer智能体即将上线,定位为具备自主任务执行与多工具调用能力的...[详细]

2026-03-28 09:34:26

MiniMax高峰期限流 MiniMax M2.7模型热度超预期

MiniMax官方确认,因M2.7模型在近期高峰时段用户请求量远超预期,已启动临时限流措施以保障服务稳定性。M2.7模...[详细]

2026-03-28 09:34:26

小米MiMo大模型联合多Agent框架 首周限免开放

小米发布MiMo大模型并与自研多Agent框架深度整合,首周面向开发者与特定用户限免开放。MiMo在多轮对话、跨模...[详细]

2026-03-28 09:34:26

美团开源LongCat大模型 Flash-Prover 刷新SOTA

美团近日宣布开源LongCat大模型及其配套Flash-Prover推理验证框架,LongCat在多项长文本理解与生成任务中刷新...[详细]

2026-03-28 09:34:26

ChatGPT广告测试进展慢 部分品牌预算难花完

据媒体报道,ChatGPT的广告测试推进速度不及预期,部分参与品牌反映投放预算难以按计划消耗完毕。测试主要围绕...[详细]

2026-03-28 09:34:26

OpenAI 携手 Shazam 为 ChatGPT 客户端嵌入音频指纹检索音乐信息功能

OpenAI 与 Shazam 达成合作,在 ChatGPT 客户端中集成音乐识别能力,用户可直接提交音频片段获取曲目信息与背景...[详细]

2026-03-14 10:58:15

OpenAI收购医疗初创Torch 推进ChatGPTHealth建设

近日,OpenAI宣布完成对医疗保健领域初创公司Torch的收购,以此加快ChatGPTHealth相关业务的布局。消息由OpenAI...[详细]

2026-01-14 07:36:44

联系方式

商务QQ:19667318