Back to Headlines

Meta收购AI音频公司WaveForms,强化Llama语音能力

5 天前

Meta近日宣布收购AI语音初创公司WaveForms,进一步强化其在人工智能语音技术领域的布局。此次收购是Meta继上月收购PlayAI后,一个月内第二笔针对AI音频技术的重大收购,凸显其加速构建“超级智能实验室”(Superintelligence Labs)的野心。 WaveForms成立于2024年12月,虽仅成立八个月,却已获得Andreessen Horowitz领投的4000万美元种子轮融资,公司估值达2亿美元。其核心目标是攻克“语音图灵测试”,即让AI生成的语音在情感表达、语调变化和自然度上与真人无异。公司致力于打造“情感通用智能”(Emotional General Intelligence, EGI),使AI不仅能听懂语言,更能感知并回应用户的情绪状态。 此次收购的两位联合创始人——Alexis Conneau和Coralie Lemaitre——已正式加入Meta。Conneau曾任职于Meta和OpenAI,是GPT-4o高级语音模式的关键研发者,主导开发了可实时、自然回应人类口语的神经网络。Lemaitre则拥有谷歌广告战略经验,具备出色的商业化与产品落地能力。 WaveForms的技术亮点在于其“端到端音频语言模型”,能够一次性完成语音转文本、文本生成与语音合成三大任务,无需多个独立模型协同,显著提升响应效率与交互流畅性。该模型还整合了情感识别功能,可依据语调、语气等线索动态调整回应方式,实现真正个性化的人机对话。 尽管WaveForms官网已关闭,LinkedIn页面也已更新,但其团队中约14名成员(含首席技术官Kartikay Khandelwal)是否全部加入Meta,尚待确认。此次收购金额未公开,但结合其估值及Meta在AI人才争夺战中的高溢价策略,预计金额可能达数亿美元。 对Meta而言,此次收购意义重大。其原计划推出的Llama 4模型因语音交互能力不足而推迟,而WaveForms的技术有望弥补这一短板。未来,该技术将被整合至Meta AI聊天机器人、Instagram Reels内容生成、以及元宇宙中的虚拟角色语音系统中,极大提升人机交互的自然度与沉浸感。 随着扎克伯格提出“人人都将拥有一个全天候AI伙伴”的愿景,Meta正通过持续收购顶尖AI团队,加速构建下一代情感化、智能化的语音交互生态。WaveForms的加入,标志着Meta在AI语音赛道迈出了关键一步。

Related Links