HyperAI超神经
Back to Headlines

微软发布Mu:轻量级模型带来Windows智能体新突破

4 days ago

今天凌晨,微软正式发布了其最新创新的小参数模型——Mu。这款模型的参数仅有3.3亿,却在性能上与此前发布的Phi-3.5-mini不相上下,而体积仅为后者的十分之一。Mu模型的最大亮点在于其在离线NPU笔记本设备上能够实现每秒超过100个token的响应速度,这是小参数模型领域的重大突破。 Mu模型借鉴了微软先前发布的Phi Silica模型,特别针对小型本地部署进行了优化,尤其适用于配备NPU的Copilot+ PC。该模型的核心架构是一个仅解码器的Transformer,微软在此基础上引入了三项主要创新:首先是优化了模型的架构设计,确保其在低资源环境下依然能够高效运行;其次,采用了先进的预热稳定衰减时间表和Muon优化器,进一步提高了模型的训练效率;最后,使用了知识蒸馏技术,使Mu模型能够从Phi模型中继承关键的知识和技能,从而实现更高的参数效率。 为了提升Windows系统的易用性,微软一直在努力开发能够理解和执行自然语言指令的AI智能体。这一智能体能够通过简单的语音或文字命令帮助用户调整系统设置,例如增大鼠标指针、调节屏幕亮度等。微软计划将Mu模型驱动的智能体集成到现有的Windows搜索框中,以提供无缝的用户体验。这不仅需要智能体能够快速响应,还需要它能够精确理解用户的命令并正确执行。 在测试过程中,微软发现尽管基线Mu模型在未经微调的情况下精度会下降50%,但通过多项技术和策略,成功克服了这些挑战。具体来说,微软将训练规模扩大到了360万个样本,提升了1300倍,同时将处理的设置从约50项扩展到了数百项。通过采用自动化标注的合成方法、带元数据的提示调优、多样化的措辞、噪声注入和智能采样等技术,基于Mu的微调模型达到了预定的质量标准。 最终测试结果显示,由Mu模型驱动的智能体在理解和执行Windows系统设置方面表现出色,响应时间控制在500毫秒以内。这一成果不仅增强了Windows系统的智能化水平,也为用户提供了更加便捷的操作体验。 业内人士对此次发布给予高度评价,认为穆模型的推出标志着小参数模型在性能和实际应用中的重要突破。微软长期以来在人工智能领域的研发和创新,再次为业界树立了新的标杆。作为全球知名的科技巨头,微软在AI领域不断探索,此次发布的Mu模型及其应用场景,无疑将进一步巩固其在行业内的领先地位。

Related Links