微软Phi-4系列再升级：多模态与迷你模型震撼发布，引领AI技术新潮流

Title
微软Phi-4系列再升级：多模态与迷你模型震撼发布，引领AI技术新潮流

发布时间：2025-02-27 16:56:12 作者：小编

近日，微软在AI领域再次迈出重要一步，宣布推出Phi-4系列的两款全新模型——Phi-4多模态（Phi-4-multimodal）和Phi-4迷你（Phi-4-mini）。这两款模型的发布，不仅标志着微软在小型语言模型（SLM）技术上的持续创新，更为各类人工智能应用带来了前所未有的多模态和文本处理能力。

Phi-4多模态：语音、视觉、文本全能王

Phi-4多模态模型是微软首款集成语音、视觉和文本处理的统一架构多模态语言模型，其参数量高达56亿。在多项基准测试中，Phi-4多模态的表现均优于其他现有的先进全模态模型，如谷歌的Gemini 2.0 Flash和Gemini 2.0 Flash Lite。

在语音相关任务中，Phi-4多模态展现了其卓越的性能。在自动语音识别（ASR）和语音翻译（ST）方面，该模型超越了WhisperV3和SeamlessM4T-v2-Large等专业语音模型，并在Hugging Face OpenASR排行榜上以6.14%的词错误率位居榜首。

此外，Phi-4多模态在视觉相关任务中也表现出色。在数学和科学推理方面，该模型与Gemini-2-Flash-lite-preview和Claude-3.5-Sonnet等流行模型相媲美甚至超越。在文档理解、图表理解、光学字符识别（OCR）和视觉科学推理等常见多模态能力方面，Phi-4多模态同样展现出了强大的实力。

Phi-4迷你：文本处理的新锐力量

与Phi-4多模态相比，Phi-4迷你模型则更加专注于文本任务。其参数量为38亿，但在文本推理、数学计算、编程、指令遵循和函数调用等任务中表现优异，超越了多款流行的大型语言模型。

为确保新模型的安全性和可靠性，微软邀请了内部和外部安全专家进行测试，并采用了微软人工智能红队（AIRT）制定的策略。经过进一步优化后，Phi-4迷你和Phi-4多模态模型均可通过ONNX Runtime部署到设备端，实现跨平台使用，适用于低成本和低延迟场景。

引领AI技术新潮流

Phi-4系列新模型的推出，不仅为开发者提供了更加强大、灵活和高效的AI工具，更标志着高效AI技术的重大进步。无论是需要多模态处理能力的复杂应用场景，还是注重文本处理速度和准确性的简单任务，Phi-4系列都能提供出色的解决方案。

目前，Phi-4多模态和Phi-4迷你模型已在Azure AI Foundry、Hugging Face和NVIDIA API目录中上线，供开发者使用。我们期待这两款模型能够在未来的人工智能应用中发挥更大的作用，引领AI技术的新潮流。

返回列表

联系我们

地址：辽宁省沈阳市沈河区步阳国际B1座927
电话：15566248489
点击图标在线留言，我们会及时回复

Title 微软Phi-4系列再升级：多模态与迷你模型震撼发布，引领AI技术新潮流

Title
微软Phi-4系列再升级：多模态与迷你模型震撼发布，引领AI技术新潮流