沈阳软件开发-沈阳软件定制开发-沈阳商城开发-沈阳微信小程序开发|沈阳互帮科技有限公司
NEWS 新闻中心
当前位置:新闻中心

Title
微软Phi-4系列再升级:多模态与迷你模型震撼发布,引领AI技术新潮流

发布时间:2025-02-27 16:56:12    作者:小编

近日,微软在AI领域再次迈出重要一步,宣布推出Phi-4系列的两款全新模型——Phi-4多模态(Phi-4-multimodal)和Phi-4迷你(Phi-4-mini)。这两款模型的发布,不仅标志着微软在小型语言模型(SLM)技术上的持续创新,更为各类人工智能应用带来了前所未有的多模态和文本处理能力。


Phi-4多模态:语音、视觉、文本全能王

Phi-4多模态模型是微软首款集成语音、视觉和文本处理的统一架构多模态语言模型,其参数量高达56亿。在多项基准测试中,Phi-4多模态的表现均优于其他现有的先进全模态模型,如谷歌的Gemini 2.0 Flash和Gemini 2.0 Flash Lite。

在语音相关任务中,Phi-4多模态展现了其卓越的性能。在自动语音识别(ASR)和语音翻译(ST)方面,该模型超越了WhisperV3和SeamlessM4T-v2-Large等专业语音模型,并在Hugging Face OpenASR排行榜上以6.14%的词错误率位居榜首。

此外,Phi-4多模态在视觉相关任务中也表现出色。在数学和科学推理方面,该模型与Gemini-2-Flash-lite-preview和Claude-3.5-Sonnet等流行模型相媲美甚至超越。在文档理解、图表理解、光学字符识别(OCR)和视觉科学推理等常见多模态能力方面,Phi-4多模态同样展现出了强大的实力。


Phi-4迷你:文本处理的新锐力量

与Phi-4多模态相比,Phi-4迷你模型则更加专注于文本任务。其参数量为38亿,但在文本推理、数学计算、编程、指令遵循和函数调用等任务中表现优异,超越了多款流行的大型语言模型。

为确保新模型的安全性和可靠性,微软邀请了内部和外部安全专家进行测试,并采用了微软人工智能红队(AIRT)制定的策略。经过进一步优化后,Phi-4迷你和Phi-4多模态模型均可通过ONNX Runtime部署到设备端,实现跨平台使用,适用于低成本和低延迟场景。


引领AI技术新潮流

Phi-4系列新模型的推出,不仅为开发者提供了更加强大、灵活和高效的AI工具,更标志着高效AI技术的重大进步。无论是需要多模态处理能力的复杂应用场景,还是注重文本处理速度和准确性的简单任务,Phi-4系列都能提供出色的解决方案。


目前,Phi-4多模态和Phi-4迷你模型已在Azure AI Foundry、Hugging Face和NVIDIA API目录中上线,供开发者使用。我们期待这两款模型能够在未来的人工智能应用中发挥更大的作用,引领AI技术的新潮流。


返回列表

联系我们

contact us
2017- 2024 沈阳互帮科技有限公司  ICP备案编号:辽ICP备17009060号-3