2026年4月7日,微软必应(Bing)团队宣布开源名为“Harrier”的全新词嵌入模型系列,旨在重塑全球搜索、检索及人工智能代理的底层逻辑。Harrier系列包含三个不同规格的版本,其中旗舰级27B模型在多语言MTEBv2基准测试中超越了OpenAI、亚马逊及Google Gemini等主流专有模型,位居榜首。
Harrier模型的技术底座展现了极高的工业水准,支持超过100种语言,其上下文窗口高达32,000个词元。这一系列模型在训练策略上也相当创新,微软使用了超过20亿个真实示例,同时引入了来自GPT-5的合成数据进行强化,提升了模型在理解复杂语境与长文本处理上的能力。
除了270亿参数的完整版,微软还推出了0.6B和2.7B的小参数版本,以适应不同算力环境。所有版本均通过MIT许可证在Hugging Face平台开放。嵌入模型作为AI系统组织与检索信息的关键技术,其性能直接影响RAG(检索增强生成)系统的准确性。
微软计划将Harrier技术深度集成至Bing搜索引擎及新型AI代理服务中。随着人工智能逐步迈向多步骤任务的自主化,Harrier的开源不仅为开发者提供了高性能的替代工具,更标志着开源生态在语义表示能力上实现了对顶尖闭源方案的阶段性跨越,进一步加速了AI代理在全球多语言环境下的落地进程。Harrier的推出预示着AI技术发展进入了一个新阶段,推动了行业的创新与发展。
特别声明:以上文章内容仅代表作者本人观点,不代表新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与新浪网联系。











