微软推出 ASSERT 开源框架:提升开发者评测 AI 应用的效率

11小时前更新 775800
1 0 0

微软今日发布了开源框架 ASSERT(自适应规范驱动评分),旨在将自然语言编写的行为规范直接转化为可执行的评估流程。该框架能够自动从产品需求、政策文件或系统提示等文本中生成测试场景、数据集、评估指标和计分卡,并对目标模型、应用或智能体进行测试。ASSERT 的基础理念是:行为规范应成为评估的核心输入,而不仅仅是背景参考。

微软推出 ASSERT 开源框架:提升开发者评测 AI 应用的效率的封面图

相关快讯

微软推出开发者优化版Win11:强化Linux支持与WSL容器功能

在今日开幕的 Build 2026 开发者大会上,微软宣布将优化 Windows 11 的开发者体验,并推出新工具与平台更新,目标是提升 Windows 的开发平台信任度。Windows 负责人 Pavan Davuluri 表示,优化内容包括整合常用命令行工具、提供熟悉的 Shell 界面、加快安装过程、内置 Linux 容器的创建和操作方式,以及推出实验性的智能终端(Intelligent Terminal)。

微软推出新型量子芯片,目标2029年实现实用量子计算机

在旧金山举行的Build开发者大会上,微软发布了升级版量子计算芯片马约拉纳2代(Majorana 2)。新芯片的核心突破在于量子比特的存续时间超过20秒,且量子比特数量从8枚提升至12枚。微软借助马约拉纳2代芯片的进步,计划在2029年前研发出可规模化应用的实用型量子计算机。

微软发布首款AI推理模型Mai-Thinking-1

微软人工智能负责人宣布推出首个推理模型Mai-Thinking-1,该模型具有350亿个活跃参数。

英伟达携手微软推出统一技术栈,助力Agentic AI部署新纪元

在微软Build开发者大会上,英伟达与微软达成合作,推出了一种统一技术栈,旨在支持代理式人工智能(Agentic AI)的部署。该技术栈覆盖了从Windows设备到云端以及本地环境的全场景应用。这一合作标志着两家公司在人工智能领域的进一步深度融合。

微软推出“Project Solara”平台,专为新型AI设备而设

微软推出“Project Solara”平台,专为新型AI设备设计。该平台的芯片将运行AI代理,取代传统应用,并直接与云计算数据中心进行通信。这一创新旨在提升AI设备的性能和效率。

首款搭载英伟达芯片的Windows PC即将发布!

据Axios新闻报道,英伟达即将进军PC市场,预计下周首批搭载其芯片的Windows电脑将推出。微软此前在人工智能PC方面的尝试遇挫,但英伟达的加入为其提供了新的机会。消息人士透露,微软的Surface品牌和其他厂商如戴尔将发布搭载英伟达芯片的个人电脑。此外,微软还计划推出新软件,简化用户在Windows电脑上本地运行AI代理程序的过程。

暂无评论

暂无评论...