微软表示该基准框架 AI Agents 使用主流 Windows 应用方面的能力和速度,其中包括 Microsoft Edge 和谷歌 Chrome 浏览器,Visual Studio Code 等编程应用,记事本、时钟和画图等预装 Windows 应用,VLC 等主流媒体播放器。
翻译部分微软官方博文内容如下:
Navi微软研究院也打造了自己的多模态 Agents Navi,并在 Windows Agent Arena 基准测试中对其进行了试验。
它被要求根据特定文本提示执行任务,例如:“你能将我正在浏览的网页转换成 PDF 文件并放置在我的主屏幕上吗,就是那个桌面?”结果显示,Navi 的平均任务成功率为 19.5%,相较于人类 74.5% 的表现评分,这一成绩仍显偏低。
附上参考地址
相关教程
2023-12-18
2023-09-16
2023-11-16
2023-11-08
2023-11-30
2024-02-01
2024-04-30
2023-12-16
2024-11-18
2024-11-16
2024-11-15
2024-11-15
2024-11-14
2024-11-14
copyright © 2012-2024 纯净系统之家 m.kzmyhome.com 版权声明