专注区块链信息及金融服务
微信二维码
迪恩财经
手机版
访问手机版

[快讯] OpenAI开源BrowseComp,重塑Agent浏览器评测

0
回复
18
查看
[复制链接]

9105

主题

0

回帖

2万

积分

超级版主

积分
27387
发表于 2025-4-11 04:44:21 | 显示全部楼层 |阅读模式
 
【OpenAI开源BrowseComp,重塑Agent浏览器评测】桃报道,今天凌晨2点,OpenAI开源了专门用于智能体浏览器功能的测试基准——BrowseComp。这个测试基准非常有难度,连OpenAI自己的GPT-4o、GPT-4.5准确率只有0.6%和0.9%几乎为0,即便使用带浏览器功能的GPT-4o也只有1.9%。但OpenAI最新发布的Agent模型Deep Research准确率高达51.5%,在自主搜索、信息整合、准确性校准方面非常优秀。(AIGC开放社区)
查看原文(可能需要外网)
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

下载fochat:即可扫码

官方网站

APP下载

fo官网:

fo.com

官方地址:香港中环皇后大道中2号的“长江集团中心”

邮编:999077 推特:@钱锋雷

Copyright   ©2015-2016  FO粉丝社区Powered by©foshequ.com!技术支持:米勒