OpenAI再推新智能体Deep Research 在“人类的最后考试”中表现突出
2025-02-03 15:12:59来源:www.luwei123.com发布:二蛋
OpenAI发布了一款新的人工智能工具“Deep Research”,旨在为用户执行耗时的在线研究任务,涵盖从复杂科学问题到汽车推荐等众多领域。这一新工具进一步丰富了这家初创公司的人工智能代理阵容。
Deep Research可能需要 5 到 30 分钟来完成其工作——在你离开或处理其他任务时深入挖掘网络。最终输出以报告的形式出现在聊天中,很快用户还将看到嵌入的图像、数据可视化和其他分析输出,以增强清晰度。这次的时间大大提升了它的能力。例如,在“人类的最后考试”中,Deep Research取得了令人印象深刻的 26.6% 的准确率——远远超过了其最接近的竞争对手 DeepSeek R1,后者的得分低于 10%。这一飞跃凸显了系统的迭代优化和结构化综合能力,证明了在人工智能快速发展的步伐中,有些任务确实需要时间。
在上周日的博客文章中,OpenAI宣布,这项名为“Deep Research”的服务将通过其ChatGPT在线聊天机器人向特定付费客户开放。该工具能够根据用户的指令,在线搜索文字、图像、PDF文件以及用户上传的文件,进而生成一份详尽的报告。OpenAI将这一功能比作研究分析师,并强调它能够在“几十分钟”内完成通常需要一个人“数小时”才能完成的工作。
不过,OpenAI也提醒用户,“Deep Research”仍处于早期阶段,可能会将虚构信息误认为事实,且在区分谣言和准确信息方面可能存在困难。此外,这款研究工具“非常耗费计算资源”,初期用户每月仅能提交100次查询。
上一篇: 夜盘异动 | Triumph涨近18%,传闻公司或被收购,估值约30亿美元 下一篇: 最后一篇
相关阅读
- 02-03 夜盘异动 | Triumph涨近18%,传闻公司或被收购,估值约30亿美元
- 02-03 港股异动 | 恒生科技指数转涨!中芯国际涨超9%,阿里涨近6%
- 02-03 贸易战下一步是什么?高盛“关税是短暂的”,德银“市场需重新定价贸易战风险溢价”
- 02-03 比特币圈最新币圈子
- 02-03 【pi币在外国的价格】派币流通
- 02-03 9月份的大理什么
- 02-03 南京2月份穿什么-南京2月份穿什么衣服合适
- 02-03 15日的天气是什么-15日的天气是什么天气
- 02-03 广州7月份穿什么-广州7月份穿什么衣服
- 02-03 神农架7月穿什么-神农架7月份穿什么
- 02-03 七月新疆穿什么衣服
- 02-03 十月的唐山穿什么-十月的唐山穿什么衣服好看