百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

OpenAI全新 Agent 套件来了,可以手搓Manus,5大要点一网打尽

haoteby 2025-05-11 15:35 13 浏览

“2025 is going to be the year of Agent。”

在今天凌晨的召开的发布会上,OpenAI 发布了全套 Agent 开发套件,你还因为没有 Manus 邀请码而感到焦虑嘛?不要担心,手搓 Manus 指日可待!

先简单总结一下重点内容:

  • Responses API:这完全可以视作 Chat API 的升级版

  • 内置工具 (Built-in Tools):这里的工具一共有三个,分别是网页搜索、文件搜索 和 Computer Using Agent(CUA)

  • Agents SDK:真“Open”AI 来了!这是一个开源的 Agent 框架,单 Agent 和多 Agent 系统都可以构建

  • 监控工具:帮助追踪和检查 Agent 的执行过程

  • 如果上次的 GPT4.5 略显幽默,那这次的全新套件只能说 OpenAI 小伙立正了,来,一起看看有哪些要点吧!

1、Responses API:今天抛弃老 API

虽然原本的 Chat Completions API 并不会下架,但 Pesponses API 既兼容老 API,又会持续更新新功能,除了老 API 没有的Web 搜索、文件搜索、计算机使用(注意一下)功能,未来还将推出音频和代码解释器,完全没理由不用心的。

只需要稍微修改下代码格式,就可以成功调用了。

简单来说,Responses API 简洁强大、内置工具、统一设计、直观清晰……优点有点多,其实 2023 年 OpenAI 就搞了一个用于 Agent 开发的 API,又贵又不好用,如今也算是走向正轨了。

2、Web Search:啥都能配置,就是略贵

OpenAI 的 API 终于支持搜索了!国家、时区、搜索量等,可以配置的东西还不少,就是价格看起来有些贵,Google Search 的价格是 5 美元 1000 次,Bing Search 的价格是 20 美元 1000 次,但 Open AI 的价格最便宜的 25 美元 1000 次,最贵的达到了 50 美元 1000 次。

3、File Search:版本更新

文件搜索不是新功能,只是一次更新,如今支持包括常见的 .pdf、.docx、.pptx 等 21 种格式(包括 utf-8、utf-16 以及 ascii),价格调用 1000 次 2.5 美元,存储 1 GB 每天 0.1 美元。

4、CUA:截图就能自动化

Computer Use Agent 可以让 AI 通过截图界面理解来执行交互操作,从而实现自动化功能,它可以识别鼠标单击、双击、滚动、坐标、路径,输入文本、等待、组合键、截图等共 9 种行为,然后 CUA 进行自动的执行,就能操作电脑了。

现在 GitHub 已经有项目了,可以去试试。

https://github.com/openai/openai-cua-sample-app

5、Agents SDK:硬菜来咯

直接上 GitHub 地址:https://github.com/openai/openai-agents-python

这是一个支持 multi-agent 的框架,只要符合 OpenAI Chat Completions API 的模型都能用,也就是说 DeepSeek 也能用,这想象空间就太大了。

或许对我们这些普通用户来说,这次发布会并不那么“亲切”,但 Agent 套件的发布,必将快速改变我们的日常生活,或许在某个被智能体服务的日子里,你会想起今天清晨的第一抹阳光。


相关推荐

网站seo该怎么优化

一、网站定位在建设一个网站之前,我们首先要做的就是一个网站清晰的定位,会带来转化率相对较高的客户群体,我们建站的目的就是为了营销,只有集中来做某一件事,才会更好的展现我们的网站。在做SEO优化的同时...

3个小技巧教你如何做好SEO优化

  想半路出家做SEO?可是,怎么才做的好呢?关于SEO专业技术弄懂搜索引擎原理,咱们做搜索引擎排名的首先就是要了解搜索引擎的工作原理,对SEO优化有更深入了解之后再来做SEO,你就能从搜索引擎的视点...

SEO指令分享:filetype指令

filetype用于搜索特定的文件格式。百度和谷歌都支持filetype指令。比如搜索filetype:pdf今日头条返回的就是包含今日头条这个关键词的所有pdf文件,如下图:百度只支持:pdf...

网站seo优化技巧大全

SEO在搜索引擎中对检索结果进行排序,看谁最初是在用户的第一眼中看到的。实际上,这些排名都是通过引擎的内部算法来实现的。例如,百度算法很有名。那么,对百度SEO的优化有哪些小技巧?下面小编就会说下针对...

小技巧#10 某些高级的搜索技巧

由于某些原因,我的实验场所仅限百度。1.关键词+空格严格说来这个不能算高级,但关键词之间打空格的办法确实好用。我习惯用右手大拇指外侧敲击空格键,这个习惯在打英文报告时尤其频繁。2.site:(请不要忽...

MYSQL数据库权限与安全

权限与安全数据库的权限和数据库的安全是息息相关的,不当的权限设置可能会导致各种各样的安全隐患,操作系统的某些设置也会对MySQL的安全造成影响。1、权限系统的工作原理...

WPF样式

UniformGrid容器<UniformGridColumns="3"Rows="3"><Button/>...

mysql自动备份,并zabbix检测备份文件是否正常,备份文件大小

推荐...

MySQL学到什么程度?才有可以在简历上写精通

前言如今互联网行业用的最多就是MySQL,然而对于高级Web面试者,尤其对于寻找30k下工作的求职者,很多MySQL相关知识点基本都会涉及,如果面试中,你的相关知识答的模糊和不切要点,基...

jquery的事件名称和命名空间的方法

我们先看一些代码:当然,我们也可以用bind进行事件绑定。我们看到上面的代码,我们可以在事件后面,以点号,加我们的名字,就是事件命名空间。所谓事件命名空间,就是事件类型后面以点语法附加一个别名,以便引...

c#,委托与事件,发布订阅模型,观察者模式

什么是事件?事件(Event)基本上说是一个用户操作,如按键、点击、鼠标移动等等,或者是一些提示信息,如系统生成的通知。应用程序需要在事件发生时响应事件。通过委托使用事件事件在类中声明且生成,且通过...

前端分享-原生Popover已经支持

传统网页弹窗开发需要自己处理z-index层级冲突、编写点击外部关闭的逻辑、管理多个弹窗的堆叠顺序。核心优势对比:...

Axure 8.0 综合帖——新增细节内容

一、钢笔工具与PS或者AI中的钢笔工具一样的用法。同样有手柄和锚点,如果终点和起点没有接合在一起,只要双击鼠标左键即可完成绘画。画出来的是矢量图,可以理解为新的元件。不建议通过这个工具来画ICON图等...

PostgreSQL技术内幕28:触发器实现原理

0.简介在PostgreSQL(简称PG)数据库中,触发器(Trigger)能够在特定的数据库数据变化事件(如插入、更新、删除等)或数据库事件(DDL)发生时自动执行预定义的操作。触发器的实现原理涉及...

UWP开发入门(十七)--判断设备类型及响应VirtualKey

蜀黍我做的工作跟IM软件有关,UWP同时会跑在电脑和手机上。电脑和手机的使用习惯不尽一致,通常我倾向于根据窗口尺寸来进行布局的变化,但是特定的操作习惯是依赖于设备类型,而不是屏幕尺寸的,比如聊天窗口的...