今天凌晨 Runway 的新版本 Gen-4 发布,号称全球首款实现「世界一致性」的模型。可以创建具有一致环境、物体、位置和角色的连贯世界。
自从今年DeepSeek-R1出现之后,AI的发展好像再次进入了一个快车道。
首先就是各大厂家纷纷接入和自研深度思考模型,深度思考已经成了大模型的标配。
然后就是像 Manus 这样会干活的 Agent 也开始频繁活跃,一个邀请码炒到了10万的高价。
接着是Gemini的更新,人们刚为Gemini的用嘴改图惊艳,GPT-4o直接更新了生图功能,直接超越了Gemini。
最后就是昨天智谱上线AutoGLM沉思,全量开放且免费的Agent。
到今天gen-4d的发布,让AI视频更靠近电影级应用。
AI,真的越来越快了。
今天重点说一下智谱上线的AutoGLM沉思,亲身体验了一把会自己干活的Agent。

一、免费不限量
我们已经被各种Agent的使用折磨够了。
OpenAI的Deep Research功能,200美元。
Manus的邀请码,炒到了10万一个。
Gemini的Deep Research功能,限量使用。
智谱的AutoGLM沉思现在上线了:免费、不限量、不用魔法、不用邀请码、不卡顿、面向全部用户开放。
这是葉子觉得目前对用户最友好的Agent了,让我们不用花钱也可以体验一下最前沿的技术。
虽然经过实测之后,葉子觉得AutoGLM沉思还有很大的提升空间,但至少让葉子也感受到了Agent的魅力所在。
二、如何使用
官方地址:https://autoglm-research.zhipuai.cn/

1、电脑下载客户端
2、安装谷歌浏览器插件
3、打开客户端,左侧选择AutoGLM沉思即可使用。

三、核心功能
1、深度思考。 可以自行通过逻辑推理,进行决策。(比如一个网页打不开或者内容读不全,就会换一种策略。)
2、信息理解。 不论是图文还是视频,他都可以进行理解。(甚至打开了B站学习了AI绘画提示词的写法。)
3、网页操作。 可以自行打开网页,进行操作。(它甚至打开了即梦,画了一幅画。)
4、信息验证。 会通过不同网页对信息进行交互比对,进行验证,和我们真人操作是一样的。
5、不卡顿。 每个页面操作很快,遇到打不开,或者看不全的问题会直接跳过,不会纠结。
6、主动反馈。 每一步操作,左下角都会反馈它正在做什么,让我们有掌控感,不是感觉在浪费时间。
整体而言,使用起来感觉很舒服。一眼就知道它在干嘛。
四、官方彩蛋
最后官方还给了一个彩蛋:
下面这个账号是由AutoGLM沉思做的:2周涨了5000多粉丝,还接了个500的商单。
AI真的已经可以自己打工挣钱了!

五、开源
AutoGLM沉思使用的基座模型 GLM-4-Air-0414,推理模型 GLM-Z1-Air,以及微调沉思模型 GLM-Z1-Rumination,包括整个执行框架。
智谱都会在 4 月 14 日正式开源,到时候所有人都可以自行搭建自己的Agent了。
不得不说一句:开源YYDS。
给AutoGLM沉思输入提示词之后,看到它开始一步步思考,同时去打开网页进行操作的时候。
深刻的意识到一件事:
我们终于不必所有事情都自己完成了,我们可以把更多时间花费在生活,而不是工作。
暂无评论内容