AI编程真的卷成大麻花了!

Claude 带着它的新产品鲨回来了,不得不让我怀疑是谷歌全家桶的更新刺激了它。
这次发布的是 Claude Opus 4 和 Claude Sonnet 4。
速看更新
编程超牛
说 Claude 4 系列是全球最会编程的模型一点不夸张。不管是写代码、找代码里的毛病,还是给出高质量代码片段,它都又快又准。

在评估编码能力的 SWE – Bench Verified 基准测试里,Claude Opus 4 拿到了 72.5% 的高分,把 OpenAI 新出的 Codex 和今年 4 月发布的 GPT – 4.1 都比下去了 。

理解能力强
Claude 4 能处理高达 20 万字的超长内容,还能同时 “看懂” 文本和图片。
你要是有一整本书、很长的文档或者复杂图表需要分析,交给它就行,它能快速给出精准分析,这对要处理大量资料的人来说,效率能大大提高。
企业和开发者的好帮手
推理和调用工具的能力变强了,记忆机制也升级了,延迟降低了 65%,还有提示缓存,响应更快还更省钱。
不管是做 AI 客服、智能办公,还是开发 AI 应用,都很实用 。
思考更智能
它有个 “混合推理 2.0” 系统,能像人一样。
在快速思考和深度思考之间灵活切换。回答简单问题,0.5 秒就能给出答案;遇到复杂任务,就进入深度思考模式,逻辑推理能力超厉害 。
安全有保障
有三重安全保障。
第一,不会执行可能伤人的指令。
第二,所有操作都有详细记录,完全透明。
第三,用户随时能让 AI 停止任何行为。而且它通过了 SOC 2 Type II 认证,企业用户不用担心数据泄露 。
官方案例
日常办公提效
相信很多朋友一听到 Claude,第一个想到的就是它的编程能力。
实际上,它跟 ChatGPT 在功能类型上类似,辅助办公也是一把好手,甚至在文字创作上也很不错。
三大高级功能:深入研究、管理项目、帮你敲代码。
之前的模型它会走捷径、钻空子,好的,别说了都是泪。
目前这俩新模型出现这种情况的概率,比 Sonnet 3.7 低了 65% 。
Claude Opus 4 在存储记忆这方面,可比之前的所有模型都厉害太多了。要是开发者做应用,能让 Claude 访问本地文件,Opus 4 就能很熟练地搞个 “记忆文件”,把重要信息存起来。
现在再做智能体任务的时候,对长期任务的理解、任务的连贯性,还有完成任务的表现,都变得更好了。
就好比玩《宝可梦》的时候,Opus 4 还能搞出一份 “导航指南” 。

当能够访问本地文件时,Claude Opus 4会记录关键信息,以帮助提升其游戏表现。上面展示的笔记是Opus 4在玩《宝可梦》时记录的真实笔记。
顺带说个别的,Claude code 已经进入 GitHub 的深度测试了,官方有一个案例是直接在GitHub里艾特Claude,调用它来操作。
这不就是天仙配吗?果然玩到最后都是搞生态。
写在最后
忙到今天凌晨一点多,一点开朋友圈,这AI编程的爹就这么水灵灵地更新了。
凌晨看AI圈混战,这不比博人传还燃?
纠结了三分钟到底要不要爬起来看一眼,看了一眼飞书的待办事项,我果断闭上了双眼。

最近破局的新行动又来了,为了防止肝爆掉,就报了一个。
但是说实话,真的很想学一下AI编程,顺便再精进一下智能体。论技术类的,这两块才是确定性的未来呀!
而且真的很简单,我这种文科生+艺术生都能手搓网页了。想看效果点👇
这次Manus亏大了,免费使用+送积分(含实测案例)
今天就到这里,有空再聊,我要继续去搓文了。
暂无评论内容