世上最强编程 Claude 4 发布!连续7小时敲代码,这才是真牛码农!

AI编程真的卷成大麻花了!

图片

Claude 带着它的新产品鲨回来了,不得不让我怀疑是谷歌全家桶的更新刺激了它。

这次发布的是 Claude Opus 4 和 Claude Sonnet 4

速看更新

编程超牛

说 Claude 4 系列是全球最会编程的模型一点不夸张。不管是写代码、找代码里的毛病,还是给出高质量代码片段,它都又快又准。

Claude 4模型在编码、推理、多模态能力和智能体任务等方面都表现出色
Claude 4模型在编码、推理、多模态能力和智能体任务等方面都表现出色

在评估编码能力的 SWE – Bench Verified 基准测试里,Claude Opus 4 拿到了 72.5% 的高分,把 OpenAI 新出的 Codex 和今年 4 月发布的 GPT – 4.1 都比下去了 。

Claude 4模型在SWE-bench Verified(一个针对实际软件工程任务性能的基准测试)中领先
Claude 4模型在SWE-bench Verified(一个针对实际软件工程任务性能的基准测试)中领先

理解能力强

Claude 4 能处理高达 20 万字的超长内容,还能同时 “看懂” 文本和图片。

你要是有一整本书、很长的文档或者复杂图表需要分析,交给它就行,它能快速给出精准分析,这对要处理大量资料的人来说,效率能大大提高。

企业和开发者的好帮手

推理和调用工具的能力变强了,记忆机制也升级了,延迟降低了 65%,还有提示缓存,响应更快还更省钱。

不管是做 AI 客服、智能办公,还是开发 AI 应用,都很实用 。

思考更智能

它有个 “混合推理 2.0” 系统,能像人一样。

在快速思考和深度思考之间灵活切换。回答简单问题,0.5 秒就能给出答案;遇到复杂任务,就进入深度思考模式,逻辑推理能力超厉害 。

安全有保障

有三重安全保障。

第一,不会执行可能伤人的指令。

第二,所有操作都有详细记录,完全透明。

第三,用户随时能让 AI 停止任何行为。而且它通过了 SOC 2 Type II 认证,企业用户不用担心数据泄露 。

官方案例

日常办公提效

相信很多朋友一听到 Claude,第一个想到的就是它的编程能力。

实际上,它跟 ChatGPT 在功能类型上类似,辅助办公也是一把好手,甚至在文字创作上也很不错。

三大高级功能:深入研究、管理项目、帮你敲代码。

模型改进

之前的模型它会走捷径、钻空子,好的,别说了都是泪。

目前这俩新模型出现这种情况的概率,比 Sonnet 3.7 低了 65% 。

Claude Opus 4 在存储记忆这方面,可比之前的所有模型都厉害太多了。要是开发者做应用,能让 Claude 访问本地文件,Opus 4 就能很熟练地搞个 “记忆文件”,把重要信息存起来。

现在再做智能体任务的时候,对长期任务的理解、任务的连贯性,还有完成任务的表现,都变得更好了。

就好比玩《宝可梦》的时候,Opus 4 还能搞出一份 “导航指南” 。

图片

当能够访问本地文件时,Claude Opus 4会记录关键信息,以帮助提升其游戏表现。上面展示的笔记是Opus 4在玩《宝可梦》时记录的真实笔记。

顺带说个别的,Claude code 已经进入 GitHub 的深度测试了,官方有一个案例是直接在GitHub里艾特Claude,调用它来操作。

这不就是天仙配吗?果然玩到最后都是搞生态。

写在最后

忙到今天凌晨一点多,一点开朋友圈,这AI编程的爹就这么水灵灵地更新了。

凌晨看AI圈混战,这不比博人传还燃?

纠结了三分钟到底要不要爬起来看一眼,看了一眼飞书的待办事项,我果断闭上了双眼。

图片

最近破局的新行动又来了,为了防止肝爆掉,就报了一个。

但是说实话,真的很想学一下AI编程,顺便再精进一下智能体。论技术类的,这两块才是确定性的未来呀!

而且真的很简单,我这种文科生+艺术生都能手搓网页了。想看效果点👇

这次Manus亏大了,免费使用+送积分(含实测案例)

今天就到这里,有空再聊,我要继续去搓文了。

© 版权声明
THE END
喜欢就支持一下吧
点赞5 分享
评论 抢沙发

    暂无评论内容