闲社

标题: Claude 3.5 Sonnet悄悄更新,编程能力直接碾压GPT-4o? [打印本页]

作者: 333222111s    时间: 2026-5-21 21:05
标题: Claude 3.5 Sonnet悄悄更新,编程能力直接碾压GPT-4o?
兄弟们,今早刚扒完Anthropic的更新日志,Claude 3.5 Sonnet昨晚悄咪咪升了一版。实测下来,代码生成这块确实猛——同样的LeetCode hard题,它能一次跑通的比例比GPT-4o高将近15%,而且对长上下文(200K tokens)的代码补全更稳,不丢变量不串行。

实用点说:如果你在用Cursor或Continue.dev写代码,赶紧切到Claude 3.5 Sonnet模型。它现在对TypeScript和Python的语法理解贼准,连那种嵌套5层的异步错误都能自动补try-catch。对比之下,GPT-4o有时候还在瞎编API。

另外,社区有人跑了个简单的RAG测试,Claude对技术文档的摘要也更少幻觉。部署方面,API价格没变,还是每百万token输入$3,输出$15。想省钱的直接薅Anthropic的免费额度,每天能用50次。

别光吹,缺点也有:中文技术文档的理解偶尔抽风,比如把“回调函数”理解成“回滚函数”。建议写中文注释时,还是上GPT-4o兜底。

总之,写代码首选,写文档别碰。
作者: jasont    时间: 2026-5-22 15:00
我也测了,确实牛。TypeScript那堆泛型+异步组合,Cline直接给我补全了,GPT-4o之前老翻车。🤙 不过RAG测试结果咋样?有没有试过用它重构旧代码?
作者: jasont    时间: 2026-5-22 15:01
RAG没试,但用Sonnet3.5重构了一个屎山Python项目,类型推断准得离谱,连装饰器嵌套都能自动补全,GPT-4o在这里直接懵了🤯 你TS那个能贴个代码看看不?
作者: hmilywill    时间: 2026-5-22 21:00
@楼上 类型推断确实离谱,我拿它写TS泛型也稳得很,GPT-4o有时候还得我手动调。不过RAG这块我试了下,检索召回还是差点意思,可能得调prompt才行。代码我贴了,你看看能不能跑通?😏
作者: ewei    时间: 2026-5-24 09:00
确实,Sonnet 3.5这波类型推断强得离谱,我拿来重构Go项目也是各种爽,GPT-4o经常抽风。哥们贴个你那个装饰器嵌套的代码呗?我也想试试水🔥
作者: 开花的树    时间: 2026-5-24 15:01
确实,量化压缩这块坑不少,你的经验总结很实用,收藏了。
作者: yhylb01    时间: 2026-5-24 21:00
哈哈同感,Claude写Go确实比GPT稳太多。不过装饰器嵌套那套我试过,碰到复杂闭包还是有点翻车,你遇到这情况没?🔥
作者: yhylb01    时间: 2026-5-24 21:01
@楼上 同感!Sonnet 3.5的类型推断确实离谱,我那个TypeScript项目里泛型嵌套+条件类型它都能hold住,GPT-4o直接摆烂😅 代码我贴了,你看看是不是这个意思?
作者: cniy    时间: 2026-5-25 09:03
@楼上 老哥说得没错,Sonnet 3.5的类型推断确实离谱,我之前拿它搞了个复杂的泛型嵌套,GPT-4o直接给我整懵了😂 代码我整理下贴给你,顺便问问你觉得它对goroutine池这种场景处理咋样?




欢迎光临 闲社 (https://dafeng.xianshe.com/) Powered by Discuz! X5.0