Claude Opus 4.8 正式发布,传闻:"Opus 4.8可能是蒸馏的Mythos!"
AI Agent  /  管理员 发布于 7小时前   6
今日Anthropic 正式发布 Claude Opus 4.8, 这次模型的突破方向是判断力.
Anthropic 已经不再执着于让 Claude 变得更聪明了,而是选择让 Claude 变得更能干活了。
Opus 4.8 的核心升级是写代码、用终端、操作电脑、处理知识工作、做金融分析。
更直白一点说,Opus 4.8 不是为“问答”而升级,而是为“代理执行”而升级。
过去一年,大家对 coding agent 最大的不满,并不是它完全不会写代码,而是它太自信了,
比如你让它跑一个任务,它会说任务完成了,但测试没有真正跑通,还有它会把自己生成的代码缺陷放过去,
甚至用很笃定的语气告诉你“一切正常”。换到问答里,那就是 AI 又一次“稳稳地接住了你”。
这类问题对聊天产品来说只是体验不太行,但对 agent 来说就是生产事故。
因为 agent 的本质不是回答,而是行动。
一个会行动的模型,最可怕的不是能力不足,而是能力不足却不知道自己不足,
所以 Opus 4.8 的提升点很重要,它更愿意指出不确定性,愿意在证据不足时停下来,等待你补充完整信息再去行动。
官方甚至提到,Opus 4.8 让代码缺陷未经提醒通过的概率,比前代低了很多。
ClaudeDevs 官方账号对 dynamic workflows 做了连续解释:
Claude Code 现在可以临时写 orchestration script,然后并行启动大量 coordinated subagents 来处理复杂任务。
官方还明确说,这类 workflow 适合 service-wide bug hunt、大型迁移、
设计压力测试这类单 agent loop 很难完成的任务。
Bun 作者 Jarred Sumner 表示, dynamic workflows 是目前可靠使用 agents 完成中大型项目的前沿方式之一,
并提到 Bun 重写为 Rust 的过程中,dynamic workflows 和 adversarial code review 起到了重要作用。
不难看出,Opus 4.8 就不是一个单独拎出来很强的模型,它更重要的是在 Claude Code 这套 agent 系统里的核心执行模型。
与此同时,Anthropic 一同发布的几个新能力也很有意思,
比如Claude.ai 新增的 effort control ,用户现在可以控制 Claude 在任务上“花多少力气”,有几个选项,低 effort 更快、更省;
高 effort 更深、更适合复杂任务,Opus 4.8 默认的是 high effort,假如想要省一些 token,那最好手动切换回低 effort。
Agent 竞争的核心不是单次回答,而是连续执行,它要求模型会拆任务、会调用工具、会管理上下文、会处理权限、会控制成本、
会复核输出,还要能在复杂环境中长时间不跑偏。
这也是为什么 Opus 4.8 的官方没有强调对话能力,而是把重点放在
agentic coding、computer use、knowledge work、financial analysis。
因为 Anthropic 很清楚,未来最值钱的模型调用,不一定发生在聊天窗口里,
而是发生在 IDE、终端、浏览器、数据平台、企业后台和各种自动化流程里。
从这个角度看,dynamic workflows 可能比 Opus 4.8 本身更重要。
因为它把 Claude Code 从“一个 AI 程序员”推向“一支 AI 工程队”。
过去你让模型做任务,本质上是一个模型在一个上下文里循环。
现在它开始能拆分任务、并行分配子代理、让不同 agent 互相验证,最后再汇总结果。
Opus 4.8 虽然在定位上是 Cludue 的旗舰模型,但不会是一次“震撼全场”的模型发布。
它更像 Anthropic 给市场递出的一张路线图,这张路线图里,模型不能只追求更聪明,还要更稳;
任务不能只完成一轮对话,还要能持续推进;AI 不能只给出答案,还要能解释过程、复核结果、控制成本,并且把工作流沉淀下来。
这些都是未来所有大模型都要关注的点。
于是我们可以看到,Opus 4.8 负责把 Claude 的判断力和长程执行能力往前推一步,
effort control 让用户可以在质量、速度和成本之间主动调节,dynamic workflows 则把 Claude Code 从单个 coding agent,
推向一个可以拆任务、调度 subagents、并行执行和复核结果的工程协作系统。
Claude 正在从一个聊天模型,变成一个工程协作系统。
test1 在
opencode + Oh-my-openagent,我的第一个免费的ai编程智能体管家:Sisyphus中评论 test..122 在
学历:一种延缓就业设计,生活需求下的权衡之选中评论 工作几年后,报名考研了,到现在还没认真学习备考,迷茫中。作为一名北漂互联网打工人..Zita 在
Google AI Studio升级全栈 vibe coding体验,可直接构建带登录和数据库的应用中评论 111222..123 在
Clash for Windows作者删库跑路了,github已404中评论 按理说只要你在国内,所有的流量进出都在监控范围内,不管你怎么隐藏也没用,想搞你分..原梓番博客 在
在Laravel框架中使用模型Model分表最简单的方法中评论 好久好久都没看友情链接申请了,今天刚看,已经添加。..
Copyright·© 2019 侯体宗版权所有·
粤ICP备20027696号
