我们正处于Token大爆发的起点——0225 1)OpenClaw带动的Agent热潮和去年的Manus时刻已完全不可同日而语。如果说Manus只是Agent的一次“打样”,OpenClaw则是标志着正式进入“量产”阶段。这注定不是一次简单热点出圈,而是新一轮Token大爆发的开始 2)OpenRouter的token usage 2月每周环比增长,最新周调用量较1月环比已接近翻倍。智谱/Kimi等大模型公司在token需求爆发后缺卡严重,急到在公众号和微博上公开找卡。Kimi近20天收入直接超过了去年全年、半夜想用GLM-5 vibe coding下都还要排队。在我个人投研场景的单日token使用(推理时)毛估较节前也至少10倍以上增长,身边亲眼所见的重度用户还有更夸张的用量 3)Token裂变背后是产业的几个质变,LLMs的coding、tool-use、long-horizon能力已经足够强大,它们是大厦的地基;Agents(Claude Code/Codex/OpenClaw...)被给与了足够多的工具和执行权限,像刚走出高中教室的少男少女,呼吸到了自由的空气。Skills的出现让应用层正式进入可被标准化生成、调用、分享的阶段,它不仅是function call、prompt工程、MCP的集合体,它是Agent时代的exe、app,是Anthropic定义的新的APP形态 4)未来Claude Code这样的起初面向程序员的工具会被证明具有超乎想象的通用性,这是一个面向所有知识工作工种的通用架构。用户只需要一个OpenClaw这样的IM/WebUI交互界面,指挥CC/Codex们在后台CLI上执行代码调用工具,将经验沉淀为一个个markdown文件,把工作流封装进一个又一个的skills 5)目前Agent使用过程中依然存在瓶颈,例如token产生的账单金额可以非常高昂,尽管很多时候用最好的模型确实是buy more save more。再比如context管理依然捉襟见肘,日常使用200k分分钟打满,1M未来可能只是起步价。因此通过对注意力层、MoE层的算法优化、适配FP4或更低的数据精度、以及硬件的协同设计需求依然迫切。NV将在GTC展出的LPU值得关注,基于SRAM的小芯片组网大幅提高decoding效率,未来有望与GPU rack的scale-up域互联,分层加速context快速增长带来的庞大KV Cache处理需求 6)关注国产AIDC链(云、算租、IDC、国产芯片)、海外算力(CPO、PCB、FPGA)
我们正处于Token大爆发的起点——0225 1)OpenClaw带动的Age
纯真灵魂
2026-02-26 00:06:49
0
阅读:2