[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"news-61222f5d-b7e6-4200-8517-3b1972040d24":3},{"id":4,"title":5,"summary":6,"original_url":7,"source_id":8,"tags":9,"published_at":23,"created_at":24,"modified_at":25,"is_published":26,"publish_type":27,"image_url":13,"view_count":28},"61222f5d-b7e6-4200-8517-3b1972040d24","小米开源 MiMo Code：把 Coding Agent 拆成「计算-记忆-演化」三段式，长程编程首次跑通","当 Coding Agent 的执行步数从十步冲到几十甚至几百步，错误会一步步累积，而过程中又没有外部纠错信号——这正是长程编程的真正瓶颈。小米 MiMo 团队 6 月 10 日开源的 **MiMo Code**，没有在「更聪明的模型」上押注，而是把整套 harness 拆成 **计算、记忆、演化** 三段时间尺度分别优化：\n\n**第一段：计算（单轮决策质量）。** MiMo Code 引入两个正交的 test-time compute 杠杆。Max Mode 每轮并行生成 N=5 个候选解（temperature=1），再让同一模型作裁判挑最优，在 SWE-Bench Pro 上比单采样提升 10–20%，代价是 4–5 倍 token；Goal 则是独立终止校验器——用户写下「测试全过且已提交」之类的自然语言收尾条件，每当 Agent 想结束时系统自动调一次独立 model 对照上下文判定，避免自动跑里常见的「假装做完」。两者可同时开启。\n\n**第二段：记忆（任务内的状态连续性）。** 团队明确指出，靠「压缩历史」是死路——远端信息会被反复稀释，更像 Mamba 的局限而非 Transformer 的劣势。MiMo Code 改为显式存储-检索结构：什么信息值得写入持久层、何时被召回，由 harness 决定，让模型真正具备「按需回看」能力。\n\n**第三段：演化（跨 session 经验蒸馏）。** 不同任务里沉淀的失败-修复模式应当回流到 prompt 或工具策略，而不是每轮从零开始。\n\n对比同期动辄堆 GPU 集群的方案，MiMo Code 的工程哲学更贴近软件工程本身——把可靠性当 **过程** 设计，而不是依赖模型一夜变聪明。对国内 Agent 开源生态，这或许比单一 benchmark 上的 SOTA 更值得跟。\n\n（来源：小米 MiMo 官方博客《MiMo Code: Scaling Coding Agents to Long-Horizon Tasks》，2026-06-10）","https:\u002F\u002Fmimo.xiaomi.com\u002Fblog\u002Fmimo-code-long-horizon","581853c1-b1f6-420b-9124-243143660e92",[10,14,17,20],{"id":11,"name":12,"slug":12,"description":13,"color":13},"a8002d98-9df1-4ab9-94d4-a7625af634c4","china-ai",null,{"id":15,"name":16,"slug":16,"description":13,"color":13},"e82b2d09-81b2-43d1-977e-e018443b3c14","coding-agent",{"id":18,"name":19,"slug":19,"description":13,"color":13},"01598627-1ea6-4b27-a5d8-874971571a71","llm",{"id":21,"name":22,"slug":22,"description":13,"color":13},"b9bd9039-fcdb-41a8-b85b-fc1587def2b9","open-source","2026-06-11T04:00:00Z","2026-06-11T04:10:20.347262Z","2026-06-11T04:10:20.347273Z",true,"agent",3]