上海 AI 实验室在 Hugging Face 放出 Intern-S2-Preview,把任务规模(task scaling)推到开源前沿。模型仅 35B 参数、沿用 Qwen3.5 继续预训练,却在多类科学任务上追平自家万亿级 Intern-S1-Pro,通用推理/多模态/Agent 能力也未掉队——背后不再是堆参数或数据,而是把任务难度×多样性×覆盖度做成预训练到 RL 的全链路。 工程动作:shared-weight MTP + KL 损失压住训练—推理失配,MTP 接受率与生成速度改善;CoT 压缩用更少 token 跑出更高分;时间序列模态升级到 10^0–10^6 点的异构长序列。它也是首个把材料晶体结构生成和强通用能力同时给到的开源模型,叠加 LMDeploy/vLLM/SGLang 三栈与 Apache 2.0,本地科研 Agent 路径变宽。 LLM 走到 2026 年中段,规模叙事边际收益肉眼可见地递减,Intern-S2-Preview 证明:把科学任务的专业密度灌进 RL,35B 也能正面硬刚万亿——给所有做垂直模型团队的一剂清醒剂。