大模型能"听懂"文字、看清图像,但面对人类55%的非语言信息——心率、呼吸、情绪——仍是隐形天花板。北京微面科技(创始团队来自清华)近日推出基座模型 FacePhys,补上这条短板。 FacePhys 基于 rPPG(远程光电容积描记),通过对摄像头视频的面部细微色变建模,无接触提取心率、HRV、呼吸率、动作单元、眼动、情绪等120+ 项指标。团队构建万人级临床数据集(安贞医院验证),并把"状态空间模型"引入生理信号——思路类似大语言模型预测下一个 token,FacePhys 把心跳建模为连续物理过程,预测下一时刻的生理状态。 端侧模型仅0.2M 参数,可在手机、摄像头直接运行,心率精度 ≤2 BPM(医疗级),推理延迟 ≤10ms。"无接触望闻问切"第一次有了可量产的端侧方案。FacePhys 已切入机器人(海尔家庭机器人量产合作)、康养、车载疲劳监测三大场景。 中国团队从"生理底层"切入,把感知入口压成0.2M端侧小模型,反而更可能成为具身智能与大模型共情交互的标配基础设施。比起千亿参数对话模型,"垂直感知基座 +端侧轻量化"或是 AI下一阶段被低估的拼图。