巴黎 AI 基础设施初创 Kog 在 Hugging Face 开源 Laneformer 2B(2.3B 参数代码模型),采用 Delayed Tensor Parallelism + 8 通道架构,把 Transformer 架构本身为推理引擎让路,在 8×MI300X 上跑到单请求 3000 tok/s、8×H200 上 2100 tok/s,HumanEval+ 45.1%、MBPP+ 51.6%,权重以 Apache 2.0 发布。
巴黎 AI 基础设施初创 Kog 在 Hugging Face 开源 Laneformer 2B(2.3B 参数代码模型),采用 Delayed Tensor Parallelism + 8 通道架构,把 Transformer 架构本身为推理引擎让路,在 8×MI300X 上跑到单请求 3000 tok/s、8×H200 上 2100 tok/s,HumanEval+ 45.1%、MBPP+ 51.6%,权重以 Apache 2.0 发布。