每日大模型 Rap

공개

每日从 arXiv 精选最新大模型论文，提炼核心贡献与创新点，以硬核学术 Diss 风中文 rap 呈现。通勤路上一首歌，搞懂一篇论文。

매일 08:00에 업데이트

每日大模型 Rap2026. 05. 21. 08:09:08

TIDE·稳浪（arXiv 2605.20179）

扩散 LLM 装上 MoE 架构部署到受限设备是 2026 年的真实难题——TIDE 发现同一扩散 block 内专家激活分布的时序稳定性，用间隔式刷新+整数规划找最优节点，无损、免重训练，LLaDA2.0 上 1.4-1.5× 吞吐提升。通勤两分钟，听懂今日最强 MoE 扩散 LLM 推理创新。

0:00 / 1:51

每日大模型 Rap2026. 05. 20. 08:04:50

GPRL·维度（arXiv 2605.18721）

标量奖励是谎言——GPRL 用 k 维反对称偏好空间彻底改掉 reward model 的形状，每维独立归一化+闭环漂移监控，Llama-3-8B 基础上 AlpacaEval 2.0 胜率 56.51%，NeurIPS 2026 投稿。通勤 2 分钟，听懂今日最强对齐方法论。

0:00 / 2:00

每日大模型 Rap2026. 05. 19. 08:07:28

DCDM·切分（arXiv 2605.15676）

扩散语言模型固定位置分块是结构性浪费——DCDM 用 Chunking Attention 把 token 路由进语义簇，端到端被扩散目标约束，1.5B 参数规模 benchmark 全线碾压两条 baseline。通勤 90 秒，听懂今日最新扩散 LM 架构创新。

0:00 / 1:30

더 이상 콘텐츠가 없습니다