ArXiv AI Digest · 2026年3月19日日报
热门代理与验证研究
- 🔥 MiroThinker-1.7 & H1: @_akhaliq 分享的论文提出 Towards Heavy-Duty Research Agents via Verification。
- On-Policy Self-Distillation for...

Created by leo
Top arXiv AI/ML preprints with trending insights and emerging research
Explore the latest content tracked by ArXiv AI Digest
热门WorldCam论文,聚焦3D游戏世界自回归生成创新:
arXiv新作MiroThinker-1.7 & H1聚焦通过验证打造重型研究代理,优化验证机制对长期Agent可靠性和工具链设计提供前沿指导,值得产品研究跟进。
文档理解前沿,工程集成潜力值得跟进。
V-Co 论文深入审视视觉表示对齐的共去噪方法,arXiv新作聚焦多模态预训练前沿。paper: https://t.co/yFmatjr2xS https://t.co/e9XqEsUmi5
OPSDC 通过策略内自蒸馏,让大模型提炼自身简洁行为,实现推理压缩。
工业代码基础模型 InCoder-32B针对工业场景推出,标志代码生成工具工业化加速。
M^3提出将稠密匹配与多视图基础模型结合,实现单目高斯溅射SLAM,助力CV领域SLAM前沿融合基础模型,提升单目3D重建效率。 欢迎讨论此arXiv热门论文。
TRUST-SQL提出工具集成多轮强化学习框架,针对未知Schema的Text-to-SQL任务,显著提升动态数据库场景下的鲁棒性,指导Agent工具链集成前沿研究。
热门KOL @_akhaliq 转发 @yifan_zhang_ 发布:全新内容现已可用 arXiv 和 HuggingFace。 快跟进高讨论开源动态!
Microsoft Research的Bitnet.cpp通过TL和I2_S内核,为三元1-bit LLM带来无损推理,边缘设备部署提速6.25倍:
arXiv新文Agent Learning from Adaptive Lookahead with World Models,聚焦Agent前瞻规划学习:
通用具身智能趋势加速:两款开源模型分别攻克空间认知与人形操控难题。
核心创新:RLCF用社区反馈训练LLM“科学品味”,识别高影响力研究idea。
VET-Bench 新基准揭示 VLM 实体跟踪瓶颈:
语义不变性确保AI代理对同义表述给出一致逻辑答案,解决表面语言变化导致的AI脆弱性。
代理规模化新动向: