LLM Insight Tracker

8h ago

硅芯片烧录模型：推理吞吐量从17k暴增至51k token/s

硬件革命性提升：将模型烧录入自定义硅芯片，可使AI推理吞吐量从17,000 token/s飙升至51,000 token/s，远超预期增速。结合多token预测自蒸馏，Llama-3.1-8B获3x加速且数学准确率损失<3%，为落地部署提供高价值工程决策。

8h ago

MIT报告警示：企业AI代理安全治理缺口巨大

企业AI代理落地风险：MIT调研30个系统，发现安全测试、透明度和停止控制普遍缺失，正接入企业邮件和工作流。

透明缺口：多数厂商未披露风险评估、监控细节，执行轨迹不明，难追责。
控制盲区：资源监控弱，无水印识别；HubSpot Breeze、IBM watsonx等缺独立停止机制。
采购决策：要求细粒度日志、沙箱隔离、红队测试和per-agent kill switch。

MIT Study Warns AI Agents Are Out of Control

findarticles.com

MIT Study Warns AI Agents Are Out of Control

8h ago

14h ago

LLM Insight Tracker · 2026-02-26 日报

Anthropic 产品与安全动态

🔥 收购 Vercept_ai: Anthropic 收购 @Vercept_ai 以推进 Claude 的计算机使用能力。
AI 安全计划播客: Anthropic 发布 AI 安全计划播客，讨论 Responsible Scaling...

17h ago

Xray-Visual模型：工业规模数据下的视觉扩展

@_akhaliq 分享 Xray-Visual Models，聚焦工业规模数据下的视觉模型扩展，审视其训练技巧可复现性及对多模态模型的潜在启发。

17h ago

Soumith：某事件比OpenAI弃‘open’更疯狂，震动开源格局

Soumith Chintala 称某事件“堪比OpenAI放弃‘open’，可能更疯狂”，凸显对开源趋势与行业命名/定位的潜在战略冲击，值得大模型研究决策密切关注。

17h ago

Karpathy：过去两月模型跃升让编码代理可靠，工程团队速采纳

核心转变：过去12月模型质量、长期连贯性和韧性大幅提升，编码代理从失效转为可靠，能自主处理大型任务。

实战验证：30分钟内代理登录DGX Spark、部署vLLM、搭建视频分析仪表盘并生成报告，全程无干预。
新范式：用英语描述任务启动代理，并行管理多实例；聚焦代理工程构建长运行协调器。
落地指南：针对可验证任务分解工作，提供高层指导与迭代，工程团队立即试用以获高杠杆。

17h ago

Anthropic收购Vercept_ai推进Claude计算机使用能力

Anthropic收购Vercept_ai，旨在提升Claude的计算机使用能力，这将加速代理功能落地并影响产品路线图。

17h ago

CoVer-VLA测试时验证在PolaRiS基准上提升VLA性能

关键提升：CoVer-VLA在挑战性red-team PolaRiS基准上，实现任务进度**14%提升、成功率9%**提升。
实际对比：锅清洗任务中，基线π₀.₅错误抓锅柄，而CoVer-VLA正确使用海绵擦洗。
落地潜力：@prodarhan提供易设环境，适用于多模态代理优化。

17h ago

Naveen Rao：可控非线性动力系统重塑AI计算

关键洞见：Naveen Rao 分享构建可控非线性动力系统，能表示任意内容，或作为AI计算机备选。

可编程性测试：引用 unconvAI 实验，验证4振荡器玩具系统表达力极限。
核心问题：动力系统在AI计算中的可控性与可编程性，潜力待挖掘。

1d ago

@_akhaliq分享大模型技术趋势：测试时训练、数据工程与长上下文优化

顶尖专家@_akhaliq近期论文分享揭示大模型关键趋势：

测试时训练与KV绑定秘密等价于线性注意力，为模型优化提供新视角。
数据工程扩展LLM终端能力，助力工程落地决策。
查询焦点&记忆感知重排序器提升长上下文处理，供复现基准参考。

1d ago

Anthropic RSP v3.0：灾难风险自愿管理框架，企业安全决策参考

Anthropic RSP v3.0作为强大AI模型灾难性风险的自愿框架，2026年2月更新，提供企业级对齐政策参考。

关键更新：

Frontier Safety Roadmaps追踪安全目标，Risk Reports透明外部审查模型。
行业推荐应对化学武器生产、自主破坏、自动化研究威胁。
多层防御：严格访问控制、实时分类器、模型权重安全协议。
记录过去合规差距，优化保障，实现技术益处与责任平衡。

1d ago

Brundage：Anthropic五角大楼冲突压力巨大，会国AI高风险对峙

顶尖安全专家Miles Brundage对美AI政策高压发声，凸显安全与军用冲突加剧：

Anthropic/五角大楼事件非常压力巨大，企业面临直接挤压；
国会正上演本世纪最重要技术的高风险对峙；
趋势警示：政策高压或重塑企业决策，需密切跟踪军民平衡。

1d ago

Karpathy：LLM令牌需求爆炸下SRAM vs HBM优化启示

Karpathy警告LLM令牌需求海啸即将来临，内存+计算协调是关键工程机遇。

SRAM：片上紧邻计算单元，极快但容量低
HBM/DRAM：片外高容量，但需经“长吸管”慢速访问
长上下文推理decode最难，NVIDIA(HBM优先)与Cerebras(SRAM优先)均未完美兼顾
决策目标：针对推理/训练等流程，实现高吞吐、低延迟、低成本的海量tokens

1d ago

srush_nlp：文本扩散兴起，Mercury morels代理基准新SOTA

文本扩散技术真正兴起，srush_nlp确认“it’s really happening”。

关键更新：

Mercury morels在Artificial Analysis基准上创速度与代理质量新纪录
标志代理模型产品前沿加速，对选型提供新参考

1d ago

ICML2025 PRM新论文：信息论视角下的病态与补救

过程奖励模型（PRM）最新研究亮点：

现有PRM病态分析：探讨当前PRM的缺陷及其补救路径。
信息论框架：通过信息论视角深入调查。
ICML2025投稿：线程详解机制，提供对齐训练优化思路。

1d ago

具身LLM测试时反思规划：从试错中学习新论文

具身LLM提出从试错中学习的反思测试时规划方法。欢迎讨论该论文。

Learning from Trials and Errors: Reflective Test-Time Planning for Embodied LLMs

arxiv.org

Learning from Trials and Errors: Reflective Test-Time Planning for Embodied LLMs

1d ago

LLM Insight Tracker · 2月25日日报

新论文分享

🔥 tttLRM：长上下文自回归3D重建测试时训练: @_akhaliq分享了tttLRM论文，焦点是Test-Time Training for Long Context and Autoregressive 3D Reconstruction。
🔥...

1d ago

Anthropic双重挑战：技能指南工程创新遇五角大楼监管压力

Anthropic工程实践创新：发布30+页Claude Skills指南，标准化可重复代理工作流，包含渐进披露和工程级测试指标。

Skills核心：打包指令、脚本、资产，实现标准化代理开发。
政策摩擦：五角大楼向Anthropic发出最后通牒，HN热议25分。

决策启示：创新落地需警惕外部监管，平衡技术与政策。

1d ago

顶尖专家分享大型视频推理基准套件论文

@_akhaliq 发布 A Very Big Video Reasoning Suite 论文，这是一个全新工具，用于系统评估视频大模型的推理能力。对大模型研究落地至关重要，可直接用于基准测试与决策。

1d ago

tttLRM：长上下文自回归3D重建的测试时训练新方法

tttLRM提出测试时训练（Test-Time Training）技巧，针对长上下文自回归3D重建问题，提供适应性优化。顶尖专家@_akhaliq分享论文，值得大模型研究者关注落地潜力。

Engineering, testing, and governing safer, more reliable LLM systems

Apple reportedly planning major Siri chatbot upgrade

Microsoft developing its own AI model, reducing dependency on OpenAI

OpenAI retires older models and product changes

Anthropic research measuring user behaviors with Claude

Hire to advance AI agents and assistant tooling

Massive funding term sheet valuing Anthropic at $350B

Anthropic accuses Chinese firms of reverse-engineering Claude

OpenAI's Lockdown Mode and Elevated Risk Labels for ChatGPT

Anthropic's policy stance, research, and product updates

Recent Posts

硅芯片烧录模型：推理吞吐量从17k暴增至51k token/s

MIT报告警示：企业AI代理安全治理缺口巨大

MIT Study Warns AI Agents Are Out of Control

LLM Insight Tracker · 2026-02-26 日报

Anthropic 产品与安全动态

Xray-Visual模型：工业规模数据下的视觉扩展

Soumith：某事件比OpenAI弃‘open’更疯狂，震动开源格局

Karpathy：过去两月模型跃升让编码代理可靠，工程团队速采纳

Anthropic收购Vercept_ai推进Claude计算机使用能力

CoVer-VLA测试时验证在PolaRiS基准上提升VLA性能

Naveen Rao：可控非线性动力系统重塑AI计算

@_akhaliq分享大模型技术趋势：测试时训练、数据工程与长上下文优化

Anthropic RSP v3.0：灾难风险自愿管理框架，企业安全决策参考

Brundage：Anthropic五角大楼冲突压力巨大，会国AI高风险对峙

Karpathy：LLM令牌需求爆炸下SRAM vs HBM优化启示

srush_nlp：文本扩散兴起，Mercury morels代理基准新SOTA

ICML2025 PRM新论文：信息论视角下的病态与补救

具身LLM测试时反思规划：从试错中学习新论文

Learning from Trials and Errors: Reflective Test-Time Planning for Embodied LLMs

LLM Insight Tracker · 2月25日日报

新论文分享

Anthropic双重挑战：技能指南工程创新遇五角大楼监管压力

顶尖专家分享大型视频推理基准套件论文

tttLRM：长上下文自回归3D重建的测试时训练新方法

Reading Activity