微软因预算超支放弃 Claude Code
微软因预算超支而放弃 Claude Code,这一决定凸显了 AI 编程工具在实际落地中的成本控制难题。

Created by wearzdk (wear工程师)
AI industry and engineering updates, from model breakthroughs to deployment tools
Explore the latest content tracked by AI Pulse Digest
微软因预算超支而放弃 Claude Code,这一决定凸显了 AI 编程工具在实际落地中的成本控制难题。
当前AI定价模式注定要改变,随着推理成本持续下降,商业模式面临根本性重构。Hacker News上该话题获63分,反映从业者对这一趋势的共识。
Hark完成7亿美元A轮融资,估值达60亿美元,创始人Brett Adcock曾创办Figure AI与Archer,目标打造神秘的“通用AI界面”与个性化智能。
CODA将内存受限操作重参数化并融合到矩阵乘法epilogue中,在结果离开芯片前隐藏计算,显著提升LLM训练效率。 更值得关注的是,LLM自身也能自动生成接近SoL的高性能CODA内核。
Anthropic 推出 10 种插件,覆盖投资银行交易审查、财富管理组合分析及人力资源品牌材料生成。
新工具与 LSEG、FactSet、Slack 和 DocuSign 等合作,定位为提供基础设施与智能,供客户融入自身业务知识。
相比上月法律插件引发 8300 亿美元软件股抛售,此次发布推升 Salesforce 等合作伙伴股价上涨 4-6%。
Project NOMAD 1.32.0 为 AMD 用户带来 GPU 加速支持,同时彻底 redesign 知识库摄入流程,还新增按国家和区域下载地图功能。 这标志着开源 AI 工具链在硬件兼容性上的关键进步。
DeepSeek推进百亿美元融资轮,明确将AGI突破置于商业化之上,展现激进路线。
NVIDIA Spectrum-X以太网采用多平面网络架构,以拓扑并行替代层级深度,实现低延迟、高利用率的网络性能。硬件加速负载均衡在NIC和交换机中微秒级响应动态条件,实测达到理论线速98%并具备强容错能力,有效支撑数十万GPU规模的模型训练。
NVIDIA 机密计算与 OpenShift 沙箱容器通过硬件隔离和沙箱机制,共同保护 GPU 加速环境中的数据安全。 这为 AI 模型部署与推理提供了可落地的安全实践方案。
AI 定价正快速变化,头部公司采取截然不同的应对策略。
当前推理优化正围绕扩展架构、推测解码与缓存复用快速迭代,形成系统级落地路径。
通过 Vitis 2025.2 工作流,在 AMD Kria KV260 边缘 AI 板上运行首个硬件加速应用,仅需 4 步即可完成部署与加速。
OpenAI 内部模型成功反驳 Erdős 单位距离猜想,这一成果可直接推荐给《数学年刊》这样顶级数学期刊接受,充分展现 AI 已具备产出世界级数学研究的能力。
AI硬件担忧可能只是科技繁荣周期的旧剧重演,物理极限将成为首要信号。 这提供了一种历史视角,提醒我们关注硬件约束而非单纯技术突破。
真实电商案例 ShopSmart 展示了生产级 LLM 系统的端到端设计。
LLM 推理核心流程分为 prefill(并行处理提示)和 decode(逐 token 生成)两阶段。
LLMs 通常采用打乱语料训练,导致知识在训练时被冻结,时间定位能力受限。 这直接造成模型知识新鲜度下降。