Home Explore Pricing Blog Docs New Tracker

Get the App

•

大模型中文速递 - NBot Tracker | nbot.ai

大模型中文速递

Created by homeabbeyroad

908 posts

Updated 116 days ago

0 scanned

中文大模型技术与行业案例精选

Create Similar Tracker

Digest Calendar

July 2026

Sun

Mon

Tue

Wed

Thu

Fri

Sat

开源多模态模型发布

🔥 英伟达Nemotron 3系列: 英伟达发布Nemotron 3系列开源模型，支持全理解多模态、语音等能力，推理效率提升5倍。

模型架构创新

🔥 腾讯HY团队记忆方式:...

March 18, 2026

Nemotron 3系列开源：多模态推理效率飙升5倍

英伟达GTC重磅发布Nemotron 3系列开源模型，推理/吞吐效率提升5倍。

Nemotron 3 Ultra：MoE架构吞吐量效率飙升5倍。
Nemotron 3 Omni：精准整合音、视、语多模态能力。
Nemotron 3 VoiceChat：融合语音识别、大模型与合成，支持实时对话，并配安全模型。
行业影响：加速智能体、物理AI及医疗创新。

March 18, 2026

Kimi团队论文算力效率提升1.25倍，高三生第一作者获马斯克点赞

工程突破：Kimi团队论文改进AI大模型底层架构，算力效率提升1.25倍。

高三学生成第一作者，获马斯克公开点赞：“Kimi的工作令人印象深刻”。
该研究对AI界影响很大，凸显国产团队创新实力。

深圳高三学生成Kimi重磅论文第一作者，马斯克公开点赞 - 搜狐

March 18, 2026·

m.sohu.com

March 18, 2026

OpenClaw狂潮扩展AI变现至云部署安全合规

OpenClaw热潮重塑AI投资：

变现扩展：从单纯Agents推至云端部署、安全合规等五价值层面。
云巨头受益：阿里、腾讯、百度等部署龙头最早获利。
应用股走强：与英伟达GTC发酵，推动迅策、智谱等大涨。
逻辑转向落地：AI进入多元化商业变现阶段。

March 18, 2026

腾讯HY-WU架构多模态记忆机制通用性测试

腾讯HY团队HY-WU记忆方式在架构通用性测试中展现良好适应性：

测试两种基础架构：原生统一多模态模型（HY-Image-3.0-Instruct）；
传统多模态扩散变换器。
重新定义AI模型记忆的关键一步，工程潜力显著。

腾讯HY团队重新定义AI模型记忆方式 - 网易

March 18, 2026·

163.com

March 18, 2026

OpenAI GPT-5.4 mini：在编码推理多模态工具使用上显著提升

GPT-5.4 mini 是OpenAI迄今最强小型模型，在编码、推理、多模态理解和工具使用方面比GPT-5 mini有显著改进，运行速度更快。

OpenAI发布小型模型GPT-5.4 mini和nano

March 18, 2026·

finance.sina.cn

March 18, 2026

大模型中文速递 · 2026年3月18日日报

Kimi团队AttnRes架构曝光

🔥 杨植麟带队发论文: 月之暗面Kimi团队提出Attention Residuals架构，用深度注意力替代固定残差连接，在480亿MoE模型上实现1.25倍计算效率提升，并提出块级注意力残差降低显存开销。

产业产品动态

-...

March 18, 2026

乐天基于DeepSeek V3发布日本最大AI模型，日语优化超GPT-4o

乐天发布日本最大高性能AI模型，配置文件显示基于DeepSeek V3架构。
采用MoE架构，总参数6710亿、激活370亿、上下文128K，针对日语场景优化。
多项日语基准测试表现优于GPT-4o，凸显DeepSeek V3在日语领域的全球开源影响力。

乐天发布“日本最大高性能AI模型”，其配置文件显示基于DeepSeek V3架构

March 18, 2026·

binance.com

March 18, 2026

Kimi AttnRes：深度注意力重构残差连接，提升MoE算力效率

Kimi团队AttnRes架构亮点：

用深度注意力替代传统Transformer固定残差连接，重新设计长期被忽视的核心结构。
提出块级AttnRes，划分层块解决大规模训练显存与通信开销。
在480亿参数MoE模型上，实现1.25倍计算效率提升，性能多维优异。
多角度验证下，AttnRes或成Kimi下一代关键突破。

Kimi 推出Attention Residuals：用深度注意力替代固定残差连接

March 18, 2026·

mlpod.com

March 18, 2026

大模型幻觉：司法医疗案例深刻教训

学术论文总结虚构研究成果，医疗场景编造不存在治疗方案
司法领域教训尤为深刻：航空诉讼案（2023）
律所处理客户诉讼时，使用大模型进行法律分析

大模型也会"说谎"？深度解析幻觉成因与治理方案 - 知乎专栏

March 18, 2026·

zhuanlan.zhihu.com

March 18, 2026

2026 VLN突破：VLA融合与强化学习路径拆解

多模态大模型与VLA融合：试图消融感知与决策壁垒
强化学习优化：通过多轮交互与因果推理，缓解短视决策
VLN范式大洗牌，10篇力作拆解四大核心突破

VLN范式大洗牌｜10篇力作，拆解2026年VLN四大核心突破方向- 知乎

March 18, 2026·

zhuanlan.zhihu.com

March 18, 2026

LLM/VLM架构演进与轻量化微调工程应用

主流LLM/VLM架构演进全览，从GPT-2到Qwen3.5。

落地部署关键：

大模型部署常遇资源限制问题
轻量化微调技术适配大型预训练模型到特定领域
工程实践必备，助力领域落地

一文看懂主流LLM/VLM 架构演进：从GPT-2 到Qwen3.5 - 稀土掘金

March 18, 2026·

juejin.cn

March 18, 2026

Token涨价倒逼大模型付费生态重塑

三大关键影响：

AI智能体蓬勃发展，大模型从问答交互向任务执行转变。
自3月起，国内云计算与大模型产业链逐级传导涨价，云服务商首当其冲。
付费生态加速重塑，推动行业转型与智能体商业化落地。

Token涨价倒逼行业转型：大模型付费生态加速重塑 - 新浪财经

March 18, 2026·

finance.sina.com.cn

March 18, 2026

通义实验室开源全球首个影视级AI配音多模态大模型Fun-CineForge

通义实验室于2026年3月17日正式开源全球首个影视级AI配音多模态大模型Fun-CineForge，标志着国产多模态模型在影视配音场景的开源落地与技术里程碑。

通义实验室开源首个影视级AI配音多模态大模型Fun-CineForge - 搜狐

March 18, 2026·

m.sohu.com

March 17, 2026

AttnRes：告别Transformer固定堆叠，按需读取深层表征

AttnRes核心机制：利用Softmax注意力替换固定权重残差，解决层贡献稀释与PreNorm陷阱，实现输入动态提取前序表征。

Block AttnRes优化：区块化处理降系统复杂度O(Ld)至O(Nd)，缓解大规模训练内存与通信开销。
实验验证：Kimi Linear上获1.25倍算力等效提升，数学、逻辑推理、代码生成任务优异。
落地潜力：提供流水线并行训练策略，推动大模型架构演进。

March 17, 2026

Coding Agent工程趋势：子代理实操到机制拆解，实用性靠工程打磨

Coding Agent并非黑盒，工程优化决定效率与实用性：

OpenAI Codex子代理：3个并行代理支持代码审查、缺陷分类、文档重构，提升编程效率翻倍，并有最佳实践避坑。
内部机制拆解：LLM补全+token缓存防费用暴增+工具调用文字解析，让AI从说说变动手。
关键洞察：几十行代码易原型，但Claude Code与Cursor差距源于工程心血，好用难复制。
关注工程细节，方能翻倍落地。

March 17, 2026

AI Agent新特征：自主迭代与规模落地

AI迈入下半场，Agent开始展现“自主迭代”新特征。

从概念验证走向规模落地。
传统大模型高度依赖人类Prompt和知识库，如超级百科全书。

AI迈入下半场：从概念验证走向规模落地 - 新华网

March 17, 2026·

xinhuanet.com

March 17, 2026

大模型中文速递 · 2026-03-17 日报

本土化与多模态模型发布

🔥 全球首個藏語大模型DeepZang發布: 全球首個藏語大模型DeepZang在拉薩發布，支持藏中英三語互動，由西藏覺羅數字產業管理有限公司自主研發，並獲國家生成式人工智能备案。
🔥 通義實驗室開源Fun-CineForge:...

March 17, 2026

M4 Mac Mini 16G榨干：OpenClaw部署+oMLX 3倍提速实操

Mac Mini M4 16G内存也能高效跑本地AI大模型，静音低功耗适合24h挂机。

关键实践：

Ollama部署：安装环境+选千问3.5(9B)模型
OpenClaw面板：一键安装，WhatsApp扫码接入
oMLX提速：macOS优化框架，速度飙升3倍

端侧硬件潜力巨大，Hugging Face下载社区版模型即刻上手。

March 17, 2026

Gemini 3 Pro数学代码优势与国内免费访问攻略

MMLU得分提升约5%，尤其数学推理和代码生成任务优势明显。
国内使用受限，但提供免费使用方案实测拆解。
值得工程开发者关注其中文能力在2026国内环境的表现。

2026年国内实测：Gemini 3 Pro中文能力深度拆解与免费使用方案 - AtomGit开源社区

March 17, 2026·

gitcode.csdn.net

大模型中文速递

Digest Calendar

Recent Posts

大模型中文速递 · 2026年3月19日日报

开源多模态模型发布

模型架构创新

Nemotron 3系列开源：多模态推理效率飙升5倍

Kimi团队论文算力效率提升1.25倍，高三生第一作者获马斯克点赞

深圳高三学生成Kimi重磅论文第一作者，马斯克公开点赞 - 搜狐

OpenClaw狂潮扩展AI变现至云部署安全合规

腾讯HY-WU架构多模态记忆机制通用性测试

腾讯HY团队重新定义AI模型记忆方式 - 网易

OpenAI GPT-5.4 mini：在编码推理多模态工具使用上显著提升

OpenAI发布小型模型GPT-5.4 mini和nano

大模型中文速递 · 2026年3月18日日报

Kimi团队AttnRes架构曝光

产业产品动态

乐天基于DeepSeek V3发布日本最大AI模型，日语优化超GPT-4o

乐天发布“日本最大高性能AI模型”，其配置文件显示基于DeepSeek V3架构

Kimi AttnRes：深度注意力重构残差连接，提升MoE算力效率

Kimi 推出Attention Residuals：用深度注意力替代固定残差连接

大模型幻觉：司法医疗案例深刻教训

大模型也会"说谎"？深度解析幻觉成因与治理方案 - 知乎专栏

2026 VLN突破：VLA融合与强化学习路径拆解

VLN范式大洗牌｜10篇力作，拆解2026年VLN四大核心突破方向- 知乎

LLM/VLM架构演进与轻量化微调工程应用

一文看懂主流LLM/VLM 架构演进：从GPT-2 到Qwen3.5 - 稀土掘金

Token涨价倒逼大模型付费生态重塑

Token涨价倒逼行业转型：大模型付费生态加速重塑 - 新浪财经

通义实验室开源全球首个影视级AI配音多模态大模型Fun-CineForge

通义实验室开源首个影视级AI配音多模态大模型Fun-CineForge - 搜狐

AttnRes：告别Transformer固定堆叠，按需读取深层表征

Coding Agent工程趋势：子代理实操到机制拆解，实用性靠工程打磨

AI Agent新特征：自主迭代与规模落地

AI迈入下半场：从概念验证走向规模落地 - 新华网

大模型中文速递 · 2026-03-17 日报

本土化与多模态模型发布

M4 Mac Mini 16G榨干：OpenClaw部署+oMLX 3倍提速实操

Gemini 3 Pro数学代码优势与国内免费访问攻略

2026年国内实测：Gemini 3 Pro中文能力深度拆解与免费使用方案 - AtomGit开源社区