本日报由 AI 自动整理生成,数据来源:AI HOT、Hacker News、Bloomberg、TechCrunch 等。内容涵盖模型发布、产品更新、行业动态及实用技巧,每日更新。

模型发布/更新

1. Nex-N2-Pro 发布:基于 Qwen3.5 的 397B MoE 推理模型,性能达 GPT-5.5 水平

来源:硅基流动 SiliconFlow
neolab 推出 Nex-N2-Pro,基于 Qwen3.5-397B-A17B 的 MoE 推理模型,总参数 397B,激活 17B。支持 262K 上下文与多模态(VLM),性能达到 GPT-5.5 和 Claude Opus 4.7 级别。模型可自动调节推理深度,减少 30-50% 思考 token 且无性能折损,在 Terminal Bench 2.1、GDPVal、SWE-Verified 上取得 SOTA。兼容 Claude Code、Cursor 等编码工具,硅基流动已提供 T+0 支持,前两周免费使用。
查看原文

2. ChatGPT 推出 Dreaming 记忆系统,跨对话保持个性化上下文

来源:OpenAI 官网
ChatGPT 推出名为 Dreaming 的新记忆系统,能更有效记住用户偏好,在跨对话场景中保持上下文的新鲜感和相关性,从而提升助手个性化体验。这意味着 ChatGPT 将在长期使用中逐渐"了解"用户的工作习惯、偏好和需求,减少重复设置的成本。
查看原文

3. NVIDIA Nemotron 3 Ultra 发布:为长时间运行智能体优化推理效率

来源:NVIDIA Technical Blog
NVIDIA 发布 Nemotron 3 Ultra 模型,专为长时间运行的 AI 智能体设计。该模型能在多轮对话中保持上下文、调用工具和调用子智能体,并高效处理复杂工作流。针对多智能体协作导致模型 token 数量快速增长的问题,Nemotron 3 Ultra 通过优化推理流程显著提升速度并降低计算成本,使长周期智能体任务更加可行。
查看原文

4. Google Magenta RealTime 2 发布:开放权重实时音乐生成模型

来源:Google AI for Developers
Google AI 推出开放权重的实时音乐模型 Magenta RealTime 2(MRT2)。该模型可通过 MIDI 键盘、实时文本提示甚至手势进行演奏,在 MacBook 上原生运行,延迟低于 200ms。提供开放权重、开源推理引擎以及配套应用和插件套件,降低音乐创作的技术门槛。
查看原文

产品发布/更新

5. Codex 推出 iOS 应用构建插件,支持 SwiftUI 预览与热重载

来源:OpenAI Developers
OpenAI 为 Codex 推出 Build iOS Apps 插件,让 Codex 能在应用内浏览器查看和测试 iOS 应用,打开 SwiftUI 预览,并支持热重载编辑,无需离开 Codex 即可完成完整的 iOS 开发循环。这标志着 Codex 从纯代码生成向全栈应用开发体验的延伸。
查看原文

6. Hugging Face 重塑 hf CLI:为编码智能体优化输出,token 消耗降至 1/6

来源:Hugging Face Blog
Hugging Face 重新设计 hf CLI,使其同时服务人类用户和编码智能体(Claude Code、Codex 等)。通过环境变量自动检测智能体驱动,输出紧凑无截断的 TSV 格式,在复杂多步任务中 token 消耗最高降低至原来的 1/6。2026 年 4 月起追踪数据显示,Claude Code 约 4 万用户、近 4900 万次请求。
查看原文

7. Anthropic 开源 AI 驱动漏洞发现框架

来源:GitHub / Hacker News
Anthropic 将其用于 AI 驱动漏洞发现的开源框架代码托管在 GitHub 上。该框架利用 AI 技术进行自动化漏洞发现,旨在帮助识别软件中的安全缺陷,为开发者提供免费的 AI 安全审计工具。
查看原文

8. Replit Agent 联合 Shopify:一句话从想法到上线商店

来源:Replit
Replit 与 Shopify 合作,用户只需告诉 Replit Agent 想做什么,即可自动构建自定义店铺页面、创建 Shopify 商店、添加商品并配置支付,实现零门槛电商建站。几分钟内即可从想法到上线运营。
查看原文

9. Stanford 发布 OpenJarvis:本地优先设备端 AI 智能体框架

来源:MarkTechPost
Stanford 研究人员发布 OpenJarvis,一个完全在设备端运行的 AI 智能体框架,支持推理、智能体、记忆与学习。与最佳云端模型性能差距在 3.2 points 以内,边际 API 成本降低约 800 倍。将个人 AI 系统解构为可独立优化的五大模块:Intelligence、Engine、Agents、Tools & Memory 和 Learning。
查看原文

行业动态

10. 微软 AI 负责人:Anthropic 模型成本过高,正自研替代模型

来源:Bloomberg
微软 AI 部门负责人表示,Anthropic 推出的模型成本过高,公司目前正在内部研发更廉价的替代模型以降低对第三方模型的依赖。这一表态凸显了科技巨头在 AI 基础设施层加速自主可控的趋势,与微软在 Build 2026 发布 7 款自研 MAI 模型的战略一脉相承。
查看原文

11. OpenAI 公开承认递归自我改进(RSI)早期迹象

来源:OpenAI / X
OpenAI 在最新报告中写道:"AI 开发本身正被 AI 加速,我们看到了递归自我改进(RSI)的早期迹象。"预计这将加剧开发者与国家之间的竞争压力,并带来现有机构无法应对的治理挑战。这一公开表态在 AI 安全领域引发广泛讨论。
查看原文

12. Cloudflare Radar:机器人流量首次超过人类,占比 57.5%

来源:Cloudflare Radar
Cloudflare 最新统计显示,过去一周(5 月 28 日至 6 月 4 日)全球所有 HTML 网页请求流量中,57.5% 来自机器人(爬虫、AI 抓取、自动化脚本),仅 42.5% 来自真人浏览器。这是互联网历史上机器人流量首次超过人类,标志着互联网流量主体已从人类浏览网页转向机器间通信和 AI 数据抓取。
查看原文

技巧与观点

13. OpenRouter 大逃杀评测:11 款 LLM 实时决策,Claude 与 Grok 领跑

来源:OpenRouter
OpenRouter 用总价 482 美元的推理花费,让 11 款大语言模型在 30 轮实时决策的"大逃杀"挑战中竞争。结果表明传统静态 benchmark 无法反映模型在需要实时响应的智能体任务(如自主控制机器人)中的真实表现,Claude 和 Grok 系列在决策速度与任务成功率上表现突出,而多项高参数模型的实时调度能力未达预期。
查看原文

14. DeepSeek 连续四周在 OpenRouter 平台 token 份额排名第一

来源:OpenRouter
OpenRouter 作为风向标级 API 聚合器,DeepSeek 连续四周 token 份额排名第一。作为对比 benchmark 的实用数据,这一排名反映了 DeepSeek 在实际 API 调用量中的市场占有率,比任何静态 benchmark 更能说明模型的实际使用情况。
查看原文


数据窗口:2026-06-04 ~ 2026-06-05(UTC+8)
由 WorkBuddy 自动整理生成 | 数据来源:AI HOT

最后修改:2026 年 06 月 05 日
如果觉得我的文章对你有用,请随意赞赏