本日报由 AI 自动整理生成,数据来源:AI HOT、Anthropic Newsroom、Bloomberg、Google DeepMind Blog 等。内容涵盖模型发布、产品更新、行业动态及实用技巧,每日更新。

模型发布/更新

1. Anthropic 发布 Claude Fable 5 和 Claude Mythos 5 双旗舰模型

来源:Anthropic Newsroom
Anthropic 正式推出 Claude Fable 5(通用安全版)和 Claude Mythos 5(受限安全版)。Fable 5 在软件工程、知识工作、视觉、科研等几乎所有测试基准上达到 SOTA,FrontierCode 评分居前沿模型之首,可仅凭截图重建网页应用源码,Stripe 称其将数月工程压缩至数天。Mythos 5 在药物设计中实现约 10 倍加速,分子生物学假说盲测获科学家偏好概率约 80%。两模型输入 $10/百万 tokens、输出 $50/百万 tokens,较 Mythos Preview 降价过半。
查看原文

2. Google DeepMind 发布 Gemma 4 12B:统一无编码器多模态模型

来源:Google DeepMind Blog
Gemma 4 12B 采用无编码器统一架构,原生支持音频输入,基准测试性能接近 26B MoE 模型,但内存占用不到一半,仅需 16GB 显存即可在消费级笔记本本地运行。内置多 token 预测(MTP)drafter 降低延迟,基于 Apache 2.0 开源,已累计超 1.5 亿次下载。
查看原文

3. Cohere 发布 North Mini Code:30B 开源编码模型,SWE-Bench 达 80.2%

来源:Hugging Face Blog
Cohere 发布 North Mini Code,30B 参数 MoE 模型(3B 活跃参数),Apache 2.0 开源。在 Artificial Analysis Coding Index 得分 33.4,超越 Qwen3.5、Gemma 4 等同类模型。后训练采用两阶段 SFT 和 RLVR,SWE-Bench Verified pass@10 达 80.2%,Terminal-Bench v2 达 55.1%,专为智能体编码任务优化。
查看原文

4. 小米 MiMo-V2.5-Pro-UltraSpeed:1T 模型输出首次突破 1000 tokens/s

来源:小米 MiMo 公众号
小米 MiMo 与 TileRT 联合发布 UltraSpeed 模式,1T 参数旗舰模型输出速度首次突破 1000 tokens/s。采用 FP4 混合量化(仅量化 MoE Expert)与 DFlash 块级 masked 并行推测解码(coding 场景平均接受长度 6.30 tokens),系统侧 TileRT 引入常驻内核引擎与异构流水线协作。FP4 权重与 checkpoint 已开源至 HuggingFace。
查看原文

产品发布/更新

5. Claude Managed Agents 新增定时运行和环境变量存储功能

来源:Claude Blog
Claude Managed Agents 在 Claude Platform 公开测试两项新功能:代理可按 cron 计划自动执行周期性任务(夜间数据同步、周度合规扫描、每日摘要等),无需用户自建调度器;vaults 新增环境变量支持,允许代理通过 CLI 认证请求,真实密钥仅附加在网络边界,代理无法读取。已集成 Browserbase、Notion、Sentry 等 CLI。
查看原文

6. OpenRouter 推出 Advisor 工具:低成本模型可随时调用强模型增强生成

来源:OpenRouter Announcements
OpenRouter 发布 advisor 服务器工具,允许一个快速、便宜的模型在生成过程中咨询更强大的模型。可用 GPT-4o Mini 处理日常例行工作,在关键时刻调用 Claude Fable 解决真正重要的问题,实现成本和质量的动态平衡。
查看原文

7. OpenAI Responses API 网页搜索新增图片结果

来源:OpenAI Developers
OpenAI Responses API 的网页搜索功能现在除了文本结果外,还支持返回图片结果。开发者可以构建能展示商品、地点、视觉参考和来源链接的应用,拓展了 API 的多模态搜索能力。
查看原文

行业动态

8. 中国准备 2950 亿美元全国 AI 基础设施建设计划

来源:Bloomberg
据 Bloomberg 报道,中国计划在未来五年投入约 2 万亿元人民币(约 2950 亿美元)建设全国数据中心,以推动国内 AI 产业发展。该投资将覆盖数据中心基础设施的大规模建设,为关键技术领域的雄心提供资金支持。
查看原文

9. Apollo 与 Blackstone 联手 350 亿美元 AI 融资,Super Micro 同步募资 70 亿美元

来源:Bloomberg
Apollo 和 Blackstone 合作开展 350 亿美元 AI 融资交易,Anthropic 和 Broadcom 参与其中,可能重塑 AI 基础设施融资方式,标志着一个全新 AI 投资类别的开端。同一日,Super Micro Computer 宣布通过股权融资筹集 70 亿美元,用于采购 AI 服务器组件以满足不断增长的订单需求。
查看原文(Apollo/Blackstone) | 查看原文(Super Micro)

10. SpaceX AI1 轨道 AI 数据中心卫星方案首次详解

来源:X:Rohan Paul
Elon Musk 首次详细解释 SpaceX 的 AI1 轨道 AI 数据中心卫星方案:峰值功率 150 kW,持续计算功率约 120 kW(相当于一个 NVIDIA GB300 机架);太阳能板效率 250 W/m²;双面散热器排热 1400 W/m²;激光链路互联约 1 Tbps,低轨 600-800 km 往返延迟仅 6-8 ms。由 Starship 发射,计划部署百万颗卫星,目标吉瓦级轨道 AI 算力,长期向太瓦级推进。
查看原文

11. OpenAI 秘密提交 IPO 申请,奥尔特曼宣布公司进入第三发展阶段

来源:IT之家 / OpenAI 官网
OpenAI 近日秘密向 SEC 提交 IPO 申请。同日,CEO 奥尔特曼与首席科学家帕霍茨基联合发文,宣布公司进入第三发展阶段,三大核心目标为:打造自动化 AI 研究员、推动经济提速、为每人配备专属通用人工智能。二人强调智能系统须坚守安全底线,呼吁成立国际机构应对 AI 风险。
查看原文(IPO) | 查看原文(第三阶段)

12. 两部门:2026 年底人形机器人完成应用验证并常态部署

来源:IT之家
工信部、国资委 6 月 8 日联合发布通知,目标到 2026 年底,人形机器人等重点产品在代表性场景完成应用验证并开启常态部署,形成百个以上高价值场景、万台级规模落地。各省级地区选取不少于 20 个场景单元,央企不少于 10 个。鼓励"人形机器人即服务"等商业创新模式。
查看原文

技巧与观点

13. FrontierCode 基准测试发布:AI 编程评估新标准,最强模型通过率仅 13.4%

来源:X:阿易 AI Notes
Cognition(Devin 母公司)发布 FrontierCode 基准测试,由 20 多位顶级开源维护者手工制作 150 个任务(每个耗时 40+ 小时),依据 3000 多条规则判断维护者是否愿意合并代码。结果 Claude Opus 4.8 在最高难度档仅获 13.4%,GPT-5.5 为 6.3%,其余模型 1%-5%。该基准指出 SWE-Bench 等超半数通过测试的代码实为不可维护的垃圾——即便最强模型,近九成代码仍无法通过有经验维护者审核。
查看原文

14. Claude Code 团队 Thariq 分享提升效率的十条建议

来源:X:Rohan Paul
Claude Code 团队成员 Thariq 提出核心转变:从检查 Claude 是否做对工作,转向检查它是否在做正确的工作。关键建议包括:提前提供完整上下文;用小规格文档让 Claude 访谈实现细节;探索多方向并生成 HTML 原型;提供丰富上下文而非硬约束;设定明确目标与验证方法;利用 Workflows 并行任务并自我验证;更勇敢地将复杂任务交给 Claude Fable 5,因其可运行数小时、自检并产出高质量代码。
查看原文


数据窗口:2026-06-09 ~ 2026-06-10(UTC+8)
由 WorkBuddy 自动整理生成 | 数据来源:AI HOT

最后修改:2026 年 06 月 10 日
如果觉得我的文章对你有用,请随意赞赏