本日报由 AI 自动整理生成,数据来源:AI HOT、Hacker News、Bloomberg、TechCrunch、新浪财经、投资界等。内容涵盖模型发布、产品更新、行业动态及实用技巧,每日更新。
模型发布/更新
1. Anthropic Mythos 红队测试遭内鬼泄露,紧急叫停
来源:投资界 / Anthropic
Anthropic 新一代旗舰模型 Mythos(内部代号 Oceanus)在红队测试阶段发生重大安全事件:一名内部测试人员将核心模型检查点 claude-oceanus-v1-p 的 API 访问权限高价转售给第三方代理服务商。Anthropic 监测到异常流量后紧急叫停全部红队测试并停用该模型。尽管如此,Mythos 的性能参数(52 Token/s 吞吐量)、定价信息(80美元/百万Output Token)已被公开传播。该模型预计仍将在 6 月 16 日左右正式发布,但红队测试流程将大幅收紧。
查看原文
2. OpenCV 5 正式发布:原生支持 Transformer 与 VLM
来源:IT之家
计算机视觉领域基石 OpenCV 5 正式发布,采用基于图的全新 DNN 引擎,ONNX 算子覆盖率从 23% 大幅提升至 80%,原生支持 Transformer、VLM 和 LLM,新增 FP16/BF16 支持。这意味着 OpenCV 从传统 CV 库正式进化为支持大模型推理的全栈视觉框架。
查看原文
3. Google 本周 AI 产品汇总:Gemma 4 离线运行、Co-Scientist 多智能体科研系统
来源:Google AI
Google AI 发布本周产品更新:Gemma 4 12B 开源多模态模型可完全离线运行于笔记本;Nano Banana 2/Pro 正式 GA 并接入 Gemini API;Co-Scientist 是面向科研场景的多智能体假设生成系统;Magenta RealTime 2 则支持 MIDI/文本/手势输入的实时音乐创作。
查看原文
4. 腾讯混元提出 Stem 稀疏注意力算法,长文推理提速新 SOTA
来源:腾讯混元
腾讯混元团队提出 Stem 稀疏注意力算法,将长文本首字延迟降低 3.6 倍,在长文推理任务上实现新的 SOTA 水平。该技术通过稀疏化注意力计算显著降低推理开销,对长上下文场景(如长文档分析、代码审查)具有实际意义。
查看原文
产品发布/更新
5. Cursor 发布 Design Mode:手势+画框+语音驱动 UI 实时编辑
来源:Cursor 官方
Cursor 正式推出 Design Mode 功能,用户可通过点击选中、框选区域或语音指令实时驱动 AI 修改 UI,支持手势交互和摄像头共享。这标志着 AI 编程工具从纯文本交互进入可视化协作阶段,开发者可以直接在界面上指哪里改哪里。
查看原文
6. GitHub Spec Kit 开源:用规范驱动开发替代 Vibe Coding
来源:GitHub / X
GitHub 开源 Spec Kit 工具包,倡导 Specification-Driven Development 理念来解决 Vibe Coding 的最大痛点——缺乏系统性产品规范导致 AI 生成代码质量不稳定。该工具包支持 Copilot、Claude Code、Codex、Gemini、Cursor 等 30+ AI Agent 集成,已获 109K+ GitHub Stars。
查看原文
7. Gemini Live 支持实时图像创建与编辑
来源:Google Gemini
Gemini Live 新增实时图像生成与编辑功能,用户可通过对话配合摄像头共享,实时完成装修试色、数学解题、制作梗图等任务。Gemini 正在将多模态交互从看图说话推进到边聊边画的新阶段。
查看原文
8. 苹果新版 Siri 标记为 Beta,部分查询将调用 Google Gemini
来源:IT之家
苹果在 WWDC 上展示的新版 Siri 内部标记为 Beta,部分查询将通过 Google Cloud 调用 Gemini 模型处理,使用谷歌 NVIDIA Blackwell B200 集群。这意味着苹果在 AI 助手领域采取了多供应商策略,不再局限于自研模型。
查看原文
9. MiniMax M3 代码审计成本仅为 Claude Opus 4.8 的 1/18
来源:MiniMax 官方
第三方独立评测在同一代码库植入 17 个 bug 进行测试:MiniMax M3 花费 0.07 美元找到 13 个;Claude Opus 4.8 同样找到 13 个但花费 1.30 美元,成本差距近 50 倍(按单 bug 计算约 18 倍)。这表明国产模型在特定代码审计场景下已具备极强的性价比优势。
查看原文
10. AGIBOT WORLD CHALLENGE@ICRA 2026 圆满收官
来源:投资界
AGIBOT 在 ICRA 2026 上举办的世界具身智能挑战赛圆满收官,标志着具身智能标准化与生态建设进程加速。该赛事吸引了全球顶尖机器人团队参与,推动了人形机器人在复杂任务场景下的能力验证。
查看原文
行业动态
11. SpaceX 领衔超级 IPO,OpenAI 与 Anthropic 同步冲刺
来源:新浪财经
SpaceX 将于 6 月 12 日挂牌上市,募资 750 亿美元有望刷新全球 IPO 纪录。OpenAI 和 Anthropic 也将相继冲刺 IPO,三家合计募资规模约 2000 亿美元。市场对如此集中且大规模的 IPO 浪潮表示关注,部分投资者警示估值虚高风险。
查看原文
12. 美股 AI 交易全面回调,纳指创近 8 个月最大跌幅
来源:新浪财经
6 月 6 日美股全线下跌,纳指重挫 1121 点,芯片股遭大规模抛售。5 月非农就业数据超预期强化加息预期,AI 相关科技股受到重压。知名资管机构双线资本和橡树资本已开始为 AI 行业潜在风险布局信贷资产。
查看原文
13. Google 每月向 SpaceX 支付 9.2 亿美元购买 xAI 数据中心算力
来源:X / SpaceX
SpaceX 披露与 Google 的云服务协议,Google 每月支付约 9.2 亿美元(年约 110 亿美元)购买 xAI 数据中心算力。AI 算力正从自建基础设施扩展到跨企业算力交易,成为高度战略化的商品。
查看原文
14. 美国众议院发布 AI 监管法案草案,拟禁止各州自行立法
来源:路透社 / Hacker News
美国众议院两党议员联合发布 AI 监管法案草案,旨在将 AI 监管权力集中到联邦层面,禁止各州自行制定 AI 法规。对 AI 创业公司而言,统一的联邦监管意味着合规成本降低,但同时也意味着监管力度可能加大。
查看原文
技巧与观点
15. AI 辅助编码是否正在增加底层 Bug?
来源:Hacker News 热帖
一篇 HN 热门文章(105 分)对 rsync 项目真实数据进行分析,探讨 AI 辅助编码是否在增加低级错误率。研究方法值得所有依赖 AI 编程工具的团队参考:与其争论 AI 编码好不好,不如用数据说话,建立系统化的代码审计机制。
查看原文
16. Arena 发布真实世界 AI 智能体排行榜 Agent Arena
来源:X
基于 30 万+ 真实任务、200 万+ 工具调用评估的 Agent Arena 排行榜发布,前三名依次为 GPT-5.5 High(+10.7%)、Claude Opus 4.7 Thinking(+9.5%)、GPT-5.4 High(+8.9%)。该排行榜使用真实场景任务而非合成 benchmark,对选择编程 Agent 有参考价值。
查看原文
数据窗口:2026-06-06 ~ 2026-06-07(UTC+8)
由 WorkBuddy 自动整理生成 | 数据来源:AI HOT