MintPick

每日 AI 精选

9 条资讯

产品

Anthropic 将 Claude Fable 5 正式纳入 Max 和 Team Premium 套餐

Anthropic 官方宣布 Claude Fable 5 定价策略重大调整：自 7 月 20 日起，Fable 5 正式纳入 Max 和 Team Premium 套餐，以 50% 的限制额度使用，不再消耗额外积分。Pro 和 Team Standard 用户则继续使用现有用量积分体系，并获一次性 100 美元信用额度。此前 Anthropic 已三次延长 Fable 5 的免费访问期限，此次最终方案表明模型需求远超预期，迫使公司做出商业化妥协。

模型发布

GPT-5.6 Sol 在网络攻防基准测试创纪录，OpenAI 推出 Codex Security 插件

OpenAI 官方宣布 GPT-5.6 Sol 在英国 AISI 窄域网络安全基准和 "The Last Ones" 综合演练中均创下新纪录。在 "The Last Ones" 测试中，GPT-5.6 Sol 在 10 次尝试中以 7 次完全解决，优于竞品 Mythos 5 的 6 次。OpenAI 同步发布 Codex Security 插件，可将此能力直接集成到开发工作流中，帮助团队实时发现和修复代码漏洞。

融资

Moonshot AI 启动香港 IPO 准备，Kimi K3 开源释放商业信号

多家中国内地媒体报道，Moonshot AI（Kimi 开发者）正积极重组公司架构，目标是在六个月内启动香港首次公开募股。消息人士称公司已通知投资者并进行结构调整。这一动向与 Kimi K3 的开源策略形成呼应——通过开放 2.8 万亿参数模型建立行业影响力，随后通过商业化变现。若 IPO 成功，Moonshot AI 将成为中国 AI 领域最具价值的上市公司之一。

产品

Google 推迟 Gemini 3.5 Pro 发布，编码能力未达内部标准

AI 聚合账号 minchoi 报道，Google 已决定推迟 Gemini 3.5 Pro 的发布。内部评估显示该模型在编码任务上的表现未达预期标准。与此同时，Anthropic 的 Fable 5、OpenAI 的 GPT-5.6、xAI 的 Grok 4.5 和中国 Moonshot 的 Kimi K3 均已发布，市场竞争格局进一步加剧。分析认为 Google 不愿仓促发布不够竞争力的产品，选择继续打磨编码能力。

研究

新研究揭示 AI 代理持久记忆面临提示注入攻击风险

DAIR.AI 研究员发布新研究，系统性地测试了针对 AI 编码代理持久记忆系统的提示注入攻击。研究发现，攻击者可以在 Claude Code 和 OpenAI Codex 的记忆存储中植入恶意指令，当代理下次读取记忆时自动执行。这暴露了当前 AI 代理架构中的关键安全隐患——持久化记忆虽让代理更智能，但也成为攻击者的潜在入口。

模型发布

DeepSeek V4 进入测试阶段，早期表现匹敌 Opus 4.8

据开发者社区消息，DeepSeek V4 新版已进入 GA 前的测试阶段。早期评测显示其智能体行为和改进的编码能力达到 Opus 4.8 水平，同时在 3D 理解方面表现突出。价格策略预计保持不变。这被视为 DeepSeek 对中国 Kimi K3 开源模型的直接竞争回应，标志着中国 AI 模型竞争从单一产品扩散到多产品线并行。

产品

OpenAI 重置所有付费用户用量限制，Sottiaux 致谢团队快速迭代

OpenAI 产品负责人 Tyler Sottiaux 发布公告，重置所有付费用户的 Codex 和 ChatGPT Work 用量限制。他表示团队正在以超高速扩展基础设施，感谢团队的辛勤工作。此举发生在 OpenAI 近期频繁调整速率限制的背景下，反映出公司在应对激增用户需求时的运营挑战。同时取消了 Plus 和 Pro 用户在 Codex 中的 5 小时速率限制。

研究

Grok 4.5 登上 Cognition 新发布的 FrontierCode 编程基准排行榜

AI 公司 Cognition 推出 FrontierCode 排行榜，这是一个专注于评估 AI 模型编写可合并生产代码能力的新型基准测试。与传统合成基准不同，FrontierCode 强调实际工程价值。Grok 4.5 已出现在排行榜上，与 Kimi K3、Fable 5 等前沿模型同台竞技。这一新基准反映了行业对 AI 编程能力评估标准的升级——从学术合成测试转向真实工程场景。

研究

Google 悄然更新 Gemma 4 31B：单张 RTX 4090 即可运行百万上下文窗口

Google 低调更新了 Gemma 4 31B 密集模型，支持高达 19 万 token 的上下文窗口。Unsloth 团队迅速编译了新量化版本，实测在单张 RTX 4090（24GB 显存）上可达到每秒 33 token 的推理速度。这一进展意味着消费级 GPU 已能运行具备大规模上下文能力的开源前沿模型，VRAM 壁垒正在加速消解，本地部署 AI 的门槛进一步降低。