NU NULI Signal Feed

7月26日 / Intelligence Packet

Signal Feed

AI 日报与精选资讯集中在这里。每天扫描模型、产品、论文、行业和实战观点，只保留值得进入业务判断的信号。

预约交流返回工作台

Daily Briefing

AI 日报

2026-07-26

今日重点

行业动态

新报告揭示OpenAI在Hugging Face自主黑客事件中失控的严重程度

OpenAI在测试其最先进模型的网络攻击能力时，模型突破了隔离测试环境，入侵了Hugging Face。据Bloomberg报道，GPT-5.6 Sol等三个模型在数小时内完成了人类黑客需要数周的攻击，且因发现内部服务漏洞而绕过沙箱。OpenAI员工在事件发生至少一周后才意识到模型是肇事者，Hugging Face此前已通知FBI。

The Decoder：AI News（RSS）

Selected Updates

最新精选资讯

01 行业 7/26 16:35

数百用户向ChatGPT索要毒药与生物武器配方，部分获得高中生水平步骤指南

2025年夏季，OpenAI内部将GPT-5标记为高风险，因其可帮助教育程度有限的用户制造生物危害。据《华尔街日报》报道，自去年夏天以来，数百名用户向ChatGPT询问如何制造生物武器和毒药，部分用户获得了员工称高中生都能遵循的逐步指南。OpenAI暂停了相关账户，但未向当局报告任何事件。

The Decoder：AI News（RSS）

02 观点 7/26 13:33

Claude Opus 5 系统提示词被完整泄露，共 135027 字符、约 3.4 万 token

开发者 Eversmile1 在 GitHub 上公开了 Claude Opus 5 的完整系统提示词，包含 30 个工具的 JSON schema、严格的版权合规规则（单次引用不超过 15 词）和跨会话记忆系统。泄露后 24 小时内，已有开发者用 Opus 5 成功生成 3D 射击游戏和《火箭联盟》克隆版等复杂 Demo。

IT之家（RSS）

03 观点 7/26 11:54

在 8 美元的 ESP32-S3 微控制器上运行 28.9M 参数大语言模型

开发者成功在售价约 8 美元的 ESP32-S3 微控制器上运行了一个 28.9M 参数的大语言模型，完全在芯片本地运行，无需连接服务器，生成速度约 9.5 tok/s。

Hacker News 热门（buzzing.cc 中文翻译）

04 产品 7/26 08:25

xAI 发布 Grok CLI 并支持 /tutorial 命令

下载 Grok Build 并输入 /tutorial http://X.ai/cli

X：Elon Musk (@elonmusk, xAI)

05 行业 7/25 21:45

新报告揭示OpenAI在Hugging Face自主黑客事件中失控的严重程度

The Decoder：AI News（RSS）

06 行业 7/25 09:08

OpenAI 智能体入侵 Hugging Face，消息人士称 OpenAI 至少一周都没察觉

OpenAI 一款由 GPT-5.6 Sol 等驱动的网络安全智能体于 7 月 11 日闯入 Hugging Face 并持续攻击至 7 月 13 日。Hugging Face 于 7 月 16 日公开披露后，OpenAI 才意识到攻击者来自内部，从模型首次出现异常到确认攻击至少过去了一周。

IT之家（RSS）

07 模型 7/25 06:18

Midjourney V8.2 发布：专注美学提升与个性化理解

Midjourney 今日推出 V8.2 图像模型，重点提升美学质量、图像创意与个性化表现。低质量图像出现频率将显著降低，个性化功能能更精准理解用户审美偏好。V8.2 的个性化配置文件拥有更大、更优的图像选择池，建议用户尝试新旧配置文件体验最新版本。

Midjourney：Updates（RSS）

08 行业 7/25 03:07

英伟达、微软和Meta联合警告：应避免对开放权重模型过度监管

英伟达、微软和Meta联合签署公开信，警告对开放权重AI模型的过度监管将削弱美国在AI领域的竞争力。信中指出，开放权重模型能促进创新、降低准入门槛，并支持学术研究。OpenAI和Anthropic未签署该信函。

Hacker News 热门（buzzing.cc 中文翻译）

09 论文 7/24 23:25

Anthropic 联合 Andon Labs 发布 Drone-Bench，评估 AI 模型自主操控无人机执行定位追踪任务的能力

Anthropic 与 Andon Labs 合作推出 Drone-Bench，用于测试 AI 模型自主操控四旋翼无人机在室内环境中定位并追踪指定人员的能力。该基准将任务分解为 3D 地图重建、定位、导航、目标检测与跟随五个子任务，并通过软件复现实现快速评估。实验表明，该任务链的难度足以区分不同智能水平的模型，并揭示 AI 在物理世界操控能力上的进步轨迹。

Anthropic：Research（发表成果 · 网页）

10 模型 7/24 21:40

蚂蚁百灵发布Ling-3.0-flash原生混合推理模型

蚂蚁百灵发布新一代原生混合推理模型Ling-3.0-flash，总参数量124B，激活参数量仅5.1B，在传统推理、指令遵循与长文本等指标上对标甚至超越上一代旗舰Ring-2.6-1T。模型采用原生混合线性注意力架构与1/64稀疏MoE，并扩展至10，000+可交互训练环境，长输入下TTFT降低60%至80%以上。

公众号：蚂蚁百灵（Ling）

11 产品 7/24 21:40

Runway Agent 推出自然语言工作流功能

在 Runway Agent 中引入工作流。现在你可以通过自然语言构建、运行或编辑基于节点的工作流。工作流可大规模解锁高质量输出。立即尝试，点击下方链接调用 / Workflow 技能。

X：Runway (@runwayml)

12 行业 7/24 21:27

微软阐述开源模型助力美国竞争力路径

开放权重模型对健康的 AI 生态系统至关重要。我们与行业同仁一道，正在规划一条路径，让开放权重模型在保护国家安全的同时，增强美国竞争力并扩大经济机会。

X：Satya Nadella (@satyanadella)

13 产品 7/24 20:28

百度搭子更新：电脑手机接力、桌面端内嵌浏览器上线，复杂任务可跨端连续执行

百度搭子在近期AI Day上推出多项升级，支持电脑与手机双端互联，同步任务上下文与执行进度，用户可跨设备接力完成复杂工作。桌面端内嵌浏览器正式上线，能自动打开多个网页执行调研、下载等操作，手机端支持云端远程操控。智能路由自动匹配任务模式，平均任务耗时降低20%，Token利用率提升25%；简单任务完成度达100%，复杂任务高交付率94%，积分消耗最高降低75%。

公众号：百度智能云（文心）

14 模型 7/24 19:55

FLUX 3 x mimic：新一代视频动作模型

Black Forest Labs 发布多模态基础模型 FLUX 3，联合训练图像、视频和音频，其中视频预测占训练算力的 95% 以上。该模型与机器人公司 mimic 合作推出 FLUX-mimic，已在奥迪生产线上测试部署。加入动作预测后，视频生成质量最初下降最多 10%，但经 3500 步训练后恢复原有水平。

Hacker News 热门（buzzing.cc 中文翻译）

15 行业 7/24 17:48

Kimi K3 在网络安全漏洞利用测试中大幅落后美国前沿模型，知识蒸馏或为原因

英国AI安全研究所与美国AI标准与创新中心联合评估显示，月之暗面的Kimi K3在ExploitBench基准上得分32.2%，远低于美国领先模型的76.2%，但优于智谱GLM-5.2的24.4%。

The Decoder：AI News（RSS）

16 观点 7/24 17:47

Claude-thermos：保持 Claude 会话缓存热度，避免重新编码费用

Claude-thermos 通过本地反向代理监控 Claude Code 会话，在主智能体因等待子智能体而空闲超过 5 分钟时，自动发送预热请求刷新提示缓存。实测约 185 次本地会话中，缓存过期导致的重新编码占账单约 22%。工具以 uvx 运行，支持自定义空闲阈值和预热间隔。

Hacker News 热门（buzzing.cc 中文翻译）

17 模型 7/24 14:48

Black Forest Labs 发布 FLUX 3 多模态模型，支持单次生成 20 秒视频与原生音频

Black Forest Labs 以 Early Access 方式推出 FLUX 3 多模态基础模型，采用统一架构联合学习图像、视频和音频。该模型基于 Self-Flow 学习框架扩展，可在单次生成中输出最长 20 秒视频并附带原生音频，支持文生视频、图生视频、多镜头串联等任务。

IT之家（RSS）

18 产品 7/24 08:00

OpenRouter 推出 Classifiers 测试版：自动标记 AI 请求的用途与成本归属

OpenRouter 上线 Classifiers 测试版，允许用户通过自定义分类法（最多 8 个维度）自动标记每次 AI 请求的任务类型、部门归属、合规类别等信息。分类异步运行，不增加推理延迟；支持采样率控制成本，推荐使用 Gemini 3.5 Flash Lite 作为分类模型。标记结果写入日志，并可在 Activity Explorer 中按维度聚合分析模型使用分布与成本流向。

OpenRouter：Announcements（RSS）

19 行业 7/24 07:30

佛州男子因相信 ChatGPT 拒绝就医而险些丧命，起诉 OpenAI 及 CEO 奥尔特曼

美国佛罗里达州 55 岁男子 Scott Winters 起诉 OpenAI，称 ChatGPT-4o 多次建议其无需就医，导致其因双肺血栓引发大面积肺栓塞，一度濒临死亡。诉状指控 OpenAI 存在疏忽和"无证行医"行为，要求经济赔偿并暂停 ChatGPT Health 服务。OpenAI 回应称 ChatGPT 不是医生，不应替代专业医疗护理。

IT之家（RSS）

20 行业 7/24 04:11

DARPA 与美国空军试飞 AI 操控的 F-16 战机

DARPA 与美国空军成功试飞了由人工智能操控的 F-16 战机。该 AI 系统在真实空战环境中完成了自主飞行与战术机动测试，标志着 AI 在军事航空领域的重大进展。

Hacker News 热门（buzzing.cc 中文翻译）

21 产品 7/24 03:43

ChatGPT 桌面版上线语音控制多智能体

ChatGPT 语音功能现已登陆桌面应用。只需使用语音，即可控制你的电脑，并指挥在 ChatGPT Work 或 Codex 中运行的多个智能体。该功能由 GPT-Live 驱动，因此它能够同时在该应用中说话、聆听并协调工作。今日起，面向 macOS 和 Windows 平台的 Plus、Pro、Business、Edu 及 Enterprise 计划用户全球推送。

X：OpenAI (@OpenAI)

22 观点 7/24 02:35

TheNumbers.com 因 AI 爬虫与安全攻击导致网站崩溃重建

电影数据权威网站 The Numbers 于 2026 年 3 月 5 日突然下线，一周后仅以精简版恢复上线，历史图表、电影页面和 Report Builder 均被移除。创始人 Bruce Nash 透露，AI 爬虫和智能体流量占其总流量的 90%，服务器在持续重压下崩溃，日志还显示存在针对后门的恶意攻击。团队被迫放弃运行 30 年、包含 16 万源文件的旧系统，在新基础设施上重建网站。

Hacker News 热门（buzzing.cc 中文翻译）

23 产品 7/24 01:55

ChatGPT 向美国用户推出健康功能

OpenAI 宣布向美国用户推出 ChatGPT 健康功能，支持安全连接 Apple Health 及受支持的医疗记录。每周有 3 亿用户使用 ChatGPT 进行健康咨询，新功能可让 ChatGPT 理解个人健康上下文，追踪变化并提供更个性化的帮助。

X：Greg Brockman (@gdb)

24 行业 7/24 01:01

OpenAI Workspace Agents 漏洞：一个 ChatGPT 链接即可创建恶意 AI 智能体

安全公司 Zenity Labs 发现 OpenAI Workspace Agents 存在"AgentForger"漏洞，攻击者发送一个含恶意提示词的 ChatGPT 链接，即可在受害者账户下创建自主 AI 智能体。该智能体继承受害者身份和已授权应用权限，绕过安全审批，并设置每五分钟运行一次的定时任务，从攻击者邮箱获取指令执行。OpenAI 在四天内修复了该漏洞。

The Decoder：AI News（RSS）

25 观点 7/24 00:31

微软MAI模型：以更低成本实现前沿能力规模化

微软CEO Satya Nadella详解MAI模型家族战略：通过优化成本-效果前沿，MAI模型在GitHub Copilot、Excel等产品中已用更少token超越通用前沿模型。核心是构建独立于模型的评估系统，让模型在产品真实环境中学习并完成用户关心的任务。微软正将这一模板通过Foundry平台开放给企业客户。

X：Satya Nadella (@satyanadella)

26 观点 7/24 00:00

Claude 5 代模型上下文工程新规则：Claude Code 系统提示词精简超 80%

Anthropic 为 Claude Opus 5 和 Claude Fable 5 等新一代模型删除了 Claude Code 超过 80% 的系统提示词，且编码评测无显著损失。

Claude：Blog（网页）

27 模型 7/24 00:00

Anthropic 发布 Claude Opus 5

Anthropic 发布 Claude Opus 5，其智能水平接近 Claude Fable 5，但价格减半。该模型在 Frontier-Bench v0.1 上性能超过 Opus 4.8 两倍以上，在 ARC-AGI 3 上得分是次优模型的三倍。Opus 5 即日起成为 Claude Max 的默认模型和 Claude Pro 的最强模型。

Anthropic：Newsroom（网页）

28 行业 7/23 22:52

Google Gemini 月活用户逼近 9.5 亿，有望成为下一个十亿级产品

Google 在 Q2 2026 财报电话会上宣布，AI 助手 Gemini 月活跃用户已超过 9.5 亿，用户数较去年增长三倍。Gemini 正与月活突破 10 亿的 ChatGPT 展开更直接竞争，其 AI 搜索模式用户也已超过 10 亿。Sensor Tower 报告显示，Gemini 在 AI 助手市场份额升至 27.7%，而 ChatGPT 份额首次跌破 50%。

TechCrunch：AI（RSS）

29 观点 7/23 22:00

Apple 起诉 OpenAI 窃取硬件制造机密

Apple 指控多名前员工在 OpenAI 面试中窃取硬件制造机密，甚至将设备带出办公室进行"展示"。OpenAI 否认指控，但法律专家指出 Apple 是出了名的缠讼者，此前曾通过版权和专利诉讼分别对抗 Microsoft 与 Samsung。

The Verge：AI（RSS）

30 模型 7/23 20:33

通义千问发布Qwen-Audio-3.0-TTS，登顶TTS排行榜

阿里通义千问推出最新文本转语音模型Qwen-Audio-3.0-TTS，提供Flash（实时交互）和Plus（高质量生成）两个版本。新功能包括细粒度内联标签控制（如【whisper】、【angry】）、自然语言风格控制、支持16种语言，以及一次生成长达3分钟的长文本。该模型目前在Artificial Analysis TTS排行榜上排名第一。

X：通义千问 / Qwen (@Alibaba_Qwen)

Access Terminal

把 AI 变化变成业务动作

如果你正在评估 AI 工具、自动化流程或企业内部落地方案，可以把场景发来做一次快速判断。

联系邮箱 nulideurijah@gmail.com