01 行业 5/28 22:00
AI模型聚合平台OpenRouter宣布完成1.13亿美元B轮融资。本轮融资由CapitalG领投,NVentures、ServiceNow Ventures等多家机构参投,现有投资者Andreessen Horowitz与Menlo Ventures也参与了本轮融资。
OpenRouter:Announcements(RSS) 02 论文 5/28 18:47
Mistral AI通过收购Emmi AI,强化其在推动AI研究前沿与工业工程解决方案方面的投入。其目标是为航空航天、汽车、半导体和能源等塑造物理世界的核心产业构建基础性物理AI模型,以加速工程开发。此项研究基于一系列已发表的突破性成果,包括:用于模拟超音速湍流的3D机翼CFD数据集、计算流体动力学基础模型的前瞻综述、应用于汽车与航空的AB-UPT模型,以及用于聚变等离子体湍流模拟的GyroSwin模型。此前已开源的UPT(通用物理Transformer)和NeuralDEM等成果也为此研究奠定了基础。
Mistral AI:News(网页) 03 行业 5/28 18:47
Mistral AI 在 AI Now Summit 2026 上宣布多项进展。其工业 AI 解决方案"Mistral for Industrial Engineering"整合了物理模型与工程知识,正与空客、宝马集团和 ASML 合作,加速工程设计与优化。AI 智能体产品 Vibe 进行了升级,增强了推理和智能体任务能力。此外,公司计划在 2026 年第三季度启用位于 Les Ulis、功率达 10 MW 的新数据中心,专注推理操作以增强算力安全。
Mistral AI:News(网页) 04 行业 5/28 16:42
Qwen3.7-Max 以 77.3B tokens 的使用量登顶 @OpenRouter 热门大语言模型榜单。
而我们才刚刚开始。
👇 https://int.alibabacloud.com/m/1000413314/
X:阿里云 / Alibaba Cloud (@alibaba_cloud) 05 观点 5/28 16:07
本教程在Google Colab中构建一个完整的pgvector实验环境,展示PostgreSQL如何作为向量数据库服务于现代AI应用。内容涵盖安装PostgreSQL、编译pgvector扩展、通过Psycopg建立连接,并注册向量类型以实现与Python的平滑集成。最后使用SentenceTransformers创建并存储嵌入向量。
MarkTechPost(RSS) 06 行业 5/28 16:02
可灵AI将在全球最大AI影视会议AI on the Lot的社区日上,展示由Prompt Club的电影制作人创作的20部原创AI短片。所有短片均为原生4K分辨率,旨在探索AI电影的边界。该展示将于5月29日在加州卡尔弗市的卡尔弗剧院举行。
X:可灵 Kling AI (@Kling_ai) 07 产品 5/28 11:33
🚀 认识 DataWorks Data Agent--阿里云的AI数据智能体!
借助AI简化数据工作流,加速洞察,让数据管理更智能。
了解更多:https://int.alibabacloud.com/m/1000413560/
#AlibabaCloud #DataWorks #AI #DataAgent #BigData #DataAnalytics
X:阿里云 / Alibaba Cloud (@alibaba_cloud) 08 产品 5/28 10:19
在阿里云市场遇见 MuleRun--一个全天候的AI劳动力,用于研究、报告、代码、设计等。功能强大,适合个人使用;企业就绪,适合团队协作--支持SSO、RBAC、私有网络、团队知识管理和无缝集成。
想得更大。让 MuleRun 处理其余事务。
方案起价 $20/月 → https://int.alibabacloud.com/m/1000413520/
#AlibabaCloud #AIAgents #AIWorkforce #FutureOfWork #EnterpriseAI
X:阿里云 / Alibaba Cloud (@alibaba_cloud) 09 观点 5/28 10:14
英伟达研究团队开源了智能体强化学习框架 Polar。该框架无需重写现有智能体执行框架(如 Codex CLI、Claude Code、Qwen Code、Pi),通过在模型 API 边界放置智能体来接入 GRPO 训练。实验显示,基于 Qwen3.5-4B 模型,Polar 将 Codex 在 SWE-Bench Verified 上的 pass@1 分数从 3.8% 提升至 26.4%(增涨 594.74%)。效率上,其 prefix_merging 技术将训练步骤从 1185 次降至 218 次,速度提升约 5.39 倍,GPU 平均利用率从 20.4% 升至 87.7%。
IT之家(RSS) 10 观点 5/28 09:24
华为何庭波提出半导体新演进路径"韬(τ)定律",以"时间缩微"(如逻辑折叠)替代"几何缩微"作为新指导原则。她表示,过去6年华为已基于此自主研发381款芯片。今年秋季将发布新的麒麟手机芯片,这是首个完整的"韬芯片",其性能、集成度相比去年是"跳跃性"提升。
IT之家(RSS) 11 观点 5/28 07:09
用好 Coding Agent 的关键在于初始规划。方法是先将需求整理后,用最强模型(如 GPT-5.5、Claude Opus 4.7)分别在 Codex、Claude Code、Cursor 的 Plan 模式下生成设计方案,选择最优方案并借鉴其他版本。对于复杂计划,可将其拆分为多个 Phases 并明确要求与验证标准,形成 Markdown 文档。执行时按 Phases 进行,并辅以人工审核纠偏。最后的代码审核(Code Review)用 GPT-5.5 审核代码质量与设计符合度即可。应避免让多个智能体交叉 Review,否则可能导致代码越改越多。
X:宝玉 (@dotey) 12 论文 5/28 07:07
一项针对1260名定量社会科学家的调查显示,虽然81%的受访者用过AI聊天机器人,但仅有20%将Claude Code、Codex等编码智能体常规应用于工作。采用率存在显著差异:以男性名字命名的研究者使用率是女性研究者的两倍;顶尖大学研究者可能性高出40%。用户产出更多工作论文和基金申请,但这可能反映早期采用者自身差异。研究者对AI助力撰写可发表论文更乐观,但对重塑整个社会科学领域持保留态度。这是一项初步调查,更深入研究仍在进行中。
Anthropic:Research(发表成果 · 网页) 13 观点 5/28 06:07
本文分享了使用 Claude Opus 构建威胁模型、发现代码漏洞并进行验证、分类和修复的最佳实践。其核心流程是一个六步循环:威胁建模、沙箱隔离、漏洞发现、验证、分类和修复。作者指出,漏洞发现现在易于并行化,瓶颈已转移到后续的验证与处理阶段。以他们对开源软件的扫描为例,截至2026年5月22日已披露1,596个漏洞,其中97个已修补。指南建议结合代码库文档和专家访谈来构建准确的威胁模型,以降低误报,提升发现的可利用性。
Claude:Blog(网页) 14 行业 5/28 03:23
Cognition宣布已成为全球最大的独立智能体实验室。公司完成超10亿美元融资,估值达260亿美元,由Lux Capital、General Catalyst等领投。其企业使用量自年初增长超10倍,年化收入增至4.92亿美元。Cognition于两年前推出Devin,定位为首个AI软件工程师。公司强调其拥有多项领先优势,包括首个编码智能体、顶级代码审查能力等,并得到了Peter Thiel的重大投资。
X:swyx (@swyx) 15 产品 5/28 02:44
对话模式在文本和语音输入方面进行了改进。语音会话开始时,可访问用户的图像提示、风格参考、侧边栏设置和最近任务。图像提示功能现可从托盘和侧边栏直接使用。在语音提交过程中,托盘中的图像将保持不变,直至用户手动移除。
Midjourney:Updates(RSS) 16 产品 5/28 02:29
您的团队可以在内部网络中保留MCP服务器,同时ChatGPT、Codex和Responses API通过仅出站HTTPS进行连接。
X:OpenAI Developers (@OpenAIDevs) 17 观点 5/28 02:06
Anthropic 发布了针对企业部署自主 AI 智能体的安全框架,指出前沿大语言模型正将漏洞利用周期从数月压缩至数小时。部署智能体面临双重风险:基础设施易受 AI 加速攻击,且智能体自身具备自主决策与执行能力。文章提出一个三层零信任架构(基础、高级、优化级)及八阶段实施流程,并概述了提示注入、工具投毒、记忆投毒等特有威胁。
Claude:Blog(网页) 18 产品 5/28 01:59
OpenCode x MiMo V2.5 - 限时免费
1M 上下文 • 推理 • 文本 • 图像
X:opencode (@opencode) 19 产品 5/28 01:58
🚀仅需7秒即可生成30秒1080p视频!
我们开源了FastVideo Dreamverse:基于单张NVIDIA B200 GPU和LTX-2模型,实现实时视频生成的氛围引导工具。
Repo: https://github.com/hao-ai-lab/FastVideo/tree/main/apps/dreamverse
Blog: https://haoailab.com/blogs/fastvideo-dreamverse-release/
X:Sky Computing Lab (@haoailab) 20 产品 5/28 01:39
Google Pay 正向"智能体商务"演进,推出了通用商务协议和新的 MCP 服务器,允许 AI 智能体管理集成与分析趋势。Android 平台更新引入了动态回调以支持快速结账,并通过 WebView 将支付功能扩展至社交媒体应用。此外,平台还推出了跨设备生物认证和新的交易信号,旨在帮助商家减少流程摩擦。
Google Developers Blog(RSS) 21 论文 5/28 01:34
Google Research 推出了一种新的隐私分析解决方案。该方案结合了一种新的密码学安全聚合协议与可信执行环境(TEE)的透明性,旨在实现前沿的隐私与安全保证。其核心是基于零信任原则,通过密码学与硬件保护的结合,确保系统仅能获取群体的匿名化聚合洞察。
Google Research:Blog(网页) 22 行业 5/28 01:33
黄仁勋展示了新的台湾园区。
英伟达计划每年在台湾投资约1500亿美元。
就在竞争对手AMD宣布将向台湾AI领域投资超过100亿美元一周后。
X:Rohan Paul (@rohanpaul_ai) 23 行业 5/28 01:30
Replit 被列入 @Redpoint 的 2026 InfraRed 100 榜单。
这是一份构建 AI 运行基础设施的公司名单。很荣幸能入选,与 Stripe、Snowflake 和 HashiCorp 等往届入选者并列。
致每一位在 Replit 上发布产品的构建者:这份荣誉属于你们。
https://www.redpoint.com/infrared/report/
X:Replit (@Replit) 24 论文 5/28 01:20
由Artificial Analysis和IBM推出的ITBench-AA SRE基准测试显示,所有前沿大模型得分均未超过50%。Claude Opus 4.7(自适应推理,最大努力)以47%领先,GPT-5.5(xhigh)和Qwen3.7 Max分别得46%和42%。该测试包含59个需要通过Shell命令调查Kubernetes事件快照并提交根因诊断的智能体任务。关键发现是模型推理轮次差异近3倍,但更长的轨迹并不转化为更高准确率,过度调查的模型会因提交误报而受罚。在成本方面,开源模型Gemma 4 31B(Reasoning)以每任务$0.14的成本获得37%得分,优于成本更高但得分更低的闭源模型。
Hugging Face:Blog(RSS) 25 观点 5/28 00:38
Anthropic 与 OpenAI 通过编程智能体找到了产品市场契合点,这导致企业客户成本显著上升。两家公司已于 2026 年 4 月前后调整了企业套餐定价,从原先的高额折扣改为与 API 用量挂钩。Anthropic Enterprise 套餐变为每席位 20 美元/月外加 API 费用,OpenAI Codex 则按 API token 用量计费。同期发布的新模型 GPT-5.5(4月23日)和 Opus 4.7(4月16日)的 API 定价也显著高于前代版本。
Simon Willison 博客 26 论文 5/28 00:34
Qwen3.5在TokenSpeed推理引擎上,针对智能体工作负载达到了创纪录的580 tokens per second (tps)速度。这一成果由通义千问推理团队、lightseekorg Foundation TokenSpeed团队、NVIDIA及Mooncake团队共同实现,并采用了tri_dao的FlashAttention-4 (FA4) 优化。此里程碑标志着开源大语言模型推理性能的边界得到了推动,相关详情可查阅PyTorch社区博客。
X:通义千问 / Qwen (@Alibaba_Qwen) 27 观点 5/28 00:12
本文记录了与Google搜索产品副总裁Robby Stein在Google I/O的访谈,核心探讨Google Search向"AI原生"模式的重大转变。讨论话题包括AI Mode是进化还是重塑、如何将复杂问题拆解为多轮搜索、AI搜索的高运行成本、Google TPU及基础设施的优势、AI时代搜索量不减反增的原因,以及优质AI回答与出版商流量之间的张力。访谈还涉及Google决定展示哪些信息源与链接的逻辑,并围绕一个核心问题展开:如果Google直接给出答案,传统的基于链接的网页生态将走向何方?
X:Kim (@kimmonismus) 28 产品 5/28 00:01
在 @kilocode 中使用您的 SuperGrok 或 X Premium+ 订阅。
尝试 grok-build-0.1,享受高速和智能体编程智能,可在 Kilo IDE 扩展或 CLI 中使用。
https://x.ai/news/grok-kilocode
X:xAI (@xai) 29 产品 5/27 23:55
我们开源了重新构建的Unigram分词器,可将CPU占用降低5-6倍。
小型重排序器和嵌入模型在GPU上运行时间仅为个位数毫秒,使得CPU分词成为总延迟的重要组成部分。
http://github.com/perplexityai/pplx-garden
X:Perplexity (@perplexity_ai) 30 产品 5/27 23:48
Claude Marketplace 新增成员:@augmentcode、@boltdotnew、@coderabbitai、@hebbia 和 @WeAreLegora。
您现有的 Anthropic 消费承诺可用于购买其 Claude 驱动的产品。
了解更多:http://claude.com/platform/marketplace
X:Claude (@claudeai)