AI 前沿简报 | 2026-05-26

🔬 论文精选

From Model Scaling to System Scaling: Scaling the Harness in Agentic AI

cs.AI arXiv:2605.26112

从模型规模转向系统规模——研究AI Agent驾驭能力的规模化方法论。当单个模型遇到瓶颈时，如何通过系统架构的扩展来实现Agent能力的持续提升。

Looped Diffusion Language Models

cs.LG arXiv:2605.26106

将扩散模型循环应用于语言生成，探索非自回归文本生成的新范式。循环扩散架构可能打破自回归生成的速度瓶颈。

Claw-Anything: Benchmarking Always-On Personal Assistants with Broader Access to User's Digital World

cs.AI arXiv:2605.26086

首个评估"始终在线"AI个人助手的基准测试，覆盖用户数字世界的广泛访问权限，为下一代OS级AI助手设定评测标准。

OrpQuant: Geometric Orthogonal Residual Projection for Multiplier-Free Power-of-Two Transformer Quantization

cs.LG arXiv:2605.26092

几何正交残差投影实现无乘法器的2的幂次Transformer量化，大幅降低推理硬件成本，有望在边缘设备上运行大模型。

Language Models Need Sleep

cs.CL arXiv:2605.26099

探索语言模型是否需要类似人类睡眠的"休息-重置"机制来维持认知性能，从认知科学角度重新审视LLM的训练与推理。

📢 官方发布

OpenAI · 多项发布

5/22 被Gartner评为企业编码Agent领域领导者 (Codex)
5/20 GPT模型证伪离散几何核心猜想 — AI在纯数学领域取得突破
5/19 推进内容溯源标准，构建更安全透明的AI生态
5/18 与Dell合作：Codex推向混合云与本地部署
5/15 ChatGPT新增个人理财功能
5/14 Codex 随时随地可用 — 多平台扩展

Anthropic · Claude 生态

5/22 Project Glasswing 初始更新发布
5/14 2028: AI全球领导力两种情景 — 前瞻政策分析
5/8 Teaching Claude Why — 减少Agent不对齐的新研究
5/7 自然语言自编码器 — 将Claude思维转化为可读文本

Google · I/O 2026 余波

5/22 I/O 2026 Dialogues回顾 — AI、量子计算、机器人圆桌
5/20 I/O 2026百大公告总结：Gemini Omni、Google Antigravity、Universal Cart
5/19 AI Mode美国用户行为洞察 — 从关键词到自然语言的搜索变革
5/20 Google Beam会议功能 + Workspace AI新体验

🔥 社区热点 (Hacker News)

603 pts

💻 GitHub 趋势

⭐ 37

🤖 AI 前沿简报

🔬 论文精选

From Model Scaling to System Scaling: Scaling the Harness in Agentic AI

Looped Diffusion Language Models

Claw-Anything: Benchmarking Always-On Personal Assistants with Broader Access to User's Digital World

OrpQuant: Geometric Orthogonal Residual Projection for Multiplier-Free Power-of-Two Transformer Quantization

Language Models Need Sleep

更多值得关注的论文

📢 官方发布

OpenAI · 多项发布

Anthropic · Claude 生态

Google · I/O 2026 余波

🔥 社区热点 (Hacker News)

Using AI to write better code more slowly

Norway's 2 Petabytes of Huawei Flash Storage and LLM Training

Use Boring Languages with LLMs

💻 GitHub 趋势

UditAkhourii / adhd

sammwyy / singulary

chunxue-ai / coding-glossary

pguso / mcp-from-scratch

nndl / llm-agent