MLAI

我已经忘了MLAI是什么？

探索主题

记录操作系统编程范式算法 MLAI 计算机架构 Rust 网络统计 k8s 商业数据库风格编译器分布式阅读设计 C++Go

2026（40篇）

Alpa：用于分布式深度学习的算子间与算子内并行自动化 FSMoE：一种用于稀疏混合专家模型的灵活且可扩展的训练系统 The Illustrated Transformer 关于评估大语言模型（LLM）推理系统性能基于 Megatron-LM 的 GPU 集群上高效大规模语言模型训练 Oobleck：大模型分布式训练的容错革命 OpenHands：面向 AI 软件开发者的通用代理开放平台 Parrot：通过语义变量高效服务基于 LLM 的应用 Pie：面向新兴 LLM 应用的可编程服务系统可扩展智能体系统相关汇总机器学习集群效率：使用 ML 生产力吞吐量分析与优化大规模 Google TPU 系统 TrainVerify：基于等价性的分布式大语言模型训练验证方法 WLB-LLM：用于大语言模型训练的工作负载均衡4D 并行方案零气泡流水线并行 AReaL：用于语言推理的大规模异步强化学习系统构建 Claude 技能的完整指南（译文） DeepSeek-R1：基于强化学习的大语言模型推理能力激励方法 METIS：具备配置自适应能力的快速高质量感知 RAG 系统 ADK 开发者必知的 5 种 Agent 技能设计模式 Anthropic：把 AI Agent 的评估做对比把 Agent 做出来更重要 ARC-AGI-3：前沿智能体人工智能的新挑战 Claude Code 自动模式——更安全的权限跳过机制多智能体系统的失败归因不能只有一个答案 HNSW算法笔记基于视觉语言模型的代理化视频分析系统 (AVA) Mem0：构建具有可扩展长期记忆的生产级 AI 代理 MEM1——面向高效长跨度智能体的记忆与推理协同学习框架面向长时间运行应用开发的智能体脚手架（Harness）设计 OpenAI：怎样把 AI Agent 真正做出来让 AI Agent 排行更便宜的一种办法使用 Ayo 框架优化大语言模型应用 The Importance of Agent Harness in 2026 为什么 Agent 的安全问题不是给模型加一道护栏那么简单智能体设计模式：特征/提示链/路由自动代码评审离真正理解人类反馈还有多远把 AI Agent 当成系统来构建，才能真正上线当大模型开始学会装技能包 LLM Wiki MemFactory 正在把记忆型 Agent 的训练变成标准框架 Meta-Harness 正在把提示工程变成可搜索的软件工程