MLAI

我已经忘了MLAI是什么?

探索主题

2026(40篇)

Alpa:用于分布式深度学习的算子间与算子内并行自动化 FSMoE:一种用于稀疏混合专家模型的灵活且可扩展的训练系统 The Illustrated Transformer 关于评估大语言模型(LLM)推理系统性能 基于 Megatron-LM 的 GPU 集群上高效大规模语言模型训练 Oobleck:大模型分布式训练的容错革命 OpenHands:面向 AI 软件开发者的通用代理开放平台 Parrot:通过语义变量高效服务基于 LLM 的应用 Pie:面向新兴 LLM 应用的可编程服务系统 可扩展智能体系统相关汇总 机器学习集群效率:使用 ML 生产力吞吐量分析与优化大规模 Google TPU 系统 TrainVerify:基于等价性的分布式大语言模型训练验证方法 WLB-LLM:用于大语言模型训练的工作负载均衡4D 并行方案 零气泡流水线并行 AReaL:用于语言推理的大规模异步强化学习系统 构建 Claude 技能的完整指南(译文) DeepSeek-R1:基于强化学习的大语言模型推理能力激励方法 METIS:具备配置自适应能力的快速高质量感知 RAG 系统 ADK 开发者必知的 5 种 Agent 技能设计模式 Anthropic:把 AI Agent 的评估做对比把 Agent 做出来更重要 ARC-AGI-3:前沿智能体人工智能的新挑战 Claude Code 自动模式——更安全的权限跳过机制 多智能体系统的失败归因不能只有一个答案 HNSW算法笔记 基于视觉语言模型的代理化视频分析系统 (AVA) Mem0:构建具有可扩展长期记忆的生产级 AI 代理 MEM1——面向高效长跨度智能体的记忆与推理协同学习框架 面向长时间运行应用开发的智能体脚手架(Harness)设计 OpenAI:怎样把 AI Agent 真正做出来 让 AI Agent 排行更便宜的一种办法 使用 Ayo 框架优化大语言模型应用 The Importance of Agent Harness in 2026 为什么 Agent 的安全问题不是给模型加一道护栏那么简单 智能体设计模式:特征/提示链/路由 自动代码评审离真正理解人类反馈还有多远 把 AI Agent 当成系统来构建,才能真正上线 当大模型开始学会装技能包 LLM Wiki MemFactory 正在把记忆型 Agent 的训练变成标准框架 Meta-Harness 正在把提示工程变成可搜索的软件工程