[TIL] 与 Manus 首席科学家季亦超的三小时访谈(被Meta收购)
Source: Dev.to
2026年1月5日
Full Video
概览
- 纪一超回顾了十年 AI 初创公司的历程,涵盖了 Tokenize → LSTM → Transformer 应用的演进以及他两次构建 AI 浏览器的经验。
- 他解释了 Manus 成功的原因在于解决了云服务提供商和模型提供商无法解决的问题——具体来说,是一个能够让 LLM 自主规划任务的强大 工具库。
- AI 代理被比作制造过程,因为它们需要大量的优化。
- Manus 的产品策略强调 “决定不做什么”。
采访片段的快速链接:
Manus 与模型上下文协议 (MCP)
Manus 采用保守的方式使用 MCP,因为动态工具发现会污染 Action Space,降低缓存命中率并增加成本。提出的改进是将 MCP 置于原生 Action Space 之外 调用。
MCP 挑战
- 工具定义 会占满上下文窗口。
- 中间工具结果 消耗额外的 token。
代码执行的优势
- 代理可以 按需加载工具 并在执行环境中处理数据。
- 减少 token 使用 → 降低成本和延迟。
- 改善 隐私保护 和 状态管理。
实现细节
- 使用 TypeScript 生成可用工具的文件树。
- 代理探索文件系统,只加载必要的定义。
- 实现数据过滤、转换和隐私保护操作。
- 支持状态持久化和技能保存。
安全与基础设施
- 需要 安全的沙箱环境,具备资源限制和监控。
- 这些运营需求会增加开销和安全考虑。
Reference: “Code execution with MCP: Building more efficient agents” (Anthropic blog).
PDF on building agents (OpenAI)
AI 能力层级
- 对话式 AI / 聊天机器人
- 人类水平的问题解决 / 推理器
- 代理
- 创新者
- 组织者
(See timestamp: )
影响力论文
-
FLAN‑T5 – Scaling Instruction‑Finetuned Language Models
- 使用 11B 的 FLAN‑T5 模型取得了强劲的结果。
- arXiv:2210.11416
-
Word2Vec – Efficient Estimation of Word Representations in Vector Space
- 引入了高效的数学架构,将文本转换为语义相关的向量,开启了 NLP 深度学习时代。
- arXiv:1301.3781
创业洞见
- “当一群不太笨的人无事可做时,伟大的想法会出现。”(时间戳:)
- 引用:“对于每个复杂的问题,总有一个答案是清晰、简单且错误的。” – H. L. Mencken