Learn how Manus is built

Friday, June 6, 2025

以下内容均来自公开的互联网信息

为什么要关注 Manus?

在 2025 年,一款全新的通用型人工智能代理产品——Manus 发布,它不是另一个 Chatbot,而是一个能“自己动手做事”的超级智能助理。

Manus 其名称灵感源自 MIT 的校训“Mind and Hand”(思维与手),寓意着一个“有手有脑”的智能助理,不仅象征着思维的延展,更赋予了大模型“付诸行动”的能力,可以说是非常形象的寓意。

image-20250616001128247

传统的 Workflow 通常需要你预先定义好每一步的规则,非常死板,而 Manus 的设计哲学是“Less Structure, More Intelligence”,目标是不希望预设一些规则,而是希望充分发挥大模型的潜力。

这意味着,无论你是市场分析师还是软件工程师,它都能灵活适应你的复杂需求。

这种设计拓宽了应用场景的边界,使用户在不同行业中能够完成多种复杂任务。

例如,在简历筛选任务中,Manus 能自动打开文件、提取关键信息,并生成候选人排名建议。

Manus 如何“动手做事”?

底层模型选择——为什么选 Claude?
  1. 采用 Anthropic 的 Claude 作为首选模型,比传统 Chatbot 更擅长多轮推理与任务执行。
  2. 能力覆盖:哪怕有几十轮复杂交互,强指令遵循,适配 Agent 场景。
基础设施——弹性、低成本、强隔离

要让 AI 不仅会“说”,还要会“做”,需要一个既强大又安全的执行环境。 Manus 的整个系统构建在 AWS 之上,其架构可以分为三个核心部分:

  1. 一个坚固的“堡垒”(外网防护)
  2. 一个智能的“大脑”(内网核心)
  3. 一套高效的“流水线”(CI/CD 与监控)

在基础设施层面,Manus 几乎全部能力都构建在 AWS 上,依托 AWS 的 Firecracker 技术为每个任务快速创建轻量虚拟机,支持随时暂停、恢复或销毁。

Manus 整体架构图:

image-20250616011227440

外网环境安全防护

用户通过各类设备访问系统时,首先经过 WAF(Web Application Firewall)的安全过滤,防止常见的 Web 攻击。

Route 53 提供高可用的 DNS 解析服务,并进行智能流量路由。

CloudFront 作为 CDN,将内容缓存到用户附近的边缘节点,有效降低延迟并提升性能。

Application Load Balancer 则负责将应用流量智能分发到多个目标及不同可用区,提高应用的整体可用性与容错性。

内网环境核心组件

内网环境是整个系统的核心,包含三个关键组件:Server Cluster、API Cluster 和 Client Cluster。

Server Cluster 承担着底层服务编排与发现的重任。

Nomad 集群作为 HashiCorp 的编排工具,负责在集群内部署和管理应用,为 API 和 Client 集群提供服务编排、调度和管理能力。

Consul 集群则主要提供服务发现能力,这对微服务架构至关重要。

API Cluster 是内部应用逻辑的入口,API service 是核心逻辑处理模块,处理用户请求并与后端组件进行交互,如 RDS PostgreSQL 和 Redis 进行交互。

Client Proxy 作为 API service 与 Client Cluster 之间的代理,负责路由或认证,保障执行环境的安全通信。

Client Cluster 是动态执行环境的核心,Orchestrator 管理 FireCracker Sandboxes 的完整生命周期,包括启动、销毁及与沙箱协调通信。

FireCracker Sandboxes 是由 AWS 开发的轻量级虚拟机监控器管理,提供强隔离与安全性,特别适合运行不可信或动态工作任务。

Session-Proxy 负责沙箱化环境内的用户会话状态管理与路由,而 docker-reverse-proxy 则表明系统在 Firecracker 提供的隔离环境中同时利用了容器化能力。

CI/CD 与监控体系

Manus 建立了完整的 CI/CD 流水线,开发者将代码推送到 GitHub 后,自动化构建流程会生成容器镜像并推送到 ECR(Elastic Container Registry),同时将其他构建产物也上传至 S3。

Build Cluster 中的 template-manager 负责管理模板,用于配置或预置 FireCracker Sandboxes 及其部署镜像。

监控与可观测性方面,系统采用了业界流行的工具栈。

OpenTelemetry 作为主流标准,提供 API 和 SDK 工具用于软件埋点、数据生成与收集。

VECTOR 作为高性能可观测性数据路由器,负责收集、转换并路由来自各集群的日志、指标和 Trace 等相关数据。

Prometheus 负责采集并存储指标数据,Grafana Tempo 处理分布式链路追踪,Grafana Loki 进行日志聚合,而 Grafana 则提供统一的数据可视化和仪表盘。

如何在云端放心运行 AI 生成的代码?

Manus 沙箱环境使用的是一家名为 E2B 的产品,它的核心功能是在一个安全的、隔离的云端沙盒中执行由 AI 生成的代码。

这意味着开发者可以将 E2B 集成到自己的应用程序中,让 AI 能够安全地运行代码、处理文件、访问互联网、执行终端命令,甚至进行复杂的数据分析和可视化。

E2B 支持多种编程语言和框架,可以与 OpenAI、Anthropic、Llama 等任意大语言模型配合使用,旨在将大语言模型从一个文本生成工具,转变为一个能实际操作、解决复杂任务的“程序员”

E2B 主要解决了开发者在构建和运行 AI 应用,尤其是 AI 智能体时遇到的几大核心痛点:

  1. 安全性问题:执行由 AI 自动生成的代码存在很大的风险,甚至会对系统造成破坏。

E2B 通过使用 Firecracker microVM 技术,为每一次代码执行都提供一个完全隔离的沙盒环境,确保了代码在执行过程中的绝对安全,解决了运行不可信代码的根本担忧。

  1. 开发复杂度和时间成本:自建一个安全、稳定且可扩展的代码执行环境非常耗时耗力。

  2. 性能与可扩展性:对于需要大规模运行代码的应用(例如代码基准测试或高并发的 AI 应用),性能和扩展性至关重要。E2B 的沙盒启动时间极快,并且能够支持很长的长会话保持。

  3. 集成与兼容性:开发者通常会使用各种不同的大语言模型和开发框架。E2B 提供了对 Python 和 Node.js 的原生支持,并展示了与 OpenAI、Anthropic、Mistral、LangChain、LlamaIndex 等多种主流模型和框架的集成代码示例,确保了开发者可以轻松地将其接入到现有的技术栈中。

E2B 有很多知名的客户,如 Perplexity、Hugging Face 等,当然也包括本文介绍的 Manus。


Manus 官方入口

AIManus