安爸-超级家庭

阿里巴巴发布OpenSandbox,为软件开发人员提供统一、安全和可扩展的API以执行自主AI代理。

安爸 发布于

阿里巴巴发布了OpenSandbox,这是一款开源工具,旨在为AI代理提供安全、隔离的环境进行代码执行、网页浏览和模型训练。该项目采用Apache 2.0许可证发布,旨在标准化AI代理堆栈的“执行层”,提供一个统一的API,可以在各种编程语言和基础设施提供商之间运行。这个工具建立在阿里巴巴用于大规模AI工作负载的相同内部基础设施之上。

代理工作流中的技术差距

构建自主代理通常涉及两个组件:“大脑”(通常是一大型语言模型)和“工具”(代码执行、网络访问或文件操作)。为这些工具提供一个安全的环境要求开发者手动配置Docker容器、管理复杂的网络隔离,或依赖于第三方API。

OpenSandbox通过提供一个标准化、安全的环境来解决这一问题,其中代理可以执行任意代码或与接口交互,而不会风险主机系统的完整性。它抽象了底层基础设施,允许开发者使用单个API从本地开发转移到生产规模部署。

架构

OpenSandbox的架构基于一个由四个模块构建的四层堆栈——包括SDK层、规范层、运行时层和沙盒实例层——旨在将客户端逻辑与执行环境解耦。其核心部分,系统使用一个基于FastAPI的服务器来管理沙盒的生命周期(通过Docker或Kubernetes运行时),而通信通过OpenAPI规范(沙盒生命周期和执行规范)进行标准化。在隔离的容器内,OpenSandbox注入一个高性能的基于Go的执行守护进程(execd),它与内部Jupyter内核交互以提供有状态的代码执行、通过服务器端事件(SSE)的实时输出流和全面的文件系统管理,确保“协议优先”的方法在任何基础容器镜像中都保持一致。

(图片略)

https://open-sandbox.ai/overview/architecture

核心技术能力

OpenSandbox被设计成环境无关的。它支持Docker用于本地开发,以及Kubernetes用于分布式、生产级运行。平台提供了四种主要类型的沙盒:

  • 编码代理:针对软件开发任务进行了优化的环境,其中代理可以编写、测试和调试代码。
  • GUI代理:支持完整的VNC桌面,使代理能够与图形用户界面交互。
  • 代码执行:执行特定脚本或计算任务的高性能运行时。
  • RL训练:针对强化学习(RL)工作负载进行了优化的隔离环境,允许进行安全迭代训练。

系统使用一个统一的API,确保无论底层语言或运行时如何,交互模式始终一致。目前,OpenSandbox提供了Python、TypeScript、Java/Kotlin的SDK,C#和Go列在开发路线图上。

集成和生态系统支持

OpenSandbox的一个显著特点是与其现有AI框架和开发者工具的本地兼容性。通过提供一个安全的执行层,它允许基于不同平台构建的代理执行“现实世界”的操作。当前支持的集成包括

  • 模型接口:Claude Code、Gemini CLI和OpenAI Codex。
  • 编排框架:LangGraph和Google ADK(代理开发工具包)。
  • 自动化工具:用于基于浏览器的任务的Chrome和Playwright。
  • 可视化:完整的VNC支持,用于视觉监控和交互。

这意味着代理可以在单次隔离会话中执行“抓取网站并训练线性回归模型”的任务。代理使用Playwright导航网络,将数据下载到沙盒的本地文件系统中,并执行Python代码处理这些数据——所有这些都无需离开安全的OpenSandbox环境。

部署和配置

该项目优先考虑简化开发人员体验(DX)。通过命令行界面设置本地执行服务器需要三个主要命令:

  1. pip install opensandbox-server —— 安装服务器组件。
  2. opensandbox-server init-config —— 为环境生成必要的配置文件。
  3. opensandbox-server —— 启动服务器并公开API以供代理交互。

一旦服务器运行,开发者可以使用提供的SDK以编程方式创建、管理和终止沙盒。

关键要点

  • 统一、语言无关的执行:OpenSandbox为AI代理提供了在代码执行、网页浏览和GUI交互中保持一致的API。尽管目前它支持Python、TypeScript和Java/Kotlin,但C#和Go的SDK已在开发路线图上列出。
  • 基础设施灵活性(Docker & Kubernetes):该工具旨在从开发人员的本地机器无缝扩展到企业级生产。它使用Docker进行本地隔离和Kubernetes进行分布式、大规模部署,消除了在将代理从开发迁移到云端时通常发现的“环境漂移”。
  • 广泛的生态系统集成:它设计成可以直接连接到领先的AI框架和工具,包括LangGraph、Claude Code、Gemini CLI、OpenAI Codex和Google ADK,以及自动化库如Playwright和Chrome
  • 消除“沙盒依赖”:通过提供免费、开源的替代方案(Apache 2.0许可证),阿里巴巴消除了对昂贵的管理沙盒服务的依赖,这些服务按分钟计费或实施供应商锁定。
  • 高保真交互(VNC & Web):除了简单的脚本书写外,OpenSandbox还支持完整的VNC桌面和浏览器自动化。这允许代理在安全、防弹的环境中执行复杂的多模态任务——如在网络界面或使用桌面应用程序中导航——而不会泄露。

查看存储库文档示例。。也欢迎关注我们的Twitter,别忘了加入我们的120k+机器学习subreddit并订阅我们的时事通讯。还有!你还在Telegram上吗?现在你也可以加入我们的Telegram群组。

文章《阿里巴巴发布OpenSandbox,为软件开发者提供统一、安全且可扩展的API进行自主AI代理执行》首先发布在MarkTechPost


扫描二维码,在手机上阅读