Skip to content
Ingeniería

Toda plataforma de IA permite que los agentes ejecuten código. Solo una permite que los administradores lo aprueben.

La ejecución de código para agentes de IA se está convirtiendo en commodity. El diferenciador no es si sus agentes pueden ejecutar código. Es quién decide qué código ejecutan.

JT
JieGou Team
· · 5 min de lectura

Los agentes de IA ahora pueden ejecutar código. Anthropic incluye un entorno de ejecución sandbox. OpenAI Codex ofrece worktrees aislados. E2B y Modal proporcionan infraestructura dedicada de sandbox. La ejecución de código para agentes de IA está en todas partes.

Pero aquí está la pregunta que nadie hace: ¿quién aprueba el código que sus agentes de IA ejecutan?

La superficie de riesgo

Cuando un agente de IA ejecuta código, puede:

  • Acceder a datos a los que no debería tener acceso
  • Consumir recursos más allá de lo razonable (CPU, memoria, red)
  • Producir efectos secundarios que afecten sistemas de producción
  • Exfiltrar información a través de llamadas de red o canales de salida
  • Violar requisitos de cumplimiento al procesar datos regulados de formas no aprobadas

En el sandbox de un desarrollador, estos riesgos son manejables. ¿En un entorno de producción empresarial con datos regulados, PII de clientes y obligaciones de cumplimiento? Son factores decisivos.

Cómo manejan los competidores la ejecución de código

El entorno sandbox de Anthropic

Anthropic ofrece un entorno sandbox en beta — aislamiento de sistema de archivos y red sin sobrecarga de contenedores. Está diseñado para flujos de trabajo de desarrolladores: ejecutar código, ver resultados, iterar. No hay puertas de aprobación de administrador. El desarrollador que ejecuta el sandbox es quien decide qué código se ejecuta.

OpenAI Codex

OpenAI Codex proporciona agentes paralelos con worktrees aislados y diffs revisables. Es una herramienta de desarrollador para generación y revisión de código. El aislamiento está a nivel de worktree — cada agente obtiene su propio directorio de trabajo. No hay flujos de trabajo de aprobación de administrador empresarial.

E2B, Modal y proveedores de sandbox

E2B, Modal y servicios similares proporcionan entornos de ejecución sandbox genéricos. Son infraestructura, no gobernanza. Aíslan la ejecución de código del sistema host, pero no proporcionan ningún mecanismo para aprobar qué código se ejecuta en primer lugar.

La brecha de gobernanza

Todas estas soluciones responden la pregunta: “¿Cómo ejecutamos código de forma segura?” Ninguna responde la pregunta más difícil: “¿Quién decide qué código debe ejecutarse?”

En un contexto empresarial, la respuesta no es “el agente de IA decide” ni “el desarrollador decide”. Es “el administrador decide”. La persona responsable del cumplimiento, la seguridad y el riesgo operacional necesita:

  1. Revisar qué plantillas de código están disponibles para los agentes de IA
  2. Aprobar nuevas plantillas de código antes de que los agentes puedan usarlas
  3. Auditar cada ejecución de código con registro completo de entrada/salida
  4. Limitar el consumo de recursos (tiempo de CPU, memoria, tamaño de salida)
  5. Revocar la aprobación si una plantilla de código causa problemas

El enfoque de JieGou: ejecución de código gobernada

El paso de código de JieGou trata la ejecución de código como un paso de flujo de trabajo gobernado, no un sandbox de desarrollador. Así es como funciona:

Aprobación de código por el administrador

Antes de que cualquier agente de IA pueda ejecutar una plantilla de código, un administrador debe aprobarla. La plantilla de código se revisa, se prueba y luego se agrega a la paleta aprobada. Los agentes solo pueden seleccionar de plantillas aprobadas — no pueden escribir y ejecutar código arbitrario.

Sandbox V8 con límites de recursos

El código se ejecuta en un aislante V8 con límites configurables:

  • Tiempo de CPU: Tiempo máximo de ejecución (predeterminado: 5 segundos)
  • Memoria: Tamaño máximo de heap (predeterminado: 128 MB)
  • Tamaño de salida: Carga máxima de salida

Si una plantilla de código excede cualquier límite, la ejecución se termina inmediatamente.

Registro de auditoría

Cada ejecución de código se registra con:

  • Quién aprobó la plantilla de código
  • Qué entradas se proporcionaron
  • Qué salida se produjo
  • Cuánto tiempo tomó la ejecución
  • Cuánta memoria se consumió

Esto crea una pista de auditoría completa para la revisión de cumplimiento.

Integración con gobernanza

El paso de código se integra en la pila de gobernanza de 10 capas de JieGou. Respeta:

  • Autonomía graduada: En modo “supervisado”, los pasos de código requieren aprobación por ejecución
  • RBAC: Solo los usuarios con permisos apropiados pueden crear o aprobar plantillas de código
  • Alcance departamental: Las plantillas de código pueden tener alcance a departamentos específicos

A quién le importa esto

Si es CISO u oficial de cumplimiento y le piden aprobar la ejecución de código de agentes de IA en su organización, haga a su proveedor de plataforma estas preguntas:

  1. ¿Puedo revisar y aprobar plantillas de código antes de que los agentes las usen?
  2. ¿Se registran las ejecuciones de código con pistas de auditoría completas de entrada/salida?
  3. ¿Puedo establecer límites de recursos en la ejecución de código?
  4. ¿Puedo revocar la aprobación de una plantilla de código?
  5. ¿La ejecución de código se integra con mi marco de gobernanza existente?

Si la respuesta a alguna de estas es “no”, no tiene ejecución de código gobernada. Tiene un sandbox de desarrollador que alguien está intentando poner en producción.

La conclusión

La pregunta no es si sus agentes de IA pueden ejecutar código. Cada plataforma ofrece eso ahora. La pregunta es quién decide qué código ejecutan — y si tiene los controles de gobernanza para tomar esa decisión responsablemente.

Conozca más sobre la pila de gobernanza de JieGou o tome la evaluación de gobernanza para ver cómo se compara su configuración actual.

code-execution governance security enterprise
Compartir este artículo

¿Le gustó este artículo?

Reciba consejos sobre flujos de trabajo, actualizaciones de producto y guías de automatización en su bandeja de entrada.

No spam. Unsubscribe anytime.