amawta
Seguridad LLM

Red team y seguridad para sistemas LLM

Probamos aplicaciones GenAI contra ataques, fallas de automatización y exposición de información sensible.

Los riesgos de un sistema LLM aparecen en prompts, documentos, herramientas, agentes, permisos, logs y decisiones humanas. Los evaluamos antes de que lleguen a operación.

Pruebas principales
01

Prompt injection y abuso de instrucciones

Probamos si entradas de usuario o documentos pueden desviar el comportamiento esperado del sistema.

  • Instrucciones maliciosas
  • Context hijacking
  • Bypass de políticas
  • Manipulación de herramientas
02

Fuga de información

Revisamos exposición de datos sensibles, secretos, documentos internos y memoria conversacional.

  • Sensitive information disclosure
  • Permisos de RAG
  • Filtrado de fuentes
  • Logs y retención
03

RAG poisoning y calidad de fuentes

Evaluamos si documentos contaminados, obsoletos o ambiguos afectan respuestas y decisiones.

  • Poisoning documental
  • Conflictos de fuentes
  • Citas falsas
  • Recuperación fuera de alcance
04

Exceso de autonomía

Probamos agentes, herramientas y automatizaciones para limitar acciones irreversibles o no autorizadas.

  • Excessive agency
  • Tool abuse
  • Insecure output handling
  • Sobreconfianza en outputs
Resultado

Hallazgos priorizados

Riesgos ordenados por impacto, probabilidad y exposición operacional.

Reproducción técnica

Prompts, pasos, evidencias y condiciones para reproducir cada falla.

Controles recomendados

Guardrails, cambios de arquitectura, evaluación, permisos y fallback humano.

¿Tu copiloto o agente ya está cerca de producción?

Antes de escalarlo, conviene probar cómo falla, qué datos expone y qué acciones puede tomar.