La irrupción de los Large Language Models (LLMs) ha transformado la forma en que interactuamos con la inteligencia artificial, pero también ha abierto la puerta a nuevos vectores de ataque. Entre ellos, los prompt injections se han convertido en una de las técnicas más estudiadas, al demostrar cómo una simple instrucción maliciosa puede alterar el comportamiento esperado de un modelo.

Estas técnicas iniciales de manipulación evolucionan hacia escenarios más críticos, que van desde la exfiltración de información sensible hasta posibles intentos de remote code execution (RC). El objetivo es entender no solo los riesgos, sino también las implicancias en la seguridad de los sistemas que integran LLMs en aplicaciones del mundo real. De esto es justamente de lo que se trató esta interesante charla de ciberseguridad presentada por Galoget Latorre. Comparto a continuación algunos puntos que rescaté para estudiar en mayor profundidad.

1. Con la aparición de los LLMs, aparecen nuevos conceptos de ataque

Por solo nombrar algunos ejemplos: Direct Prompt Injection, Indirect Prompt Injection, Jailbreaks, Context Poisoning, Meta Prompting, etc. Es decir, se abre un completo abanico de riesgos y posibilidades de ataque asociados a la IA.

Tipos de prompt injection 8.8

2. Las codificaciones (encodings) son una pesadilla para la seguridad de los LLMs

Las protecciones para los LLMs están principalmente preparadas para combatir el lenguaje natural, pero no están del todo «sanitizadas» para los ataques de «bypass» utilizando técnicas de codificación:

Invisible Direct Prompt injection

 

3. Existe un LLM Top 10 de OWASP

No era consciente de que ya existe este interesante ranking de OWASP sobre las vulnerabilidades más importante que afectan a los LLMs:

owasp llm top10 2025

 

Sobre estas vulnerabilidades, crearé un artículo aparte, puesto es muy interesante revisar en mayor profundidad que significa cada una.

Conclusión

La charla “LLM Hacking: From Prompt Injection to RC” en 8.8 Matrix Chile dejó en evidencia que los Large Language Models no solo representan una revolución tecnológica, sino también un nuevo campo de ataque que exige atención inmediata. Desde la manipulación mediante prompt injection hasta escenarios más avanzados como la ejecución remota de código (RC), se demostró que los riesgos son reales y están evolucionando rápidamente.

Más allá de la demostración técnica, la principal enseñanza es que la seguridad en LLMs debe ser un pilar desde el diseño, integrando medidas preventivas, monitoreo constante y un enfoque colaborativo para enfrentar las amenazas emergentes.

 

MANTENTE INFORMADO

Suscríbete a nuestro newsletter gratuito.

Posts Relacionados

  • Durante su presentación en 8.8 Matrix Chile, John Shier, Field CISO de Sophos, compartió una idea poderosa y sencilla a la vez: la “Santísima Trinidad de la Ciberdefensa”. En un entorno donde los ataques son cada vez más sofisticados, recordó que la verdadera fortaleza de una organización no siempre depende de las tecnologías más avanzadas,

  • En la conferencia 8.8 el investigador y experto en ciberseguridad Anchises Moraes presentó la charla titulada “Brazil’s aPIXcalypse – How Real Time Payments Turned Brazilian Threat Scenario Into a Nightmare”. En su exposición, Moraes relató cómo el sistema de pagos instantáneos Pix, lanzado por el Banco Central de Brasil en 2020 y convertido rápidamente en el

  • En el marco de 8.8 Matrix Chile, tuvimos la oportunidad de asistir a la charla “Memorias de un Perito Informático Forense Vol. XII”, presentada por Lorenzo Martínez de securizame.com. En esta edición, Lorenzo nos sorprendió con un relato tan real como insólito: la reconstrucción de una negociación de ransomware llevada a cabo en un caso

  • La 8.8 Computer Security Conference es uno de los eventos más importantes de ciberseguridad en Latinoamérica. Nacida en Chile, se ha consolidado como un punto de encuentro para investigadores, profesionales y entusiastas de la seguridad informática, reuniendo cada año a expertos nacionales e internacionales para compartir experiencias, nuevas investigaciones y tendencias en el área. Este