Presentamos QCP: Un Nuevo Protocolo para Comprimir Contexto Semántico en Sistemas de IA

IntellIA Team

December 27, 2025

Presentamos QCP: Un Nuevo Protocolo para Comprimir Contexto Semántico en Sistemas de IA

Hoy anunciamos la publicación de nuestro paper "Quantized Context Protocol (QCP): A Formal Specification for Semantic Context Compression in Large Language Model Systems", disponible en Zenodo (DOI: 10.5281/zenodo.18065015).

Este trabajo representa meses de investigación en IntellIA Labs, nuestra división de Investigación y Desarrollo, abordando uno de los problemas fundamentales que enfrentan los sistemas de IA modernos: cómo representar, persistir e intercambiar información contextual de manera eficiente entre agentes inteligentes.

El problema que resolvemos

Los LLM (Large Language Models) operan dentro de ventanas de contexto finitas. Aunque estas ventanas han crecido sustancialmente con el avance tecnológico (de 4K tokens a más de 200K), persiste una ineficiencia fundamental: el lenguaje natural, pese a su riqueza en cuanto a expresividad, carga una redundancia sustancial cuando se usa como medio para representar un estado operacional.

Imaginemos un escenario típico en sistemas multi-agente: un agente procesa una tarea compleja que abarca múltiples ciclos de interacción, acumulando decisiones, observaciones y estados intermedios. Cuando este contexto debe mantenerse, transferirse a otro agente o comprimirse para caber dentro de los límites de tokens, las aproximaciones actuales presentan problemas:

Preservación literal: Retener el historial completo agota rápidamente la capacidad de contexto.
Resumen estadístico: Aplicar compresión resumiendo selectivamente, por mejor que sea el método de sumarización, genera inevitablemente pérdidas que puede descartar información semánticamente relevante.
Truncamiento arbitrario: Eliminar contexto antiguo sin conciencia semántica destruye cadenas causales fundamentales para poder continuar razonando con coherencia y solidez.

Nuestra propuesta: Quantized Context Protocol

QCP es una especificación formal para representar contexto operacional en una forma compacta, legible por máquinas y semánticamente estable. A diferencia de técnicas convencionales de resumen o compactación, QCP opera como un protocolo de compresión semántica que preserva significado, causalidad e intención operacional mientras elimina sistemáticamente la redundancia lingüística.

Arquitectura de tres capas

Diseñamos QCP con tres capas interoperables que sirven propósitos distintos:

L1 → QCP-PRETTY: Forma explicativa legible por humanos
L2 → QCP-CANONICAL: Especificación formal normativa, eficiente en tokens
L3 → QCP-COMPACT: Codificación ultra-eficiente en tokens

Las capas mantienen equivalencia semántica: transformaciones válidas entre capas preservan todo el significado operacional.

Vocabulario de primitivas semánticas

QCP define un vocabulario mínimo de primitivas contextuales:

Invariantes (inv): Hechos inmutables que deben permanecer verdaderos para la validez del contexto.
Causalidades (caus): Relaciones dirigidas indicando dependencias lógicas.
Decisiones (dec): Elecciones ya realizadas que restringen posibilidades futuras.
Acciones pendientes (pend): Tareas o pasos aún no completados.

Esta descomposición permite que cualquier contexto operacional se pueda representar como una tupla estructurada Σ = ⟨I, C, D, P⟩.

Un ejemplo concreto

Consideremos este contexto en lenguaje natural, en el ámbito de un despliegue de software:

"El clúster de Kubernetes quedó levantado, operativo y saludable. Las credenciales de la base de datos ya fueron validadas correctamente. El build de la imagen se completó sin errores y el push al registry se realizó de forma exitosa. El deployment se encuentra actualmente en curso, apuntando al entorno de producción, con 3 réplicas activas. Aguardamos la validación de los health checks antes de actualizar el DNS, ya que el proceso queda automáticamente bloqueado hasta confirmar que el despliegue se completó correctamente y sin incidencias."

545 caracteres de texto narrativo.

Su representación en QCP-COMPACT:

QCP/0.1|state|inv[k8s_active|db_creds_valid];
caus[build->push->deploy,health->dns];
dec[ns=prod|rep=3];pend[health|dns];
prog[build:D|push:D|deploy:IP|health:P|dns:B[health]]

175 caracteres — una compresión de 3.1x preservando toda la información operacional.

Relación con MCP y A2A

Es importante aclarar que QCP no compite con protocolos existentes sino que los complementa:

Model Context Protocol (MCP) de Anthropic define cómo los agentes se conectan a herramientas y recursos externos → capa de conectividad.
Agent2Agent Protocol (A2A) de Google aborda comunicación agente-a-agente → capa de transporte y ruteo.
Quantized Context Protocol (QCP) de IntellIA aborda cómo se codifica el estado semántico para transferencia o persistencia → la capa de representación

La analogía: Si pensamos el sistema como una red logística, MCP sería el conjunto de carreteras y accesos a los depósitos, A2A serían los camiones y rutas que trasladan la carga entre centros, y QCP sería el estándar de embalaje inteligente que decide cómo se empaqueta la información para que ocupe menos espacio, llegue intacta y pueda ser reinterpretada correctamente en destino. Sin ese embalaje, el transporte existe, pero es ineficiente y frágil.

Refuerzo de contexto intra-agente

Más allá de handoffs entre agentes, QCP introduce el concepto de "cognición QCP-nativa": el agente mantiene un estado semántico interno codificado en primitivas de QCP, que se actualiza y referencia continuamente durante la generación.

Este mecanismo funciona mediante ciclos de auto-reinyección del contexto, lo que permite lograr ratios de compresión de entre 12:1 y 18:1 frente a una simple concatenación de información. En la práctica, esto significa que se puede conservar más del 94 % de la información relevante, usando mucho menos espacio y manteniendo el contexto realmente útil para la tarea.

Resultados preliminares

Los experimentos realizados en IntellIA Labs, utilizando un conjunto de aproximadamente 75.000 pares de datos provenientes de dominios como ingeniería de software, flujos de trabajo en salud y procesos empresariales, permiten extraer conclusiones consistentes sobre el comportamiento del sistema.

En comparación con una representación literal del contexto, que promedia alrededor de 490 tokens, los enfoques basados en resumen reducen el tamaño a unos 145 tokens, aunque con una pérdida semántica significativa. En contraste, el enfoque QCP-COMPACT logra una reducción mucho más eficiente, con un promedio cercano a 90 tokens, manteniendo al mismo tiempo entre un 88 % y un 94 % de preservación semántica, y con un nivel de determinismo claramente superior.

Los experimentos de traducción round-trip (Texto → QCP → Texto) muestran scores de similitud semántica entre 0.85 y 0.91, junto con tasas de preservación de elementos clave que oscilan entre el 91 % y el 96 %, lo que indica una reconstrucción altamente fiel del contenido original.

Aplicaciones prácticas

Este enfoque habilita múltiples casos de uso donde la compresión semántica controlada es crítica:

Desarrollo de software: transferencia de estado entre etapas de pipelines CI/CD, permitiendo builds más determinísticos y reproducibles.
Salud: handoff de información clínica entre profesionales, manteniendo la integridad del contexto y reduciendo pérdidas de información crítica.
Atención al cliente: continuidad contextual en sistemas multi-agente, evitando reinicios innecesarios del estado conversacional.
Sistemas autónomos: coordinación entre agentes o componentes distribuidos mediante estados compactos y consistentes.
Ámbito legal: soporte a flujos de análisis y auditoría, donde la trazabilidad y la fidelidad semántica son fundamentales.

Próximos pasos

El protocolo permanece en desarrollo activo. Nuestras prioridades incluyen:

Extensiones del protocolo: QCP probabilístico para representar incertidumbre, QCP temporal para razonamiento temporal explícito.
Desarrollo de herramientas: Editores visuales, validación automatizada, herramientas de diff semántico.
Estandarización: Especificación formal estilo RFC, implementaciones de referencia, estándares de conformidad.

Acceso al paper

El paper completo está disponible en el siguiente link: https://zenodo.org/records/18065015

Para ampliar información o realizar alguna consulta, escribinos a:

research@intellia.online