Referencias críticas
El workshop depende de estos artefactos públicos
Estas referencias no son material accesorio. Son la evidencia pública del sistema, la base para seguir el código fuente y la forma más rápida de validar que el recorrido descrito en el workshop existe de verdad.
Live Site
ai-agent-chat.cloudio.click.s3-website-us-east-1.amazonaws.com
Esta es la referencia operativa más importante para la audiencia: la instancia publicada donde se observa la experiencia conversacional final y el stream que consume el frontend.
Source Code
ai-agent-data
Contiene la capa de ingestión y preparación de conocimiento: S3, dispatcher, Batch, rag_context y la indexación upstream hacia OpenSearch.
Source Code
ai-agent-rag
Contiene la capa RAG: Function URL, orquestación con LangGraph, translation, classifier, retrieval y generation con grounding verificable.
Source Code
ai-agent-chat
Contiene la UI Angular que recibe NDJSON tipado, renderiza streaming y expone la superficie pública del sistema para la experiencia final del workshop.
Qué resuelve
Un recorrido concreto para construir una capacidad útil
Este workshop toma un caso concreto, define un source set acotado, establece una política clara de generación y muestra cómo AWS puede componer cada etapa de forma trazable.
El resultado es un flujo capaz de producir una primera propuesta de contrato API fundamentada en documentación bancaria real.
Arquitectura
La vista consolidada a nivel C2 del sistema completo
01
Persona y canal
El usuario interactúa con una sola superficie: ai-agent-chat, la UI Angular que muestra streaming y bloques de código.
02
`ai-agent-chat`
El frontend se ocupa de la interacción. Envía { message } al endpoint público y consume la respuesta progresiva.
03
`ai-agent-rag`
La capa RAG expone el Function URL, orquesta translation, classifier, retrieval y generation, y devuelve NDJSON tipado.
04
`ai-agent-data`
La capa de datos prepara el conocimiento upstream: procesa documentos, produce rag_context e indexa chunks en OpenSearch.
Diagrama C2 consolidado
flowchart LR
USER[Usuario]
subgraph Chat["ai-agent-chat"]
UI[Angular chat UI
stream rendering]
end
subgraph Rag["ai-agent-rag"]
URL[Lambda Function URL]
API[Node.js API handler]
ORCH[LangGraph orchestrator
translation -> classifier -> retrieval -> generation]
CTX[(S3 context responses)]
URL --> API --> ORCH --> CTX
end
subgraph Data["ai-agent-data"]
SRC[S3 source bucket]
BATCH[AWS Batch processor]
RAGJSON[processed/rag_context JSON]
ING[OpenSearch ingestor]
OS[(OpenSearch index)]
SRC --> BATCH --> RAGJSON --> ING --> OS
end
USER --> UI
UI --> URL
ORCH --> OS
ORCH -->|NDJSON tipado| UI
Este diagrama presenta el sistema ai-agent como una composición de containers con responsabilidades claras, y deja el detalle interno para ai-agent-data, ai-agent-rag y ai-agent-chat.
AWS Fit
Por qué esta arquitectura resulta pertinente para una audiencia de AWS
Entrada
S3 como frontera limpia
Los documentos ingresan por S3, lo que facilita disparo por eventos, trazabilidad y almacenamiento de artefactos intermedios.
Proceso
Lambda y Batch sin forzarlos
Las Lambdas cubren la parte reactiva. El procesamiento documental de mayor peso se resuelve en AWS Batch.
Conocimiento
OpenSearch como retrieval operable
OpenSearch mantiene el retrieval observable, trazable y más fácil de ajustar que un enfoque basado en prompts extensos.
MVP Hardening
Qué quedó más sólido antes de enseñar este flujo
Fixture
Demo reproducible
El workshop trabaja sobre un source set canónico, prompts definidos y resultados esperados, lo que facilita repetibilidad y revisión técnica.
Contrato
Metadata explícita
El contrato mínimo de rag_context quedó definido y forma parte explícita de la explicación técnica.
UX
Contrato de streaming más claro
El cliente consume un protocolo de stream tipado, con una separación más clara entre contenido, metadata y estados de ejecución.
Decisiones clave
Detalles de implementación que sí agregan valor al workshop
Bedrock
Modelos diferenciados por fase
La clasificación usa Amazon Nova Micro para resolver dominio e intención con baja latencia y salida JSON. La generación usa por defecto Amazon Nova Pro, con soporte configurable para Claude y Llama en la capa final.
Language bridge
Translate antes de retrieval
El query del usuario suele llegar en español, pero buena parte de la documentación de estándares y del material indexado está en inglés. Traducir primero mejora el alineamiento léxico para clasificación y búsqueda.
Payload limits
S3 como puente entre Lambdas
El retrieval persiste el hit set en S3 y devuelve una s3_reference. Esa decisión evita límites de tamaño en Lambda y desacopla retrieval de generation sin perder grounding.
Classification
Clasificación con señales combinadas
La intención final no depende de una sola técnica. El sistema combina keywords y clasificación LLM para reducir errores tempranos y mantener una ruta de ejecución más estable.
Contract
Metadata explícita para retrieval
domain, document_type, standard, source_format y content_type forman parte del contrato que vuelve el retrieval más gobernable que un prompt monolítico.
Operations
Rutas operativas documentadas
Los tres subproyectos incluyen rutas operativas para infraestructura, build y deploy. Eso le da al workshop una transición razonable hacia operación continua.
Servicios
Las piezas que sostienen la historia técnica
Recorrido
Qué construye realmente el lector
Levanta la capa de datos
Provisiona bucket, dispatcher, Batch, ingestor y OpenSearch con Terraform desde ai-agent-data.
Prepara conocimiento útil
Sube el source set canónico, dispara el procesamiento y verifica Markdown, rag_context e indexación.
Conecta la capa RAG
Despliega ai-agent-rag, consume el estado remoto de datos y valida el stream NDJSON tipado.
Prueba la interfaz
Levanta ai-agent-chat, ejecuta prompts canónicos y observa el flujo completo con grounding visible.
Canon
Los prompts que ordenan la demo
Prompt principal
Necesito un contrato OpenAPI para iniciar pagos basado en ISO 20022. Quiero request y response en application/json y una propuesta inicial en YAML.
Prompt explicativo
Explicame la estructura de un mensaje de estado de pagos en ISO 20022 y los campos principales que deberia considerar.
Prompt de borde
Genera un contrato API completo basado en BIAN para customer onboarding y devuelvelo en OpenAPI.