Señales y alertas en tiempo real vía WebSocket
Cómo el pipeline emite alertas en tiempo real a los frontends conectados usando WebSockets, con broadcast thread-safe desde el scheduler y registro de conexiones por proyecto.
Cómo el pipeline emite alertas en tiempo real a los frontends conectados usando WebSockets, con broadcast thread-safe desde el scheduler y registro de conexiones por proyecto.
Cómo el pipeline extrae transcripciones de YouTube sin credenciales, consulta el archivo de MediaCloud con rotación de API keys, y usa Apify para Google, Twitter/X y YouTube.
Las tres funciones de análisis narrativo del pipeline: detect_framing, fact_check_claims y compare_coverage, con fallback DSPy y LiteLLM como proxy de modelos.
Cómo el pipeline detecta y agrupa documentos duplicados o muy similares usando similitud de Jaccard y un sistema de clustering incremental.
Integración con las cuatro APIs de GDELT v2: DOC, GEO, Context y Timeline, con throttling estricto y reintentos para respetar el límite de 5 s entre llamadas.
Cómo el pipeline monitoriza el BOE, 17 boletines autonómicos, el Congreso y el Senado con scrapers específicos y un extractor universal como fallback.
Cómo el conector RSS del pipeline gestiona feeds heterogéneos con un circuit breaker por feed que evita que una fuente caída bloquee el resto.
Visión general del pipeline KatanServant: conectores de fuentes, normalización, deduplicación, análisis y señales de alerta.