Qué encontrarás acá
Cómo construimos el Monitor Presidencial: de dónde provienen los textos, cómo los procesamos, qué mide cada indicador y qué cosas el análisis no puede decirte.
Archivos
- 36 Cuentas Públicas (1990–2025) — todos los discursos del 21 de mayo y 1 de junio desde el retorno a la democracia. Fuentes: archivos oficiales del Gobierno de Chile y Memoria Chilena.
- 9 programas de gobierno — los programas de campaña de cada candidatura ganadora desde el gobierno de Patricio Aylwin (1990) hasta el de José Antonio Kast (2026). Fuentes: documentos públicos de campaña en Servel.
Procesamiento de los textos
Cada PDF se convierte a texto plano y luego se divide en fragmentos para indexar. En algunos casos antiguos (escaneados) usamos OCR para recuperar el texto. Los discursos que no estaban digitalizados se reconstruyeron desde imagen.
Indicadores cuantitativos
- Palabras— Total de palabras del discurso.
- Diversidad léxica— Vocabulario único dividido por el total de palabras. Cercano a 0 indica un lenguaje más repetitivo; cercano a 1, más amplio.
- Legibilidad (Índice Fernández-Huerta)— Escala de 0 a 100; mayor puntaje, más fácil de leer. Combina el largo de las palabras y de las oraciones.
- Grado escolar— Nivel educativo equivalente para comprender el texto sin esfuerzo.
- Palabras distintivas (TF-IDF)— Aquellas que aparecen mucho en un discurso y poco en los demás. Filtra términos genéricos como “Chile” o “gobierno” y resalta lo característico de cada texto.
Análisis temático
Trabajamos con un conjunto de temas (Economía, Seguridad, Salud, Educación, entre otros) definidos a partir de un diccionario de palabras clave revisado manualmente.
Para cada documento contamos cuántas veces aparece cada tema y normalizamos por largo: menciones por cada 1.000 palabras. De esta forma, un discurso de 6.000 palabras y uno de 28.000 son comparables.
El relato
Cada discurso pasa por un análisis con un modelo de IA que extrae cinco dimensiones: protagonista, antagonista, sueño, tipo de relato (refundación, continuidad, reconciliación, entre otros) y tono dominante.
Toda extracción está respaldada por citas literales del texto, verificables al pinchar sobre cada dimensión.
El análisis automatizado aporta una lectura estructural rápida, pero no reemplaza la interpretación humana. Léelo como hipótesis a contrastar, no como verdad cerrada.
Buscador
El buscador entrega coincidencia exacta de palabras.
Limitaciones
- El análisis temático depende del diccionario que definimos: si un presidente aborda un tema sin usar las palabras incluidas, no queda registrado.
- El análisis del relato es interpretativo: dos lectores pueden identificar protagonistas o tipos de relato distintos en el mismo discurso.
- Las cifras del TF-IDF reflejan lenguaje, no posición política: una palabra distintiva no implica una postura distintiva.
- Los PDFs antiguos escaneados pueden contener errores menores de reconocimiento óptico.
Créditos
Este es un proyecto de Unholster, elaborado con fuentes públicas. Creemos que la data bien utilizada aporta valor real a instituciones, organismos y personas, enriqueciendo la toma de decisiones y el debate público. Por eso construimos plataformas de análisis de información pública que consolidamos en el sitio www.decidechile.com.
