¿Cuánto del plan de gobierno que tu partido presentó ante el JNE fue escrito por inteligencia artificial?
Esta ficha documenta el origen de los datos, la herramienta utilizada, el proceso de análisis y las limitaciones del estudio. Los resultados son de naturaleza probabilística y deben interpretarse como tal: no constituyen prueba definitiva ni acusación formal de ningún tipo.
Identificación
Autores y contexto
- Autores
- Roberto Monjaras, Fiorella Ramírez y Francesca Chocano
- Publicación
- Febrero 2026
- Recolección y procesamiento
- 20 de febrero de 2026
- Contexto
- Elecciones Generales Perú 2026
- URL
- fiorellarmartins.github.io/reporte-ia-planes-2026
Cobertura
Documentos analizados
Se analizaron los planes de gobierno presentados oficialmente ante el Jurado Nacional de Elecciones (JNE) por los partidos inscritos para las Elecciones Generales Perú 2026. Todos los documentos son de acceso público. El dataset cubre 36 partidos políticos y 38 documentos analizados (38 registros en el CSV).
Se utilizó la versión oficial presentada ante el JNE como documento primario para cada partido. En los casos de Alianza Para el Progreso y Renovación Popular se incluyó un segundo documento por estar disponible públicamente, haber sido utilizado activamente en campaña y ser conceptualmente distinto del plan JNE; ambos fueron analizados por separado y aparecen como registros independientes en el dataset.
Metodología
Proceso de análisis
Se recopilaron los planes de gobierno disponibles públicamente en la web del JNE. Cada documento fue cargado en PDF a la plataforma de Pangram Labs, que analiza el texto a nivel de párrafo y asigna a cada fragmento una clasificación binaria (generado por IA / escrito por humanos), produciendo un número fijo de puntos de muestreo por documento según la extensión del texto. Se registró el porcentaje global y el desglose por categoría de escritura para cada partido, y los resultados fueron volcados a los archivos CSV disponibles en este repositorio.
La detección fue realizada con Pangram Labs (versión 3.0). El modelo utiliza una arquitectura de lenguaje clásica que tokeniza el texto, genera embeddings y produce una clasificación por fragmento. Según la documentación pública de Pangram, el modelo fue entrenado con aproximadamente un millón de documentos y alcanza una precisión declarada de 99,98% con una tasa de falsos positivos cercana a cero, reducida mediante un algoritmo de hard negative mining iterativo. No existe, hasta donde los autores conocen, una validación independiente publicada en revisión por pares de estas cifras. Para más información, ver pangram.com/research/how-it-works.
Clasificación
Categorías de escritura (Pangram 3.0)
El modelo clasifica cada fragmento de texto en una de cuatro categorías. El porcentaje titular que se muestra en el reporte corresponde únicamente a Generado por IA. El desglose completo está disponible en el dataset.
- Generado por IA Texto muy probablemente creado íntegramente por un modelo de lenguaje.
- Asistencia moderada Texto sustancialmente reescrito o co-generado con ayuda de IA.
- Asistencia leve Texto con edición menor o asistencia puntual de IA.
- Escrito por humanos Texto sin indicios de generación o edición por IA.
En el corpus analizado, ningún fragmento fue clasificado en las categorías intermedias (asistencia moderada o leve): todos los textos recibieron clasificación binaria entre Generado por IA y Escrito por humanos. Esto refleja el output directo de Pangram 3.0 para estos documentos.
Datos abiertos
Variables del dataset
Los datos están disponibles en formato abierto en la carpeta data/ del repositorio. El campo porcentaje_ia es el valor redondeado al entero más próximo utilizado en la visualización; el valor preciso está en pct_generado_por_ia.
| Columna | Descripción |
|---|---|
partido | Nombre del partido político |
candidato | Nombre del candidato presidencial |
version | Versión del documento cuando hay más de uno por partido |
porcentaje_ia | Porcentaje titular de contenido generado por IA |
palabras | Total de palabras del documento analizado |
pct_generado_por_ia | % clasificado como generado íntegramente por IA |
pct_asistencia_moderada_ia | % clasificado como asistencia moderada de IA |
pct_asistencia_leve_ia | % clasificado como asistencia leve de IA |
pct_escrito_por_humanos | % clasificado como escrito por humanos |
pangram_url | Enlace al análisis individual en Pangram Labs |
pdf | Ruta al PDF del plan de gobierno en el repositorio |
El archivo data/sparklines.csv contiene la serie de tiempo en formato largo: la probabilidad de IA a lo largo del documento en aproximadamente 60 puntos de muestreo por registro.
Limitaciones
¿Qué dicen estos datos y qué no?
Los porcentajes reflejan la probabilidad estadística de que el contenido haya sido generado por IA según el modelo de Pangram Labs. No constituyen prueba definitiva ni acusación formal de ningún tipo. Los detectores de IA operan sobre patrones estadísticos del texto y pueden producir falsos positivos, especialmente en documentos técnicos, textos con vocabulario muy estandarizado o fragmentos copiados de normativa oficial. Los resultados deben leerse como indicadores probabilísticos, no como veredictos.
El dataset está en actualización a medida que se incorporan nuevos planes o versiones corregidas de documentos ya analizados.
Reproducibilidad
Verificación independiente
Cualquier persona puede verificar los resultados de forma independiente. Los enlaces a cada análisis individual en Pangram Labs están disponibles tanto en el reporte (botón "Ver reporte" por partido) como en la columna pangram_url del CSV.
Los PDFs de los planes de gobierno analizados están disponibles en la carpeta planes/ del repositorio para consulta directa.
Cita
Cómo citar este trabajo
Esta cita aplica para cualquier uso del reporte, los datos en CSV, las visualizaciones o cualquier derivado de este proyecto.
Licencia y atribución
Uso del material
- Código
- Disponible bajo licencia MIT
- Datos de detección
- Pertenecen a Pangram Labs
- Planes de gobierno
- Documentos públicos del Jurado Nacional de Elecciones (JNE)
- Logotipos
- Usados con fines identificativos; propiedad de los respectivos partidos políticos