¿Qué es el Hemerobot?

En la última actualización hemos añadido una nueva herramienta a la web: el Hemerobot. Se trata de un agente de inteligencia artificial que tiene acceso a varias hemerotecas deportivas, y puede leerlas por ti y responder consultas respecto a ellas.

El funcionamiento es sencillo: seleccionar un diario, escoger una fecha y realizar una pregunta en formato textual (da mejores resultados hacer las preguntas en lenguaje natural que usar palabras clave).

Cobertura inicial

Por ahora disponemos de las siguientes hemerotecas:

  • Marca (desde 1942 hasta 2021)
  • AS (desde 1967 hasta 2007)
  • Mundo Deportivo (desde 1905 hasta 2025)

En el futuro añadiremos más, y también de otros países. También está previsto permitir seleccionar rangos de fechas en lugar de un día concreto, y poder buscar en todos los diarios a la vez.

Hay dos modelos de IA disponibles:

Modelo Básico (gratuito)

Este modelo es útil solo para realizar consultas generales, rápidas y sin profundidad, para obtener una idea general del contenido del diario. Pero no es un modelo fiable y no es adecuado para consultas específicas. Aunque el diario seleccionado contenga la información que el usuario está pidiendo, es posible que responda que no la contiene. También son frecuentes las alucinaciones (respuestas con datos inventados que no aparecen en el diario).

Modelo avanzado (1€)

Este modelo es muy fiable. En las pruebas que hemos hecho prácticamente no se inventa nada y muy pocas veces no encuentra un dato que el diario contiene. Es ideal cuando necesitas datos concretos y correctos.

Benchmark

Para elegir el modelo de IA que usa el Hemerobot, hemos creado un benchmark: Hemerobench. El benchmark consiste en un conjunto de más de 70 consultas, de distintos diarios, fechas, y temáticas.

Para cada una de estas consultas, un humano ha leído el diario correspondiente y ha redactado la respuesta correcta según la información que éste contiene. La respuesta del humano luego se compara con la del modelo de IA para calcular su nivel de precisión.

Podemos ver que el mejor modelo es o3 de OpenAI con una precisión de 87,5% comparada con la de un humano, seguido muy de cerca por GPT5 (87,1%). El modelo o3 ha sido el elegido para el modelo avanzado. En cambio para el modo básico gratuito el modelo que se usa es Gemini 1.5 flash, con una precisión de solo el 43%.

En este contexto podríamos considerar que la AGI (inteligencia artificial general) se alcanzará cuando la precisión llegue al 100%. En ese momento ya no será necesario consultar los diarios por uno mismo para encontrar crónicas, datos, etc., se podrá confiar en que la IA obtendrá la misma calidad de respuesta que daría una persona. Por ahora, sin embargo, todavía hay un 13% de casos en los que el diario contiene información que la IA incluso con el modelo avanzado aún no es capaz de encontrar (y un humano sí).

Por ejemplo uno de los casos donde falla es con un diario del año 1926 (en esa época los diarios eran muy densos, con 6 columnas por página, y letra muy pequeña). La pregunta es «Alineaciones del Sant Andrés – Lleida y resultado en formato Goles1-Goles2» pero el modelo no es capaz de localizar este fragmento del diario que aparece en la página 3:

Este tipo de fallos son habituales en el modelo básico gratuito (56%). En el modo avanzado son infrecuentes (13%), pero existen, sobre todo en ejemplares muy antiguos o en ejemplares extensos.

Consejos para obtener mejores respuestas

  • Habla en natural: “¿Quién marcó en el partido del Girona contra el Rayo y en qué minuto?” funciona mejor que conjuntos de palabras sueltas (keywords) como «goleadores girona rayo».
  • Da contexto: Equipo, rival, competición, etc. ayudan a la IA a orientarse.
  • Pide formato si lo necesitas: “Dame la alineación en lista separada por comas, por ejemplo: ‘Portero, Lateral, Central, Defensa, etc’”.
  • Verifica datos sensibles: Considera usar el modo avanzado para asegurar respuestas más fiables.

Seguiremos mejorando Hemerobot en el futuro, probando nuevos modelos y añadiendo más hemerotecas y funcionalidades. Esperamos que os resulte útil nuestro nuevo juguete!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *