30. Resumen automático de texto

30.1 Introducción

Una de las aplicaciones más valiosas del NLP moderno es la capacidad de resumir textos automáticamente. En lugar de producir cualquier continuación posible, aquí el objetivo es condensar información importante sin perder el contenido esencial.

El resumen automático es un caso especialmente interesante porque combina comprensión y generación. El sistema debe entender qué es relevante y luego decidir cómo expresarlo de forma más breve.

30.2 ¿Qué significa resumir?

Resumir no consiste simplemente en acortar un texto. Un buen resumen conserva las ideas principales, elimina redundancias, reduce detalles secundarios y mantiene una representación fiel del contenido original.

Por eso, el problema no es solo lingüístico, sino también informacional: el sistema debe decidir qué conservar y qué descartar.

30.3 Objetivo del resumen automático

La meta general es transformar un documento extenso en una versión más breve que siga siendo útil para el lector. Esa utilidad puede depender del contexto: a veces interesa una visión global, otras veces un resumen técnico o una síntesis muy corta.

En todos los casos aparece la misma tensión: reducir longitud sin perder información crítica.

Resumir bien exige equilibrio entre brevedad, cobertura informativa, coherencia y fidelidad respecto del texto original.

30.4 Dos grandes enfoques

En términos generales, existen dos familias clásicas de técnicas de resumen:

  • Resumen extractivo: selecciona fragmentos del texto original.
  • Resumen abstractivo: genera frases nuevas para expresar el contenido de manera condensada.

Esta distinción es central porque ambos enfoques tienen fortalezas, limitaciones y requisitos muy distintos.

30.5 Resumen extractivo

En el resumen extractivo, el sistema elige oraciones o fragmentos ya presentes en el documento fuente. No inventa formulaciones nuevas, sino que reorganiza o selecciona partes existentes.

La ventaja principal es la fidelidad léxica: al reutilizar texto original, se reduce el riesgo de distorsionar el contenido. La desventaja es que el resultado puede quedar menos natural o menos cohesivo.

30.6 Resumen abstractivo

En el enfoque abstractivo, el modelo genera texto nuevo. Puede reformular, fusionar información dispersa y expresar ideas con palabras distintas a las del documento original.

Este estilo se parece más a cómo resume una persona, pero también es mucho más difícil. Requiere comprensión fuerte del contenido y conlleva mayor riesgo de errores o invenciones.

30.7 Ventajas del enfoque extractivo

El resumen extractivo tiene varias ventajas prácticas:

  • Es más simple de implementar.
  • Suele preservar mejor la fidelidad literal.
  • Reduce el riesgo de alucinaciones.
  • Puede funcionar razonablemente bien con técnicas clásicas.

Por estas razones, fue durante mucho tiempo una opción muy utilizada en aplicaciones reales.

30.8 Limitaciones del enfoque extractivo

Su principal límite es que no siempre produce un texto fluido y compacto. Puede seleccionar oraciones redundantes, dejar referencias sin contexto o conservar detalles poco relevantes simplemente porque están embebidos en una oración importante.

Además, no puede fusionar elegantemente información distribuida en distintas partes del documento.

30.9 Ventajas del enfoque abstractivo

El resumen abstractivo permite condensar mejor, reformular ideas y generar una salida más natural. En principio, ofrece resultados más cercanos a los resúmenes humanos.

También puede integrar información de varias partes del texto en una misma frase breve, algo mucho más difícil para métodos puramente extractivos.

30.10 Riesgos del enfoque abstractivo

Su gran problema es la fidelidad. Un sistema abstractivo puede sonar convincente y, sin embargo, introducir datos erróneos, exagerar conclusiones o inventar relaciones que no estaban en el texto fuente.

Esto lo vuelve especialmente delicado en dominios donde la precisión importa mucho, como medicina, derecho, periodismo o documentación técnica.

30.11 Resumen como selección de relevancia

Tanto en extractivo como en abstractivo, el núcleo del problema es el mismo: decidir qué información es relevante. Eso implica identificar ideas centrales, distinguirlas de detalles secundarios y controlar la redundancia.

En otras palabras, resumir es en gran parte un problema de priorización informativa.

30.12 Cobertura y redundancia

Dos criterios aparecen constantemente en evaluación y diseño de resúmenes:

  • Cobertura: cuánto del contenido importante está presente en el resumen.
  • Redundancia: cuánto repite ideas ya mencionadas.

Un buen resumen debería cubrir mucho con pocas palabras y sin repetir innecesariamente.

30.13 Coherencia y cohesión

No alcanza con seleccionar información relevante. El resumen también debe leerse como un texto razonablemente coherente. Puede fallar si aparecen pronombres sin referente claro, saltos bruscos de tema o frases unidas sin conexión lógica.

Esto es particularmente visible en enfoques extractivos, aunque los abstractivos tampoco están libres de este problema.

30.14 Resumen de un solo documento y multidocumento

Hay diferencias importantes entre resumir un único documento y resumir un conjunto de documentos sobre el mismo tema. En el segundo caso, el sistema debe integrar información de múltiples fuentes, detectar coincidencias y resolver contradicciones o solapamientos.

Eso vuelve el problema más complejo, pero también más útil en contextos como noticias, investigación o vigilancia temática.

30.15 Resúmenes genéricos y orientados a consulta

Un resumen puede ser genérico, si intenta capturar lo más importante del documento en términos generales, o orientado a consulta, si responde a un interés particular del usuario.

En este segundo caso, la relevancia cambia según la pregunta o necesidad, de modo que el resumen debe ser más selectivo y contextualizado.

30.16 Modelos modernos para resumen

Los modelos modernos de resumen suelen apoyarse en Transformers, especialmente en configuraciones encoder-decoder o en modelos generativos adaptados a tareas de condensación textual.

Esto permitió avances importantes en calidad, fluidez y capacidad de reformulación, aunque no eliminó los riesgos de error factual.

30.17 Evaluación del resumen

Evaluar resúmenes no es trivial. A diferencia de otras tareas con una respuesta claramente correcta, un mismo texto puede tener muchos buenos resúmenes posibles.

Por eso suelen combinarse métricas automáticas con evaluación humana, especialmente cuando importa la calidad final del sistema.

30.18 Métricas automáticas

Entre las métricas más usadas históricamente aparece ROUGE, que compara superposición de n-gramas entre el resumen generado y uno o varios resúmenes de referencia.

Estas métricas son útiles, pero no capturan por completo fidelidad, coherencia o utilidad real. Dos resúmenes con palabras parecidas no siempre significan lo mismo, y dos resúmenes muy buenos pueden usar formulaciones distintas.

30.19 Evaluación humana

La evaluación humana suele considerar criterios como claridad, coherencia, cobertura, fidelidad y utilidad. Aunque es más costosa, sigue siendo fundamental cuando la aplicación tiene impacto real.

En sistemas productivos, confiar solo en métricas automáticas puede ocultar problemas serios de calidad.

30.20 Aplicaciones frecuentes

El resumen automático tiene aplicaciones muy claras:

  • Resumir noticias extensas.
  • Condensar informes o documentos técnicos.
  • Reducir conversaciones o tickets de soporte.
  • Sintetizar artículos científicos.
  • Generar vistas previas de documentos largos.

En todos estos casos, el valor práctico aparece cuando el volumen de información supera lo que una persona puede revisar con rapidez.

30.21 Comparación conceptual

Enfoque Cómo resume Ventaja principal Limitación principal
Extractivo Selecciona fragmentos del texto original. Mayor fidelidad literal. Menor naturalidad y flexibilidad.
Abstractivo Genera nuevas formulaciones. Mayor capacidad de condensación. Más riesgo de errores o alucinaciones.

30.22 Ejemplo en Python: resumen con un modelo preentrenado

Antes de ejecutar el ejemplo, necesitamos instalar las bibliotecas transformers, torch y sentencepiece con el comando pip install transformers torch sentencepiece.

Este ejemplo usa un pipeline de resumen. Lo importante no es memorizar el modelo exacto, sino observar cómo una tarea compleja puede resolverse reutilizando un sistema preentrenado.

from transformers import pipeline

resumidor = pipeline("summarization", model="facebook/bart-large-cnn")

texto = """
El procesamiento de lenguaje natural ha avanzado de forma acelerada en los últimos años.
Los modelos basados en Transformers permitieron mejorar tareas como clasificación,
traducción, resumen y generación de texto. Al mismo tiempo, estos avances plantean
desafíos relacionados con costo computacional, sesgos, interpretabilidad y evaluación.
"""

resultado = resumidor(texto, max_length=60, min_length=20, do_sample=False)

print(resultado[0]["summary_text"])

Este tipo de ejemplo ilustra una idea central del tema: resumir no es solo acortar, sino condensar información importante en una salida más breve y útil.

30.23 Qué debes recordar de este tema

  • El resumen automático busca condensar un texto preservando su información esencial.
  • Existen dos enfoques principales: extractivo y abstractivo.
  • El extractivo suele ser más fiel al texto fuente; el abstractivo suele ser más natural pero más riesgoso.
  • La calidad del resumen depende de relevancia, cobertura, coherencia y fidelidad.
  • Evaluar resúmenes es difícil y requiere más que una única métrica automática.
  • Es una aplicación clave cuando hay grandes volúmenes de información textual.

30.24 Conclusión

El resumen automático muestra con claridad que el NLP moderno no solo puede etiquetar o continuar texto, sino también reorganizar información para volverla más manejable y útil.

Al mismo tiempo, es una tarea exigente porque obliga a equilibrar brevedad, cobertura y fidelidad, especialmente cuando se usan enfoques generativos.

En el próximo tema estudiaremos la traducción automática, otra aplicación fundamental donde el sistema debe transformar un texto en otro conservando significado, aunque ahora entre lenguas diferentes.