Philologia Hispalensis · 2024 · Vol. · 38 · Nº 2 · pp. 15-20

ISSN 1132-0265 · © 2024 · E. Universidad de Sevilla. · (CC BY-NC-ND 4.0 DEED)


Presentación

PRESENTATION

Laura Hernández-Lorenzo

Universidad de Sevilla

Desde sus orígenes con los proyectos pioneros del Hispanic Seminary of Medieval Studies de la Universidad de Wisconsin, las Humanidades Digitales hispánicas han recorrido un largo camino, en el que destaca su institucionalización y consolidación a través de la creación de asociaciones como la Sociedad Internacional Humanidades Digitales Hispánicas (HDH), la Asociación Argentina de Humanidades Digitales (AAHD) o la mexicana Red HD. En estos últimos años, cada vez ha sido mayor su presencia en congresos y actividades científicas sobre Literatura hispánica celebrados tanto dentro como fuera de España, siendo una constante en algunos de los más consolidados, como el congreso de la Asociación Internacional «Siglo de Oro» (AISO), en el que desde 2017 se celebra un encuentro de investigadores en Humanidades Digitales, o los congresos germanos de la Romanistentag y la Hispanistentag, con frecuentes secciones dedicadas a estas metodologías, impulsadas en parte por el grupo de trabajo de Estudios Románicos Digitales (Arbeitsgruppe Digitale Romanistik, integrante de Der Deutsche Romanistikverband). Ya se han celebrado, además, seis congresos de la asociación HDH, con un séptimo previsto en 2025 en la Universitat de València. Cabe también destacar cómo relevantes reuniones mundiales de Humanidades Digitales están teniendo lugar en el ámbito hispánico, como es el caso del congreso de la asociación mundial, la Alliance of Digital Humanities Organizations (ADHO), celebrado en 2018 en México, o el congreso mundial de la Text Encoding Initiative (TEI), que ha tenido lugar este mes de octubre de 2024 en Buenos Aires (Argentina). Aunque no en territorio hispano, el próximo congreso de la ADHO tendrá lugar en la Península ibérica, concretamente en Lisboa, en 2025.

Asimismo, han aparecido monográficos de Humanidades Digitales y textos en español en diferentes revistas científicas, entre los que podemos destacar los de Janus (2014), Anuario Lope de Vega (2014), Ínsula (2015 y 2024), Signa (2016), Studia Aurea (2017), Cuadernos de AISPI (2018), Romanische Studien (2019), Historias Fingidas (2022), Apropos (2022) o Tirant (2023); y a los que podemos sumar los números dedicados al ámbito hispánico de Digital Humanities Quarterly (2018) y Journal of the Text Encoding Initiative (2023). Y contamos también con publicaciones hispánicas especializadas como la Revista de Humanidades Digitales, que ha publicado nueve volúmenes desde su creación en 2017, y la reciente creación de la colección Digitalia Humanistica de la Universidade Da Coruña, con dos libros publicados hasta la fecha.

En el plano formativo —importantísimo al tratarse de un ámbito interdisciplinar—, en los últimos años las iniciativas docentes en España se han multiplicado, tanto en forma de cursos de extensión universitaria como de programas oficiales de máster e incluso algún programa de doctorado, a lo que podemos añadir las actividades formativas llevadas a cabo por el Laboratorio de Innovación en Humanidades Digitales (LINHD), y la sección de tutoriales de herramientas digitales en español que el ampliamente usado The Programming Historian publica desde 2017. Se ha establecido, además, un premio a la mejor tesis doctoral en Humanidades Digitales por parte de la Fundación BBVA y la HDH, que ya cuenta con tres ediciones.

Otro avance reciente de gran relevancia ha sido la inclusión de España en las infraestructuras europeas de Humanidades Digitales CLARIN y DARIAH en 2023 y la creación de CLARIAH-ES. También en respuesta al creciente interés por la Inteligencia Artificial se han organizado en el último año varias actividades de IA y Humanidades Digitales, entre las que destacan la jornada «Bibliotecas, datos, inteligencia artificial: las nuevas rutas del conocimiento» organizada por la Biblioteca Nacional de España en noviembre del 2023, y el seminario «Inteligencia Artificial y patrimonio literario. Aplicaciones a los estudios áureos» de la Universitat Autònoma de Barcelona celebrado en abril de este año 2024.

Con su llegada y consolidación, el «giro computacional» que han supuesto las Humanidades Digitales ha proporcionado nuevas metodologías para el estudio de la literatura hispánica que no sustituyen a las anteriores, pero que las complementan, amplían y enriquecen con las posibilidades que ofrecen hoy los medios informáticos. Como el lector podrá comprobar a lo largo de las siguientes páginas, estos nuevos métodos pueden tanto facilitar y agilizar tareas de investigación como responder a preguntas en las que no podíamos seguir avanzando con las metodologías tradicionales, e incluso abrir nuevas vías de exploración y análisis. El objetivo del presente volumen es ofrecer una muestra de los trabajos e investigaciones que se están realizando con textos literarios hispánicos, contribuyendo así a la bibliografía sobre esta cuestión, y con el propósito de animar a filólogos e investigadores a acercarse a estas nuevas metodologías, a pesar del importante esfuerzo formativo que suponen, y a plantearse cómo esta nueva perspectiva puede ofrecer enfoques complementarios que nos permitan avanzar en la preservación y el conocimiento de nuestros textos literarios.

La sección monográfica que se presenta a continuación está compuesta por seis artículos y dos reseñas, realizados por grandes especialistas en esta disciplina. El objeto de estudio sigue siendo los textos literarios hispánicos de diferentes periodos (Edad Media, Siglo de Oro y Edad de Plata, principalmente), cuya edición, preservación, estudio y análisis se aborda a través de algunas de las principales líneas de investigación, métodos y herramientas, que se engloban en lo que la comunidad de las Humanidades Digitales denomina la «Big Tent».

El volumen se abre con la contribución de Sagrario López Poza, quien traza una magnífica y completa panorámica de cómo han contribuido las tecnologías y herramientas digitales a la investigación en nuestra literatura del Siglo de Oro, resultando este trabajo una guía imprescindible para cualquier investigador de este periodo que quiera aproximarse a las Humanidades Digitales. Mediante un análisis meticuloso, esta estudiosa señala los principales cambios que se han producido en los procesos de investigación, tanto en la democratización del acceso a fuentes primarias y secundarias gracias a la digitalización masiva de estos, como a la irrupción de software y soportes digitales que han hecho posible la aparición de bases de datos, tecnologías de reconocimiento automático de textos y transcripción automática, técnicas de indexación y búsqueda probabilística, y hasta la recreación en 3D con realidad virtual, sin pasar por alto el importante papel de infraestructuras de investigación como DARIAH y CLARIN. Seguidamente, se detiene en las principales líneas de especialización que han potenciado las metodologías digitales y han sido aplicadas con resultados exitosos a la investigación con textos áureos, resaltando tres en concreto: la edición digital académica, la estilometría y estilística de corpus, y la fotografía espectral y análisis químico con espectrometría. La autora otorga también su justa importancia a los revolucionarios avances en la difusión de la investigación gracias al movimiento de ciencia abierta y a la aparición de repositorios como Zenodo, para concluir reivindicando la importancia de combinar estas nuevas metodologías y herramientas con una sólida formación filológica.

A continuación, el artículo de Gimena del Río Riande se centra en un aspecto fundamental, de vital importancia en cualquier proyecto de Humanidades Digitales: su sostenibilidad y preservación, ejemplificado a través del caso de las ediciones digitales. Con el fin de descubrir la clave para que un proyecto de edición digital perdure en el tiempo y, lo que es fundamental, se mantenga en línea a lo largo de los años, esta estudiosa comienza realizando un repaso de los primeros grandes proyectos de la disciplina y analiza el papel decisivo que jugó la correcta elección de metodologías e infraestructuras en su sostenibilidad y preservación, y que permitió que posteriormente estos sirvieran de base para iniciativas posteriores. A continuación, el presente trabajo se enriquece con una mirada retrospectiva sobre las primeras ediciones digitales de textos hispánicos anteriores a la institucionalización de las Humanidades Digitales, a las que aplica una clasificación ya existente basada en la industria de la moda, que divide las ediciones en haute-couture y prêt-à-porter. En este sentido, esta investigadora valora hasta qué punto la complejidad en el diseño de una edición digital puede influir en su perdurabilidad y cómo las circunstancias concretas de cada proyecto, especialmente el acceso a infraestructuras, apoyo institucional y financiación disponible son fundamentales para decidir el tipo de edición más apropiado, y propone además soluciones para que el investigador pueda trabajar de forma autónoma a través de iniciativas como la minimal computing. En definitiva, este artículo resulta de obligada lectura para cualquier investigador que quiera iniciar un proyecto de edición digital, pues le permite reflexionar sobre los factores a tener en cuenta durante el proceso de elección de tecnologías con el objetivo de que su trabajo pueda mantenerse en el tiempo.

De las ediciones digitales pasamos a los sistemas de transcripción automática con la contribución de Stefano Bazzaco, que constituye una utilísima y completa introducción a los sistemas HTR (Handwritten Text Recognition) y al estado de la cuestión en transcripción automática. Con el objetivo de promover una colaboración entre profesionales de la información y del mundo académico, el autor aborda la aparición de los sistemas de HTR, gracias al desarrollo de las tecnologías de Inteligencia Artificial y aprendizaje profundo, y cómo por su mayor eficacia han sustituido rápidamente al tradicional OCR. Seguidamente, nos presenta sus especificidades y funcionamiento, y los diferentes planteamientos y flujos de trabajo con estas tecnologías, con sus fortalezas y debilidades, y con particular énfasis en los sistemas HTR elaborados y empleados por la comunidad científica e investigadora a través de las plataformas Transkribus y eScriptorium. Asimismo, se nos plantea el interés y las potencialidades de los modelos mixtos, con ejemplos para impresos antiguos y manuscritos en español, y se nos introduce a las últimas tendencias de creación de macromodelos. Además, en esta completa exposición, se nos alerta de la importancia de las buenas prácticas a la hora de desarrollar y emplear estos modelos, así como de tener muy presentes los objetivos finales perseguidos con la transcripción.

Seguidamente, el artículo de Elena Cano nos muestra cómo se han aplicado las Humanidades Digitales en el proyecto SILEM llevado a cabo por las universidades de Sevilla y Córdoba. Se trata de un ejemplo de la implementación de diferentes métodos de Humanidades Digitales en un proyecto filológico de larga andadura, en este caso, dedicado al estudio del Siglo de Oro. Con el propósito de alcanzar los fines del proyecto y de crear una serie de bibliotecas digitales, se han empleado diferentes herramientas de edición digital, cuyo uso se presenta de forma detallada. Este proyecto destaca también por la creación de una amplia ontología de etiquetas semánticas para codificar elementos literarios relacionados con los intereses de investigación fijados, así como por el gran volumen de entradas y textos publicados en TEI. Por último, la financiación competitiva que ha obtenido de forma continuada a través de sus diferentes etapas lo convierten en uno de los más consolidados del panorama nacional.

El siguiente conjunto de artículos se enmarca dentro de la línea de investigación en análisis distante y minería de textos, más concretamente mediante la aplicación de métodos estilométricos.

En el primero de ellos, José Manuel Fradejas Rueda aborda la autoría de una obra medieval de gran importancia, las Siete Partidas. Concebidas e impulsadas por el rey Alfonso X, a día de hoy no hay un consenso en la crítica sobre quién pudo ser el autor material de las mismas, como nos explica de forma detallada este estudioso en una esclarecedora introducción. Con el ambicioso objetivo de descubrir si pudieron intervenir varios redactores/compositores en la redacción de esta obra, se presentan una serie de experimentos estilométricos con diferentes métodos (entre ellos, el análisis secuencial para detectar posibles cambios de estilo) y parámetros suficientemente probados y validados sobre un corpus preparado al efecto y que se ofrece de forma abierta a la comunidad científica, garantizándose así la replicabilidad de los análisis y resultados obtenidos. El problema autorial elegido constituye un gran desafío para la estilometría, pues no se dispone de textos de referencia de los principales candidatos ni se conoce de antemano cuántos pueden ser ni dónde habrían intervenido. A pesar de estas limitaciones, gracias a un brillante manejo de las diferentes técnicas, los resultados obtenidos arrojan nueva luz sobre la compleja redacción de esta obra.

Una pregunta de atribución de autoría es también el punto de partida del último artículo de este monográfico. Realizado de forma conjunta por Dolores Romero López, María Jesús Fraga Fernández Cuevas y José Calvo Tello, el trabajo constituye un ejemplo de cómo la colaboración entre profesionales y especialistas de diferentes disciplinas (en este caso, la filología y la estilometría) puede dar frutos muy valiosos que ayuden a avanzar en el conocimiento de nuestras obras literarias e incluso a abrir nuevas vías de investigación. Los autores abordan la autoría de la novela El pensionado de Casilda, atribuida a Elena Fortún y Matilde Ras, combinando las metodologías de la lectura cercana (filológica) y la lectura distante (digital y estilométrica). En primer lugar, los autores nos introducen a la problemática autorial, los avatares de la complicada transmisión de la obra, las biografías de las dos potenciales candidatas y el contexto histórico-cultural en el que se gestó. A continuación, presentan los resultados de la lectura cercana de fuentes y comparación de estilos de las obras de cada una de las autoras, seguidos de un análisis de lectura distante a través de técnicas estilométricas. Para este último no solo emplean el texto discutido y otros textos ficcionales de Matilde Ras y Elena Fortún, sino que añaden un corpus de comparación de autores de la Edad de Plata con más de doscientos volúmenes. En los análisis realizados se han empleado tanto métodos no supervisados como refinados métodos de clasificación, todos destacables por su eficiencia y éxito en estudios previos. Aunque no se llega a conclusiones definitivas, la rigurosa investigación realizada sobre la obra estudiada, en la que se entremezclan autoría femenina, colaborativa y tema lésbico, permite abrir nuevas hipótesis y vías de investigación.

El monográfico se cierra con las reseñas de dos libros recientemente publicados sobre la aplicación de métodos estilométricos a la literatura hispánica: The Novel in the Spanish Silver Age. A Digital Analysis of Genre using Machine Learning (2021) y Análisis de textos desde la Estilometría (2022), reseñados respectivamente por Isabel Moyano Moreno y Patricia García-Sánchez Migallón. Estas novedades editoriales dan cuenta del peso y consolidación que está adquiriendo esta metodología, y que junto al resto de los enfoques y planteamientos presentados en este volumen auguran un futuro prometedor para la definitiva integración de las Humanidades Digitales en los estudios literarios hispánicos.

Financiación

Este trabajo se inscribe en el proyecto de investigación «La institución del “Siglo de Oro”. Procesos de construcción en la prensa periódica (1801-1868). SILEM III» (PID2022-136995NB-I00), financiado por el Plan Nacional de Investigación del Ministerio de Ciencia e Innovación y dirigido por Mercedes Comellas (Universidad de Sevilla). El lector cuenta con completos estados de la cuestión y repasos históricos sobre las Humanidades Digitales en el ámbito hispánico (Rojas Castro, 2013; López Poza, 2019; Hernández-Lorenzo, 2020; Rio Riande y Allés-Torrent, 2023; entre otros), que se completan con los artículos publicados en este volumen, por lo que en esta introducción únicamente se resaltarán las cuestiones de mayor relevancia y especialmente las novedades más recientes.

Referencias

Hernández Lorenzo, L. (2020). Humanidades Digitales y Literatura española: 50 años de repaso histórico y panorámica de proyectos representativos. Janus: estudios sobre el Siglo de Oro, 9, 562-595. https://www.janusdigital.es/articulo.htm?id=154

López Poza, S. (2019). Humanistas y Humanidades Digitales. Trayectoria y proyección en la Filología española. En A. Egido, J. E. Laplana y L. Sánchez Laílla (Eds.), Humanidades y Humanismo. Homenaje a María Pilar Cuartero (pp. 125-159). Institución Fernando el Católico.

Rio Riande, G. del, y Allés-Torrent, S. (2023). Treinta años de TEI en español: Usos y comunidad. Journal of the Text Encoding Initiative, 16. https://doi.org/10.4000/jtei.4871

Rojas Castro, A. (2013). El mapa y el territorio. Una aproximación histórico-bibliográfica a la emergencia de las Humanidades Digitales en España. Caracteres, 2(2), 10-53. http://revistacaracteres.net/revista/vol2n2noviembre2013/el-mapa-y-el-territorio/