Philologia Hispalensis · 2024 Vol. · 38 · Nº 2 · pp. 21-40
ISSN 1132-0265 · © 2024. E. Universidad de Sevilla. · (CC BY-NC-ND 4.0 DEED)
Recibido: 03-11-2023. Aceptado: 21-12-2023
Resumen
El objetivo de este artículo es analizar cómo y en qué medida las tecnologías digitales han repercutido en cada uno de los procesos y métodos de trabajo relacionados con la investigación en la literatura española del Siglo de Oro desde la última década del siglo xx. Se subrayan algunas tendencias recientes impulsadas por el desarrollo de software que han potenciado algunas líneas de especialización y se valora el impacto de los cambios producidos.
Palabras clave: tecnología digital, literatura del Siglo de Oro, investigación, software, Humanidades digitales.
Abstract
The aim of this article is to analyze how and to what extent digital technologies have had an impact on each of the processes and working methods related to research in Spanish Golden Age Literature since the last decade of the twentieth century. Some recent trends driven by software development that have boosted some lines of specialization are highlighted and the impact of the changes produced is assessed.
Keywords: digital technology, Spanish literature Golden Age, research, software, Digital Humanities.
Los estudios de cualquier tipo han estado siempre mediatizados por la tecnología de uno u otro modo. Cuando se inventó la imprenta, muchos intelectuales mostraron resistencia a los cambios que introducía esta novedad y siguieron prefiriendo los manuscritos durante algún tiempo. Cada cambio sustancial por la incorporación de nuevos recursos técnicos introduce también cambios en la forma de trabajar y hasta en la forma de pensar y proceder. El propósito de este artículo es exponer cómo han influido, a mi juicio, las tecnologías digitales en la investigación en literatura española del Siglo de Oro desde la última década del siglo xx.
En mi opinión, los estudios sobre literatura española en general, y de literatura del Siglo de Oro en particular, han salido perjudicados por el desplazamiento del interés genuino en el estudio de los textos hacia cierto narcisismo metateórico, según calificación de García Barrientos (2006: 44), proveniente de universidades americanas, que ha ido desplazando el centro de interés del texto a la relación de ese texto con los sujetos que lo estudian, algo que aporta poquísimo o nada a entender las obras en sí o a sus autores y el contexto en que crearon.
La fragmentación de áreas desde las dos últimas décadas del siglo xx (teoría de la literatura, literatura comparada, ciencias y técnicas historiográficas, etc.) han ido desnudando de algunos contenidos tradicionales lo que entendíamos por investigación en literatura española del Siglo de Oro. Las nuevas tecnologías han contribuido, por otra parte, a que la interdisciplinariedad (inherente a lo que llamamos humanidades digitales) facilite y enriquezca nuestras investigaciones, si bien a veces la literatura parece haberse visto relegada bien a proporcionar textos transcritos que puedan alimentar corpus que exploten los lingüistas (porque eran necesarios para impulsar el desarrollo de la inteligencia artificial en español) o han pasado a considerarse como parte de lo que se ha venido en llamar estudios del patrimonio, en este caso, patrimonio escrito, patrimonio impreso, etc. Con todo, las nuevas formas de investigar, con la ayuda de herramientas, dispositivos y metodologías hasta ahora poco explotadas, han abierto nuevas líneas de investigación y auguran interesantes resultados en los próximos años.
El mundo académico ha sufrido grandes cambios en lo relativo a la investigación humanística en los últimos treinta años debido a la influencia de las nuevas tecnologías, la digitalización y la generalización del uso de Internet. Todo ello ha sido determinante en el modo de investigar, en las distintas metodologías empleadas y en la forma de difundir, visualizar y reutilizar la investigación. Esos cambios no se han producido súbitamente, y en lo relativo a la filología, y en particular a la literatura española del Siglo de Oro, el proceso ha sido lento en la esfera de la investigación, pero fueron precisamente los filólogos los pioneros en el ámbito de las humanidades en aplicar métodos y técnicas digitales a sus estudios. Se ha realizado un largo recorrido, con resistencias y dudas iniciales y con franca adhesión posterior a las ventajas que ofrecía el uso de herramientas, aplicaciones y perspectivas de investigación ligadas a la informática, la estadística y el desarrollo de Internet. Son interesantes las conclusiones que ofrece el estudio de Maurizio Toscano et al. (2020) basado en el análisis de trescientos treinta y siete proyectos desarrollados en España desde 1993 a 2019 vinculados a las humanidades digitales. El estudio confirmó el predominio de filólogos entre los investigadores involucrados (36%), seguidos de historiadores (16,5%) e ingenieros informáticos (10,9%).
Toda investigación comienza por una fase propedéutica con el fin de determinar el asunto que vamos a estudiar o propuesta de investigación, un listado de objetivos y preguntas, una hipótesis y la elaboración de un marco metodológico. Sigue una fase proyectiva en que se planifican las actividades y se diseña el proyecto. No podré detenerme en lo que respecta a estas fases, que se han visto afectadas favorablemente por las nuevas tecnologías. Vamos a suponer que ya tenemos determinado nuestro objeto de estudio, que hemos planificado las actividades que llevaremos a cabo y que tenemos diseñado nuestro proyecto de investigación.
La siguiente fase, de ejecución, comenzaría con la búsqueda de bibliografía sobre el asunto que vamos a estudiar para garantizar que usaremos la más actualizada posible. Luego vendría una fase heurística, de análisis de los datos y, finalmente, la interpretación y conclusiones del estudio, que se inscriben en la fase hermenéutica. A partir de ahí, vendría la redacción y edición del trabajo y su difusión para presentar los resultados de la investigación.
En todas esas fases se han producido cambios notables en relación con la investigación que afectan al acceso a las fuentes primarias, acceso a las fuentes secundarias, aplicación de desarrollos de software específico para la investigación en humanidades, difusión de los resultados de investigación, retroalimentación o discusión sobre los resultados y contacto con especialistas o pares intelectuales. Veamos con más detalle.
El acceso a las fuentes primarias para estudios sobre literatura española del Siglo de Oro en el pasado era difícil y muy costoso económicamente. Además, ocupaba gran parte del tiempo del proceso de la investigación. Había que desplazarse a veces a lugares muy lejanos (con el consiguiente gasto en viajes y estancia fuera de casa) para acceder a manuscritos o impresos especiales allí donde se conservaran: bibliotecas, archivos, etc. Había que lidiar con restricciones de acceso, horarios caprichosos (especialmente en archivos o bibliotecas eclesiásticas), etc. Además de la consulta in situ, con frecuencia necesitábamos una reproducción, si no de todas las fuentes consultadas, de una parte de ellas. Podía hacerse por procedimiento fotográfico, en microfilm o microficha, pues aunque existieran ya fotocopiadoras, los libros antiguos no se podían someter al deterioro que la luz intensa de esas máquinas podía provocarles. Una vez conseguida la reproducción, si era en microfilm o microficha, era necesario contar con un lector (que solía estar en una biblioteca), con lo cual había que desplazarse de nuevo y sujetarse a horarios que no siempre nos convenían. Si deseábamos hacer copia de alguna página del microfilm o microficha, solo algunas bibliotecas disponían de los aparatos lectores que permitían hacer copia, pues eran carísimos. Las copias realizadas eran en papel especial, que también costaba mucho y el investigador había de pagarlo, y las reproducciones no tenían calidad suficiente la mayor parte de las veces.
Respecto a la forma de editar nuestro trabajo, los avances que nos han aportado los diversos programas de tratamiento de textos son inconmensurables, y solo lo podrán apreciar los que ahora son viejos, pues las nuevas generaciones no han tenido que sufrir el teclear los textos en máquina de escribir mecánica, con papel de calco para hacer hasta cinco copias (en casos de una tesis doctoral) procurando no equivocarse mucho, pues de lo contrario habría que repetir toda la página. Las máquinas de escribir electrónicas aportaron belleza al texto y ajuste de caracteres, pero no fue un gran avance en términos de trabajo.
Hoy podemos tener acceso desde nuestra casa a una gran cantidad de fuentes primarias sin movernos de nuestra mesa de trabajo y sin gastos significativos. En mi caso trabajo con un ordenador y dos pantallas de veintisiete pulgadas. Puedo tener delante (en la pantalla de la izquierda) una copia de un manuscrito de Quevedo digitalizado por la Biblioteca Nacional de España (BNE) y ofrecido a través de Biblioteca Digital Hispánica y puedo cotejarlo, a la vez, con una edición de la obra de 1882 (en un ejemplar que posee la Universidad de Illinois, Estados Unidos). Al mismo tiempo, puedo tener delante mi transcripción (en la pantalla de la derecha), ayudarme en consultas al CORDE —herramienta de gran utilidad que ofrece la Real Academia[1]— y puedo tener otras conexiones de utilidad abiertas a la vez en mi ordenador. Además, puedo acceder a un tiempo a fuentes primarias y secundarias.
Hace unos años tenía que ir a una sala especial de la BNE (donde solo pueden entrar investigadores) a consultar el manuscrito (habiendo solicitado varios días antes que lo tuvieran disponible), pero debía trasladarme a la sala general si quería consultar otras ediciones no tan antiguas y que me hacían falta para el cotejo.
El acceso a las fuentes primarias ha sufrido una revolución. Sigue siendo preciso, como es natural, ver los objetos originales: libros, partituras, estampas, etc., pero disponemos de muchísimas reproducciones digitales con calidad que pueden ahorrarnos mucho tiempo y dinero. Ello se debe a la digitalización de fondo antiguo bibliográfico que se inició en los años 90 del siglo xx por varias bibliotecas notables con ricos fondos que pronto se hicieron accesibles a través de Internet. Gallica (de la Biblioteca Nacional de Francia) fue una de las pioneras; sus primeras digitalizaciones se remontan a 1992 y ya a finales de 1997 ofrecía a través de Internet las obras que iba digitalizando; Internet Archive (fundada por Brewster Kahle en 1996); el Munich Digitization Centre —MDZ— (1997), de la Bayerische Staatsbibliothek; Google Books (2004) y Europeana (2005). A partir de 2006 la Unión Europea dio un gran paso al decidir la digitalización masiva de fondo antiguo[2]. Ello, junto con la práctica del acceso abierto, nos ha ido proporcionando la consulta de una cantidad ingente de manuscritos e impresos digitalizados sin movernos de casa y de forma gratuita. Entre sus ventajas está el poder ampliar la imagen, contrastar esa fuente con otra (de la misma o distinta edición) que está en otra biblioteca, y una variedad de posibilidades que serían imposibles incluso suponiendo que en una biblioteca tuvieran distintas ediciones de la obra que nos interesa.
Gracias a ello se han podido descubrir ediciones fraudulentas, como algunas contrahechas (casos frecuentes en el siglo xvii) que suplantaban ediciones legales tomando de las auténticas en parte o por entero los datos del pie de imprenta, el año (que también podía ser distinto) y los preliminares exigidos por la ley. Asimismo, ediciones clandestinas que falsificaban datos referentes a ciudad, impresor, editor, aprobaciones y licencias (el año de edición puede ser auténtico o también falso). Gracias al acceso rápido a gran cantidad de ediciones de determinados impresores podemos hacer acopio de los tipos de adornos tipográficos que se usaban en su taller para contrastarlos y descubrir que alguna obra impresa que no indicaba impresor (por razones que hoy pueden extrañarnos, pero que en su momento fueron poderosas) fue en realidad ejecutada en un determinado taller tipográfico[3].
De gran utilidad para encontrar fuentes primarias digitalizadas es el Catálogo Virtual de Karlsruhe (KVK), desarrollado por el Instituto de Tecnología de Karlsruhe (suroeste de Alemania). Es un motor de búsqueda meta para la detección de cientos de millones de libros, revistas en bibliotecas y catálogos de ventas de libros en todo el mundo. Es muy útil el hecho de que permite que podamos recuperar solo los libros que están digitalizados. Podemos acceder a las bibliotecas o repositorios y leer los libros en pantalla, hacer búsquedas dentro de ellos (si están digitalizados con reconocimiento de texto) e incluso descargar la copia gratuitamente. Ahorra mucho tiempo.
Para acometer una investigación es de primordial importancia conocer bien las fuentes secundarias: libros, artículos, tesis doctorales, etc. Todo lo que otros colegas hayan producido sobre el tema que nos interesa, para así poder trazar un estado de la cuestión.
Las tradicionales fuentes secundarias para una investigación en humanidades solían ser: repertorios bibliográficos, obras de referencia, monografías y revistas especializadas. Más adelante ya pudimos disponer de bases de datos bibliográficas o de diverso tipo, con estudio de fuentes primarias.
Antaño, para acceder a los repertorios bibliográficos, cuya elaboración era muy laboriosa y su adquisición cara, había que ir a una buena biblioteca que invirtiera dinero en comprarlos y mantenerlos actualizados. Eso lo hacían las bibliotecas universitarias, pero solían centrarse en los repertorios de temas en que investigaban sus profesores; así que si el investigador no lograba que otros se interesaran en su especialidad, a la biblioteca no solía compensarle el gasto. En el caso de literatura del Siglo de Oro, los anuarios de la MLA que listaban la bibliografía producida en el último año sobre los temas de que se ocupaba esa asociación eran de mucho interés para mantenerse informado de las novedades.
Lo mismo pasaba con las revistas especializadas. Las universidades se suscribían a la recepción de varias en función de la investigación que se hiciera en su universidad, pero llegó un momento en que ni siquiera las más ricas universidades norteamericanas podían asumir el gasto que suponía estar suscrito a tantas revistas especializadas, cuyos precios solían ser elevados, y surgió una solución que respondía a un tipo de negocio.
En 1995, William G. Bowen, que presidía la Universidad de Princeton, fundó JSTOR, que es abreviatura en inglés de Journal STORage «almacén de publicaciones periódicas». Se trata de un sistema de archivo en línea de publicaciones académicas. Consistía en que varias publicaciones periódicas de interés en diferentes áreas, principalmente de humanidades y ciencias sociales, pactaron la digitalización de sus principales artículos para reunirlos en un repositorio. Ellos tendrían acceso gratis, pero alquilarían por suscripción el derecho de acceso a otros centros, instituciones y universidades. En efecto, aunque la suscripción suponía un gasto importante para las universidades, comenzaron a suscribirse a ese repositorio, no solo porque les ahorraría estar suscritas a tantas revistas, sino por la ventaja que suponía para los investigadores poder acceder en el acto, desde cualquier sitio con conexión a Internet, a través de la web de su biblioteca institucional a miles de artículos sobre un tema y descargar los ficheros PDF que precisaran, sin tener que esperar a la solicitud de un préstamo interbibliotecario. JSTOR hoy ha ampliado sus fondos a libros y otros materiales, y permite acceso abierto en determinadas circunstancias y a determinados materiales.
En España, en 2002 se puso en marcha Dialnet, una plataforma abierta a la cooperación bibliotecaria con la posibilidad de disponer de usuarios externos que se fue desarrollando con el tiempo y se ha convertido en uno de los mayores portales bibliográficos del mundo, ofreciendo mucho más que información bibliográfica. A diferencia de JSTOR, Dialnet es de acceso gratuito. Desde 2009 la gestión pasó a manos de la Fundación Dialnet, constituida por el Equipo de Gobierno de la Universidad de La Rioja como una entidad sin ánimo de lucro. Todo investigador en los ámbitos de ciencias humanas, jurídicas y sociales puede hallar no solo información bibliográfica, sino un servicio de alerta sobre publicaciones de los asuntos de interés que el suscrito haya establecido para mantenerse al día de las publicaciones de su ámbito de investigación. Si el documento del que informan está en acceso abierto, Dialnet ofrece el enlace y permite la descarga.
Otro adelanto importante en el acceso a fuentes secundarias tiene que ver con las facilidades que los diferentes repositorios (de las universidades y de otras entidades) y redes sociales académicas han proporcionado a los investigadores, pues gracias a ellos se puede acceder a producción que antes era muy difícil de conseguir. En ellos encontramos tesis doctorales casi recién defendidas, trabajos recién publicados por los autores, e incluso preprints, pues un autor puede compartir su investigación aún no publicada, con la seguridad de que los metadatos que genera la aplicación del repositorio asignarán a su trabajo de investigación una fecha que puede resultar útil en casos de litigio por plagio, etc. Estos trabajos son hallados por los metabuscadores y aportan a los investigadores información reciente que de otro modo no podría hallar. Los repositorios universitarios solo alojan producción de los miembros de su institución.
La Unión Europea, en su esfuerzo por impulsar la «Ciencia abierta» creó Zenodo en 2013, que es un repositorio multidisciplinar que permite a los investigadores depositar artículos de investigación, conjuntos de datos, software específico, informes y cualquier otro artefacto digital relacionado con la investigación. Zenodo puede dar acceso a fuentes secundarias muy recientes y a datos procedentes de proyectos de investigación en curso o recién terminados. Más adelante volveremos a mencionar este repositorio, pues atañe también a la sección de la difusión de la investigación.
Además de los repositorios universitarios existen otros bastante populares, como Academia.edu y ResearchGate, que alojan producción personal de investigadores que se registran en plataformas que funcionan como redes sociales académicas. Estas dos plataformas son de uso gratuito (con posibilidad de un acceso de pago que ofrece más difusión y datos al suscriptor). Su objetivo es conectar científicos, ofrecerles una plataforma para compartir sus trabajos de investigación y facilitarles el seguimiento de los artículos que son relevantes para sus campos de estudio. Aparte de poder subir y compartir documentos en diferentes formatos, permiten interactuar con otros investigadores mediante mensajes en la misma plataforma, recibir recomendaciones automáticas de artículos e investigadores, según los intereses de investigación y personas a las que seguimos, obtener datos estadísticos que permiten medir el impacto de la investigación y marcar documentos de interés para leerlos más tarde. El autor (que tiene los derechos de autor de su trabajo) lo cuelga en la plataforma con unas palabras clave temáticas, de forma que todos los interesados en el tema lo pueden leer y descargar al recibir un aviso de su publicación.
Es fácil comprender que estos sistemas han supuesto un avance indudable para el acceso a fuentes secundarias, lo que junto con Dialnet ha marginado notablemente al negocio de plataformas de pago como JSTOR o ProQuest, que ofrecían estos servicios y obligaban a las universidades a hacer ingentes gastos para conseguir los trabajos de investigación, incluso a veces realizados por sus propios investigadores.
El desarrollo de software orientado a solucionar problemas específicos de la investigación humanística ha incidido en nuestras investigaciones, bien como ayuda para facilitar o acelerar procesos de análisis (por ejemplo, los sistemas de escaneado con reconocimiento automático y semiautomático de caracteres, en textos no solo de impresos, sino de manuscritos —software de OCR/HTR—) o para poder acometer investigaciones nunca imaginadas, como la recreación en 3D con realidad virtual o la posibilidad de ediciones académicas digitales que permiten formas de consulta del texto con marcación semántica.
Uno de los mayores avances en el acceso a datos de interés para las investigaciones sobre determinados ámbitos del Siglo de Oro son los bancos de datos que albergan el fruto de pacientes investigaciones de muchos años de grupos multidisciplinares que, generosamente, lo ofrecen en acceso libre para que otros investigadores progresen en sus trabajos. Desde la década de los 90 del siglo xx se desarrollaron progresivamente bases de datos relacionales en cuyo modelado, que precisaba de conocimiento experto en materia de literatura del Siglo de Oro y otras que contribuyen a su mejor conocimiento, participaron colegas del área. Algunas de las más tempranas se agruparon en la red Aracne, Red de Humanidades Digitales y Letras Hispánicas (https://www.red-aracne.es/presentacion), que fue incorporando otras más tarde. Actualmente la red está integrada por veintidós recursos digitales de once grupos de investigación[4] (Alvite Díez y Pena Sueiro, 2020). Además de un metabuscador común, que permite recuperar datos juntos de todas las bases de datos de la red, el protocolo que emplea, (OAI-PMH), la hace proveedora de Europeana, con lo que los recursos adquieren enorme difusión.
Son muchas las bases de datos creadas en los últimos años sobre temas de interés para la investigación en literatura del Siglo de Oro, pero el espacio de que dispongo impide reseñarlas. Quien desee ampliar información tiene disponibles los estados de la cuestión presentados en los «encuentros de investigadores» de los congresos de la AISO (Asociación Internacional Siglo de Oro) donde se exponen las novedades producidas en los tres años previos a cada congreso y en los que desde 2017 se añadió una sección específica de humanidades digitales (Martos Pérez, 2022; Boadas, 2023)[5]. Por su antigüedad y relevancia, me permito destacar los recursos ofrecidos por BIDISO (Pena Sueiro, 2017) y por ASODAT[6], portales que integran varias bases de datos con ingente información de interés para estudios del Siglo de Oro y teatro áureo[7].
Para las tareas de crítica textual, uno de los campos principales de nuestras investigaciones, la tecnología ha revolucionado la metodología de trabajo, los procedimientos y los métodos de publicación de las ediciones críticas. Algunas de las tecnologías que han resultado más útiles para la investigación en literatura española del Siglo de Oro son las que siguen.
El OCR (Optical Character Recognition —reconocimiento óptico de caracteres—) pertenece a un área de estudio de la inteligencia artificial llamada automatic recognition y se desarrolló a lo largo de muchos años con técnicas de machine reading. Los primeros paquetes comerciales de software de OCR datan de los años 80 del siglo xx; sin embargo, fue a partir del año 2000 (y ligado a los proyectos de digitalización europeos arriba indicados) cuando experimentaron un gran desarrollo que supuso un importante auxilio para la investigación, especialmente para la realización de ediciones críticas, al agilizar la transcripción manual. En un principio los errores de lectura alcanzaban un tanto por ciento que disuadía a muchos de emplearlos, pero con la intervención de técnicas de deep learning e inteligencia artificial se produjo un avance determinante y hoy son usados con mucha más frecuencia. Además, según los programas, pueden generar etiquetas para marcado.
Asimismo, el HTR (Handwriting Text Recognition —reconocimiento de texto manuscrito—) se ha convertido en una importante ayuda, pues permite leer y transcribir manuscritos e impresos antiguos en poquísimo tiempo y con un alto grado de fiabilidad. Para trabajar sobre Siglo de Oro es preciso dedicar un poco de tiempo a trabajos preliminares para resolver problemas específicos de ligaduras, signos tironianos, abreviaturas, etc., y utilizar buenas copias digitales de los originales.
Hay muchas aplicaciones de software de OCR tanto gratuitas como de pago. Durante mucho tiempo fue bastante popular el software del programa comercial ABBY FineReader, creado para reconocer formatos de archivos PDF, y sigue dando buenos resultados para textos modernos, pero no tanto para el Siglo de Oro, pues reconoce mal las eses altas y caracteres que pueden ser frecuentes en impresos de los siglos xvi-xvii.
Entre las que más aceptación han tenido en nuestras líneas de trabajo en los últimos años está Transkribus (READ Coop), software desarrollado en la universidad austriaca de Innsbruck por el grupo DEA (Digitalisierug & Elektronische Archivierung) junto con otras once instituciones como partners y financiado por el plan europeo Horizonte 2020: READ Project (Retrieval and Enrichment of Archival Documents) que obtuvo buenas críticas en 2018 y 2019. La aplicación transcribe texto en cualquier idioma y con cualquier juego de caracteres (carga su propio teclado virtual), exportando los documentos en varios formatos, tales como .txt, .doc, PDF, XML y HTML. Inicialmente (desde 2015, como parte del proyecto Transcriptorium) podía usarse gratis, ya que los usuarios contribuían con la carga de los textos a enriquecer el proceso de aprendizaje del programa, pero desde 2020 el reconocimiento de páginas tiene un coste, con diferentes planes de pago. Varios proyectos de textos medievales, del siglo xvi y xvii han usado Transkribus con notables resultados (Bazzaco, 2020; Cossío Olavide, 2022).
Otro software lanzado en 2018 como plataforma open source bastante reconocido para impresos antiguos es OCR4All, desarrollado por el Zentrum für philologie und digitalität «kallimachos» de la Universität Würzburg. Integra funcionalidades de OCRopus/OCRopy, Kraken y Calamari. Ha sido usado con impresos (no con manuscritos).
Existen otras muchas aplicaciones de software para reconocimiento de textos impresos con diferentes resultados (Tesseract, Rekognition, etc.). El investigador ha de valorar los pros y contras de cada uno en función de lo que desee obtener.
Las nuevas técnicas de indexación y búsqueda probabilística permiten hacer interesantes formas de análisis big data, como analítica de textos, clasificación de documentos, recuperación de la información, etc. Ello ha sido posible por el desarrollo del deep learning, un subconjunto de machine learning, que es básicamente una red neuronal con tres o más capas que emulan el sistema visual humano y logran «aprender» a partir de grandes cantidades de datos. Aunque una red neuronal con una sola capa ya puede realizar predicciones aproximadas, las capas ocultas adicionales ayudan a optimizar y refinar la precisión, realizando tareas analíticas y físicas sin intervención humana y con más precisión que la humana, al ser capaz el programa de descifrar letras o palabras casi imperceptibles para el ojo humano.
En los últimos años se ha estado trabajando en la aplicación de técnicas de inteligencia artificial a documentos históricos para obtener resultados similares a los del OCR, pero sin transcripción, con una tecnología de indexación probabilística desarrollada en la Universitat Politécnica de Valencia bajo la dirección de Enrique Vidal Ruiz. Consiste en clasificar según su contenido textual conjuntos ingentes de imágenes de textos no transcritos de documentos manuscritos. Por cada imagen crean una especie de mapa que contiene para cada punto de la imagen las palabras que pueden estar relacionadas. Se ha aplicado con éxito en el proyecto Carabela, a partir de 130 000 imágenes digitalizadas de documentos del Archivo General de Indias y el Archivo Histórico de Cádiz[8] (Vidal et al., 2020). Se deseaba rastrear en esos documentos con la misma rapidez que un buscador web imágenes de palabras y combinaciones de palabras que permitieran descubrir qué documentos trataban de naufragios, para restringir la consulta de esos documentos en los archivos donde estaban depositados a posibles cazatesoros o empresas que pretenden sacar beneficios esquilmando el patrimonio histórico y cultural español[9].
Hay que tener en cuenta que esos documentos están escritos por muchas manos, con letras de muy difícil lectura y a veces en estado de conservación muy precario. Llevaría muchos años al ojo humano hacer una lectura de tantos legajos para realizar esa tarea y muchísimos años para transcribir toda esa documentación. El equipo del PRHLT (Centro de Investigación Pattern Recognition and Human Language Technology) de la Universitat Politècnica de València ha participado en el proyecto europeo READ, que ha estudiado y analizado documentos del Siglo de Oro de la literatura española, entre ellos manuscritos de Lope de Vega pertenecientes a la colección de la Biblioteca Nacional; así como correspondencia de los Hermanos Grimm del Archivo Estatal de Marburgo. También ha trabajado en el Archivo Nacional de Finlandia, del que se han indexado cerca de 150 000 páginas.
Lo que hace unos años parecería un sueño, estamos hoy más cerca de conseguirlo si se dedicaran los recursos precisos. Si se les aplicaran estas técnicas a archivos de protocolos, podríamos encontrar mucha documentación de interés para los estudios literarios del Siglo de Oro: contratos de edición, testamentos de autores, procesos legales, etc., que completarían los datos biográficos de aquellos autores que nos interesan y la historia editorial de los libros que produjeron.
Para determinados trabajos que complementan o enriquecen los textos que estudiamos pueden ser de utilidad las técnicas de realidad virtual y reproducción en tres dimensiones que permiten crear imágenes y espacios simulados en los que una persona, mediante un dispositivo visual, tiene la sensación de estar y poder desenvolverse dentro de ellos. El láser escáner 3D se ha usado con éxito en labores de digitalización y reproducción del patrimonio y en los estudios que nos atañen se han usado estas técnicas para reconstrucciones virtuales de corrales de comedias; por ejemplo, la que llevaron a cabo investigadores de la Universidad de Sevilla coordinados por Piedad Bolaños, con la reconstrucción virtual del corral de comedias La Montería del siglo xvii[10] o la recreación virtual de la Casa de Comedias de la Olivera (siglos xvii y xviii) en Valencia que realizó un equipo multidisciplinar dirigido por Joan Oleza[11]. También se han llevado a cabo reconstrucciones virtuales de arquitecturas efímeras erigidas en Toledo para la entrada solemne de la reina Isabel de Valois en el año 1560 y su rico programa iconográfico y simbólico (López Salas et al., 2023).
Durante varios años ha habido un interés de grupos de investigación en integrarse en plataformas europeas como DARIA[12] y CLARIN[13] que facilitaran el acceso compartido y colaborativo a recursos digitales y el uso de cómputo intensivo con instrumentos específicos de análisis. Sin embargo, los ministerios de diversos gobiernos que debían implicarse y tomar la decisión (pues el costo era importante y la participación había de ser nacional) no acababan de aprobar la integración de España. Por fin, desde el verano de 2023, España participa en las infraestructuras CLARIN y DARIAH a través del consorcio CLARIAH-ES. Esta red estratégica reúne a diez centros[14] líderes en tecnologías del lenguaje (TL), inteligencia artificial (IA), computación de alto rendimiento (HPC), de humanidades y ciencias sociales, y la Biblioteca Nacional de España. Veremos los resultados en los próximos años[15].
Para la edición crítica literaria, tarea tan importante para los filólogos, las nuevas tecnologías han proporcionado ayuda en todas las fases del proceso: captura de los textos (digitalización), reconocimiento, transcripción, codificación, procesamiento, transformación, análisis y difusión. La edición digital académica[16] (EDA) tiene muy poco que ver con las ediciones de textos tradicionales (Allés-Torrent, 2020)[17]. Esto es debido al desarrollo de metalenguajes como XML, que define un conjunto de reglas para la codificación de documentos y ayuda a marcar la estructura lógica, física y semántica de un texto en formato digital. Es un estándar abierto e internacionalmente reconocido que asegura la interoperabilidad entre aplicaciones, plataformas y lenguajes informáticos.
Codificar el texto, es decir, indicar por medio de etiquetas y otros recursos que ciertas cadenas de texto plano tienen determinada significación (texto semánticamente estructurado) es una de las principales diferencias entre una edición convencional impresa en papel y una edición digital. El etiquetado de textos ofrece beneficios que compensan sus costes iniciales, pues incluye la relativa facilidad con que los documentos XML pueden ser reutilizados a medida que van variando las plataformas y sistemas de computación standard, así como la capacidad para permitir a los investigadores que pregunten y respondan nuevas cuestiones sobre textos que no podrían contestar si estuvieran disponibles solo en papel o un formato electrónico que imita al papel, como el PDF.
Junto a lenguajes como XML, otro estándar para la representación de los textos en forma digital ha aportado avances para realizar presentaciones antes inauditas, enlaces entre texto, imagen y materiales multimedia, así como ediciones digitales académicas enriquecidas. Me refiero a TEI (Text Encoding Iniciative), estándar para la representación de textos en formato digital que recibió impulso desde 1994. TEI ofreció y fue perfeccionando después directrices que especifican métodos de codificación para textos legibles por máquina para su edición y presentación en línea. Además, el consorcio TEI proporciona una variedad de recursos, bibliografía, encuentros y software desarrollado o adaptado a TEI, que hoy es una organización sin fines de lucro compuesta por instituciones académicas, proyectos de investigación y académicos individuales de todo el mundo. Hay diferentes métodos o estándares para la representación de los textos en forma digital, pero TEI es la que con más frecuencia se ha elegido en nuestros ámbitos de interés, en parte porque su codificación optimiza la reutilización y preservación de los datos.
Una de las ventajas de las EDAs es que pueden modificarse con nuevas capas de información, como variantes relevantes de otros testimonios, añadir facsímiles de otras ediciones o traducciones y en consonancia ampliar también las posibilidades de visualización, creando múltiples lecturas alternativas desde distintas perspectivas.
A pesar de las ventajas que puede proporcionar una edición digital académica (Pierazzo, 2015), su producción es escasa hasta ahora[18]; en lo relativo a literatura del Siglo de Oro, Allés-Torrent (2017) señala algunas cuestiones pendientes de mejora, y desde un espectro más general, Pierazzo (2019). Alvite-Díez y Rojas-Castro (2022) abordan la cuestión de la baja producción y apuntan a algunas de las posibles causas, por lo que señalan la necesidad de consensuar patrones de visualización de EDAs por parte de la comunidad académica, así como la urgencia de buscar sinergias con las editoriales comerciales o institucionales. A la dificultad que entraña la realización de una edición crítica, para llevar a cabo una EDA se requiere, además, formación técnica (que no suele lograrse aún fácilmente en ámbitos académicos convencionales). Las herramientas disponibles son complejas (no se adaptan con facilidad) y a ello se añade la fragilidad y complejidad de las interfaces[19]. Eso, por no hablar de la estabilidad u obsolescencia de las plataformas donde se depositaría la edición digital. Los procesos del flujo de trabajo requieren tal esfuerzo que pocos investigadores se animan a acometer esta tarea. Ese bajo número de interesados, por otra parte, no anima a los desarrolladores de software orientado a la edición académica a superarse y ofrecer herramientas y entornos virtuales de publicación más amigables, y las editoriales comerciales ven con poco interés este tipo de negocio. Este es, sin duda, uno de los campos en que más hay que trabajar para la adaptación óptima de tecnologías e investigadores, así como para la explotación de productos editoriales que superen los tipos de edición convencionales.
Algunos de los proyectos de edición digital académica sobre obras del Siglo de Oro español son:
Hay un número cada vez mayor de ediciones de las que suelen llamarse ediciones digitalizadas (Sahle, 2016) y Allés-Torrent (2020: 74) que no tengo espacio para comentar.
En la última década se han desarrollado herramientas y métodos para el análisis cuantitativo de textos que ha dado frutos significativos en literatura del Siglo de Oro (sobre todo en teatro y poesía), principalmente por los avances de la inteligencia artificial y las posibilidades de acceso a textos digitalizados. Las querellas académicas sobre autoría de obras anónimas o de atribución dudosa, basadas en intuiciones mejor o peor defendidas, sin que hayan dejado de tener sentido, se han visto apoyadas por la fiabilidad y la objetividad que la cuantificación garantiza. Asistimos cada poco tiempo a noticias que desmontan atribuciones de autoría que supondrán realizar análisis de los textos desde distintas perspectivas. En algunos casos modificarán lo que dábamos por seguro en la historia de nuestra literatura. Las herramientas y los métodos para el análisis cuantitativo de los textos están dando magníficos resultados en el estudio del teatro español del Siglo de Oro, merced al trabajo ingente durante años de una variedad de equipos que sabiamente han colaborado para integrar sus bases de datos (caso del proyecto coordinado ya citado ASODAT), de modo que sirvan para disponer de textos transcritos y multitud de datos fruto de análisis experto. Proliferan últimamente tesis doctorales, trabajos fin de grado, monografías, presentaciones, cursos y proyectos en esta línea de la estilometría. La limitación de espacio me impide citar todos los trabajos que conozco de esta línea; sin embargo, creo que son dignos de mención, al menos, las tesis doctorales de Laura Hernández Lorenzo (2020) y de Álvaro Cuéllar (2022).
También los avances en técnicas de fotografía podrán aportar importantes datos de manuscritos de autores al permitir recuperar fragmentos ilegibles, restaurar tachaduras, analizar la intervención de diferentes manos y clasificarlas, analizar el uso de diferentes tintas en un mismo manuscrito, determinar diferentes fases de escritura, etc. Sònia Boadas está aplicando estas técnicas en su proyecto Creatext, que fue subvencionado por la Fundación BBVA con una Beca Leonardo en 2022. Su objetivo es analizar seis manuscritos autógrafos de Lope de Vega para contrastar la hipótesis de un trabajo colaborativo en la creación y revisión de sus comedias.
Antaño, para publicar un trabajo se requerían varios meses o años. Si era un libro, venía primero el peregrinaje por las editoriales a ver si les interesaba, y si era un artículo, aun en el caso de que una revista lo admitiera, pasaba a la cola y había de esperar por lo general dos o tres años hasta que su autor lo veía publicado.
Se ha producido un cambio radical gracias al concepto de ciencia abierta, un movimiento que nació en 2011 y que proponía dar acceso a todos los ciudadanos a las investigaciones científicas, sobre todo a las producidas con fondos públicos. Se estaba dando la paradójica situación de que los contribuyentes, que ya habían subvencionado la investigación (e incluso a veces pagado por derechos de publicación de los resultados en revistas de alto impacto), tenían que seguir pagando para poder acceder a los artículos mediante la suscripción de las instituciones a esas revistas.
El repositorio de acceso abierto Zenodo, desarrollado bajo el programa OpenAIRE, la organización sin ánimo de lucro de la Unión Europea para favorecer la ciencia abierta y alojado en el CERN (European Organization for Nuclear Research), permite almacenar 1 GB a cada usuario y habilita la posibilidad de ser utilizado por instituciones que carecen de su propio repositorio. Como hemos mencionado más arriba, Zenodo permite a los investigadores (además de acceder a resultados de investigación muy recientes) la difusión de su producción en un lugar seguro, con garantías y con posibilidades de máxima difusión. Los metadatos están bajo licencia CC0, es decir, dedicadas al dominio público sin restricciones ni solicitud de permisos, excepto para las direcciones de correo electrónico. Todos los datos son susceptibles de ser recogidos por terceros canales a través del protocolo OAI-PMH. Zenodo admite varios tipos de licencia, aunque se decanta por aquellas abiertas como medio de obtener mayor visibilidad y reputación. Además, permite a los usuarios crear sus propias colecciones en un espacio propio, asignando las licencias y atribuyendo un DOI a cada dataset y a cada publicación.
La difusión de la investigación hoy, especialmente en humanidades, se hace a través de revistas digitales que suelen ser gratuitas y publican muy pronto los artículos, contribuyendo así a difundir con rapidez las novedades de investigación. Al margen de estos cauces habituales, la notificación de publicaciones, avisos de congresos, anuncios de tesis doctorales realizadas, etc., se realiza con frecuencia a través de redes sociales, logrando una difusión antes inusitada. Y, desde luego, la forma de difusión es la red de redes, Internet, donde los proyectos suelen exponerse y, en esa línea de acceso abierto, ofrecer a la sociedad los recursos producidos.
La retroalimentación o discusión sobre los resultados y el contacto con especialistas o pares intelectuales también ha sufrido cambios, pues antes esas etapas de la investigación solían ser siempre presenciales y hoy cada vez son más virtuales, por medio de foros, redes, plataformas que funcionan como redes sociales académicas, etc. Durante los años 2020 y 2021 las reuniones presenciales se vieron afectadas por la pandemia de COVID-19, que anuló congresos y seminarios primero y luego, tímidamente, se volvieron a celebrar. Esa circunstancia incrementó mucho las reuniones virtuales a través de plataformas online, pero restringió los contactos personales.
Como se ha visto, son muchísimos los cambios que en las metodologías y procesos de investigación tradicionales de la filología se han producido en los últimos treinta años. Hemos podido observar en este recorrido cómo se ha democratizado el acceso a las fuentes, ha prevalecido una conciencia de acceso libre de la ciudadanía al conocimiento generado con sus recursos, y gracias a la existencia de Internet la información requerida se puede conseguir rápidamente, sin enormes gastos de desplazamiento, estancia y reproducción documental. Los avances técnicos han abreviado los tiempos de una investigación tradicional y las facilidades de visualización de documentos digitalizados han mejorado mucho la legibilidad de letras desgastadas o ilegibles. Por otra parte, los documentos originales no sufren tanto desgaste al ser menos manejados gracias a la reproducción digital, lo cual contribuye a su preservación. La difusión de los productos de investigación se hace de manera más rápida y sin necesidad de costes en la mayor parte de los casos, lo cual estimula otras investigaciones de forma mucho más dinámica que antes.
Ha mermado, sin embargo, la importante relación persona a persona que se producía en los encuentros, seminarios, coloquios, congresos, etc., en que una conversación con un colega más experto que nosotros o una relación que se establecía tomando un café después de una sesión podía ser determinante en el futuro del investigador o de su investigación.
Es indudable, como hemos visto, que hoy disponemos de herramientas que facilitan mucho nuestra tarea investigadora, pero conviene reflexionar sobre el paulatino deterioro en la formación en fundamentos instrumentales de base que siguen siendo necesarios para comprender y explicar la literatura que crearon nuestros clásicos, para lo cual, a mi juicio, sigue siendo tan necesario como antes acercarse a la formación que tuvieron los propios autores que estudiamos: saber latín, la lengua franca en las universidades y escuelas de humanidades en que se formaron los autores, conocer los tratados de retórica que leyeron, los ejercicios de progymnasmata recomendados en los tratados de retórica, leer textos de filosofía moral, conocer la Biblia y otros textos que estudiaban o leían nuestros autores, como catecismos, por ejemplo, conocer muy bien la mitología y leerla en los tratados que ellos manejaron, saber utilizar las polianteas (a las que acudían como apoyo erudito o en búsqueda de motivos de invención) tener una buena formación en historia y, sobre todas las cosas, hay que entender cómo leían nuestros autores, cómo tomaban nota y cómo creaban (Ramos Maldonado, 2015; López Poza, 2021). Las nuevas tecnologías digitales también pueden ayudar en esto y conviene no olvidarlo.
Esta publicación es parte del proyecto de I+D+i Biblioteca Digital Siglo de Oro 6 (BiDISO 6), referencia: PID2019-105673GB-I00 financiado por MCIN/ AEI/10.13039/501100011033/.
Allés-Torrent, S. (2017). Tiempos hay de acometer y tiempos de retirar: literatura áurea y edición digital. Studia aurea, (11), 13-30. https://doi.org/10.5565/rev/studiaaurea.261
Allés-Torrent, S. (2020). Crítica textual y edición digital o ¿dónde está la crítica en las ediciones digitales?. Studia aurea, (14), 63-98. https://doi.org/10.5565/rev/studiaaurea.395
Alvite-Díez, M. L. y Rojas-Castro, A. (2022). Ediciones digitales académicas: Concepto, estándares de calidad y software de publicación. El Profesional de la Información, 31(2). https://doi.org/10.3145/epi.2022.mar.16
Alvite Díez, M. L. y Pena Sueiro, N. (2020). Colecciones digitales patrimoniales especializadas. Estudio de la Red ARACNE. En J. Tramullas Saz, P. Garrido Picazo y G. Marco Cuenta (Coords.), Actas del IV Congreso ISKO España-Portugal 2019, XIV Congreso ISKO España (pp. 185-195). Sociedad Internacional para la Organización del Conocimiento (ISKO)-Capítulo Ibérico.
Bazzaco, S. (2020). El reconocimiento automático de textos en letra gótica del Siglo de Oro: Creación de un modelo HTR basado en libros de caballerías del siglo XVI en la plataforma Transkribus. Janus, (9), 534-561. https://www.janusdigital.es/articulo.htm?id=160
Boadas, S. (2023) (Coord.). Encuentro de investigadores: Humanidades Digitales. XIII Congreso de la AISO. https://aiso-asociacion.org/encuentros-de-investigadores-oviedo-2023-listados-bibliograficos-2020-2023
Cossío Olavide, M. (2022). Usando Transkribus con manuscritos medievales (1): primeros pasos. Lucidarios, 30(11). https://lucidarios.hypotheses.org/816 https://doi.org/10.59350/1fxy3-jke62
Cuéllar, Á. (2022). Propuestas de autoría y datación en el teatro de Lope de Vega a la luz de la Inteligencia Artificial. [Tesis doctoral]. University of Kentucky.
García Barrientos, J. L. (2006). La Teoría literaria en la actualidad. Tradición europea y modas de Norteamérica. En Grupo de Estudios sobre la Crítica Literaria (Coord.), Teorías y Prácticas Críticas en la Actualidad. Actas del V Encuentro Internacional sobre Teorías y Prácticas Críticas (GEC) (pp. 30-46). Universidad Nacional de Cuyo.
Hernández Lorenzo, L. (2020). Los textos poéticos de Fernando de Herrera: aproximaciones desde la estilística de corpus y la estilometría. [Tesis doctoral]. Universidad de Sevilla.
López Poza, S. (2021). «Sicut apes». Recepción e imitación de los clásicos en el Siglo de Oro y creación artística híbrida (texto e imagen). Hipogrifo (9.1), 21-46. https://doi.org/10.13035/H.2021.09.01.04
López Poza, S. (2022). La imprenta anónima de la segunda edición de las «Empresas políticas» de Diego Saavedra Fajardo y detalles sobre la princeps y su repercusión. Etiópicas. Revista de Letras Renacentistas, (18), 155-183. http://www.uhu.es/publicaciones/ojs/index.php/etiopicas/article/view/7634
López Salas, E., García Arranz, J. L., Santos Miñambres, M. A. y López Poza, S. (2023). Estudio interdisciplinar de una relación festiva: de la descripción textual a la representación visual de la arquitectura efímera y su iconografía. En F. Díez Platas y C. González-Pérez (Coords.), Scire vias. Humanidades Digitales y Conocimiento (pp. 75-108). Servizo de Publicacións da UDC.
Martos Pérez, M.-D. (2022). La literatura áurea en el entorno digital (2017-2020): Balance, metodologías y diagnósticos. Etiópicas. Revista de Letras Renacentistas, (18), 517-592.
Pena Sueiro, N. (2017). El portal BIDISO: pasado, presente y futuro inmediato. Un ejemplo de evolución en aplicaciones de las HD. Studia aurea: revista de literatura española y teoría literaria del Renacimiento y Siglo de Oro, (11), 73-92. https://raco.cat/index.php/StudiaAurea/article/view/332382 https://doi.org/10.5565/rev/studiaaurea.264
Pierazzo, E. (2015). Digital scholarly editing: theories, models and methods. Ashgate.
Pierazzo, E. (2019). What future for digital scholarly editions? From haute couture to prêt-à-porter. International Journal of Digital Humanities, 1(2), 209-220. https://doi.org/10.1007/s42803-019-00019-3
Ramos Maldonado, S. (2015). Ad iuvenes studiosos: sobre cómo introducir en el aula metodologías activas de aprendizaje de las lenguas clásicas y no morir en el intento. Ponencia presentada en las Jornadas de innovación didáctica en latín y griego. Málaga, 23 de septiembre de 2015 (pp. 1-4). http://hdl.handle.net/10630/10363
Real Academia Española (s. f.). Banco de datos (CORDE) [en línea]. Corpus diacrónico del español. http://www.rae.es
Revenga García, N. (2021). La Estrella de Sevilla y las potencialidades de la edición digital. [Tesis Doctoral]. Universitat de València.
Rojas Castro, A. (2022). La publicación de ediciones digitales académicas y el caso de las Soledades de Luis de Góngora. Historias Fingidas, (Número Extra 1), 195-217.
Sahle, P. (2016). What is a scholarly edition? En D. Matthew-James y E. Pierazzo (Eds.), Digital scholarly editing: theories and practices (pp. 19-40). Open Book Publishers. https://doi.org/10.11647/OBP.0095.02
Toscano, M., Rabadán, A., Ros, S. y González-Blanco, E. (2020). Digital humanities in Spain: Historical perspective and current scenario. El Profesional de la Información, 29(6), e290601. https://doi.org/10.3145/epi.2020.nov.01
Vidal, E., Alonso Villalobos, C., Romero Gómez, V., Márquez Carmona, L., Orcero, M. de C., Garrido Romero, D. y Jiménez Melero, M. (2020). Proyecto Carabela. Un método revolucionario para la investigación de naufragios en archivos históricos basado en la inteligencia artificial. Drassana: revista del Museu Marítim, (28), 88-105. https://revistadrassana.cat/index.php/Drassana/article/view/647/754
[1] Corpus diacrónico del español (CORDE), accesible desde 1999. Este corpus textual de todas las épocas y lugares en que se habló español desde los inicios del idioma hasta el año 1974 permite consultar las palabras en su contexto a lo largo de los siglos para comprobar su evolución de significados y otros aspectos de interés filológico. Está formado por algo más de doscientas cincuenta millones de formas.
[2] Las «Recomendaciones de 2006 del Consejo de Europa sobre la digitalización, la accesibilidad en línea del material cultural y la conservación digital» facilitaron la adopción de estrategias comunes de las distintas administraciones y de entidades privadas y se crearon repositorios nacionales agregadores de contenidos de Europeana (biblioteca digital europea, accesible desde 2009 y, desde 2015, Infraestructura de Servicios Digitales —DSI— de la Comisión Europea). Este gran repositorio central reúne y permite el acceso abierto a materiales culturales en formato digital (de texto, imagen, sonido, vídeo y 3D) de unas 2200 instituciones de los veintisiete estados y otros asociados, gracias a un único modelo de metadatos abiertos y estructurados (Europeana Semantic Elements [ESE]), que establecía un conjunto de campos Dublin Core junto con otros doce elementos específicos para Europeana. Ese modelo hubo de ser reemplazado por uno nuevo, Europeana Data Model (EDM), cuya primera versión data de 2011, que ofrece más posibilidades de búsqueda e información para el usuario, y de interoperabilidad en proyectos con los datos enlazados o Linked Open Data. Hispana es el repositorio español agregador de Europeana (así como otras instituciones, grupos y proyectos españoles que utilizan el protocolo de interoperabilidad OAI-PMH (OAI Protocol for Metadata Harvesting), más ligero para el intercambio de metadatos entre servicios.
[3] Contrastando en mis dos pantallas muchas ediciones milanesas del siglo xvii pude averiguar que la famosa segunda edición de las empresas de Diego Saavedra Fajardo, impresa según la portada en Milán en 1642, sin editor, fue en realidad impresa en los talleres de los hermanos Giovanni Battista y Giulio Cesare Malatesta, y que la fecha fue 1643 y no 1642 (López Poza, 2022).
[4] Las bases integradas en Aracne son: Amadís, Base de datos caballeresca; Bieses, Base de datos de escritoras españolas hasta 1800; Biblioteca digital de paratextos y buscador, Biblioteca de obras impresas de escritoras hasta 1800; BSF, Biblioteca Saavedra Fajardo; CICLE (Corpus de ediciones de clásicos latinos en España); Comedic, Catálogo de obras medievales impresas en castellano; DEBOW (Digital Emblem Books on Web), Catálogo de ediciones digitales de libros de emblemas y obras afines accesibles en Internet; Dialogyca, Biblioteca digital de diálogo hispánico; DINAM, Diccionario de nombres del ciclo amadisiano; Emblemas Traducidos, Biblioteca Digital de Emblemas Traducidos; Emblemática Hispánica, Biblioteca Digital de emblemática hispánica; ESTALA, Poesía hispánica en el bajo barroco; Grafos de redes de sociabilidad, Grafos de las relaciones entre escritoras españolas y el medio literario; Heredia, Base de datos de literatura aragonesa; IBSO, Inventarios y bibliotecas del Siglo de Oro; Junta de Libros, Poesía hispánica en el bajo barroco; Poliantea, Enciclopedias, repertorios y misceláneas; Relaciones de Sucesos, Catálogo y Biblioteca Digital de Relaciones de Sucesos; Sendebar, Base de datos del cuento medieval; Silem; Biblioteca digital; Symbola. Divisas o empresas históricas; Tipobibliografía valenciana de los siglos XV y XVI.
[5] Estos estados de la cuestión suelen publicarse en la revista Etiópicas. María D. Martos Pérez (2022), como encargada del encuentro en el congreso de Neuchâtel en 2020 ofrece una visión panorámica de las principales líneas de investigación sobre humanidades digitales aplicadas a los estudios del Siglo de Oro entre los años 2018 a 2020. El último «encuentro de investigadores» con relación a recursos digitales sobre Siglo de Oro, tuvo lugar en julio de 2023 en Oviedo, con motivo del xiii congreso de la AISO y fue coordinado por Sònia Boadas (https://aiso-asociacion.org/wp-content/uploads/2023/09/Lista_HHDD_Boadas.pdf).
[6] ASODAT (http://asodat.uv.es), Bases de Datos Integradas del Teatro Clásico Español, bajo la dirección de Teresa Ferrer, integra el trabajo de muchos años y muchos investigadores depositadas en las siguientes bases de datos; ARTELOPE (http://artelope.uv.es/basededatos/index.php), base de datos y argumentos sobre el teatro de Lope de Vega, bajo la dirección de Joan Oleza; CATCOM (http://catcom.uv.es), base de datos de comedias mencionadas en la documentación teatral (1540- 1700), bajo la dirección de Teresa Ferrer; CLEMIT (http://buscador.clemit.es/buscador.php), Censuras y licencias en manuscritos e impresos teatrales, bajo la dirección de Héctor Urzaiz; DICAT (https://dicat.uv.es), Diccionario biográfico de actores del teatro clásico español, bajo la dirección de Teresa Ferrer; Digital Música Poética (http://digitalmp.uv.es), base de datos integrada del Teatro Clásico Español, bajo la dirección de Lola Josa; EMOTHE (https://emothe.uv.es/basededatos), European Modern Theatre, bajo la dirección de Joan Oleza Simó; ETSO (http://etso.es/), Estilometría aplicada al teatro del Siglo de Oro, bajo la dirección de Germán Vega-García Luengos y Álvaro Cuéllar; CETSO (https://etso.es/cetso), Corpus de Estilometría aplicada al Teatro del Siglo de Oro; TEXORO (https://etso.es/texoro), Textos del Siglo de Oro; ISTAE (https://istae.uv.es/consulta/busqueda), Impresos sueltos del teatro antiguo español, bajo la dirección de Alejandra Ulla; Manos teatrales (https://manos.net), base de datos de manuscritos y copistas teatrales, bajo la dirección de A. García-Reidy y M. R. Greer.
[7] Más reciente y de interés para estudios de teatro es AUTESO (Autógrafos teatrales del Siglo de Oro), dirigida por Sònia Boadas y Marco Presotto.
[8] https://www.fbbva.es/noticias/proyecto-carabela-una-herramienta-de-inteligencia-artificial-al-servicio-de-la-investigacion-historica; https://www.youtube.com/watch?v=kjp5S3VomyE
[9] Aún tenemos fresco el litigio que duró años sobre la propiedad del tesoro del navío Nuestra Señora de las Mercedes. Finalmente, la legislación internacional dio la razón al estado español, lo que permitió recuperar un valiosísimo tesoro acopiado por la empresa Odyssey cerca de la bahía de Cádiz.
[10] El corral de la montería de Sevilla: reconstrucción virtual del edificio y de su dispositivo escénico (https://idus.us.es/handle/11441/103174).
[11] Casa de Comedias de La Olivera (https://www.youtube.com/watch?v=aLuLGn9CSac).
[12] DARIAH (https://www.dariah.eu). Infraestructura de investigación digital para las artes y las humanidades cuyo objetivo es apoyar la investigación y la enseñanza digitales, ayudando a los investigadores para construir, analizar e interpretar recursos digitales. Proporciona acceso y difunde la investigación que surge de las colaboraciones y garantiza que se sigan las mejores prácticas y los estándares metodológicos y técnicos.
[13] CLARIN (https://www.clarin.eu): infraestructura de investigación paneuropea cuya finalidad es apoyar el intercambio, el uso y la sostenibilidad de los datos y herramientas lingüísticos para la investigación en humanidades y ciencias sociales.
[14] UPV/EHU (HiTZ), la Universidad de Santiago de Compostela (Instituto da Lingua Galega y CiTIUS), la Universidad de Alicante (Biblioteca Virtual Miguel de Cervantes), la UNED (CLARIAH-UNED), el BSC-CNS, el Consorcio Universidades de la Comunidad de Madrid (CLARIAH-CM), la Universidad de Jaén (CEATIC), la Universidad de Las Palmas de Gran Canaria (IATEXT), el Centro de Ciencias Humanas y Sociales (CSIC) y la Biblioteca Nacional de España (BNE).
[15] En septiembre de 2023 se presentó el Catálogo de Herramientas y Servicios de DARIAH, que da acceso a unos doscientos recursos (herramientas y servicios, publicaciones, conjuntos de datos, flujos de trabajo, etc.) a través del SSH Open Marketplace.
[16] La nomenclatura de «edición digital académica» (EDA) se ha ido consolidando en los últimos años. Un magnífico resumen sobre las vacilaciones en la terminología y el concepto mismo de este tipo de ediciones lo exponen Alvite-Díez y Rojas-Castro (2022), quienes también exploran los desarrollos de software para la publicación, analizan una muestra de aplicaciones y evalúan su adecuación a los estándares.
[17] No deben confundirse las ediciones digitales académicas, con texto marcado con etiquetas y que pueden ofrecer varias presentaciones generadas por algoritmos específicos, con otras ediciones que solo ofrecen mera digitalización del material impreso en formatos PDF y otros. Como dice Patrick Sahle (2016) «A digitised edition is not a digital edition» (‘una edición digitalizada no es una edición digital’).
[18] Los catálogos que siguen muestran poquísima representación de obras en español: Catalogue of Digital Scholarly Editions de Patrick Sahle (Universität zu Köln) (https://v3.digitale-edition.de) y el Catalogue of Digital Editions, producido por la colaboración de Peter Andorfer y Ksenia Zaytseva, del Austrian Centre for Digital Humanities (ACDH, Vienna) y Greta Franzini del UCL Centre for Digital Humanities (UCLDH, Londres) (https://dig-ed-cat.acdh.oeaw.ac.at). Este último está más actualizado que el primero (mayo de 2023). Ofrece dieciocho ediciones en español, de las que solo tres figuran como realizadas por instituciones españolas. De todos modos, en España se está avanzando en esta línea de trabajo y pronto se verán resultados que ahora están en ciernes. Se han dedicado algunas tesis doctorales al asunto, como la de Nadia Revenga García (2021).
[19] Alvite-Díez y Rojas-Castro (2022) ofrecen análisis y evaluación de tres herramientas de publicación gratuitas y de código abierto surgidas recientemente: las dos versiones de Edition Visualization Technology (EVT1 y EVT2) y TEI Publisher. Las versiones examinadas han sido: V. 1.3 de EVT1, V. BETA2 de EVT2 y V. 7.0.0 de TEI Publisher.