Philologia Hispalensis · 2024 Vol. · 38 · Nº 2 · pp. 79-100
ISSN 1132-0265 · © 2024. E. Universidad de Sevilla. · (CC BY-NC-ND 4.0 DEED)
Recibido: 30-11-2023. Aceptado: 16-01-2024
Resumen
El presente trabajo pretende cubrir la necesidad de compartir planteamientos de investigación, hipótesis, metodología y herramientas en los proyectos digitales en el ámbito de la filología hispánica y, en concreto, en la literatura áurea.
A este respecto, se ilustra sobre el origen del Proyecto Interuniversitario Silem, coordinado por las universidades de Córdoba y Sevilla y nacido en el seno del grupo de investigación PASO (Poesía Andaluza del Siglo de Oro) hace ocho años, los planteamientos filológicos de los que partía, la elección de las herramientas digitales utilizadas, la consecución de los objetivos fijados y la rentabilización de los recursos digitales usados, en virtud de un estándar, que ha producido las herramientas informáticas empleadas, a día de hoy, en cinco proyectos I+D en el ámbito de la literatura hispánica del Siglo de Oro.
Palabras clave: humanidades digitales, proyecto Silem, TEI, Teiscribe, eXist-db.
Abstract
This work aims to serve the need to share research approaches, hypotheses, methodology and tools in digital projects in the field of Hispanic Philology and, specifically, in Golden Literature.
In this regard, the origin of the Silem Interuniversity Project, coordinated by the universities of Córdoba and Seville and born within the research group PASO (Andalusian Poetry of the Golden Age), eight years ago, illustrates the philological approaches of the that started, the choice of the digital tools used, the achievement of the set objectives and the profitability of the digital resources used, under a standard, which has produced the computer tools used, to date, in five I+D projects in the field of Hispanic literature of the Golden Age.
Keywords: Digital Humanities, Silem Project, TEI, Teiscribe, eXist-db.
El mundo digital ha tardado más tiempo en recalar en los estudios filológicos que en otras disciplinas, no obstante, en la actualidad son habituales las iniciativas que incluyen humanidades digitales en las investigaciones de la lengua y la literatura[1].
De las nuevas inquietudes de investigación y la definición de nuevos problemas y objetos de estudio que motivaron una paralela renovación en las herramientas digitales nació en el año 2015 el proyecto interuniversitario, coordinado por las universidades de Córdoba y Sevilla, bajo la dirección de Pedro Ruiz Pérez, Silem («Sujeto e Institución Literaria en la Edad Moderna») (Figura 1) en el seno del Grupo PASO (Poesía Andaluza del Siglo de Oro)[2] dirigido por Juan Montero Delgado.
Su objeto era centrar la atención sobre un elemento fundamental en la constitución de la literatura moderna (y de su ideología y valores), como es la definición de la figura del autor y del sujeto en la modernidad. Delimitar el lugar y estrategias del autor junto a algunos de los elementos de impacto de su tarea resultaba un elemento clave tanto en el acercamiento al sentido de las obras individuales como en una historiografía más allá de la historia de las formas.
Silem buscaba un acercamiento panorámico a los procesos de configuración de la institución literaria en España a lo largo de la Edad Moderna a través de dos grandes líneas de recuperación documental y de reflexión:
No fue la primera incursión del Grupo PASO en las humanidades digitales. Ya en 2012 bajo el auspicio del proyecto «Poesía Hispánica en el Bajo Barroco (Repertorio, edición, historia» [FFI2011-24102]), dirigido por Pedro Ruiz Pérez, creamos la web PHEBO (Poesía Hispánica en el Bajo Barroco[3]) (Figura 2) que contenía una base de datos de libros de poesía e impresos poéticos entre 1650 y 1750, textos editados, bibliografía, materiales relativos al bajo barroco y un motor de búsqueda.
Dicha web fue incluida en la Red Aracne[4], red de humanidades digitales y letras hispánicas (Figura 3), cuya creación lideraron y coordinaron Phebo y Silem formando parte como núcleo central desde el inicio, junto a varios proyectos con objeto de evitar la dispersión de proyectos de investigación en la aplicación de los conceptos y herramientas de las humanidades digitales, y con el fin de establecer procedimientos comunes en distintos niveles, incluidos los conceptuales, metodológicos, de visibilidad y tecnológicos.
En esta ocasión el proyecto Silem pretendía dar un paso más en las humanidades digitales. Así, a la hora de elegir una herramienta de trabajo para el proyecto se eligió el estándar TEI (Text Encoding Iniciative[5]), lenguaje basado en XML para codificar cualquier estructura textual en formato digital.
La iniciativa se remonta al marco de un proyecto de cooperación internacional (1987) que buscaba un esquema de codificación común para estructuras textuales complejas que permitiese reducir la diversidad de prácticas existentes en la codificación de textos (Figura 4).
Desde el año 2000 el proyecto lo mantiene el Consorcio TEI, una organización sin ánimo de lucro, del que forman parte instituciones académicas y proyectos de investigación y académicos individuales de todo el mundo.
El estándar TEI ofrece un esquema (Figura 5) con un conjunto de elementos que permiten marcar las principales características estructurales, interpretativas y conceptuales de los textos con el objeto de poder ser procesadas posteriormente. El TEI se creó bajo la premisa de ser un lenguaje flexible y extensible, adaptable a las necesidades específicas de cualquier proyecto y texto; por otra parte, permite su interoperabilidad entre aplicaciones, plataformas y lenguajes informáticos y, por ende, entre proyectos.
Además, contamos con las TEI Guidelines for electronic text encoding and interchange (última versión P5 Version 4.7.0., 16 noviembre 2023), gramática XML con las pautas del estándar, en la que se documenta, por capítulos, el sistema de clases, atributos y módulos del esquema; con la TEI Lite, pequeña guía rápida, que, si bien no es completa, resuelve el 90% de las dudas, y con Roma, un asistente de personalización del esquema DTD (Document Type Definition) o ODD (One Document Does It All).
Tras la elección del tipo de lenguaje que íbamos a utilizar se creó una exhaustiva ontología (Figuras 6a y 6b) que diese cuenta de todos aquellos rasgos que nos interesaba marcar en los textos.
La ontología se componía básicamente de dos etiquetas: «sujeto social y literario» (<listPerson>)y «obra» (<desc>), que a su vez, se desplegaban en sus respectivos atributos: «edad» (<note type= “age”>), «sexo» (<sex>), «familia» (<note type= “family”>), «estatus social» (<socecStatus>), «formación» (<education>), «valores» (<note type= “values”>, «trayectoria» (<note type= “career”>), «géneros cultivados» (<note type= “genre”>), «sociabilidad/redes» (<note type= “network”>), «posición de campo» (<note type= “literaryField”>), «condición» (<state> + <p>), «imagen» (<note type= “authorFashioning”>) y «autoimagen» (<note type= “selfFashioning”>) y «canon» (<note type= “canon”>), «censura» (<note type= “censorship”>), «idioma» (<note type= “language”>), «idioma fuente» (<note type= “sourceLanguage”>), «juicios sobre las fuentes» (<note type= “sourceJudgment”>), «período tratado» (<note type= “treatedPeriods”>), y «categorías periodológicas» (<note type= “periodologicalFeatures”>) en el caso del «sujeto social y literario»; y «edición» (<desc type= “edition”>), «materia» (<desc type= “subject”>), «genera» (<desc type= “genera”>), «estilo» (<desc type= “style”>), «reglas» (<desc type= “rules”>), «imitación» (<desc type= “imitation”>), «desarrollo polémica» (<desc type= “devControversy”>), «difusión polémica» (<desc type= “difControversy”>), «temas polemizados» (<desc type= “subControversy”>), «modalidad discursiva» (<desc type= “modControversy”>), «autoridad» (<desc type= “authority”>), «autoría» (<desc type= “authorship”>), etc., en la obra (<desc>) descompuestos, a su vez, en diversos valores que recogen los matices que serán etiquetados en el texto; como, por ejemplo, en el caso del atributo «Imagen» (<note type= “authorFashioning”>), perteneciente a la etiqueta «sujeto social y literario» (<listPerson>), esta se despliega en los valores: «negación», «modestia», «justificación», «vindicación», «celebración» y «ataque» (<subtype=“denial|modesty|justification|vindication|celebration|attack”>).
Los textos van encabezados (<TeiHeader>) por la información del título del texto editado, autor del texto, título de la obra, autor de la obra, edición, más información (relación de preliminares), fuentes (ejemplar del que se realiza la transcripción del texto), información técnica (editor, codificador, proyecto al que pertenece, criterios y lenguaje de cifrado).
Con el lenguaje de codificación y la ontología era necesario elegir el programa a utilizar para editar los textos. Entre las opciones barajadas se encontraban los editores Oxygen, software privado, o Copy Editor, gratuito, entre otros. No obstante, las estrechas redes de colaboración de larga duración con el proyecto de Bieses[8] nos pusieron en contacto con una herramienta (Figura 7) que el Laboratorio de Humanidades Digitales de la UNED había creado y puesto a disposición de toda la comunidad investigadora: TeiScribe[9]. Se trata de un editor de TEI de fácil manejo que pudiéramos comparar con un procesador de textos y con él se han etiquetado los textos que componen las bibliotecas del proyecto Silem (Figuras 8a y 8b).
O en el caso de la etiqueta de «redes», que se despliega en «protección», por ejemplo.
Para el trabajo de los investigadores se creó una plantilla en Word (Figura 13), donde por medio de una labor crítica, filológica e interpretativa marcaban aquellos rasgos conceptuales presentes de interés para el proyecto (etiquetas).
Una vez cumplimentada la plantilla se cargaba en una intranet, en este caso Moodle (Figura 14), de donde tras pasar las revisiones necesarias la tomaban los etiquetadores para marcar el texto en TeiScribe.
La elaboración técnica del proyecto Silem fue labor del profesor de la Universidad Autónoma de Barcelona Cipriano López Lorenzo y mía y somos los responsables de la web de Silem y de la elaboración digital de la ontología y el etiquetado de textos.
Etiquetados los documentos, se cargaban en eXist-db[12], un sistema de gestión de bases de datos, software de código abierto, que almacena datos XML (Figura 15). Implica una base de datos nativa, ya que fue concebida para ser un motor de base de datos en documentos XML, si bien soporta casi cualquier tipo de documento, no solo XML, y comporta una base de datos no relacional que proporciona XQuery y XSLT como lenguajes de programación de aplicaciones y consultas. eXist fue creado por Wolfgang Meier y sus principales versiones fueron publicadas en octubre de 2006, año en que fue galardonada como la mejor base de datos del año por InfoWorld.
Para su indexado en eXist, de cara a su recuperación, los textos han sido identificados respecto a la biblioteca[13] a la que pertenezcan (BIO para Biografías, PAR en el caso de Paratextos, etc. [Figura 17]), la fecha de los textos y el autor de los mismos.
Como toda herramienta, TeiScribe tiene sus limitaciones, superadas con creces por su facilidad y rapidez de uso; es el caso del atributo en la etiqueta <TEI> que TeiScribe incluye, por defecto, en los textos (<TEI xmlns= “http://www.tei-c.org/ns/1.0”>) que debe eliminarse en cualquier editor (XML Copy Editor, por ejemplo, [Figura 18]), para su correcta lectura en eXist-db (<TEI>).
Los planteamientos científicos y de la propia concepción de la investigación de Silem siempre se basaron en proporcionar una herramienta de consulta abierta online para la comunidad investigadora y el público en general. Así pues, los resultados de Silem se siguen volcando en la web instalada en el servidor de la Universidad de Córdoba[15], donde el usuario puede acercarse a una serie de textos que le servirán de herramienta en investigaciones futuras, volcados en varias bibliotecas digitales.
Las cinco primeras bibliotecas —Polémicas, Inventarios, Biografías, Retratos y Paratextos— ofrecían al usuario una selección abierta de textos —o microtextos— y retratos procedentes de impresos y manuscritos de entre los siglos xvi y xviii que responden a un determinado motivo o foco de interés, según el caso.
Silem tuvo feliz continuación en Silem II (2018), que incluyó una nueva biblioteca de Textos historiográficos y multiplicó exponencialmente los textos recogidos en las bibliotecas. A su vez, la web de Silem alberga actualmente las bibliotecas de los proyectos I+D Paranoba («El discurso paratextual de la novela corta barroca. Poética y sociabilidad literaria» (PY18-3938), dirigido por Rafael Bonilla Cerezo e Ignacio García Aguilar[17], y Presolo («Prácticas editoriales y sociabilidad literaria en torno a Lope de Vega»), dirigido por Ignacio García Aguilar[18], proyectos autónomos desarrollados a partir del planteamiento general.
Por otra parte, el proyecto Silem continuó la labor de investigación vinculado también al Proyecto de Excelencia «El canon poético barroco en el siglo xviii: pervivencia y debates andaluces», dirigido por Pedro Ruiz Pérez, cuyos resultados de investigación se incluyeron ya en Silem I en la sexta biblioteca de la web, Canon poético, que recoge ediciones de algunos de los textos fundamentales, relacionados en casi todos los casos con las prácticas líricas y académicas en la Andalucía de los siglos xvi y xviii hasta su valoración en el siglo xviii y que conformaron el canon poético del bajo barroco y la lectura que de él hicieron los ilustrados en su camino hacia un ideal neoclásico. Los textos recogidos pertenecen a distintos ámbitos: historiografía, crítica, alternativa clasicista o transmisión culta/popular.
En la actualidad, el Grupo PASO, siguiendo en la línea de trabajo acerca de la conformación del canon áureo acomete el estudio de la contribución de la prensa periódica a la formación e implantación del canon de la literatura española en relación con la noción de «Siglo de Oro» con el proyecto interuniversitario SILEM III «La institución del “Siglo de Oro”. Procesos de construcción en la prensa periódica (1801-1868)», dirigido por Mercedes Comellas.
La finalidad del proyecto es estudiar la manera en que la prensa del siglo xix popularizó y difundió modelos y valores literarios de cara a la construcción del imaginario nacional, institucionalizando y conceptualizando las letras áureas.
Los resultados investigativos de los dos proyectos precedentes sobre la institucionalización de la literatura, los planteamientos críticos, conceptuales y metodológicos resultan una base sólida para el proyecto presente, que parte de la hipótesis del valor determinante en arraigo y extensión, aunque no único, de los periódicos en la divulgación de los valores relacionados con la construcción del discurso historiográfico, ya que el medio favorecía su asimilación con sencillos discursos de un imaginario colectivo por capas más amplias de la sociedad.
Los periódicos acogieron desde el inicio del siglo xix escritos y ensayos que condicionaron la recepción del conocimiento del pasado, propagando controversias en un proceso vinculado a los intentos por asentar un orden institucional y un imaginario nacional, como fuerza unificadora de la cultura nacional española.
La historia de la literatura hispánica se convierte en un elemento de unificación nacional, conformando criterios canónicos con el fin de alcanzar un público mayoritario. Así, la prensa regula y forma la sociedad cumpliendo una función de mediación, con la que se pone al conjunto social en contacto con los valores de la minoría dirigente, en este caso la burguesía liberal empeñada en incorporar la literatura y su historia a la construcción de la identidad nacional. La hipótesis de partida es que la presencia y el tratamiento de los autores y obras de los siglos xvi y xvii responden a este objetivo y que en su despliegue se culmina la caracterización como «Siglo de Oro» para un periodo en que se diluye la contraposición entre los dos siglos para determinar a cuál corresponde la entidad áurea.
En un escenario en el que se desarrolla y proyecta el debate entre clasicistas y románticos el tratamiento del objeto de estudio responde en parte importante a los cambios derivados de la oposición de paradigmas estéticos. De ellos derivan los matices y alteración en la construcción de la tradición canónica nacional, en los que se centra el estudio. En él se atenderá a los criterios estéticos, filosóficos y emocionales vinculados a los intereses ligados a la construcción de la nación, paralelos a los puestos en funcionamiento en Europa. La voluntad es la de recomponer e interpretar críticamente cómo se produce una relectura (y una reescritura) y cómo esta encuentra en la prensa el instrumento idóneo para asentar la visión del pasado histórico en una conciencia nacional extendida a un grupo de lectores más amplio y heterogéneo.
El objeto de estudio se centra en el Siglo de Oro como canon clásico hispano y cumbre de la calidad estética, es decir, el clasicismo español, esgrimido por los autores decimonónicos con un valor de continuidad, al establecer vínculos entre la literatura áurea y la contemporánea, y de pervivencia de unos valores nacionales de los que dependen las posibilidades de crecimiento futuro.
El arco temporal del proyecto abarca los dos primeros tercios del siglo xix desde la aparición del Memorial literario (1801) hasta el emblemático 1868, fecha de la profunda transformación de valores políticos, sociales, ideológicos y culturales que significó la Gloriosa, el nacimiento de la aplicación del positivismo científico a la historia literaria (la Histoire de la littérature anglaise de Taine es de 1864) y el inicio del estudio sociohistórico de la literatura.
Se estudiará, a su vez, la caracterización de los modelos discursivos y genéricos desplegados en la prensa periódica para conformar una imagen áurea; al tiempo que se construirá una semántica de valores conceptuales y emocionales de aplicación a la construcción del canon áureo en la historiografía decimonónica.
Estará presente el estudio del canon áureo en la prensa decimonónica desde una perspectiva de género, el papel como agente que tuvo la mujer en el proceso de institucionalización de la literatura del Siglo de Oro en la prensa, campo más abierto que el literario, si bien caso de especial marginación en la construcción historiográfica y crítica como objeto.
Y todo ello contextualizado en el marco común europeo para la delimitación de sus semejanzas y diferencias específicas al respecto de una serie de rasgos no exclusivos del caso hispánico (extensión de la burguesía, formación de la ideología liberal y plasmación en las ideas estéticas arraigadas en el romanticismo) que deben explicarse en relación con las situaciones que comienzan a configurarse en Gran Bretaña, Francia, Italia y Alemania. Realidad europea coetánea.
Los resultados de la investigación interpretativa y crítica se plasmarán en una serie de libros o monográficos colectivos que llevarán a cabo un estudio sistemático de los distintos aspectos de la formación del canon áureo en la prensa periódica decimonónica.
Finalmente, se prevé la creación de un espacio en la Biblioteca Virtual Miguel de Cervantes, dentro del Portal Literatura y Periodismo en la época del Romanticismo en España[19], dirigido por M.ª José Alonso Seoane, miembro del proyecto.
La primera fase del proyecto, en la que nos encontramos inmersos, constituye la transcripción y etiquetado semántico de los materiales periodísticos (1801-1868) relacionados con la literatura de los siglos xvi y xvii y su canonización como «siglo de oro» para su inclusión en una biblioteca digital específica integrada en la web de SILEM, coordinada con el resto de las bibliotecas ya realizadas. A esto se unirá el vaciado de los anuncios de publicaciones en La Gaceta de Madrid y una treintena de cabeceras impresas en España entre 1801-1868. Esto supone una implementación de la actual web, actualizada con el nuevo proyecto y la nueva biblioteca.
De otro lado, se elaborará una base de datos de la prensa periódica con agencia en la formación del canon, para lo que se adaptarán las elaboradas por el equipo NICANTO de la Université Bordeaux-Montaigne, en File-Maker, para ofrecerlos en abierto.
A la biblioteca digital se unirán las representaciones de redes de sociabilidad mediante grafos elaborados con Gephi (promotores de publicaciones periódicas, escritores/as destacados/as con actividad en la prensa, otras escritoras).
Tras ocho años desde el inicio de Silem, la conjunción de la construcción de la arquitectura digital, la maduración de los planteamientos histórico-críticos y la estructura de trabajo se han rentabilizado con resultados tecnológicos y filológicos que han mostrado la eficacia del tratamiento TEI de los textos y las posibilidades al respecto de búsquedas conceptuales avanzadas[20], permitiendo augurar que el proyecto actual avanzará con cierta solidez a partir de los resultados previos, y pensar en su superación en una línea de avance tanto en lo humanístico como en lo digital. Los resultados iniciales, que permiten valorar más de dos mil entradas (con sus correspondientes transcripciones), a las que se unirán las que compondrán la nueva biblioteca, «Prensa y canon», sustentan la validez del interés de su análisis por su capacidad de impacto y justifica la necesidad de una herramienta digital para gestionar tal volumen de información y extraer los pertinentes datos de investigación.
Biblioteca Nacional de España. (s. f.). Catálogo de Autoridades. http://catalogo.bne.es/uhtbin/authoritybrowse.cgi
eXist-db. (s. f.). https://exist-db.org/exist/apps/homepage/index.html
Grupo PASO (Poesía Andaluza del Siglo de Oro). (s. f.). https://grupo.us.es/paso/
Guía de uso Silem. (s. f.). http://www.uco.es/servicios/ucopress/silem/buscador/pdf/Guia_Busqueda_Silem.pdf
Laboratorio de Innovación en Humanidades Digitales de la UNED. (2016). Uso de TeiScribe en el EVILINDH. https://www.youtube.com/watch?v=Zs1KDuBGFRE
Martos Pérez, M. D. (2023). La literatura áurea en el entorno digital (2017-2020): Balance, metodologías y diagnósticos. Etiópicas. Revista de Letras Renacentistas, 18, 517-592. https://doi.org/10.33776/eti.v18.7836
Portal Literatura y periodismo en la época del Romanticismo en España. (s. f.). https://www.cervantesvirtual.com/portales/literatura_y_periodismo_del_romanticismo
Proyecto PHEBO. «Phebo Poesía Hispánica en el Bajo Barroco (Repertorio, edición, historia)». (s. f.). http://www.uco.es/phebo/es
Red Aracne. (s. f.). https://www.red-aracne.es/
Text Encoding Iniciative (TEI). (s. f.). http://www.tei-c.org/index.xml
The Virtual International Authority File. (s. f.). https://viaf.org/
XML Copy Editor. (s. f.). https://xml-copy-editor.sourceforge.io/
[1] Al respecto del estado actual de los proyectos digitales en la literatura áurea, véase Martos Pérez, M. D. (2023).
[2] Web Grupo PASO: https://grupo.us.es/paso/
[3] Web PHEBO: http://www.uco.es/phebo/es
[4] Web Red Aracne: https://www.red-aracne.es/
[5] Web TEI: http://www.tei-c.org/index.xml
[6] La ontología completa se encuentra a disposición del usuario en la web (Guía de uso Silem http://www.uco.es/servicios/ucopress/silem/buscador/pdf/Guia_Busqueda_Silem.pdf).
[7] La ontología completa se encuentra a disposición del usuario en la web (Guía de uso Silem: http://www.uco.es/servicios/ucopress/silem/buscador/pdf/Guia_Busqueda_Silem.pdf).
[8] Ambos grupos de investigación han participado en la Red de Excelencia VOCES y SILENCIOS, dirigida por Pedro Ruiz Pérez, junto con otros grupos como Dialogyca, VIES o Censura, a partir de las líneas de trabajo coincidentes en la época estudiada (la Edad Moderna) y el problema de investigación (la identidad autorial, para las mujeres en un caso, en general en otro). [https://www.uco.es/redvoces/]. Colaboraron también en la formación de la Red ARACNE en un proceso en el que la sintonía conceptual se extendió a lo relativo a las humanidades digitales, donde SILEM acomodó el planteamiento de base respecto al uso de TEI y modos de aplicación, tomado de BIESES a sus intereses en un diálogo productivo.
[9] Laboratorio de Innovación en Humanidades Digitales de la UNED (2016). Uso de TeiScribe en el EVILINDH: https://www.youtube.com/watch?v=Zs1KDuBGFRE
[10] Catálogo de Autoridades de la BNE: http://catalogo.bne.es/uhtbin/authoritybrowse.cgi
[11] Web The Virtual International Authority File: https://viaf.org/
[12] En la web eXist-db se puede efectuar la descarga gratuita del software: https://exist-db.org/exist/apps/homepage/index.html
[13] Véase infra.
[14] En la web de XML Copy Editor se puede efectuar la descarga gratuita del software: https://xml-copy-editor.sourceforge.io/
[16] Guía de uso Silem: http://www.uco.es/servicios/ucopress/silem/buscador/pdf/Guia_Busqueda_Silem.pdf
[20] Como hemos comentado, con estas herramientas se ha construido el etiquetado y visualización de las bibliotecas de cinco proyectos: Silem I, II, Presolo, Paranoba y Silem III; si bien, tanto Presolo como Paranoba, dado su carácter autónomo, poseen también web propia.