Anotación y explotación de variantes gráficas de base fonética en el corpus Oralia Diacrónica del Español
DOI:
https://doi.org/10.12795/PH.2024.v38.i01.13Palabras clave:
corpus histórico, anotación de corpus, fonética histórica, seseo, ceceoResumen
Los corpus históricos de referencia disponibles para el español son de gran utilidad para investigar aspectos de carácter léxico y morfosintáctico, pero resultan inadecuados para extraer información de tipo fonético. Conscientes de esta necesidad, se están creando en los últimos años corpus especializados que prestan especial cuidado en el rigor gráfico de las transcripciones. El objetivo de este trabajo es doble. Por un lado, proponemos algunas líneas de mejora en la recolección de datos históricos que sean fiables para realizar estudios fonéticos. Por otro lado, presentamos el corpus especializado Oralia Diacrónica del Español, prestando especial atención a los aspectos que convierten a ODE en una herramienta idónea para abordar estudios cuantitativos sobre fonética histórica. Usando los datos de ODE, analizamos un estudio de caso, el de las grafías indicadoras de seseo y ceceo, con el objeto de demostrar la utilidad de este corpus para la investigación en fonética histórica del español clásico y moderno.
Descargas
Citas
Almeida Cabrejas, B. (Coord.). (s. f.). Corpus hispánico y americano en la red: textos antiguos (CHARTA). https://www.corpuscharta.es/consultas.html
Almeida Cabrejas, B. (2014). Scriptores con bajo y medio nivel socioeducacional en documentos del siglo XIX del Archivo Municipal de Alcalá de Henares: acercamiento a sus usos gráficos. En R. Díaz Moreno y B. Almeida (Eds.), Estudios sobre la historia de los usos gráficos en español (pp. 167-210). Axac.
Almeida Cabrejas, B. (2017). Mujeres que escriben y sistema(s) gráfico(s) en el siglo XVI: acercamiento desde un corpus de cartas. En B. Almeida, R. Díaz Moreno y C. Fernández López (Eds.), Cansada tendré a Vuestra Excelencia con tan larga carta». Estudios sobre aprendizaje y práctica de la escritura por mujeres en el ámbito hispánico (1500-1900) (pp. 9-53). Axac.
Archer, D., Kytö, M., Baron, A. y Rayson, P. (2015). Guidelines for normalizing Early Modern English corpora: Decisions and justifications. ICAME Journal, 39(1), 5-24. https://doi.org/10.1515/icame-2015-0001
Blas Arroyo, J. L. (2012). Tras las huellas de la variación y el cambio lingüístico a través de textos de inmediatez comunicativa. Fundamentos de un proyecto de sociolingüística histórica. En J. M. García Martín (Dir.), Actas del IX Congreso Internacional de Historia de la Lengua Española (pp. 1737-1756). Iberoamericana Vervuert.
Burnard, L. (2014). What is the Text Encoding Initiative? How to add intelligent markup to digital resources. OpenEdition Press. https://doi.org/10.4000/books.oep.426
Calderón Campos, M. (2019). La edición de corpus históricos en la plataforma TEITOK. El caso de ‘Oralia diacrónica del español’. Chimera: Romance Corpora and Linguistic Studies, (6), 21-36.
Calderón Campos, M. y García-Godoy, M. T. (Dirs.). (2019-). Oralia diacrónica del español (ODE). http://corpora.ugr.es/ode
Calderón Campos, M. y Vaamonde, G. (2020). Oralia diacrónica del español: Un nuevo corpus de la Edad Moderna. Scriptum Digital, (9), 167-189. https://doi.org/10.5565/rev/scriptum.108
Cano Aguilar, R. (1996). Lenguaje ‘espontáneo’ y retórica epistolar en cartas de emigrantes españoles a Indias. En T. Kotschi, W. Oesterreicher y K. Zimmermann (Eds.), El español hablado y la cultura oral en España e Hispanoamérica (pp. 375-404). Iberoamericana Vervuert.
Corpus Mallorca. (s. f.). Corpus Mallorca. Documentos castellanos en archivos de las Islas Baleares. https://www.corpusmallorca.es/
Culpeper, J. y Kytö, M. (2010). Early Modern English dialogues. Spoken interaction as writing. Cambridge University Press.
Davies, M. (Dir.). (2001). Corpus del Español (Género/Histórico) (CdEhist). www.corpusdelespanol.org/hist-gen/
Davies, M. (2009). Creating useful historical corpora: A comparison of CORDE, the Corpus del español, and the Corpus do português. En A. Enrique-Arias (Ed.), Diacronía de las lenguas iberorrománicas. Nuevas aportaciones desde la lingüística de corpus (pp. 137-166). Iberoamericana Vervuert. https://doi.org/10.31819/9783865278685-009
Dollinger, S. (2004). ‘Philological computing’ vs. ‘philological outsourcing’ and the compilation of historical corpora: a Late Modern English test case. Vienna English Working Papers (VIEWS), 13, 3-23.
Enrique-Arias, A. (Dir.). (2008). Biblia Medieval. http://www.bibliamedieval.es
Fradejas Rueda, J. M. (2019). Cuentapalabras. Estilometría y análisis de textos con R para Filólogos. http://www.aic.uva.es/cuentapalabras
González Sopeña, I. (2023). Confusión de sibilantes y neutralización -r/-l en los inventarios de bienes andaluces del siglo XVIII. Études romanes de Brno, 44(1), 141-162. https://doi.org/10.5817/ERB2023-1-9
Grupo de investigación de textos para la historia del español (GITHE). (s. f.). CODEA+ 2022. https://www.corpuscodea.es/
Hernangómez, D. (2024). mapSpain: Administrative Boundaries of Spain. https://doi.org/10.5281/zenodo.5366622
Honkapohja, A., Kaislaniemi, S. y Marttila, V. (2009). Digital Editions for Corpus Linguistics: Representing Manuscript Reality in Electronic Corpora. En A. H. Jucker, D. Schreier y M. Hundt (Eds.), Corpora: Pragmatics and Discourse (pp. 451-475). Rodopi.
Janssen, M. (2016). TEITOK: Text-Faithful Annotated Corpora. En N. Calzolari, K. Choukri, T. Declerck, S. Goggi, M. Grobelnik, B. Maegaard, J. Mariani, H. Mazo, A. Moreno, J. Odijk y S. Piperidis (Eds.), Proceedings of the LREC (pp. 4037-4043). European Language Resources Association.
Jenset, G. B. y McGillivray, B. (2017). Quantitative Historical Linguistics. A Corpus Framework. Oxford University Press.
Lass, R. (1997). Historical linguistics and language change. Cambridge University Press. https://doi.org/10.1017/CBO9780511620928
McEnery, T. y Wilson, A. (2001). Corpus linguistics. An introduction. Edinburgh University Press.
Meurman-Solin, A. (2001). Structured Text Corpora in the Study of Language Variation and Change. Literary and Linguistic Computing, 16(1), 5-27. https://doi.org/10.1093/llc/16.1.5
Morala Rodríguez, J. R. (Dir.). (2018a). Corpus léxico de inventarios (CorLexIn). https://corlexin.unileon.es/
Morala Rodríguez, J. R. (2018b). El proyecto CorLexIn y la variación diatópica en el léxico del Siglo de Oro. En D. Corbella Díaz, A. Fajardo Aguirre y J. Langenbacher-Liebgott (Eds.), Historia del léxico español y Humanidades digitales (pp. 397-417). Peter Lang.
Morala, J. R. y Perdiguero, H. (2019). La isoglosa de la aspiración de /f/ en el siglo XVII. En M. Castillo Lluch y E. Diez del Corral (Eds.), Reescribiendo la historia de la lengua española a partir de la edición de documentos (pp. 175-199). Peter Lang.
Núñez-Méndez, E. (2021). An overview of the sibilant merger and its development in Spanish. En E. Núñez-Méndez (Ed.), Sociolinguistic approaches to sibilant variation in Spanish (pp. 9-72). Routledge. https://doi.org/10.4324/9781003153948-3
Oesterreicher, W. (2004). Textos entre inmediatez y distancia comunicativas. El problema de lo hablado escrito en el Siglo de Oro. En R. Cano Aguilar (Ed.), Historia de la lengua española (pp. 729-769). Ariel.
Ortiz Cruz, D. (2020). Variaciones fonéticas en el léxico de inventarios de bienes aragoneses del siglo XVIII. RILEX. Revista sobre investigaciones léxicas, 3(1), 74-95. https://doi.org/10.17561/rilex.3.1.5297
P. S. Post Scriptum. (2014). P. S. Post Scriptum. Arquivo Digital de Escrita Quotidiana em Portugal e Espanha na Época Moderna. http://ps.clul.ul.pt
Real Academia Española. (s. f.). Corpus Diacrónico del Español (CORDE). http://www.rae.es
Real Academia Española. (2013). Corpus del diccionario histórico de la lengua española (CDH). http://www.rae.es
Rodríguez Puente, P. (2018). En busca de lo hablado en lo escrito en los corpus diacrónicos del español: Una comparativa con los corpus anglosajones. E-Scripta Romanica, 5, 89-127. https://doi.org/10.18778/2392-0718.05.09
Rojo, G. (2010). Aguja de navegar corpus. En V. Castel y L. Cubo de Severino (Eds.), La renovación de la palabra en el bicentenario de la Argentina. Los colores de la mirada lingüística (pp. 1151-1163). Editorial FFyL, UNCuyo.
Rojo, G. (2016). Corpus textuales del español. En J. Gutiérrez-Rexach (Ed.), Enciclopedia de Lingüística Hispánica (Vol. 2, pp. 285-296). Routledge. https://doi.org/10.4324/9781315713441-99
Rojo, G. (2021). Introducción a la lingüística de corpus en español. Routledge. https://doi.org/10.4324/9781003119760
Sánchez-Prieto Borja, P. (2020). Consonantismo avanzado en Madrid entre los siglos XVI y XIX a partir de un corpus documental (ALDICAM-CM). Verba: Anuario galego de filoloxia, 47, 55-86. https://doi.org/10.15304/verba.47.5616
Sánchez-Prieto Borja, P., Torrens Álvarez, M. J. y Vázquez Balonga, D. (Coords.). (2021). La lengua de Madrid a lo largo del tiempo. Editorial Universidad de Sevilla. https://doi.org/10.12795/9788447231140
Sánchez-Prieto Borja, P. y Vázquez Balonga, D. (2019). La beneficencia madrileña. Lengua y discurso en los documentos de los siglos XVI a XIX. Editorial Complutense.
Smith, J. (1997). An Historical Study of English. Function, Form and Change. Routledge.
Ueda, H. (2019). Las grafías bilabiales sonoras , y del español en relación con el fonema /f/ y el paradigma sibilante. En M. Castillo Lluch y E. Diez del Corral (Eds.), Reescribiendo la historia de la lengua española a partir de la edición de documentos (pp. 141-174). Peter Lang.
Vaamonde, G. (2018). Escritura epistolar, edición digital y anotación de corpus. Cuadernos del Instituto Historia de la Lengua, (11), 139-164. https://doi.org/10.58576/cilengua.vi11.53
Vázquez Balonga, D. y Sánchez-Prieto, B. (2015). ¿Seseo en el centro peninsular? Revista de Historia de la Lengua Española, (10), 201-207. https://doi.org/10.54166/rhle.2015.10.07
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2024 Gael Vaamonde, Miguel Calderón
Esta obra está bajo una licencia internacional Creative Commons Atribución-SinDerivadas 4.0.
Las ediciones impresa y electrónica de esta Revista son editadas por la Editorial Universidad de Sevilla, siendo necesario citar la procedencia en cualquier reproducción parcial o total.
Salvo indicación contraria, todos los contenidos de la edición electrónica se distribuyen bajo una licencia de uso y distribución “Creative Commons Atribución-NoComercial-SinDerivar 4.0 Internacional” . Puede consultar desde aquí la versión informativa y el texto legal de la licencia. Esta circunstancia ha de hacerse constar expresamente de esta forma cuando sea necesario.
Los autores/as que publiquen en esta revista aceptan las siguientes condiciones:
- Los autores/as conservan los derechos de autor y ceden a la revista el derecho de la primera publicación, y consienten en que se distribuya con una licencia Creative Commons By NC ND 4.0, que permite a terceros utilizar lo publicado siempre que mencionen la autoría del trabajo y a la primera publicación en esta revista, no se haga uso comercial y se reutilice de igual forma."
- Los autores/as pueden realizar otros acuerdos contractuales independientes y adicionales para la distribución no exclusiva de la versión del artículo publicado en esta revista (p. ej., incluirlo en un repositorio institucional o publicarlo en un libro) siempre que indiquen claramente que el trabajo se publicó por primera vez en esta revista.
- Se permite y recomienda a los autores/as que una vez publicado el artículo en la revista Philologia Hispalensis (versión online) se descarguen el PDF correspondiente y lo difundan por internet (ResearchGate, Academia.edu, etc.) ya que puede conducir a intercambios científicos productivos y a una mayor y más rápida difusión del trabajo publicado (vea The Effect of Open Access).
Aceptado 2024-02-22
Publicado 2024-06-05
- Resumen 101
- PDF 67
- HTML 7
- XML 9