Anotación y explotación de variantes gráficas de base fonética en el corpus Oralia Diacrónica del Español

Autores/as

DOI:

https://doi.org/10.12795/PH.2024.v38.i01.13

Palabras clave:

corpus histórico, anotación de corpus, fonética histórica, seseo, ceceo

Resumen

Los corpus históricos de referencia disponibles para el español son de gran utilidad para investigar aspectos de carácter léxico y morfosintáctico, pero resultan inadecuados para extraer información de tipo fonético. Conscientes de esta necesidad, se están creando en los últimos años corpus especializados que prestan especial cuidado en el rigor gráfico de las transcripciones. El objetivo de este trabajo es doble. Por un lado, proponemos algunas líneas de mejora en la recolección de datos históricos que sean fiables para realizar estudios fonéticos. Por otro lado, presentamos el corpus especializado Oralia Diacrónica del Español, prestando especial atención a los aspectos que convierten a ODE en una herramienta idónea para abordar estudios cuantitativos sobre fonética histórica. Usando los datos de ODE, analizamos un estudio de caso, el de las grafías indicadoras de seseo y ceceo, con el objeto de demostrar la utilidad de este corpus para la investigación en fonética histórica del español clásico y moderno.

Descargas

Los datos de descargas todavía no están disponibles.

Citas

Almeida Cabrejas, B. (Coord.). (s. f.). Corpus hispánico y americano en la red: textos antiguos (CHARTA). https://www.corpuscharta.es/consultas.html

Almeida Cabrejas, B. (2014). Scriptores con bajo y medio nivel socioeducacional en documentos del siglo XIX del Archivo Municipal de Alcalá de Henares: acercamiento a sus usos gráficos. En R. Díaz Moreno y B. Almeida (Eds.), Estudios sobre la historia de los usos gráficos en español (pp. 167-210). Axac.

Almeida Cabrejas, B. (2017). Mujeres que escriben y sistema(s) gráfico(s) en el siglo XVI: acercamiento desde un corpus de cartas. En B. Almeida, R. Díaz Moreno y C. Fernández López (Eds.), Cansada tendré a Vuestra Excelencia con tan larga carta». Estudios sobre aprendizaje y práctica de la escritura por mujeres en el ámbito hispánico (1500-1900) (pp. 9-53). Axac.

Archer, D., Kytö, M., Baron, A. y Rayson, P. (2015). Guidelines for normalizing Early Modern English corpora: Decisions and justifications. ICAME Journal, 39(1), 5-24. https://doi.org/10.1515/icame-2015-0001

Blas Arroyo, J. L. (2012). Tras las huellas de la variación y el cambio lingüístico a través de textos de inmediatez comunicativa. Fundamentos de un proyecto de sociolingüística histórica. En J. M. García Martín (Dir.), Actas del IX Congreso Internacional de Historia de la Lengua Española (pp. 1737-1756). Iberoamericana Vervuert.

Burnard, L. (2014). What is the Text Encoding Initiative? How to add intelligent markup to digital resources. OpenEdition Press. https://doi.org/10.4000/books.oep.426

Calderón Campos, M. (2019). La edición de corpus históricos en la plataforma TEITOK. El caso de ‘Oralia diacrónica del español’. Chimera: Romance Corpora and Linguistic Studies, (6), 21-36.

Calderón Campos, M. y García-Godoy, M. T. (Dirs.). (2019-). Oralia diacrónica del español (ODE). http://corpora.ugr.es/ode

Calderón Campos, M. y Vaamonde, G. (2020). Oralia diacrónica del español: Un nuevo corpus de la Edad Moderna. Scriptum Digital, (9), 167-189. https://doi.org/10.5565/rev/scriptum.108

Cano Aguilar, R. (1996). Lenguaje ‘espontáneo’ y retórica epistolar en cartas de emigrantes españoles a Indias. En T. Kotschi, W. Oesterreicher y K. Zimmermann (Eds.), El español hablado y la cultura oral en España e Hispanoamérica (pp. 375-404). Iberoamericana Vervuert.

Corpus Mallorca. (s. f.). Corpus Mallorca. Documentos castellanos en archivos de las Islas Baleares. https://www.corpusmallorca.es/

Culpeper, J. y Kytö, M. (2010). Early Modern English dialogues. Spoken interaction as writing. Cambridge University Press.

Davies, M. (Dir.). (2001). Corpus del Español (Género/Histórico) (CdEhist). www.corpusdelespanol.org/hist-gen/

Davies, M. (2009). Creating useful historical corpora: A comparison of CORDE, the Corpus del español, and the Corpus do português. En A. Enrique-Arias (Ed.), Diacronía de las lenguas iberorrománicas. Nuevas aportaciones desde la lingüística de corpus (pp. 137-166). Iberoamericana Vervuert. https://doi.org/10.31819/9783865278685-009

Dollinger, S. (2004). ‘Philological computing’ vs. ‘philological outsourcing’ and the compilation of historical corpora: a Late Modern English test case. Vienna English Working Papers (VIEWS), 13, 3-23.

Enrique-Arias, A. (Dir.). (2008). Biblia Medieval. http://www.bibliamedieval.es

Fradejas Rueda, J. M. (2019). Cuentapalabras. Estilometría y análisis de textos con R para Filólogos. http://www.aic.uva.es/cuentapalabras

González Sopeña, I. (2023). Confusión de sibilantes y neutralización -r/-l en los inventarios de bienes andaluces del siglo XVIII. Études romanes de Brno, 44(1), 141-162. https://doi.org/10.5817/ERB2023-1-9

Grupo de investigación de textos para la historia del español (GITHE). (s. f.). CODEA+ 2022. https://www.corpuscodea.es/

Hernangómez, D. (2024). mapSpain: Administrative Boundaries of Spain. https://doi.org/10.5281/zenodo.5366622

Honkapohja, A., Kaislaniemi, S. y Marttila, V. (2009). Digital Editions for Corpus Linguistics: Representing Manuscript Reality in Electronic Corpora. En A. H. Jucker, D. Schreier y M. Hundt (Eds.), Corpora: Pragmatics and Discourse (pp. 451-475). Rodopi.

Janssen, M. (2016). TEITOK: Text-Faithful Annotated Corpora. En N. Calzolari, K. Choukri, T. Declerck, S. Goggi, M. Grobelnik, B. Maegaard, J. Mariani, H. Mazo, A. Moreno, J. Odijk y S. Piperidis (Eds.), Proceedings of the LREC (pp. 4037-4043). European Language Resources Association.

Jenset, G. B. y McGillivray, B. (2017). Quantitative Historical Linguistics. A Corpus Framework. Oxford University Press.

Lass, R. (1997). Historical linguistics and language change. Cambridge University Press. https://doi.org/10.1017/CBO9780511620928

McEnery, T. y Wilson, A. (2001). Corpus linguistics. An introduction. Edinburgh University Press.

Meurman-Solin, A. (2001). Structured Text Corpora in the Study of Language Variation and Change. Literary and Linguistic Computing, 16(1), 5-27. https://doi.org/10.1093/llc/16.1.5

Morala Rodríguez, J. R. (Dir.). (2018a). Corpus léxico de inventarios (CorLexIn). https://corlexin.unileon.es/

Morala Rodríguez, J. R. (2018b). El proyecto CorLexIn y la variación diatópica en el léxico del Siglo de Oro. En D. Corbella Díaz, A. Fajardo Aguirre y J. Langenbacher-Liebgott (Eds.), Historia del léxico español y Humanidades digitales (pp. 397-417). Peter Lang.

Morala, J. R. y Perdiguero, H. (2019). La isoglosa de la aspiración de /f/ en el siglo XVII. En M. Castillo Lluch y E. Diez del Corral (Eds.), Reescribiendo la historia de la lengua española a partir de la edición de documentos (pp. 175-199). Peter Lang.

Núñez-Méndez, E. (2021). An overview of the sibilant merger and its development in Spanish. En E. Núñez-Méndez (Ed.), Sociolinguistic approaches to sibilant variation in Spanish (pp. 9-72). Routledge. https://doi.org/10.4324/9781003153948-3

Oesterreicher, W. (2004). Textos entre inmediatez y distancia comunicativas. El problema de lo hablado escrito en el Siglo de Oro. En R. Cano Aguilar (Ed.), Historia de la lengua española (pp. 729-769). Ariel.

Ortiz Cruz, D. (2020). Variaciones fonéticas en el léxico de inventarios de bienes aragoneses del siglo XVIII. RILEX. Revista sobre investigaciones léxicas, 3(1), 74-95. https://doi.org/10.17561/rilex.3.1.5297

P. S. Post Scriptum. (2014). P. S. Post Scriptum. Arquivo Digital de Escrita Quotidiana em Portugal e Espanha na Época Moderna. http://ps.clul.ul.pt

Real Academia Española. (s. f.). Corpus Diacrónico del Español (CORDE). http://www.rae.es

Real Academia Española. (2013). Corpus del diccionario histórico de la lengua española (CDH). http://www.rae.es

Rodríguez Puente, P. (2018). En busca de lo hablado en lo escrito en los corpus diacrónicos del español: Una comparativa con los corpus anglosajones. E-Scripta Romanica, 5, 89-127. https://doi.org/10.18778/2392-0718.05.09

Rojo, G. (2010). Aguja de navegar corpus. En V. Castel y L. Cubo de Severino (Eds.), La renovación de la palabra en el bicentenario de la Argentina. Los colores de la mirada lingüística (pp. 1151-1163). Editorial FFyL, UNCuyo.

Rojo, G. (2016). Corpus textuales del español. En J. Gutiérrez-Rexach (Ed.), Enciclopedia de Lingüística Hispánica (Vol. 2, pp. 285-296). Routledge. https://doi.org/10.4324/9781315713441-99

Rojo, G. (2021). Introducción a la lingüística de corpus en español. Routledge. https://doi.org/10.4324/9781003119760

Sánchez-Prieto Borja, P. (2020). Consonantismo avanzado en Madrid entre los siglos XVI y XIX a partir de un corpus documental (ALDICAM-CM). Verba: Anuario galego de filoloxia, 47, 55-86. https://doi.org/10.15304/verba.47.5616

Sánchez-Prieto Borja, P., Torrens Álvarez, M. J. y Vázquez Balonga, D. (Coords.). (2021). La lengua de Madrid a lo largo del tiempo. Editorial Universidad de Sevilla. https://doi.org/10.12795/9788447231140

Sánchez-Prieto Borja, P. y Vázquez Balonga, D. (2019). La beneficencia madrileña. Lengua y discurso en los documentos de los siglos XVI a XIX. Editorial Complutense.

Smith, J. (1997). An Historical Study of English. Function, Form and Change. Routledge.

Ueda, H. (2019). Las grafías bilabiales sonoras , y del español en relación con el fonema /f/ y el paradigma sibilante. En M. Castillo Lluch y E. Diez del Corral (Eds.), Reescribiendo la historia de la lengua española a partir de la edición de documentos (pp. 141-174). Peter Lang.

Vaamonde, G. (2018). Escritura epistolar, edición digital y anotación de corpus. Cuadernos del Instituto Historia de la Lengua, (11), 139-164. https://doi.org/10.58576/cilengua.vi11.53

Vázquez Balonga, D. y Sánchez-Prieto, B. (2015). ¿Seseo en el centro peninsular? Revista de Historia de la Lengua Española, (10), 201-207. https://doi.org/10.54166/rhle.2015.10.07

Publicado

2024-06-05

Cómo citar

Calderón Campos, M., & Vaamonde, G. (2024). Anotación y explotación de variantes gráficas de base fonética en el corpus Oralia Diacrónica del Español. Philologia Hispalensis, 38(1), 301–323. https://doi.org/10.12795/PH.2024.v38.i01.13
Recibido 2023-07-31
Aceptado 2024-02-22
Publicado 2024-06-05
Visualizaciones
  • Resumen 101
  • PDF 67
  • HTML 7
  • XML 9