Annotation and Exploitation of Phonetically-Based Spelling Variation in the Corpus Oralia Diacrónica del Español
DOI:
https://doi.org/10.12795/PH.2024.v38.i01.13Keywords:
historical corpus, corpus annotation, historical phonetics, seseo, ceceoAbstract
Historical reference corpora available for Spanish are very useful for investigating lexical and morphosyntactic aspects, but they are inadequate for extracting phonetic information. Aware of this need, in recent years specialized corpora have been developed that pay particular attention to the graphic accuracy of the transcriptions. The aim of this work is twofold. On the one hand, we propose some lines of improvement in the collection of historical data that are reliable for carrying out phonetics approaches. On the other hand, we present a specialized corpus Oralia Diacrónica del Español, paying special attention to those aspects that make ODE a suitable tool to handle quantitative studies on historical phonetics. Based on the data in this corpus, we analyze a case study, that of the spellings indicating seseo and ceceo, in order to prove the usefulness of this corpus for research in the historical phonetics of classical and modern Spanish.
Downloads
References
Almeida Cabrejas, B. (Coord.). (s. f.). Corpus hispánico y americano en la red: textos antiguos (CHARTA). https://www.corpuscharta.es/consultas.html
Almeida Cabrejas, B. (2014). Scriptores con bajo y medio nivel socioeducacional en documentos del siglo XIX del Archivo Municipal de Alcalá de Henares: acercamiento a sus usos gráficos. En R. Díaz Moreno y B. Almeida (Eds.), Estudios sobre la historia de los usos gráficos en español (pp. 167-210). Axac.
Almeida Cabrejas, B. (2017). Mujeres que escriben y sistema(s) gráfico(s) en el siglo XVI: acercamiento desde un corpus de cartas. En B. Almeida, R. Díaz Moreno y C. Fernández López (Eds.), Cansada tendré a Vuestra Excelencia con tan larga carta». Estudios sobre aprendizaje y práctica de la escritura por mujeres en el ámbito hispánico (1500-1900) (pp. 9-53). Axac.
Archer, D., Kytö, M., Baron, A. y Rayson, P. (2015). Guidelines for normalizing Early Modern English corpora: Decisions and justifications. ICAME Journal, 39(1), 5-24. https://doi.org/10.1515/icame-2015-0001
Blas Arroyo, J. L. (2012). Tras las huellas de la variación y el cambio lingüístico a través de textos de inmediatez comunicativa. Fundamentos de un proyecto de sociolingüística histórica. En J. M. García Martín (Dir.), Actas del IX Congreso Internacional de Historia de la Lengua Española (pp. 1737-1756). Iberoamericana Vervuert.
Burnard, L. (2014). What is the Text Encoding Initiative? How to add intelligent markup to digital resources. OpenEdition Press. https://doi.org/10.4000/books.oep.426
Calderón Campos, M. (2019). La edición de corpus históricos en la plataforma TEITOK. El caso de ‘Oralia diacrónica del español’. Chimera: Romance Corpora and Linguistic Studies, (6), 21-36.
Calderón Campos, M. y García-Godoy, M. T. (Dirs.). (2019-). Oralia diacrónica del español (ODE). http://corpora.ugr.es/ode
Calderón Campos, M. y Vaamonde, G. (2020). Oralia diacrónica del español: Un nuevo corpus de la Edad Moderna. Scriptum Digital, (9), 167-189. https://doi.org/10.5565/rev/scriptum.108
Cano Aguilar, R. (1996). Lenguaje ‘espontáneo’ y retórica epistolar en cartas de emigrantes españoles a Indias. En T. Kotschi, W. Oesterreicher y K. Zimmermann (Eds.), El español hablado y la cultura oral en España e Hispanoamérica (pp. 375-404). Iberoamericana Vervuert.
Corpus Mallorca. (s. f.). Corpus Mallorca. Documentos castellanos en archivos de las Islas Baleares. https://www.corpusmallorca.es/
Culpeper, J. y Kytö, M. (2010). Early Modern English dialogues. Spoken interaction as writing. Cambridge University Press.
Davies, M. (Dir.). (2001). Corpus del Español (Género/Histórico) (CdEhist). www.corpusdelespanol.org/hist-gen/
Davies, M. (2009). Creating useful historical corpora: A comparison of CORDE, the Corpus del español, and the Corpus do português. En A. Enrique-Arias (Ed.), Diacronía de las lenguas iberorrománicas. Nuevas aportaciones desde la lingüística de corpus (pp. 137-166). Iberoamericana Vervuert. https://doi.org/10.31819/9783865278685-009
Dollinger, S. (2004). ‘Philological computing’ vs. ‘philological outsourcing’ and the compilation of historical corpora: a Late Modern English test case. Vienna English Working Papers (VIEWS), 13, 3-23.
Enrique-Arias, A. (Dir.). (2008). Biblia Medieval. http://www.bibliamedieval.es
Fradejas Rueda, J. M. (2019). Cuentapalabras. Estilometría y análisis de textos con R para Filólogos. http://www.aic.uva.es/cuentapalabras
González Sopeña, I. (2023). Confusión de sibilantes y neutralización -r/-l en los inventarios de bienes andaluces del siglo XVIII. Études romanes de Brno, 44(1), 141-162. https://doi.org/10.5817/ERB2023-1-9
Grupo de investigación de textos para la historia del español (GITHE). (s. f.). CODEA+ 2022. https://www.corpuscodea.es/
Hernangómez, D. (2024). mapSpain: Administrative Boundaries of Spain. https://doi.org/10.5281/zenodo.5366622
Honkapohja, A., Kaislaniemi, S. y Marttila, V. (2009). Digital Editions for Corpus Linguistics: Representing Manuscript Reality in Electronic Corpora. En A. H. Jucker, D. Schreier y M. Hundt (Eds.), Corpora: Pragmatics and Discourse (pp. 451-475). Rodopi.
Janssen, M. (2016). TEITOK: Text-Faithful Annotated Corpora. En N. Calzolari, K. Choukri, T. Declerck, S. Goggi, M. Grobelnik, B. Maegaard, J. Mariani, H. Mazo, A. Moreno, J. Odijk y S. Piperidis (Eds.), Proceedings of the LREC (pp. 4037-4043). European Language Resources Association.
Jenset, G. B. y McGillivray, B. (2017). Quantitative Historical Linguistics. A Corpus Framework. Oxford University Press.
Lass, R. (1997). Historical linguistics and language change. Cambridge University Press. https://doi.org/10.1017/CBO9780511620928
McEnery, T. y Wilson, A. (2001). Corpus linguistics. An introduction. Edinburgh University Press.
Meurman-Solin, A. (2001). Structured Text Corpora in the Study of Language Variation and Change. Literary and Linguistic Computing, 16(1), 5-27. https://doi.org/10.1093/llc/16.1.5
Morala Rodríguez, J. R. (Dir.). (2018a). Corpus léxico de inventarios (CorLexIn). https://corlexin.unileon.es/
Morala Rodríguez, J. R. (2018b). El proyecto CorLexIn y la variación diatópica en el léxico del Siglo de Oro. En D. Corbella Díaz, A. Fajardo Aguirre y J. Langenbacher-Liebgott (Eds.), Historia del léxico español y Humanidades digitales (pp. 397-417). Peter Lang.
Morala, J. R. y Perdiguero, H. (2019). La isoglosa de la aspiración de /f/ en el siglo XVII. En M. Castillo Lluch y E. Diez del Corral (Eds.), Reescribiendo la historia de la lengua española a partir de la edición de documentos (pp. 175-199). Peter Lang.
Núñez-Méndez, E. (2021). An overview of the sibilant merger and its development in Spanish. En E. Núñez-Méndez (Ed.), Sociolinguistic approaches to sibilant variation in Spanish (pp. 9-72). Routledge. https://doi.org/10.4324/9781003153948-3
Oesterreicher, W. (2004). Textos entre inmediatez y distancia comunicativas. El problema de lo hablado escrito en el Siglo de Oro. En R. Cano Aguilar (Ed.), Historia de la lengua española (pp. 729-769). Ariel.
Ortiz Cruz, D. (2020). Variaciones fonéticas en el léxico de inventarios de bienes aragoneses del siglo XVIII. RILEX. Revista sobre investigaciones léxicas, 3(1), 74-95. https://doi.org/10.17561/rilex.3.1.5297
P. S. Post Scriptum. (2014). P. S. Post Scriptum. Arquivo Digital de Escrita Quotidiana em Portugal e Espanha na Época Moderna. http://ps.clul.ul.pt
Real Academia Española. (s. f.). Corpus Diacrónico del Español (CORDE). http://www.rae.es
Real Academia Española. (2013). Corpus del diccionario histórico de la lengua española (CDH). http://www.rae.es
Rodríguez Puente, P. (2018). En busca de lo hablado en lo escrito en los corpus diacrónicos del español: Una comparativa con los corpus anglosajones. E-Scripta Romanica, 5, 89-127. https://doi.org/10.18778/2392-0718.05.09
Rojo, G. (2010). Aguja de navegar corpus. En V. Castel y L. Cubo de Severino (Eds.), La renovación de la palabra en el bicentenario de la Argentina. Los colores de la mirada lingüística (pp. 1151-1163). Editorial FFyL, UNCuyo.
Rojo, G. (2016). Corpus textuales del español. En J. Gutiérrez-Rexach (Ed.), Enciclopedia de Lingüística Hispánica (Vol. 2, pp. 285-296). Routledge. https://doi.org/10.4324/9781315713441-99
Rojo, G. (2021). Introducción a la lingüística de corpus en español. Routledge. https://doi.org/10.4324/9781003119760
Sánchez-Prieto Borja, P. (2020). Consonantismo avanzado en Madrid entre los siglos XVI y XIX a partir de un corpus documental (ALDICAM-CM). Verba: Anuario galego de filoloxia, 47, 55-86. https://doi.org/10.15304/verba.47.5616
Sánchez-Prieto Borja, P., Torrens Álvarez, M. J. y Vázquez Balonga, D. (Coords.). (2021). La lengua de Madrid a lo largo del tiempo. Editorial Universidad de Sevilla. https://doi.org/10.12795/9788447231140
Sánchez-Prieto Borja, P. y Vázquez Balonga, D. (2019). La beneficencia madrileña. Lengua y discurso en los documentos de los siglos XVI a XIX. Editorial Complutense.
Smith, J. (1997). An Historical Study of English. Function, Form and Change. Routledge.
Ueda, H. (2019). Las grafías bilabiales sonoras , y del español en relación con el fonema /f/ y el paradigma sibilante. En M. Castillo Lluch y E. Diez del Corral (Eds.), Reescribiendo la historia de la lengua española a partir de la edición de documentos (pp. 141-174). Peter Lang.
Vaamonde, G. (2018). Escritura epistolar, edición digital y anotación de corpus. Cuadernos del Instituto Historia de la Lengua, (11), 139-164. https://doi.org/10.58576/cilengua.vi11.53
Vázquez Balonga, D. y Sánchez-Prieto, B. (2015). ¿Seseo en el centro peninsular? Revista de Historia de la Lengua Española, (10), 201-207. https://doi.org/10.54166/rhle.2015.10.07
Published
How to Cite
Issue
Section
License
Copyright (c) 2024 Gael Vaamonde, Miguel Calderón
This work is licensed under a Creative Commons Attribution-NoDerivatives 4.0 International License.
The printed and electronic editions of this Journal are edited by the University of Seville Editorial, and the source must be cited in any partial or total reproduction.
Unless otherwise indicated, all the contents of the electronic edition are distributed under a license of use and distribution “Attribution-NonCommercial-NoDerivatives 4.0 International” . You can view the informative version and the legal text of the license here. This fact must be expressly stated in this way when necessary.
Authors who publish in this journal accept the following conditions:
- The author/s retain copyright and grant the journal the first publication right, and accept it to be distributed with the Creative Commons By NC ND 4.0 licence, which allows third parties to use what is published whenever they mention the authorship of the work and the first publication in this journal and whenever they do not make commercial use and reuse it in the same way.
- Authors can make other independent and additional contractual agreements for the non-exclusive distribution of the article published in this journal (e.g., include it in an institutional repository or publish it in a book) provided they clearly indicate that the work was published for the first time in this journal.
Authors are allowed and recommended, once the article has been published in the journal Philologia Hispalensis (online version), to download the corresponding PDF and disseminate it online (ResearchGate, Academia.edu, etc.) as it may lead to productive scientific exchanges and to a greater and faster dissemination of published work (see The Effect of Open Access).
Accepted 2024-02-22
Published 2024-06-05
- Abstract 148
- PDF (Español (España)) 89
- HTML (Español (España)) 14
- XML (Español (España)) 14