Idiom variation: analyzing the performance of monolingual corpora as translation resources

Vol.42,No.1(2021)

Abstract
Idioms tend to vary significantly in discourse (variation, grammatical inflection, discontinuity…). This makes it especially difficult to create appropriate query patterns that obtain these units in all shapes and forms while avoiding excessive noise. In this context, this paper analyses the performance of different corpus management systems available for Spanish when searching phraseological variants such as tener entre manos, traer entre manos and llevar entre manos, as well as ir al pelo and venir al pelo. More specifically, we will examine two corpora created by the Real Academia Española (CREA, in its original and annotated version, and CORPES XXI), the Corpus del Español by Mark Davies (BYU), and Sketch Engine. The results of our study will shed some light on which corpus management system can offer a better performance for translators under the challenge of idiom variation.

Keywords:
idiom variation; discontinuity; query patterns; corpus management systems

Pages:
359–379
References

Anastasiou, D. (2011). Idiom treatment experiments in machine translation. Newcastle upon Tyne: Cambridge Scholars.

Cambridge University Press (n. d.). Cambridge Dictionary. < https://dictionary.cambridge.org/>. Fecha de última actualización: 2021.

Corpas Pastor, G. (1996). Manual de fraseología española. Madrid: Gredos

Corpas Pastor, G. (2015). Translating English Verbal Collocations into Spanish: on Distribution and other Relevant Differences related to Diatopic Variation. Lingvisticae Investigationes Special Issue 'Spanish Phraseology. Varieties and variations', 38, 2, 229–262. https://doi.org/10.1075/li.38.2.03cor>. | DOI 10.1075/li.38.2.03cor>

Corpas Pastor, G. (2017). Collocational Constructions in Translated Spanish: What Corpora Reveal. In R. Mitkov (Ed.), Computational and Corpus-Based Phraseology. Europhras 2017 (pp. 29–40). Berlin: Springer. doi: < https://doi.org/10.1007/978–3-319–69805–2>. | DOI 10.1007/978–3-319–69805–2>

Corpas Pastor, G. (2018). Laughing one's head off in Spanish subtitles: a corpus-based study on diatopic variation and its consequences for translation. En P. Mogorrón Huerta, & A. Albadalejo-Martínez (Eds.), Fraseología, Diatopía y Traducción, Colección "IVITRA Research in Linguistics and Literature, (pp. 54–106). Amsterdam: John Benjamins.

Corpas Pastor, G.; & Mena Martínez, F. (2003). Aproximación a la variabilidad fraseológica de las lenguas alemana, inglesa y española. ELUA, 17, 181–201. | DOI 10.14198/ELUA2003.17.10

[CORPES XXI] Real Academia Española. Corpus del Español del Siglo XXI (CORPES XXI). < https://www.rae.es/banco-de-datos/corpes-xxi/>.

[CREA] Real Academia Española. Corpus de Referencia del Español Actual (CREA). < https://www.rae.es/banco-de-datos/crea>.

Dal Maso, E. (2020). Sinonimia y variación léxica en la fraseología española e italiana: propuesta para un diccionario bilingüe bidireccional en línea. In M. De Beni (Ed.), Representación de la fraseología en herramientas digitales: problemas, avances, propuestas, Círculo de Lingüística Aplicada a la Comunicación 82 (pp. 27–40). https://dx.doi.org/10.5209/clac.689561>. | DOI 10.5209/clac.689561>

Davies, M. (2018). Corpus del Español: NOW. < http://www.corpusdelespanol.org/>.

[DLE] Real Academia Española (n. d.). Diccionario de la Lengua Española. < http://www.rae.es>.

Durán Muñoz, I.; & Corpas Pastor, G. (2020). Corpus-based multilingual lexicographic resources for translators: an overview. In M. J. Domínguez Vázquez, M. Mirazo Balsa, & C. Válcarcel Riveiro (Eds.), Studies on Multilingual Lexicography, (Lexicographica, Series Maior) (pp. 159–178). Berlin: De Gruyter. https://doi.org/10.1515/9783110607659–009>. | DOI 10.1515/9783110607659–009>

García-Page, M. (2008). Introducción a la fraseología española. Barcelona: Anthropos.

Gréciano, G. (1987). Idiom und Text. Deutsche Sprache, 15, 193–208.

HarperCollins Publishers (n. d.). Collins Dictionary. < https://www.collinsdictionary.com/>.

Hidalgo-Ternero, C. M. (2020). Google Translate vs. DeepL: analysing neural machine translation performance under the challenge of phraseological variation. In P. Mogorrón Huerta (Ed.), Análisis multidisciplinar del fenómeno de la variación en traducción e interpretación / Multidisciplinary Analysis of the Phenomenon of Phraseological Variation in Translation and Interpreting. MonTI Special Issue 6, 154–177

Kellogg, M. (n. d.) Wordreference. < http://www.Wordreference.com/>.

Kilgarriff, A.; Baisa, V.; Bušta, J.; Jakubíček, M.; Kovář, V.; Michelfeit, J.; Rychlý, P.; & Suchomel, V. (2003). The Sketch Engine. < https://www.sketchengine.eu>.

Koike, K. (2007). Relaciones paradigmáticas y sintagmáticas de las locuciones verbales en español. In J. Cuartero Otal, & M. Emsel (Eds.). Vernetzungen Bedeutung in Wort, Satz und Text. Festschrift für Gerd Wotjak zum 65. Geburtstag (pp. 263–275). Frankfurt am Main: Peter Lang.

Lawick, H. van. (2007). Phraseologie und Übersetzung unter Anwendung von Parallelkorpora. In M. Schlesinger, & R. Stolze (Eds.), Translation Studies. Doubts and Directions. (pp. 281–296). Amsterdam y Philadelphia: John Benjamins.

Leppihalme, R. (2000). Päätalo Idioms and Catchphrases in Translation. In P. Jauhola, O. Järvi, & D. Wilske (Eds.), Erikoiskielet ja käännösteoria/LSP and Theory of Translation. VAKKI-symposium XX. Vaasa: University of Vaasa 11, 27, 224–234.

Marco Borillo, J. (2009). Normalisation and the translation of phraseology in the COVALT corpus, Meta, 54, 4, 842–856. | DOI 10.7202/038907ar

Marco Borillo, J. (2011) Some Insights into the Factors Underlying the Translation of Phraseology in the COVALT corpus. In P. Kujamäki, L. Kolehmainen, E. Penttilä, & H. Kemppanen (Eds.), Beyond Borders – Translations Moving Languages, Literatures and Cultures. (pp. 197–214). Berlin: Frank & Timme.

Mellado Blanco, C. (2004). Fraseologismos somáticos del alemán. Frankfurt am Main: Peter Lang.

Montoro del Arco, E. T. (2005). Hacia una sistematización de la variabilidad fraseológica. In M. A. Pastor Millán (coord.), Estudios lingüísticos en recuerdo del profesor Juan Martínez Marín. (pp. 125–152). Granada: Universidad de Granada. Oxford University Press (n. d.) Oxford Spanish Dictionary. < https://www.lexico.com/es>.

Philip, G. (2008). Reassessing the Canon: 'Fixed' Phrases in General Reference Corpora. In S. Granger, & F. Meunier (Eds.), Phraseology: An Interdisciplinary Perspective. (pp. 95–108). Amsterdam, Philadelphia: John Benjamins Publishing Company.

Seco, M.; Ramos, G.; & Andrés, O. (2017). Diccionario fraseológico documentado del español actual, locuciones y modismos españoles (2ª edición). Madrid: Aguilar.

Valencia Giraldo, M. V.; & Corpas Pastor, G. (2019). The Portrait of Dorian Gray: A Corpus-Based Analysis of Translated Verb + Noun (Object) Collocations in Peninsular and Colombian Spanish. In G. Corpas Pastor, & R. Mitkov (Eds.): Computational and Corpus-Based Phraseology. Europhras 2019 (pp. 417–430). Cham: Springer Nature Switzerland AG. https://doi.org/10.1007/978–3-030–30135–4_13>. | DOI 10.1007/978–3-030–30135–4_13>

Zuluaga, A. (1980). Introducción al estudio de las expresiones fijas. Frankfurt: Verlag Peter D. Lang.

Metrics

web of science logo


15

Views

0

PDF (Spanish) views