Caracterización lingüística de las unidades terminológicas para determinar el nivel de especialización textual
La presente tesis tiene como objetivo el análisis de unidades terminológicas para comprender su comportamiento en textos de diferente nivel de especialización y así sustentar su inclusión o exclusión en un índice de especialización textual. En primera instancia, se compila el corpus de referencia Va...
- Autores:
-
Vásquez Giraldo, David
- Tipo de recurso:
- Doctoral thesis
- Fecha de publicación:
- 2024
- Institución:
- Universidad de Antioquia
- Repositorio:
- Repositorio UdeA
- Idioma:
- spa
- OAI Identifier:
- oai:bibliotecadigital.udea.edu.co:10495/45761
- Acceso en línea:
- https://hdl.handle.net/10495/45761
- Palabra clave:
- Corpus lingüístico
Corpora (Linguistics)
Linguistic analysis (linguistics)
Terminología
Terminology
Análisis lingüístico
Discurso especializado
Unidad terminológica
Especialización textual
- Rights
- embargoedAccess
- License
- http://creativecommons.org/licenses/by-nc-sa/4.0/
| Summary: | La presente tesis tiene como objetivo el análisis de unidades terminológicas para comprender su comportamiento en textos de diferente nivel de especialización y así sustentar su inclusión o exclusión en un índice de especialización textual. En primera instancia, se compila el corpus de referencia VaTeVe de 1 680 000 tokens, conformado con dos corpus principales en las áreas de medicina (841 009 tokens) y medio ambiente (840 592 tokens), y tres subcorpus en niveles alto, medio y bajo de especialización. De igual manera, se hace un muestreo a través de dos estudios piloto en el área de oncología para un mayor control de las variables. En segundo lugar, se realiza la extracción de unidades a través del programa de extracción terminológica TermostatWeb 3.0 y se procede con la limpieza, adecuación y validación de datos por medio de herramientas informáticas y expertos. Se analizaron adjetivos terminológicos, nombres terminológicos, adverbios terminológicos, verbos terminológicos, formas abreviadas y SNEE en una muestra de tres textos en 8 experimentos, así se tuvo un total de 24 textos para el muestreo en oncología. En esta etapa se excluyó el área de medio ambiente por motivos de alcance de la investigación. Cada uno de los textos se eligió del corpus de referencia y se realizó un corte a 2500 tokens, es decir que cada experimento tenía 7500 tokens distribuidos en los tres textos: texto nivel alto, nivel medio y nivel bajo. Las clases textuales se seleccionaron de modo que reflejaran con precisión el nivel de especialización y para ello la selección de los textos se dio desde un punto de vista pragmático pensando principalmente en el registro y tenor funcional (relación entre los interlocutores). Los géneros fueron entonces artículos de investigación formato InMRyD en el nivel alto, GPC de estrategia PICO y manuales en el medio; y guías para pacientes y notas periodísticas en el nivel bajo. En tercer lugar, se desarrollan principalmente dos tipos de análisis: un análisis lingüístico y un análisis estadístico tanto descriptivo como inferencial. El análisis lingüístico se lleva a cabo a través de la caracterización de las unidades previamente seleccionadas como parametrizables en el índice de especialización textual y los posibles contextos de uso que permiten identificar su estatus terminológico y las diferencias sintáctico-semánticas en tres niveles de especialización. Por medio de análisis estadístico se establece cuáles UT o USE poseen diferencias estadísticamente significativas en los niveles alto, medio y bajo de especialización en el dominio de la oncología. Los análisis y comparativas lingüísticas entre las unidades permiten saber si la unidad es o no discriminatoria en el nivel de especialización y se apoyan de dos análisis estadísticos, uno descriptivo y otro inferencial. El modelo para análisis inferencial se fundamentó en una regresión lineal para comprobar la correlación existente entre las variables de las UT y el nivel de especialización textual. A partir de los análisis planteados, se concluye que no todas las unidades pueden ser incluidas en el índice vertical de especialización textual (INVEST), además, se establecen las unidades que pueden ser fácilmente analizadas en muestras pequeñas y las unidades que deben ser estudiadas en corpus de mayor tamaño. Igualmente, se bridan recomendaciones para estudios subsecuentes en la temática trabajada en esta tesis. |
|---|
