Comparación entre métodos para clasificación usando algunas distribuciones multivariadas

El problema de establecer similitudes o diferencias en áreas como la genética, biología, ciencias médicas, ingeniería, entre otras, es llamado problema de clasificación, consiste en asignar una pertenencia a determinado individuo ya sea por sus características, orden o estructura. En un trabajo prev...

Full description

Autores:
Cortés Vélez, Catalina Inés
Tipo de recurso:
Fecha de publicación:
2014
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/75216
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/75216
http://bdigital.unal.edu.co/39733/
Palabra clave:
51 Matemáticas / Mathematics
Clasificación
Máquinas de soporte vectorial
Regresión logística
Análisis discriminante lineal
Tasa de clasificación errónea
Classification
Support vector machines
Logistic regression
Linear dis-criminant analysis
False discovery rate
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_d837d816789a39d303249c5f07e667c7
oai_identifier_str oai:repositorio.unal.edu.co:unal/75216
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Salazar Uribe, Juan CarlosCortés Vélez, Catalina Inés8b6b2b4b-fd4e-4f6e-930f-3cc3a4430c953002019-07-03T19:19:33Z2019-07-03T19:19:33Z2014-07-29https://repositorio.unal.edu.co/handle/unal/75216http://bdigital.unal.edu.co/39733/El problema de establecer similitudes o diferencias en áreas como la genética, biología, ciencias médicas, ingeniería, entre otras, es llamado problema de clasificación, consiste en asignar una pertenencia a determinado individuo ya sea por sus características, orden o estructura. En un trabajo previo Salazar, Vélez y Salazar comparan vía simulación la eficiencia de las máquinas de soporte vectorial y la Regresión Logística, para datos que necesiten la clasificación en dos grupos y que posean una distribución univariada. En este trabajo se compara la eficiencia de Regresión Logística, Máquinas de Soporte Vectorial, Análisis Discriminante y Clasificador Fuzzy, para clasificar un grupo de datos en dos categorías mutuamente excluyentes, en el escenario de datos multivariados provenientes de poblaciones con distribución normal multivariada, normal asimétrica y t multivariada. Dicha eficiencia o desempeño se medirá con la tasa de clasificación errónea.medical sciences, engineering, just to mention some of them is known as classification. This process consists on assigning a subject to a specific group according to his/her features, order or structure. In a previous work, Salazar and Salazar compared the efficiency of both Support Vector Machines -SVM- and Logistic Regression -LR-, using two groups and univariate distributions by means of a simulation study. In this work, we compare the efficiency of the following classifiers to classify a dataset in two category mutually exclusive: Support Vector Machines -SVM-, Logistic Regression - LR-, Discriminant Analysis -DA- and Fuzzy Classifier. The comparison is carried out using multivariate data coming from several multivariate populations. Such efficiency is measured through the False Discovery Rate -FDR-.Maestríaapplication/pdfspaUniversidad Nacional de Colombia Sede Medellín Facultad de Ciencias Escuela de EstadísticaEscuela de EstadísticaCortés Vélez, Catalina Inés (2014) Comparación entre métodos para clasificación usando algunas distribuciones multivariadas. Maestría thesis, Universidad Nacional de Colombia, Sede Medellín.51 Matemáticas / MathematicsClasificaciónMáquinas de soporte vectorialRegresión logísticaAnálisis discriminante linealTasa de clasificación erróneaClassificationSupport vector machinesLogistic regressionLinear dis-criminant analysisFalse discovery rateComparación entre métodos para clasificación usando algunas distribuciones multivariadasTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMORIGINAL32353665.2014.pdfTesis de Maestría en Ciencias - Estadísticaapplication/pdf652776https://repositorio.unal.edu.co/bitstream/unal/75216/1/32353665.2014.pdf7967dbb951d7dc7fa3bdbecc8ea39f89MD51THUMBNAIL32353665.2014.pdf.jpg32353665.2014.pdf.jpgGenerated Thumbnailimage/jpeg4171https://repositorio.unal.edu.co/bitstream/unal/75216/2/32353665.2014.pdf.jpg0efcadd131aa649a475d4acc8d327400MD52unal/75216oai:repositorio.unal.edu.co:unal/752162023-07-07 23:04:11.068Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co
dc.title.spa.fl_str_mv Comparación entre métodos para clasificación usando algunas distribuciones multivariadas
title Comparación entre métodos para clasificación usando algunas distribuciones multivariadas
spellingShingle Comparación entre métodos para clasificación usando algunas distribuciones multivariadas
51 Matemáticas / Mathematics
Clasificación
Máquinas de soporte vectorial
Regresión logística
Análisis discriminante lineal
Tasa de clasificación errónea
Classification
Support vector machines
Logistic regression
Linear dis-criminant analysis
False discovery rate
title_short Comparación entre métodos para clasificación usando algunas distribuciones multivariadas
title_full Comparación entre métodos para clasificación usando algunas distribuciones multivariadas
title_fullStr Comparación entre métodos para clasificación usando algunas distribuciones multivariadas
title_full_unstemmed Comparación entre métodos para clasificación usando algunas distribuciones multivariadas
title_sort Comparación entre métodos para clasificación usando algunas distribuciones multivariadas
dc.creator.fl_str_mv Cortés Vélez, Catalina Inés
dc.contributor.author.spa.fl_str_mv Cortés Vélez, Catalina Inés
dc.contributor.spa.fl_str_mv Salazar Uribe, Juan Carlos
dc.subject.ddc.spa.fl_str_mv 51 Matemáticas / Mathematics
topic 51 Matemáticas / Mathematics
Clasificación
Máquinas de soporte vectorial
Regresión logística
Análisis discriminante lineal
Tasa de clasificación errónea
Classification
Support vector machines
Logistic regression
Linear dis-criminant analysis
False discovery rate
dc.subject.proposal.spa.fl_str_mv Clasificación
Máquinas de soporte vectorial
Regresión logística
Análisis discriminante lineal
Tasa de clasificación errónea
Classification
Support vector machines
Logistic regression
Linear dis-criminant analysis
False discovery rate
description El problema de establecer similitudes o diferencias en áreas como la genética, biología, ciencias médicas, ingeniería, entre otras, es llamado problema de clasificación, consiste en asignar una pertenencia a determinado individuo ya sea por sus características, orden o estructura. En un trabajo previo Salazar, Vélez y Salazar comparan vía simulación la eficiencia de las máquinas de soporte vectorial y la Regresión Logística, para datos que necesiten la clasificación en dos grupos y que posean una distribución univariada. En este trabajo se compara la eficiencia de Regresión Logística, Máquinas de Soporte Vectorial, Análisis Discriminante y Clasificador Fuzzy, para clasificar un grupo de datos en dos categorías mutuamente excluyentes, en el escenario de datos multivariados provenientes de poblaciones con distribución normal multivariada, normal asimétrica y t multivariada. Dicha eficiencia o desempeño se medirá con la tasa de clasificación errónea.
publishDate 2014
dc.date.issued.spa.fl_str_mv 2014-07-29
dc.date.accessioned.spa.fl_str_mv 2019-07-03T19:19:33Z
dc.date.available.spa.fl_str_mv 2019-07-03T19:19:33Z
dc.type.spa.fl_str_mv Trabajo de grado - Maestría
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TM
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/75216
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/39733/
url https://repositorio.unal.edu.co/handle/unal/75216
http://bdigital.unal.edu.co/39733/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Sede Medellín Facultad de Ciencias Escuela de Estadística
Escuela de Estadística
dc.relation.references.spa.fl_str_mv Cortés Vélez, Catalina Inés (2014) Comparación entre métodos para clasificación usando algunas distribuciones multivariadas. Maestría thesis, Universidad Nacional de Colombia, Sede Medellín.
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/75216/1/32353665.2014.pdf
https://repositorio.unal.edu.co/bitstream/unal/75216/2/32353665.2014.pdf.jpg
bitstream.checksum.fl_str_mv 7967dbb951d7dc7fa3bdbecc8ea39f89
0efcadd131aa649a475d4acc8d327400
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1814089697053376512