Detección y tratamiento de valores extremos: una revisión

Los valores extremos son observaciones o medidas que son sospechosas en tanto que son mucho menores o mucho mayores que el resto de las observaciones. Estas observaciones son problemáticas en tanto que puede que no sean causadas por los procesos mentales que están siendo estudiados o puede que no re...

Full description

Autores:
Cousineau, Denis
Chartier, Sylvain
Tipo de recurso:
Article of journal
Fecha de publicación:
2010
Institución:
Universidad de San Buenaventura
Repositorio:
Repositorio USB
Idioma:
eng
OAI Identifier:
oai:bibliotecadigital.usb.edu.co:10819/25702
Acceso en línea:
https://hdl.handle.net/10819/25702
https://doi.org/10.21500/20112084.844
Palabra clave:
Statistics
outlier detection
outlier treatment
intervalos de confianza
estadística de los intervalos
guías
representación gráfica
encuestas nacionales
aproximación Bayesiana
Rights
openAccess
License
International Journal of Psychological Research - 2010
id SANBUENAV2_cda5081b0a7360f003dcfb6736ae2547
oai_identifier_str oai:bibliotecadigital.usb.edu.co:10819/25702
network_acronym_str SANBUENAV2
network_name_str Repositorio USB
repository_id_str
dc.title.spa.fl_str_mv Detección y tratamiento de valores extremos: una revisión
dc.title.translated.spa.fl_str_mv Detección y tratamiento de valores extremos: una revisión
title Detección y tratamiento de valores extremos: una revisión
spellingShingle Detección y tratamiento de valores extremos: una revisión
Statistics
outlier detection
outlier treatment
intervalos de confianza
estadística de los intervalos
guías
representación gráfica
encuestas nacionales
aproximación Bayesiana
title_short Detección y tratamiento de valores extremos: una revisión
title_full Detección y tratamiento de valores extremos: una revisión
title_fullStr Detección y tratamiento de valores extremos: una revisión
title_full_unstemmed Detección y tratamiento de valores extremos: una revisión
title_sort Detección y tratamiento de valores extremos: una revisión
dc.creator.fl_str_mv Cousineau, Denis
Chartier, Sylvain
dc.contributor.author.eng.fl_str_mv Cousineau, Denis
Chartier, Sylvain
dc.subject.eng.fl_str_mv Statistics
outlier detection
outlier treatment
topic Statistics
outlier detection
outlier treatment
intervalos de confianza
estadística de los intervalos
guías
representación gráfica
encuestas nacionales
aproximación Bayesiana
dc.subject.spa.fl_str_mv intervalos de confianza
estadística de los intervalos
guías
representación gráfica
encuestas nacionales
aproximación Bayesiana
description Los valores extremos son observaciones o medidas que son sospechosas en tanto que son mucho menores o mucho mayores que el resto de las observaciones. Estas observaciones son problemáticas en tanto que puede que no sean causadas por los procesos mentales que están siendo estudiados o puede que no reflejen la habilidad que se está estudiando. El problema es que unas pocas observaciones extremas son suficientes para distorsionar los resultados (alterando el desempeño medio, incrementando la variabilidad, etc.). En este artículo se revisan varias técnicas diseñadas para detectar observaciones extremas. Estas técnicas se subdividen en dos clases, aquellas relacionadas con datos univariados y aquellas relacionadas con datos multivariados. Dentro de estas dos clases, se consideran casos en que la distribución de la población es asumida como normal, casos en que la distribución es normal pero no conocida, o casos en que la población es desconocida. Para cada escenario se proponen algunas recomendaciones.
publishDate 2010
dc.date.accessioned.none.fl_str_mv 2010-06-30T00:00:00Z
2025-07-31T16:11:19Z
dc.date.available.none.fl_str_mv 2010-06-30T00:00:00Z
2025-07-31T16:11:19Z
dc.date.issued.none.fl_str_mv 2010-06-30
dc.type.spa.fl_str_mv Artículo de revista
dc.type.coar.fl_str_mv http://purl.org/coar/resource_type/c_2df8fbb1
dc.type.coar.eng.fl_str_mv http://purl.org/coar/resource_type/c_6501
dc.type.coarversion.eng.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.content.eng.fl_str_mv Text
dc.type.driver.eng.fl_str_mv info:eu-repo/semantics/article
dc.type.local.eng.fl_str_mv Journal article
dc.type.version.eng.fl_str_mv info:eu-repo/semantics/publishedVersion
format http://purl.org/coar/resource_type/c_6501
status_str publishedVersion
dc.identifier.doi.none.fl_str_mv 10.21500/20112084.844
dc.identifier.eissn.none.fl_str_mv 2011-7922
dc.identifier.issn.none.fl_str_mv 2011-2084
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/10819/25702
dc.identifier.url.none.fl_str_mv https://doi.org/10.21500/20112084.844
identifier_str_mv 10.21500/20112084.844
2011-7922
2011-2084
url https://hdl.handle.net/10819/25702
https://doi.org/10.21500/20112084.844
dc.language.iso.eng.fl_str_mv eng
language eng
dc.relation.bitstream.none.fl_str_mv https://revistas.usb.edu.co/index.php/IJPR/article/download/844/601
dc.relation.citationedition.eng.fl_str_mv Núm. 1 , Año 2010 : Special Issue of Statistics in Psychology
dc.relation.citationendpage.none.fl_str_mv 67
dc.relation.citationissue.eng.fl_str_mv 1
dc.relation.citationstartpage.none.fl_str_mv 58
dc.relation.citationvolume.eng.fl_str_mv 3
dc.relation.ispartofjournal.eng.fl_str_mv International Journal of Psychological Research
dc.relation.references.eng.fl_str_mv Bamber, D. (1969). Reaction times and error rates for "same"-"different" judgments of multidimensional stimuli. Perception and Psychophysics, 6, 169-174. Belsley, D. A., Kuh, E., & Welsch, R. E. (1980). Regression diagnostics : identifying influential data and sources of collinearity. Wiley series in probability and mathematical statistics. New York: John Wiley & Sons. Cook, R. D. (1977). Detection of influatial observation in linear regression. Technometrics, 19, 15-18. Cousineau, D., & Shiffrin, R. M. (2004). Termination of a visual search with large display size effect. Spatial Vision, 17, 327-352.
dc.rights.eng.fl_str_mv International Journal of Psychological Research - 2010
dc.rights.accessrights.eng.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.eng.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.uri.eng.fl_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
rights_invalid_str_mv International Journal of Psychological Research - 2010
http://purl.org/coar/access_right/c_abf2
https://creativecommons.org/licenses/by-nc-sa/4.0/
eu_rights_str_mv openAccess
dc.format.mimetype.eng.fl_str_mv application/pdf
dc.publisher.eng.fl_str_mv Universidad San Buenaventura - USB (Colombia)
dc.source.eng.fl_str_mv https://revistas.usb.edu.co/index.php/IJPR/article/view/844
institution Universidad de San Buenaventura
bitstream.url.fl_str_mv https://bibliotecadigital.usb.edu.co/bitstreams/c25efc00-587a-4731-831f-f5b1fd274d02/download
bitstream.checksum.fl_str_mv 84a39d31e90f30637345df6341fbe07d
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositorio Institucional Universidad de San Buenaventura Colombia
repository.mail.fl_str_mv bdigital@metabiblioteca.com
_version_ 1851053607011483648
spelling Cousineau, DenisChartier, Sylvain2010-06-30T00:00:00Z2025-07-31T16:11:19Z2010-06-30T00:00:00Z2025-07-31T16:11:19Z2010-06-30Los valores extremos son observaciones o medidas que son sospechosas en tanto que son mucho menores o mucho mayores que el resto de las observaciones. Estas observaciones son problemáticas en tanto que puede que no sean causadas por los procesos mentales que están siendo estudiados o puede que no reflejen la habilidad que se está estudiando. El problema es que unas pocas observaciones extremas son suficientes para distorsionar los resultados (alterando el desempeño medio, incrementando la variabilidad, etc.). En este artículo se revisan varias técnicas diseñadas para detectar observaciones extremas. Estas técnicas se subdividen en dos clases, aquellas relacionadas con datos univariados y aquellas relacionadas con datos multivariados. Dentro de estas dos clases, se consideran casos en que la distribución de la población es asumida como normal, casos en que la distribución es normal pero no conocida, o casos en que la población es desconocida. Para cada escenario se proponen algunas recomendaciones.Outliers are observations or measures that are suspicious because they are much smaller or much larger than the vast majority of the observations. These observations are problematic because they may not be caused by the mental process under scrutiny or may not reflect the ability under examination. The problem is that a few outliers is sometimes enough to distort the group results (by altering the mean performance, by increasing variability, etc.). In this paper, various techniques aimed at detecting potential outliers are reviewed. These techniques are subdivided into two classes, the ones regarding univariate data and those addressing multivariate data. Within these two classes, we consider the cases where the population distribution is known to be normal, the population is not normal but known, or the population is unknown. Recommendations will be put forward in each case.application/pdf10.21500/20112084.8442011-79222011-2084https://hdl.handle.net/10819/25702https://doi.org/10.21500/20112084.844engUniversidad San Buenaventura - USB (Colombia)https://revistas.usb.edu.co/index.php/IJPR/article/download/844/601Núm. 1 , Año 2010 : Special Issue of Statistics in Psychology671583International Journal of Psychological ResearchBamber, D. (1969). Reaction times and error rates for "same"-"different" judgments of multidimensional stimuli. Perception and Psychophysics, 6, 169-174. Belsley, D. A., Kuh, E., & Welsch, R. E. (1980). Regression diagnostics : identifying influential data and sources of collinearity. Wiley series in probability and mathematical statistics. New York: John Wiley & Sons. Cook, R. D. (1977). Detection of influatial observation in linear regression. Technometrics, 19, 15-18. Cousineau, D., & Shiffrin, R. M. (2004). Termination of a visual search with large display size effect. Spatial Vision, 17, 327-352.International Journal of Psychological Research - 2010info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2https://creativecommons.org/licenses/by-nc-sa/4.0/https://revistas.usb.edu.co/index.php/IJPR/article/view/844Statisticsoutlier detectionoutlier treatmentintervalos de confianzaestadística de los intervalosguíasrepresentación gráficaencuestas nacionalesaproximación BayesianaDetección y tratamiento de valores extremos: una revisiónDetección y tratamiento de valores extremos: una revisiónArtículo de revistahttp://purl.org/coar/resource_type/c_6501http://purl.org/coar/resource_type/c_2df8fbb1http://purl.org/coar/version/c_970fb48d4fbd8a85Textinfo:eu-repo/semantics/articleJournal articleinfo:eu-repo/semantics/publishedVersionPublicationOREORE.xmltext/xml2499https://bibliotecadigital.usb.edu.co/bitstreams/c25efc00-587a-4731-831f-f5b1fd274d02/download84a39d31e90f30637345df6341fbe07dMD5110819/25702oai:bibliotecadigital.usb.edu.co:10819/257022025-07-31 11:11:19.547https://creativecommons.org/licenses/by-nc-sa/4.0/https://bibliotecadigital.usb.edu.coRepositorio Institucional Universidad de San Buenaventura Colombiabdigital@metabiblioteca.com