Robust analysis of the central tendency, simple and multiple regression and ANOVA: a step by step tutorial.

After much exertion and care to run an experiment in social science, the analysis of data should not be ruined by an improper analysis. Often, classical methods, like the mean, the usual simple and multiple linear regressions, and the ANOVA require normality and absence of outliers, which rarely occ...

Full description

Autores:
Courvoisier, Delphine S.
Renaud, Olivier
Tipo de recurso:
Fecha de publicación:
2010
Institución:
Universidad de San Buenaventura
Repositorio:
Repositorio USB
Idioma:
spa
OAI Identifier:
oai:bibliotecadigital.usb.edu.co:10819/6501
Acceso en línea:
http://hdl.handle.net/10819/6501
Palabra clave:
Robust methods
Anova
Regression
Diagnostic
Outliers
Métodos robustos
Regresión
Diagnóstico
Valores externos
Estadística
Investigación cuantitativa
Rights
License
Atribución-NoComercial-SinDerivadas 2.5 Colombia
id SANBUENAV2_70ccf6e168ee295a647235d08bad130b
oai_identifier_str oai:bibliotecadigital.usb.edu.co:10819/6501
network_acronym_str SANBUENAV2
network_name_str Repositorio USB
repository_id_str
dc.title.spa.fl_str_mv Robust analysis of the central tendency, simple and multiple regression and ANOVA: a step by step tutorial.
dc.title.alternative.spa.fl_str_mv Análisis robusto de la tendencia central, regresión simple, múltiple y ANOVA: Un tutorial paso a paso
title Robust analysis of the central tendency, simple and multiple regression and ANOVA: a step by step tutorial.
spellingShingle Robust analysis of the central tendency, simple and multiple regression and ANOVA: a step by step tutorial.
Robust methods
Anova
Regression
Diagnostic
Outliers
Métodos robustos
Regresión
Diagnóstico
Valores externos
Estadística
Investigación cuantitativa
title_short Robust analysis of the central tendency, simple and multiple regression and ANOVA: a step by step tutorial.
title_full Robust analysis of the central tendency, simple and multiple regression and ANOVA: a step by step tutorial.
title_fullStr Robust analysis of the central tendency, simple and multiple regression and ANOVA: a step by step tutorial.
title_full_unstemmed Robust analysis of the central tendency, simple and multiple regression and ANOVA: a step by step tutorial.
title_sort Robust analysis of the central tendency, simple and multiple regression and ANOVA: a step by step tutorial.
dc.creator.fl_str_mv Courvoisier, Delphine S.
Renaud, Olivier
dc.contributor.author.none.fl_str_mv Courvoisier, Delphine S.
Renaud, Olivier
dc.subject.spa.fl_str_mv Robust methods
Anova
Regression
Diagnostic
Outliers
Métodos robustos
Regresión
Diagnóstico
Valores externos
topic Robust methods
Anova
Regression
Diagnostic
Outliers
Métodos robustos
Regresión
Diagnóstico
Valores externos
Estadística
Investigación cuantitativa
dc.subject.lemb.spa.fl_str_mv Estadística
Investigación cuantitativa
description After much exertion and care to run an experiment in social science, the analysis of data should not be ruined by an improper analysis. Often, classical methods, like the mean, the usual simple and multiple linear regressions, and the ANOVA require normality and absence of outliers, which rarely occurs in data coming from experiments. To palliate to this problem, researchers often use some ad-hoc methods like the detection and deletion of outliers. In this tutorial, we will show the shortcomings of such an approach. In particular, we will show that outliers can sometimes be very difficult to detect and that the full inferential procedure is somewhat distorted by such a procedure. A more appropriate and modern approach is to use a robust procedure that provides estimation, inference and testing that are not influenced by outlying observations but describes correctly the structure for the bulk of the data. It can also give diagnostic of the distance of any point or subject relative to the central tendency. Robust procedures can also be viewed as methods to check the appropriateness of the classical methods. To provide a step-by-step tutorial, we present descriptive analyses that allow researchers to make an initial check on the conditions of application of the data. Next, we compare classical and robust alternatives to ANOVA and regression and discuss their advantages and disadvantages. Finally, we present indices and plots that are based on the residuals of the analysis and can be used to determine if the conditions of applications of the analyses are respected. Examples on data from psychological research illustrate each of these points and for each analysis and plot, R code is provided to allow the readers to apply the techniques presented throughout the article.
publishDate 2010
dc.date.issued.none.fl_str_mv 2010
dc.date.accessioned.none.fl_str_mv 2018-11-13T19:11:39Z
dc.date.available.none.fl_str_mv 2018-11-13T19:11:39Z
dc.date.submitted.none.fl_str_mv 2018-11-09
dc.type.spa.fl_str_mv Artículo de revista
dc.type.coar.fl_str_mv http://purl.org/coar/resource_type/c_2df8fbb1
dc.type.spa.spa.fl_str_mv Artículo
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/article
dc.identifier.citation.spa.fl_str_mv Courvoisier S., D., & Renaud, O. (2010). Robust analysis of the central tendency, simple and multiple regression and ANOVA: a step by step tutorial. International Journal of Psychological Research, 3(1), 78–87. https://doi.org/10.21500/20112084.849
dc.identifier.issn.none.fl_str_mv 2011-7922
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/10819/6501
identifier_str_mv Courvoisier S., D., & Renaud, O. (2010). Robust analysis of the central tendency, simple and multiple regression and ANOVA: a step by step tutorial. International Journal of Psychological Research, 3(1), 78–87. https://doi.org/10.21500/20112084.849
2011-7922
url http://hdl.handle.net/10819/6501
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.uri.spa.fl_str_mv http://dx.doi.org/10.21500/20112084.849
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.cc.spa.fl_str_mv Atribución-NoComercial-SinDerivadas 2.5 Colombia
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
rights_invalid_str_mv Atribución-NoComercial-SinDerivadas 2.5 Colombia
http://creativecommons.org/licenses/by-nc-nd/2.5/co/
http://purl.org/coar/access_right/c_abf2
dc.format.spa.fl_str_mv pdf
dc.format.extent.spa.fl_str_mv 10 páginas
dc.format.medium.spa.fl_str_mv Recurso en linea
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.publisher.spa.fl_str_mv Editorial Bonaventuriana
dc.publisher.faculty.spa.fl_str_mv Psicología
dc.publisher.sede.spa.fl_str_mv Medellín
dc.source.spa.fl_str_mv International Journal of Psychological Research
institution Universidad de San Buenaventura
dc.source.instname.spa.fl_str_mv Universidad de San Buenaventura - Medellín
dc.source.reponame.spa.fl_str_mv Biblioteca Digital Universidad de San Buenaventura
bitstream.url.fl_str_mv https://bibliotecadigital.usb.edu.co/bitstreams/8ab54594-1ac1-4c20-9bf4-32bd10dc384f/download
https://bibliotecadigital.usb.edu.co/bitstreams/6ab9f866-ad9f-4804-983d-4c0f583a6f3c/download
https://bibliotecadigital.usb.edu.co/bitstreams/7c7aee23-d7b8-40e7-9aef-1a526e55d4f2/download
https://bibliotecadigital.usb.edu.co/bitstreams/3bcdb824-83a7-43eb-85c3-66599bfe5b9c/download
bitstream.checksum.fl_str_mv 21d97654e20b5ac47d0c8643766955e9
0c7b7184e7583ec671a5d9e43f0939c0
a21aa6091693bd365257233b43119c5d
18592834a01cdcbe577492184ee76b5b
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad de San Buenaventura Colombia
repository.mail.fl_str_mv bdigital@metabiblioteca.com
_version_ 1837099271905607680
spelling Comunidad Científica y AcadémicaCourvoisier, Delphine S.02f17e78-cfbd-4ed3-ba97-ad59830673dc-1Renaud, Oliviere78dfc50-f2de-41e2-b7a9-beebd5653571-12018-11-13T19:11:39Z2018-11-13T19:11:39Z20102018-11-09After much exertion and care to run an experiment in social science, the analysis of data should not be ruined by an improper analysis. Often, classical methods, like the mean, the usual simple and multiple linear regressions, and the ANOVA require normality and absence of outliers, which rarely occurs in data coming from experiments. To palliate to this problem, researchers often use some ad-hoc methods like the detection and deletion of outliers. In this tutorial, we will show the shortcomings of such an approach. In particular, we will show that outliers can sometimes be very difficult to detect and that the full inferential procedure is somewhat distorted by such a procedure. A more appropriate and modern approach is to use a robust procedure that provides estimation, inference and testing that are not influenced by outlying observations but describes correctly the structure for the bulk of the data. It can also give diagnostic of the distance of any point or subject relative to the central tendency. Robust procedures can also be viewed as methods to check the appropriateness of the classical methods. To provide a step-by-step tutorial, we present descriptive analyses that allow researchers to make an initial check on the conditions of application of the data. Next, we compare classical and robust alternatives to ANOVA and regression and discuss their advantages and disadvantages. Finally, we present indices and plots that are based on the residuals of the analysis and can be used to determine if the conditions of applications of the analyses are respected. Examples on data from psychological research illustrate each of these points and for each analysis and plot, R code is provided to allow the readers to apply the techniques presented throughout the article.Después de mucho esfuerzo y cuidado para realizar un experimento en ciencias sociales, el análisis de datos no debe ser arruinado por un análisis inadecuado. A menudo, los métodos clásicos, como la media, las regresiones lineales simples y múltiples usuales, y el ANOVA requieren normalidad y ausencia de valores atípicos, lo que rara vez ocurre en los datos provenientes de experimentos. Para paliar este problema, los investigadores a menudo utilizan algunos métodos ad hoc como la detección y eliminación de valores atípicos. En este tutorial, mostraremos las deficiencias de tal enfoque. En particular, mostraremos que los valores atípicos a veces pueden ser muy difíciles de detectar y que el procedimiento inferencial completo está algo distorsionado por dicho procedimiento. Un enfoque más apropiado y moderno es usar un procedimiento robusto que proporcione una estimación, inferencia y pruebas que no estén influenciadas por observaciones externas, pero que describan correctamente la estructura de la mayor parte de los datos. También puede dar un diagnóstico de la distancia de cualquier punto o tema en relación con la tendencia central. Los procedimientos robustos también se pueden ver como métodos para verificar la idoneidad de los métodos clásicos. Para proporcionar un tutorial paso a paso, presentamos análisis descriptivos que permiten a los investigadores realizar una comprobación inicial de las condiciones de aplicación de los datos. A continuación, comparamos alternativas clásicas y robustas a ANOVA y regresión y discutimos sus ventajas y desventajas. Finalmente, presentamos índices y gráficos que se basan en los residuos del análisis y se pueden utilizar para determinar si se respetan las condiciones de las aplicaciones de los análisis. Los ejemplos de datos de investigación psicológica ilustran cada uno de estos puntos y para cada análisis y gráfico, se proporciona el código R para permitir a los lectores aplicar las técnicas presentadas a lo largo del artículo.pdf10 páginasRecurso en lineaapplication/pdfCourvoisier S., D., & Renaud, O. (2010). Robust analysis of the central tendency, simple and multiple regression and ANOVA: a step by step tutorial. International Journal of Psychological Research, 3(1), 78–87. https://doi.org/10.21500/20112084.8492011-7922http://hdl.handle.net/10819/6501spaEditorial BonaventurianaPsicologíaMedellínhttp://dx.doi.org/10.21500/20112084.849Atribución-NoComercial-SinDerivadas 2.5 ColombiaPor medio de este formato manifiesto mi voluntad de AUTORIZAR a la Universidad de San Buenaventura, Sede Bogotá, Seccionales Medellín, Cali y Cartagena, la difusión en texto completo de manera gratuita y por tiempo indefinido en la Biblioteca Digital Universidad de San Buenaventura, el documento académico-investigativo objeto de la presente autorización, con fines estrictamente educativos, científicos y culturales, en los términos establecidos en la Ley 23 de 1982, Ley 44 de 1993, Decisión Andina 351 de 1993, Decreto 460 de 1995 y demás normas generales sobre derechos de autor. Como autor manifiesto que el presente documento académico-investigativo es original y se realiza sin violar o usurpar derechos de autor de terceros, por lo tanto, la obra es de mi exclusiva autora y poseo la titularidad sobre la misma. La Universidad de San Buenaventura no será responsable de ninguna utilización indebida del documento por parte de terceros y será exclusivamente mi responsabilidad atender personalmente cualquier reclamación que pueda presentarse a la Universidad. Autorizo a la Biblioteca Digital de la Universidad de San Buenaventura convertir el documento al formato que el repositorio lo requiera (impreso, digital, electrónico o cualquier otro conocido o por conocer) o con fines de preservación digital. Esta autorización no implica renuncia a la facultad que tengo de publicar posteriormente la obra, en forma total o parcial, por lo cual podrá, dando aviso por escrito con no menos de un mes de antelación, solicitar que el documento deje de estar disponible para el público en la Biblioteca Digital de la Universidad de San Buenaventura, así mismo, cuando se requiera por razones legales y/o reglas del editor de una revista.http://creativecommons.org/licenses/by-nc-nd/2.5/co/http://purl.org/coar/access_right/c_abf2International Journal of Psychological ResearchUniversidad de San Buenaventura - MedellínBiblioteca Digital Universidad de San BuenaventuraRobust methodsAnovaRegressionDiagnosticOutliersMétodos robustosRegresiónDiagnósticoValores externosEstadísticaInvestigación cuantitativaRobust analysis of the central tendency, simple and multiple regression and ANOVA: a step by step tutorial.Análisis robusto de la tendencia central, regresión simple, múltiple y ANOVA: Un tutorial paso a pasoArtículo de revistaArtículoinfo:eu-repo/semantics/articlehttp://purl.org/coar/resource_type/c_2df8fbb1PublicationORIGINALAnalysis_Central_Tendency_Delphine_2010.pdfAnalysis_Central_Tendency_Delphine_2010.pdfapplication/pdf308384https://bibliotecadigital.usb.edu.co/bitstreams/8ab54594-1ac1-4c20-9bf4-32bd10dc384f/download21d97654e20b5ac47d0c8643766955e9MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-82071https://bibliotecadigital.usb.edu.co/bitstreams/6ab9f866-ad9f-4804-983d-4c0f583a6f3c/download0c7b7184e7583ec671a5d9e43f0939c0MD52TEXTAnalysis_Central_Tendency_Delphine_2010.pdf.txtAnalysis_Central_Tendency_Delphine_2010.pdf.txtExtracted texttext/plain43591https://bibliotecadigital.usb.edu.co/bitstreams/7c7aee23-d7b8-40e7-9aef-1a526e55d4f2/downloada21aa6091693bd365257233b43119c5dMD53THUMBNAILAnalysis_Central_Tendency_Delphine_2010.pdf.jpgAnalysis_Central_Tendency_Delphine_2010.pdf.jpgGenerated Thumbnailimage/jpeg15035https://bibliotecadigital.usb.edu.co/bitstreams/3bcdb824-83a7-43eb-85c3-66599bfe5b9c/download18592834a01cdcbe577492184ee76b5bMD5410819/6501oai:bibliotecadigital.usb.edu.co:10819/65012023-04-12 16:39:35.3http://creativecommons.org/licenses/by-nc-nd/2.5/co/https://bibliotecadigital.usb.edu.coRepositorio Institucional Universidad de San Buenaventura Colombiabdigital@metabiblioteca.comPGNlbnRlcj4KPGgzPkJJQkxJT1RFQ0EgRElHSVRBTCBVTklWRVJTSURBRCBERSBTQU4gQlVFTkFWRU5UVVJBIC0gQ09MT01CSUE8L2gzPgo8cD4KVMOpcm1pbm9zIGRlIGxhIGxpY2VuY2lhIGdlbmVyYWwgcGFyYSBwdWJsaWNhY2nDs24gZGUgb2JyYXMgZW4gZWwgcmVwb3NpdG9yaW8gaW5zdGl0dWNpb25hbDwvcD48L2NlbnRlcj4KPFAgQUxJR049Y2VudGVyPgpQb3IgbWVkaW8gZGUgZXN0ZSBmb3JtYXRvIG1hbmlmaWVzdG8gbWkgdm9sdW50YWQgZGUgQVVUT1JJWkFSIGEgbGEgVW5pdmVyc2lkYWQgZGUgU2FuIEJ1ZW5hdmVudHVyYSwgU2VkZSBCb2dvdMOhIHkgPEJSPlNlY2Npb25hbGVzIE1lZGVsbMOtbiwgQ2FsaSB5IENhcnRhZ2VuYSwgbGEgZGlmdXNpw7NuIGVuIHRleHRvIGNvbXBsZXRvIGRlIG1hbmVyYSBncmF0dWl0YSB5IHBvciB0aWVtcG8gaW5kZWZpbmlkbyBlbiBsYTxCUj4gQmlibGlvdGVjYSBEaWdpdGFsIFVuaXZlcnNpZGFkIGRlIFNhbiBCdWVuYXZlbnR1cmEsIGVsIGRvY3VtZW50byBhY2Fkw6ltaWNvIC0gaW52ZXN0aWdhdGl2byBvYmpldG8gZGUgbGEgcHJlc2VudGUgPEJSPmF1dG9yaXphY2nDs24sIGNvbiBmaW5lcyBlc3RyaWN0YW1lbnRlIGVkdWNhdGl2b3MsIGNpZW50w63CrWZpY29zIHkgY3VsdHVyYWxlcywgZW4gbG9zIHTDqXJtaW5vcyBlc3RhYmxlY2lkb3MgZW4gbGEgTGV5IDIzIGRlIDxCUj4gMTk4MiwgTGV5IDQ0IGRlIDE5OTMsIERlY2lzacOzbiBBbmRpbmEgMzUxIGRlIDE5OTMsIERlY3JldG8gNDYwIGRlIDE5OTUgeSBkZW3DoXMgbm9ybWFzIGdlbmVyYWxlcyBzb2JyZSBkZXJlY2hvczxCUj4gZGUgYXV0b3IuIDxCUj4gCiAKQ29tbyBhdXRvciBtYW5pZmllc3RvIHF1ZSBlbCBwcmVzZW50ZSBkb2N1bWVudG8gYWNhZMOpbWljbyAtIGludmVzdGlnYXRpdm8gZXMgb3JpZ2luYWwgeSBzZSByZWFsaXrDsyBzaW4gdmlvbGFyIG8gPEJSPiB1c3VycGFyIGRlcmVjaG9zIGRlIGF1dG9yIGRlIHRlcmNlcm9zLCBwb3IgbG8gdGFudG8sIGxhIG9icmEgZXMgZGUgbWkgZXhjbHVzaXZhIGF1dG9yw63CrWEgeSBwb3NlbyBsYSB0aXR1bGFyaWRhZCA8QlI+IHNvYnJlIGxhIG1pc21hLiBMYSBVbml2ZXJzaWRhZCBkZSBTYW4gQnVlbmF2ZW50dXJhIG5vIHNlcsOhIHJlc3BvbnNhYmxlIGRlIG5pbmd1bmEgdXRpbGl6YWNpw7NuIGluZGViaWRhIGRlbCBkb2N1bWVudG8gPEJSPnBvciBwYXJ0ZSBkZSB0ZXJjZXJvcyB5IHNlcsOhIGV4Y2x1c2l2YW1lbnRlIG1pIHJlc3BvbnNhYmlsaWRhZCBhdGVuZGVyIHBlcnNvbmFsbWVudGUgY3VhbHF1aWVyIHJlY2xhbWFjacOzbiBxdWUgcHVlZGE8QlI+IHByZXNlbnRhcnNlIGEgbGEgVW5pdmVyc2lkYWQuIDxCUj4KIApBdXRvcml6byBhIGxhIEJpYmxpb3RlY2EgRGlnaXRhbCBkZSBsYSBVbml2ZXJzaWRhZCBkZSBTYW4gQnVlbmF2ZW50dXJhIGNvbnZlcnRpciBlbCBkb2N1bWVudG8gYWwgZm9ybWF0byBxdWUgZWwgPEJSPnJlcG9zaXRvcmlvIGxvIHJlcXVpZXJhIChpbXByZXNvLCBkaWdpdGFsLCBlbGVjdHLDs25pY28gbyBjdWFscXVpZXIgb3RybyBjb25vY2lkbyBvIHBvciBjb25vY2VyKSBvIGNvbiBmaW5lcyBkZTxCUj4gcHJlc2VydmFjacOzbiBkaWdpdGFsLiA8QlI+CiAKRXN0YSBhdXRvcml6YWNpw7NuIG5vIGltcGxpY2EgcmVudW5jaWEgYSBsYSBmYWN1bHRhZCBxdWUgdGVuZ28gZGUgcHVibGljYXIgcG9zdGVyaW9ybWVudGUgbGEgb2JyYSwgZW4gZm9ybWEgdG90YWwgbyA8QlI+cGFyY2lhbCwgcG9yIGxvIGN1YWwgcG9kcsOpLCBkYW5kbyBhdmlzbyBwb3IgZXNjcml0byBjb24gbm8gbWVub3MgZGUgdW4gbWVzIGRlIGFudGVsYWNpw7NuLCBzb2xpY2l0YXIgcXVlIGVsIDxCUj5kb2N1bWVudG8gZGVqZSBkZSBlc3RhciBkaXNwb25pYmxlIHBhcmEgZWwgcMO6YmxpY28gZW4gbGEgQmlibGlvdGVjYSBEaWdpdGFsIGRlIGxhIFVuaXZlcnNpZGFkIGRlIFNhbiBCdWVuYXZlbnR1cmEsIDxCUj4gYXPDrcKtIG1pc21vLCBjdWFuZG8gc2UgcmVxdWllcmEgcG9yIHJhem9uZXMgbGVnYWxlcyB5L28gcmVnbGFzIGRlbCBlZGl0b3IgZGUgdW5hIHJldmlzdGEuIDxCUj48L1A+Cg==