Implementación de algoritmos de parallel boosting

En este trabajo de grado, se desarrollaron los diferentes algoritmos pertenecientes a la técnica de Boosting paralelo en Python. Para esto, se utilizaron librerías comunes en computación científica como lo son Scikit-Learn para el entrenamiento de modelos débiles, NumPy para el tratamiento de estruc...

Full description

Autores:
López Rubiano, Daniel Felipe
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2024
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/73842
Acceso en línea:
https://hdl.handle.net/1992/73842
Palabra clave:
Machine learning
Boosting
Decission trees
Adaboost
XGboost
Parallel computing
Ingeniería
Rights
openAccess
License
https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
id UNIANDES2_779df3a47cae131276cfea760e03ecfb
oai_identifier_str oai:repositorio.uniandes.edu.co:1992/73842
network_acronym_str UNIANDES2
network_name_str Séneca: repositorio Uniandes
repository_id_str
dc.title.none.fl_str_mv Implementación de algoritmos de parallel boosting
title Implementación de algoritmos de parallel boosting
spellingShingle Implementación de algoritmos de parallel boosting
Machine learning
Boosting
Decission trees
Adaboost
XGboost
Parallel computing
Ingeniería
title_short Implementación de algoritmos de parallel boosting
title_full Implementación de algoritmos de parallel boosting
title_fullStr Implementación de algoritmos de parallel boosting
title_full_unstemmed Implementación de algoritmos de parallel boosting
title_sort Implementación de algoritmos de parallel boosting
dc.creator.fl_str_mv López Rubiano, Daniel Felipe
dc.contributor.advisor.none.fl_str_mv Lozano Martínez, Fernando Enrique
dc.contributor.author.none.fl_str_mv López Rubiano, Daniel Felipe
dc.contributor.jury.none.fl_str_mv Osma Cruz, Johann Faccelo
dc.subject.keyword.eng.fl_str_mv Machine learning
Boosting
Decission trees
Adaboost
XGboost
Parallel computing
topic Machine learning
Boosting
Decission trees
Adaboost
XGboost
Parallel computing
Ingeniería
dc.subject.themes.spa.fl_str_mv Ingeniería
description En este trabajo de grado, se desarrollaron los diferentes algoritmos pertenecientes a la técnica de Boosting paralelo en Python. Para esto, se utilizaron librerías comunes en computación científica como lo son Scikit-Learn para el entrenamiento de modelos débiles, NumPy para el tratamiento de estructuras de datos y Joblib para el tratamiento de la computación paralela. Adicionalmente, se evaluaron sus desempeños en conjuntos de datos modernos. Particularmente, los algoritmos y conjuntos de datos tratados son enfocados en el problema de clasificación binario, con lo cual se utilizaron bases de datos que tratan problemas como el de identificar señales del bosón de Higgs en el acelerador de partículas o identificar que reclamos al seguro de autos resultaron en una retribución. Las pruebas realizadas en conjuntos de datos modificados de los anteriormente mostrados, señalaron que la técnica de Parallel Boosting mejor en gran medida el tiempo necesario para entrenar arboles de decisión, sin embargo no garantiza el mismo rendimiento que Adaboost o XGBoost posee.
publishDate 2024
dc.date.accessioned.none.fl_str_mv 2024-02-02T19:49:52Z
dc.date.available.none.fl_str_mv 2024-02-02T19:49:52Z
dc.date.issued.none.fl_str_mv 2024-01-15
dc.type.none.fl_str_mv Trabajo de grado - Pregrado
dc.type.driver.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.version.none.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.content.none.fl_str_mv Text
dc.type.redcol.none.fl_str_mv http://purl.org/redcol/resource_type/TP
format http://purl.org/coar/resource_type/c_7a1f
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/1992/73842
dc.identifier.instname.none.fl_str_mv instname:Universidad de los Andes
dc.identifier.reponame.none.fl_str_mv reponame:Repositorio Institucional Séneca
dc.identifier.repourl.none.fl_str_mv repourl:https://repositorio.uniandes.edu.co/
url https://hdl.handle.net/1992/73842
identifier_str_mv instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
repourl:https://repositorio.uniandes.edu.co/
dc.language.iso.none.fl_str_mv spa
language spa
dc.rights.uri.none.fl_str_mv https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
dc.rights.accessrights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.none.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.none.fl_str_mv 36 páginas
dc.format.mimetype.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de los Andes
dc.publisher.program.none.fl_str_mv Ingeniería Electrónica
dc.publisher.faculty.none.fl_str_mv Facultad de Ingeniería
dc.publisher.department.none.fl_str_mv Departamento de Ingeniería Eléctrica y Electrónica
publisher.none.fl_str_mv Universidad de los Andes
institution Universidad de los Andes
bitstream.url.fl_str_mv https://repositorio.uniandes.edu.co/bitstreams/d994bce8-54d6-419f-b69f-63b0d4ac9c8b/download
https://repositorio.uniandes.edu.co/bitstreams/4193ad08-b5eb-465d-9ce8-1e3362bb7764/download
https://repositorio.uniandes.edu.co/bitstreams/4e746daa-da39-450b-bb06-2b0413075a4c/download
https://repositorio.uniandes.edu.co/bitstreams/8dd77bf3-2123-4314-8d52-afefb634f395/download
https://repositorio.uniandes.edu.co/bitstreams/75ed9cbd-db20-4173-8988-6d44a7168f97/download
https://repositorio.uniandes.edu.co/bitstreams/ad8d3cd6-6339-42f9-8670-88b05d180d9f/download
https://repositorio.uniandes.edu.co/bitstreams/5ec87684-3f87-4186-a13b-c08cbefc38f6/download
bitstream.checksum.fl_str_mv f8f8ddc65a76b98c92dfde50f2990428
fcce8cc1d14d5988645c19523b2ce4e5
ae9e573a68e7f92501b6913cc846c39f
eed1d43012d872c6ed8ae7ad7653ffcc
e3fac96f8f3644637792bbc6e2429b4e
4a783656860ff110767a7b457807e00d
34ad03cd3a7df3d1e0b9b50a9534eb79
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio institucional Séneca
repository.mail.fl_str_mv adminrepositorio@uniandes.edu.co
_version_ 1831927800267800576
spelling Lozano Martínez, Fernando Enriquevirtual::20987-1López Rubiano, Daniel FelipeOsma Cruz, Johann Faccelo2024-02-02T19:49:52Z2024-02-02T19:49:52Z2024-01-15https://hdl.handle.net/1992/73842instname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/En este trabajo de grado, se desarrollaron los diferentes algoritmos pertenecientes a la técnica de Boosting paralelo en Python. Para esto, se utilizaron librerías comunes en computación científica como lo son Scikit-Learn para el entrenamiento de modelos débiles, NumPy para el tratamiento de estructuras de datos y Joblib para el tratamiento de la computación paralela. Adicionalmente, se evaluaron sus desempeños en conjuntos de datos modernos. Particularmente, los algoritmos y conjuntos de datos tratados son enfocados en el problema de clasificación binario, con lo cual se utilizaron bases de datos que tratan problemas como el de identificar señales del bosón de Higgs en el acelerador de partículas o identificar que reclamos al seguro de autos resultaron en una retribución. Las pruebas realizadas en conjuntos de datos modificados de los anteriormente mostrados, señalaron que la técnica de Parallel Boosting mejor en gran medida el tiempo necesario para entrenar arboles de decisión, sin embargo no garantiza el mismo rendimiento que Adaboost o XGBoost posee.Ingeniero ElectrónicoPregrado36 páginasapplication/pdfspaUniversidad de los AndesIngeniería ElectrónicaFacultad de IngenieríaDepartamento de Ingeniería Eléctrica y Electrónicahttps://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdfinfo:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Implementación de algoritmos de parallel boostingTrabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_7a1fTexthttp://purl.org/redcol/resource_type/TPMachine learningBoostingDecission treesAdaboostXGboostParallel computingIngeniería201816742Publicationedd81d8c-e0b9-4c1f-bf04-eed0e12e755dvirtual::20987-1edd81d8c-e0b9-4c1f-bf04-eed0e12e755dvirtual::20987-1https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000025550virtual::20987-1ORIGINALImplementación de algoritmos de parallel boosting.pdfImplementación de algoritmos de parallel boosting.pdfapplication/pdf721147https://repositorio.uniandes.edu.co/bitstreams/d994bce8-54d6-419f-b69f-63b0d4ac9c8b/downloadf8f8ddc65a76b98c92dfde50f2990428MD51autorizacion tesis (1).pdfautorizacion tesis (1).pdfHIDEapplication/pdf222181https://repositorio.uniandes.edu.co/bitstreams/4193ad08-b5eb-465d-9ce8-1e3362bb7764/downloadfcce8cc1d14d5988645c19523b2ce4e5MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82535https://repositorio.uniandes.edu.co/bitstreams/4e746daa-da39-450b-bb06-2b0413075a4c/downloadae9e573a68e7f92501b6913cc846c39fMD52TEXTImplementación de algoritmos de parallel boosting.pdf.txtImplementación de algoritmos de parallel boosting.pdf.txtExtracted texttext/plain62164https://repositorio.uniandes.edu.co/bitstreams/8dd77bf3-2123-4314-8d52-afefb634f395/downloadeed1d43012d872c6ed8ae7ad7653ffccMD53autorizacion tesis (1).pdf.txtautorizacion tesis (1).pdf.txtExtracted texttext/plain2056https://repositorio.uniandes.edu.co/bitstreams/75ed9cbd-db20-4173-8988-6d44a7168f97/downloade3fac96f8f3644637792bbc6e2429b4eMD55THUMBNAILImplementación de algoritmos de parallel boosting.pdf.jpgImplementación de algoritmos de parallel boosting.pdf.jpgGenerated Thumbnailimage/jpeg6322https://repositorio.uniandes.edu.co/bitstreams/ad8d3cd6-6339-42f9-8670-88b05d180d9f/download4a783656860ff110767a7b457807e00dMD54autorizacion tesis (1).pdf.jpgautorizacion tesis (1).pdf.jpgGenerated Thumbnailimage/jpeg11040https://repositorio.uniandes.edu.co/bitstreams/5ec87684-3f87-4186-a13b-c08cbefc38f6/download34ad03cd3a7df3d1e0b9b50a9534eb79MD561992/73842oai:repositorio.uniandes.edu.co:1992/738422024-12-04 16:58:53.868https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdfopen.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.coPGgzPjxzdHJvbmc+RGVzY2FyZ28gZGUgUmVzcG9uc2FiaWxpZGFkIC0gTGljZW5jaWEgZGUgQXV0b3JpemFjacOzbjwvc3Ryb25nPjwvaDM+CjxwPjxzdHJvbmc+UG9yIGZhdm9yIGxlZXIgYXRlbnRhbWVudGUgZXN0ZSBkb2N1bWVudG8gcXVlIHBlcm1pdGUgYWwgUmVwb3NpdG9yaW8gSW5zdGl0dWNpb25hbCBTw6luZWNhIHJlcHJvZHVjaXIgeSBkaXN0cmlidWlyIGxvcyByZWN1cnNvcyBkZSBpbmZvcm1hY2nDs24gZGVwb3NpdGFkb3MgbWVkaWFudGUgbGEgYXV0b3JpemFjacOzbiBkZSBsb3Mgc2lndWllbnRlcyB0w6lybWlub3M6PC9zdHJvbmc+PC9wPgo8cD5Db25jZWRhIGxhIGxpY2VuY2lhIGRlIGRlcMOzc2l0byBlc3TDoW5kYXIgc2VsZWNjaW9uYW5kbyBsYSBvcGNpw7NuIDxzdHJvbmc+J0FjZXB0YXIgbG9zIHTDqXJtaW5vcyBhbnRlcmlvcm1lbnRlIGRlc2NyaXRvcyc8L3N0cm9uZz4geSBjb250aW51YXIgZWwgcHJvY2VzbyBkZSBlbnbDrW8gbWVkaWFudGUgZWwgYm90w7NuIDxzdHJvbmc+J1NpZ3VpZW50ZScuPC9zdHJvbmc+PC9wPgo8aHI+CjxwPllvLCBlbiBtaSBjYWxpZGFkIGRlIGF1dG9yIGRlbCB0cmFiYWpvIGRlIHRlc2lzLCBtb25vZ3JhZsOtYSBvIHRyYWJham8gZGUgZ3JhZG8sIGhhZ28gZW50cmVnYSBkZWwgZWplbXBsYXIgcmVzcGVjdGl2byB5IGRlIHN1cyBhbmV4b3MgZGUgc2VyIGVsIGNhc28sIGVuIGZvcm1hdG8gZGlnaXRhbCB5L28gZWxlY3Ryw7NuaWNvIHkgYXV0b3Jpem8gYSBsYSBVbml2ZXJzaWRhZCBkZSBsb3MgQW5kZXMgcGFyYSBxdWUgcmVhbGljZSBsYSBwdWJsaWNhY2nDs24gZW4gZWwgU2lzdGVtYSBkZSBCaWJsaW90ZWNhcyBvIGVuIGN1YWxxdWllciBvdHJvIHNpc3RlbWEgbyBiYXNlIGRlIGRhdG9zIHByb3BpbyBvIGFqZW5vIGEgbGEgVW5pdmVyc2lkYWQgeSBwYXJhIHF1ZSBlbiBsb3MgdMOpcm1pbm9zIGVzdGFibGVjaWRvcyBlbiBsYSBMZXkgMjMgZGUgMTk4MiwgTGV5IDQ0IGRlIDE5OTMsIERlY2lzacOzbiBBbmRpbmEgMzUxIGRlIDE5OTMsIERlY3JldG8gNDYwIGRlIDE5OTUgeSBkZW3DoXMgbm9ybWFzIGdlbmVyYWxlcyBzb2JyZSBsYSBtYXRlcmlhLCB1dGlsaWNlIGVuIHRvZGFzIHN1cyBmb3JtYXMsIGxvcyBkZXJlY2hvcyBwYXRyaW1vbmlhbGVzIGRlIHJlcHJvZHVjY2nDs24sIGNvbXVuaWNhY2nDs24gcMO6YmxpY2EsIHRyYW5zZm9ybWFjacOzbiB5IGRpc3RyaWJ1Y2nDs24gKGFscXVpbGVyLCBwcsOpc3RhbW8gcMO6YmxpY28gZSBpbXBvcnRhY2nDs24pIHF1ZSBtZSBjb3JyZXNwb25kZW4gY29tbyBjcmVhZG9yIGRlIGxhIG9icmEgb2JqZXRvIGRlbCBwcmVzZW50ZSBkb2N1bWVudG8uPC9wPgo8cD5MYSBwcmVzZW50ZSBhdXRvcml6YWNpw7NuIHNlIGVtaXRlIGVuIGNhbGlkYWQgZGUgYXV0b3IgZGUgbGEgb2JyYSBvYmpldG8gZGVsIHByZXNlbnRlIGRvY3VtZW50byB5IG5vIGNvcnJlc3BvbmRlIGEgY2VzacOzbiBkZSBkZXJlY2hvcywgc2lubyBhIGxhIGF1dG9yaXphY2nDs24gZGUgdXNvIGFjYWTDqW1pY28gZGUgY29uZm9ybWlkYWQgY29uIGxvIGFudGVyaW9ybWVudGUgc2XDsWFsYWRvLiBMYSBwcmVzZW50ZSBhdXRvcml6YWNpw7NuIHNlIGhhY2UgZXh0ZW5zaXZhIG5vIHNvbG8gYSBsYXMgZmFjdWx0YWRlcyB5IGRlcmVjaG9zIGRlIHVzbyBzb2JyZSBsYSBvYnJhIGVuIGZvcm1hdG8gbyBzb3BvcnRlIG1hdGVyaWFsLCBzaW5vIHRhbWJpw6luIHBhcmEgZm9ybWF0byBlbGVjdHLDs25pY28sIHkgZW4gZ2VuZXJhbCBwYXJhIGN1YWxxdWllciBmb3JtYXRvIGNvbm9jaWRvIG8gcG9yIGNvbm9jZXIuPC9wPgo8cD5FbCBhdXRvciwgbWFuaWZpZXN0YSBxdWUgbGEgb2JyYSBvYmpldG8gZGUgbGEgcHJlc2VudGUgYXV0b3JpemFjacOzbiBlcyBvcmlnaW5hbCB5IGxhIHJlYWxpesOzIHNpbiB2aW9sYXIgbyB1c3VycGFyIGRlcmVjaG9zIGRlIGF1dG9yIGRlIHRlcmNlcm9zLCBwb3IgbG8gdGFudG8sIGxhIG9icmEgZXMgZGUgc3UgZXhjbHVzaXZhIGF1dG9yw61hIHkgdGllbmUgbGEgdGl0dWxhcmlkYWQgc29icmUgbGEgbWlzbWEuPC9wPgo8cD5FbiBjYXNvIGRlIHByZXNlbnRhcnNlIGN1YWxxdWllciByZWNsYW1hY2nDs24gbyBhY2Npw7NuIHBvciBwYXJ0ZSBkZSB1biB0ZXJjZXJvIGVuIGN1YW50byBhIGxvcyBkZXJlY2hvcyBkZSBhdXRvciBzb2JyZSBsYSBvYnJhIGVuIGN1ZXN0acOzbiwgZWwgYXV0b3IgYXN1bWlyw6EgdG9kYSBsYSByZXNwb25zYWJpbGlkYWQsIHkgc2FsZHLDoSBkZSBkZWZlbnNhIGRlIGxvcyBkZXJlY2hvcyBhcXXDrSBhdXRvcml6YWRvcywgcGFyYSB0b2RvcyBsb3MgZWZlY3RvcyBsYSBVbml2ZXJzaWRhZCBhY3TDumEgY29tbyB1biB0ZXJjZXJvIGRlIGJ1ZW5hIGZlLjwvcD4KPHA+U2kgdGllbmUgYWxndW5hIGR1ZGEgc29icmUgbGEgbGljZW5jaWEsIHBvciBmYXZvciwgY29udGFjdGUgY29uIGVsIDxhIGhyZWY9Im1haWx0bzpiaWJsaW90ZWNhQHVuaWFuZGVzLmVkdS5jbyIgdGFyZ2V0PSJfYmxhbmsiPkFkbWluaXN0cmFkb3IgZGVsIFNpc3RlbWEuPC9hPjwvcD4K