Extracción de Información en la Deep Web para el Desarrollo de Alertas Tempranas para la Fuerza Aeroespacial Colombiana

En la era digital actual, la ciberseguridad representa un desafío crítico para instituciones como la Fuerza Aeroespacial Colombiana, que necesita proteger su infraestructura tecnológica y responder eficazmente a las amenazas emergentes. Este proyecto aborda la problemática mediante el diseño e imple...

Full description

Autores:
Ojeda Amaya, Lina MarÍa
Murcia Goméz, Sebastián
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2024
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/75393
Acceso en línea:
https://hdl.handle.net/1992/75393
Palabra clave:
Fuerza Aeroespacial Colombiana
Crawler
Scraper
Ingeniería
Rights
openAccess
License
Attribution 4.0 International
id UNIANDES2_8f44798d66db998fc9dd4a74b466b8c0
oai_identifier_str oai:repositorio.uniandes.edu.co:1992/75393
network_acronym_str UNIANDES2
network_name_str Séneca: repositorio Uniandes
repository_id_str
dc.title.spa.fl_str_mv Extracción de Información en la Deep Web para el Desarrollo de Alertas Tempranas para la Fuerza Aeroespacial Colombiana
title Extracción de Información en la Deep Web para el Desarrollo de Alertas Tempranas para la Fuerza Aeroespacial Colombiana
spellingShingle Extracción de Información en la Deep Web para el Desarrollo de Alertas Tempranas para la Fuerza Aeroespacial Colombiana
Fuerza Aeroespacial Colombiana
Crawler
Scraper
Ingeniería
title_short Extracción de Información en la Deep Web para el Desarrollo de Alertas Tempranas para la Fuerza Aeroespacial Colombiana
title_full Extracción de Información en la Deep Web para el Desarrollo de Alertas Tempranas para la Fuerza Aeroespacial Colombiana
title_fullStr Extracción de Información en la Deep Web para el Desarrollo de Alertas Tempranas para la Fuerza Aeroespacial Colombiana
title_full_unstemmed Extracción de Información en la Deep Web para el Desarrollo de Alertas Tempranas para la Fuerza Aeroespacial Colombiana
title_sort Extracción de Información en la Deep Web para el Desarrollo de Alertas Tempranas para la Fuerza Aeroespacial Colombiana
dc.creator.fl_str_mv Ojeda Amaya, Lina MarÍa
Murcia Goméz, Sebastián
dc.contributor.advisor.none.fl_str_mv Donoso Meisel, Yezyd Enrique
dc.contributor.author.none.fl_str_mv Ojeda Amaya, Lina MarÍa
Murcia Goméz, Sebastián
dc.contributor.jury.none.fl_str_mv Donoso Meisel, Yezid Enrique
dc.subject.keyword.spa.fl_str_mv Fuerza Aeroespacial Colombiana
Crawler
Scraper
topic Fuerza Aeroespacial Colombiana
Crawler
Scraper
Ingeniería
dc.subject.themes.none.fl_str_mv Ingeniería
description En la era digital actual, la ciberseguridad representa un desafío crítico para instituciones como la Fuerza Aeroespacial Colombiana, que necesita proteger su infraestructura tecnológica y responder eficazmente a las amenazas emergentes. Este proyecto aborda la problemática mediante el diseño e implementación de un sistema automatizado para la extracción de información en la Deep Web, con el objetivo de desarrollar alertas tempranas que apoyen la toma de decisiones estratégicas. El sistema desarrollado incluye dos componentes principales: un crawler, basado en Aprendizaje por Refuerzo (RL), y un scraper, diseñado para interactuar con plataformas específicas.
publishDate 2024
dc.date.issued.none.fl_str_mv 2024-12-15
dc.date.accessioned.none.fl_str_mv 2025-01-14T14:20:50Z
dc.date.available.none.fl_str_mv 2025-01-14T14:20:50Z
dc.type.none.fl_str_mv Trabajo de grado - Pregrado
dc.type.driver.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.version.none.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.content.none.fl_str_mv Text
dc.type.redcol.none.fl_str_mv http://purl.org/redcol/resource_type/TP
format http://purl.org/coar/resource_type/c_7a1f
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/1992/75393
dc.identifier.instname.none.fl_str_mv instname:Universidad de los Andes
dc.identifier.reponame.none.fl_str_mv reponame:Repositorio Institucional Séneca
dc.identifier.repourl.none.fl_str_mv repourl:https://repositorio.uniandes.edu.co/
url https://hdl.handle.net/1992/75393
identifier_str_mv instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
repourl:https://repositorio.uniandes.edu.co/
dc.language.iso.none.fl_str_mv spa
language spa
dc.relation.references.none.fl_str_mv Devasirvatham, W., & Thiyagarajan, J. D. (2022). Extricating web pages from deep web using DEAIMA architecture. Theoretical Computer Science, 931, 93-103.
Madan, K., & Bhatia, R. (2021). Crawling the Deep Web Using Asynchronous Advantage Actor Critic Technique. Journal of Web Engineering, 20(3), 879-902.
Zheng, Q., Wu, Z., Cheng, X., Jiang, L., & Liu, J. (2013). Learning to crawl deep web. Information Systems, 38, 801-819.
Barrio, P., & Gravano, L. (2017). Sampling strategies for information extraction over the deep web. Information Processing and Management, 53, 309-331.
dc.rights.en.fl_str_mv Attribution 4.0 International
dc.rights.uri.none.fl_str_mv http://creativecommons.org/licenses/by/4.0/
dc.rights.accessrights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.none.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv Attribution 4.0 International
http://creativecommons.org/licenses/by/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.none.fl_str_mv 45 páginas
dc.format.mimetype.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de los Andes
dc.publisher.program.none.fl_str_mv Ingeniería de Sistemas y Computación
dc.publisher.faculty.none.fl_str_mv Facultad de Ingeniería
dc.publisher.department.none.fl_str_mv Departamento de Ingeniería de Sistemas y Computación
publisher.none.fl_str_mv Universidad de los Andes
institution Universidad de los Andes
bitstream.url.fl_str_mv https://repositorio.uniandes.edu.co/bitstreams/00e054e6-1848-46c2-aa65-bf158a5d2176/download
https://repositorio.uniandes.edu.co/bitstreams/6367e44b-a287-4c41-8f8d-ba76260ad97a/download
https://repositorio.uniandes.edu.co/bitstreams/94a39639-0f10-41d8-b121-2537058ded2f/download
https://repositorio.uniandes.edu.co/bitstreams/089f95a1-6677-4d8c-ba0f-9dfca341f406/download
https://repositorio.uniandes.edu.co/bitstreams/1713fb88-a03c-4190-9a85-f0e798b63040/download
https://repositorio.uniandes.edu.co/bitstreams/5f1c994f-23dc-440c-9b53-6c504b964e2a/download
https://repositorio.uniandes.edu.co/bitstreams/0db6c57b-7c7a-4c40-8422-387a378bc78c/download
https://repositorio.uniandes.edu.co/bitstreams/5bda4b8a-dd4d-4538-a76d-2787f090d52a/download
bitstream.checksum.fl_str_mv 791825a3055b25301e444b865a63cbc2
e111a065371c10a154bea6770d4a12ae
0175ea4a2d4caec4bbcc37e300941108
ae9e573a68e7f92501b6913cc846c39f
8183860ad13b26706851974af698d0c8
273a1fa613ce389c3a1e5a9e37a12683
d27799b29fcc2c3d7380ddb320d861cd
799bd2cdb8aaef58cfc7a8d42259c6df
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio institucional Séneca
repository.mail.fl_str_mv adminrepositorio@uniandes.edu.co
_version_ 1828159291872247808
spelling Donoso Meisel, Yezyd Enriquevirtual::22046-1Ojeda Amaya, Lina MarÍaMurcia Goméz, SebastiánDonoso Meisel, Yezid Enrique2025-01-14T14:20:50Z2025-01-14T14:20:50Z2024-12-15https://hdl.handle.net/1992/75393instname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/En la era digital actual, la ciberseguridad representa un desafío crítico para instituciones como la Fuerza Aeroespacial Colombiana, que necesita proteger su infraestructura tecnológica y responder eficazmente a las amenazas emergentes. Este proyecto aborda la problemática mediante el diseño e implementación de un sistema automatizado para la extracción de información en la Deep Web, con el objetivo de desarrollar alertas tempranas que apoyen la toma de decisiones estratégicas. El sistema desarrollado incluye dos componentes principales: un crawler, basado en Aprendizaje por Refuerzo (RL), y un scraper, diseñado para interactuar con plataformas específicas.Pregrado45 páginasapplication/pdfspaUniversidad de los AndesIngeniería de Sistemas y ComputaciónFacultad de IngenieríaDepartamento de Ingeniería de Sistemas y ComputaciónAttribution 4.0 Internationalhttp://creativecommons.org/licenses/by/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Extracción de Información en la Deep Web para el Desarrollo de Alertas Tempranas para la Fuerza Aeroespacial ColombianaTrabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_7a1fTexthttp://purl.org/redcol/resource_type/TPFuerza Aeroespacial ColombianaCrawlerScraperIngenieríaDevasirvatham, W., & Thiyagarajan, J. D. (2022). Extricating web pages from deep web using DEAIMA architecture. Theoretical Computer Science, 931, 93-103.Madan, K., & Bhatia, R. (2021). Crawling the Deep Web Using Asynchronous Advantage Actor Critic Technique. Journal of Web Engineering, 20(3), 879-902.Zheng, Q., Wu, Z., Cheng, X., Jiang, L., & Liu, J. (2013). Learning to crawl deep web. Information Systems, 38, 801-819.Barrio, P., & Gravano, L. (2017). Sampling strategies for information extraction over the deep web. Information Processing and Management, 53, 309-331.202112324202015229Publicationhttps://scholar.google.es/citations?user=Razvs2MAAAAJvirtual::22046-10000-0003-1659-1522virtual::22046-1https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000094706virtual::22046-16b9d423b-11e8-4930-b0d2-061b34e9806bvirtual::22046-16b9d423b-11e8-4930-b0d2-061b34e9806bvirtual::22046-1ORIGINALExtraccion de Informacion en la Deep Web.pdfExtraccion de Informacion en la Deep Web.pdfapplication/pdf5947732https://repositorio.uniandes.edu.co/bitstreams/00e054e6-1848-46c2-aa65-bf158a5d2176/download791825a3055b25301e444b865a63cbc2MD51Formato Autorización y Entrega de Tesis.pdfFormato Autorización y Entrega de Tesis.pdfHIDEapplication/pdf297372https://repositorio.uniandes.edu.co/bitstreams/6367e44b-a287-4c41-8f8d-ba76260ad97a/downloade111a065371c10a154bea6770d4a12aeMD52CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8908https://repositorio.uniandes.edu.co/bitstreams/94a39639-0f10-41d8-b121-2537058ded2f/download0175ea4a2d4caec4bbcc37e300941108MD53LICENSElicense.txtlicense.txttext/plain; charset=utf-82535https://repositorio.uniandes.edu.co/bitstreams/089f95a1-6677-4d8c-ba0f-9dfca341f406/downloadae9e573a68e7f92501b6913cc846c39fMD54TEXTExtraccion de Informacion en la Deep Web.pdf.txtExtraccion de Informacion en la Deep Web.pdf.txtExtracted texttext/plain64690https://repositorio.uniandes.edu.co/bitstreams/1713fb88-a03c-4190-9a85-f0e798b63040/download8183860ad13b26706851974af698d0c8MD55Formato Autorización y Entrega de Tesis.pdf.txtFormato Autorización y Entrega de Tesis.pdf.txtExtracted texttext/plain2079https://repositorio.uniandes.edu.co/bitstreams/5f1c994f-23dc-440c-9b53-6c504b964e2a/download273a1fa613ce389c3a1e5a9e37a12683MD57THUMBNAILExtraccion de Informacion en la Deep Web.pdf.jpgExtraccion de Informacion en la Deep Web.pdf.jpgGenerated Thumbnailimage/jpeg8989https://repositorio.uniandes.edu.co/bitstreams/0db6c57b-7c7a-4c40-8422-387a378bc78c/downloadd27799b29fcc2c3d7380ddb320d861cdMD56Formato Autorización y Entrega de Tesis.pdf.jpgFormato Autorización y Entrega de Tesis.pdf.jpgGenerated Thumbnailimage/jpeg11006https://repositorio.uniandes.edu.co/bitstreams/5bda4b8a-dd4d-4538-a76d-2787f090d52a/download799bd2cdb8aaef58cfc7a8d42259c6dfMD581992/75393oai:repositorio.uniandes.edu.co:1992/753932025-01-15 03:04:15.324http://creativecommons.org/licenses/by/4.0/Attribution 4.0 Internationalopen.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.coPGgzPjxzdHJvbmc+RGVzY2FyZ28gZGUgUmVzcG9uc2FiaWxpZGFkIC0gTGljZW5jaWEgZGUgQXV0b3JpemFjacOzbjwvc3Ryb25nPjwvaDM+CjxwPjxzdHJvbmc+UG9yIGZhdm9yIGxlZXIgYXRlbnRhbWVudGUgZXN0ZSBkb2N1bWVudG8gcXVlIHBlcm1pdGUgYWwgUmVwb3NpdG9yaW8gSW5zdGl0dWNpb25hbCBTw6luZWNhIHJlcHJvZHVjaXIgeSBkaXN0cmlidWlyIGxvcyByZWN1cnNvcyBkZSBpbmZvcm1hY2nDs24gZGVwb3NpdGFkb3MgbWVkaWFudGUgbGEgYXV0b3JpemFjacOzbiBkZSBsb3Mgc2lndWllbnRlcyB0w6lybWlub3M6PC9zdHJvbmc+PC9wPgo8cD5Db25jZWRhIGxhIGxpY2VuY2lhIGRlIGRlcMOzc2l0byBlc3TDoW5kYXIgc2VsZWNjaW9uYW5kbyBsYSBvcGNpw7NuIDxzdHJvbmc+J0FjZXB0YXIgbG9zIHTDqXJtaW5vcyBhbnRlcmlvcm1lbnRlIGRlc2NyaXRvcyc8L3N0cm9uZz4geSBjb250aW51YXIgZWwgcHJvY2VzbyBkZSBlbnbDrW8gbWVkaWFudGUgZWwgYm90w7NuIDxzdHJvbmc+J1NpZ3VpZW50ZScuPC9zdHJvbmc+PC9wPgo8aHI+CjxwPllvLCBlbiBtaSBjYWxpZGFkIGRlIGF1dG9yIGRlbCB0cmFiYWpvIGRlIHRlc2lzLCBtb25vZ3JhZsOtYSBvIHRyYWJham8gZGUgZ3JhZG8sIGhhZ28gZW50cmVnYSBkZWwgZWplbXBsYXIgcmVzcGVjdGl2byB5IGRlIHN1cyBhbmV4b3MgZGUgc2VyIGVsIGNhc28sIGVuIGZvcm1hdG8gZGlnaXRhbCB5L28gZWxlY3Ryw7NuaWNvIHkgYXV0b3Jpem8gYSBsYSBVbml2ZXJzaWRhZCBkZSBsb3MgQW5kZXMgcGFyYSBxdWUgcmVhbGljZSBsYSBwdWJsaWNhY2nDs24gZW4gZWwgU2lzdGVtYSBkZSBCaWJsaW90ZWNhcyBvIGVuIGN1YWxxdWllciBvdHJvIHNpc3RlbWEgbyBiYXNlIGRlIGRhdG9zIHByb3BpbyBvIGFqZW5vIGEgbGEgVW5pdmVyc2lkYWQgeSBwYXJhIHF1ZSBlbiBsb3MgdMOpcm1pbm9zIGVzdGFibGVjaWRvcyBlbiBsYSBMZXkgMjMgZGUgMTk4MiwgTGV5IDQ0IGRlIDE5OTMsIERlY2lzacOzbiBBbmRpbmEgMzUxIGRlIDE5OTMsIERlY3JldG8gNDYwIGRlIDE5OTUgeSBkZW3DoXMgbm9ybWFzIGdlbmVyYWxlcyBzb2JyZSBsYSBtYXRlcmlhLCB1dGlsaWNlIGVuIHRvZGFzIHN1cyBmb3JtYXMsIGxvcyBkZXJlY2hvcyBwYXRyaW1vbmlhbGVzIGRlIHJlcHJvZHVjY2nDs24sIGNvbXVuaWNhY2nDs24gcMO6YmxpY2EsIHRyYW5zZm9ybWFjacOzbiB5IGRpc3RyaWJ1Y2nDs24gKGFscXVpbGVyLCBwcsOpc3RhbW8gcMO6YmxpY28gZSBpbXBvcnRhY2nDs24pIHF1ZSBtZSBjb3JyZXNwb25kZW4gY29tbyBjcmVhZG9yIGRlIGxhIG9icmEgb2JqZXRvIGRlbCBwcmVzZW50ZSBkb2N1bWVudG8uPC9wPgo8cD5MYSBwcmVzZW50ZSBhdXRvcml6YWNpw7NuIHNlIGVtaXRlIGVuIGNhbGlkYWQgZGUgYXV0b3IgZGUgbGEgb2JyYSBvYmpldG8gZGVsIHByZXNlbnRlIGRvY3VtZW50byB5IG5vIGNvcnJlc3BvbmRlIGEgY2VzacOzbiBkZSBkZXJlY2hvcywgc2lubyBhIGxhIGF1dG9yaXphY2nDs24gZGUgdXNvIGFjYWTDqW1pY28gZGUgY29uZm9ybWlkYWQgY29uIGxvIGFudGVyaW9ybWVudGUgc2XDsWFsYWRvLiBMYSBwcmVzZW50ZSBhdXRvcml6YWNpw7NuIHNlIGhhY2UgZXh0ZW5zaXZhIG5vIHNvbG8gYSBsYXMgZmFjdWx0YWRlcyB5IGRlcmVjaG9zIGRlIHVzbyBzb2JyZSBsYSBvYnJhIGVuIGZvcm1hdG8gbyBzb3BvcnRlIG1hdGVyaWFsLCBzaW5vIHRhbWJpw6luIHBhcmEgZm9ybWF0byBlbGVjdHLDs25pY28sIHkgZW4gZ2VuZXJhbCBwYXJhIGN1YWxxdWllciBmb3JtYXRvIGNvbm9jaWRvIG8gcG9yIGNvbm9jZXIuPC9wPgo8cD5FbCBhdXRvciwgbWFuaWZpZXN0YSBxdWUgbGEgb2JyYSBvYmpldG8gZGUgbGEgcHJlc2VudGUgYXV0b3JpemFjacOzbiBlcyBvcmlnaW5hbCB5IGxhIHJlYWxpesOzIHNpbiB2aW9sYXIgbyB1c3VycGFyIGRlcmVjaG9zIGRlIGF1dG9yIGRlIHRlcmNlcm9zLCBwb3IgbG8gdGFudG8sIGxhIG9icmEgZXMgZGUgc3UgZXhjbHVzaXZhIGF1dG9yw61hIHkgdGllbmUgbGEgdGl0dWxhcmlkYWQgc29icmUgbGEgbWlzbWEuPC9wPgo8cD5FbiBjYXNvIGRlIHByZXNlbnRhcnNlIGN1YWxxdWllciByZWNsYW1hY2nDs24gbyBhY2Npw7NuIHBvciBwYXJ0ZSBkZSB1biB0ZXJjZXJvIGVuIGN1YW50byBhIGxvcyBkZXJlY2hvcyBkZSBhdXRvciBzb2JyZSBsYSBvYnJhIGVuIGN1ZXN0acOzbiwgZWwgYXV0b3IgYXN1bWlyw6EgdG9kYSBsYSByZXNwb25zYWJpbGlkYWQsIHkgc2FsZHLDoSBkZSBkZWZlbnNhIGRlIGxvcyBkZXJlY2hvcyBhcXXDrSBhdXRvcml6YWRvcywgcGFyYSB0b2RvcyBsb3MgZWZlY3RvcyBsYSBVbml2ZXJzaWRhZCBhY3TDumEgY29tbyB1biB0ZXJjZXJvIGRlIGJ1ZW5hIGZlLjwvcD4KPHA+U2kgdGllbmUgYWxndW5hIGR1ZGEgc29icmUgbGEgbGljZW5jaWEsIHBvciBmYXZvciwgY29udGFjdGUgY29uIGVsIDxhIGhyZWY9Im1haWx0bzpiaWJsaW90ZWNhQHVuaWFuZGVzLmVkdS5jbyIgdGFyZ2V0PSJfYmxhbmsiPkFkbWluaXN0cmFkb3IgZGVsIFNpc3RlbWEuPC9hPjwvcD4K