Extracción de Información en la Deep Web para el Desarrollo de Alertas Tempranas para la Fuerza Aeroespacial Colombiana
En la era digital actual, la ciberseguridad representa un desafío crítico para instituciones como la Fuerza Aeroespacial Colombiana, que necesita proteger su infraestructura tecnológica y responder eficazmente a las amenazas emergentes. Este proyecto aborda la problemática mediante el diseño e imple...
- Autores:
-
Ojeda Amaya, Lina MarÍa
Murcia Goméz, Sebastián
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2024
- Institución:
- Universidad de los Andes
- Repositorio:
- Séneca: repositorio Uniandes
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.uniandes.edu.co:1992/75393
- Acceso en línea:
- https://hdl.handle.net/1992/75393
- Palabra clave:
- Fuerza Aeroespacial Colombiana
Crawler
Scraper
Ingeniería
- Rights
- openAccess
- License
- Attribution 4.0 International
id |
UNIANDES2_8f44798d66db998fc9dd4a74b466b8c0 |
---|---|
oai_identifier_str |
oai:repositorio.uniandes.edu.co:1992/75393 |
network_acronym_str |
UNIANDES2 |
network_name_str |
Séneca: repositorio Uniandes |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Extracción de Información en la Deep Web para el Desarrollo de Alertas Tempranas para la Fuerza Aeroespacial Colombiana |
title |
Extracción de Información en la Deep Web para el Desarrollo de Alertas Tempranas para la Fuerza Aeroespacial Colombiana |
spellingShingle |
Extracción de Información en la Deep Web para el Desarrollo de Alertas Tempranas para la Fuerza Aeroespacial Colombiana Fuerza Aeroespacial Colombiana Crawler Scraper Ingeniería |
title_short |
Extracción de Información en la Deep Web para el Desarrollo de Alertas Tempranas para la Fuerza Aeroespacial Colombiana |
title_full |
Extracción de Información en la Deep Web para el Desarrollo de Alertas Tempranas para la Fuerza Aeroespacial Colombiana |
title_fullStr |
Extracción de Información en la Deep Web para el Desarrollo de Alertas Tempranas para la Fuerza Aeroespacial Colombiana |
title_full_unstemmed |
Extracción de Información en la Deep Web para el Desarrollo de Alertas Tempranas para la Fuerza Aeroespacial Colombiana |
title_sort |
Extracción de Información en la Deep Web para el Desarrollo de Alertas Tempranas para la Fuerza Aeroespacial Colombiana |
dc.creator.fl_str_mv |
Ojeda Amaya, Lina MarÍa Murcia Goméz, Sebastián |
dc.contributor.advisor.none.fl_str_mv |
Donoso Meisel, Yezyd Enrique |
dc.contributor.author.none.fl_str_mv |
Ojeda Amaya, Lina MarÍa Murcia Goméz, Sebastián |
dc.contributor.jury.none.fl_str_mv |
Donoso Meisel, Yezid Enrique |
dc.subject.keyword.spa.fl_str_mv |
Fuerza Aeroespacial Colombiana Crawler Scraper |
topic |
Fuerza Aeroespacial Colombiana Crawler Scraper Ingeniería |
dc.subject.themes.none.fl_str_mv |
Ingeniería |
description |
En la era digital actual, la ciberseguridad representa un desafío crítico para instituciones como la Fuerza Aeroespacial Colombiana, que necesita proteger su infraestructura tecnológica y responder eficazmente a las amenazas emergentes. Este proyecto aborda la problemática mediante el diseño e implementación de un sistema automatizado para la extracción de información en la Deep Web, con el objetivo de desarrollar alertas tempranas que apoyen la toma de decisiones estratégicas. El sistema desarrollado incluye dos componentes principales: un crawler, basado en Aprendizaje por Refuerzo (RL), y un scraper, diseñado para interactuar con plataformas específicas. |
publishDate |
2024 |
dc.date.issued.none.fl_str_mv |
2024-12-15 |
dc.date.accessioned.none.fl_str_mv |
2025-01-14T14:20:50Z |
dc.date.available.none.fl_str_mv |
2025-01-14T14:20:50Z |
dc.type.none.fl_str_mv |
Trabajo de grado - Pregrado |
dc.type.driver.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
dc.type.version.none.fl_str_mv |
info:eu-repo/semantics/acceptedVersion |
dc.type.coar.none.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
dc.type.content.none.fl_str_mv |
Text |
dc.type.redcol.none.fl_str_mv |
http://purl.org/redcol/resource_type/TP |
format |
http://purl.org/coar/resource_type/c_7a1f |
status_str |
acceptedVersion |
dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/1992/75393 |
dc.identifier.instname.none.fl_str_mv |
instname:Universidad de los Andes |
dc.identifier.reponame.none.fl_str_mv |
reponame:Repositorio Institucional Séneca |
dc.identifier.repourl.none.fl_str_mv |
repourl:https://repositorio.uniandes.edu.co/ |
url |
https://hdl.handle.net/1992/75393 |
identifier_str_mv |
instname:Universidad de los Andes reponame:Repositorio Institucional Séneca repourl:https://repositorio.uniandes.edu.co/ |
dc.language.iso.none.fl_str_mv |
spa |
language |
spa |
dc.relation.references.none.fl_str_mv |
Devasirvatham, W., & Thiyagarajan, J. D. (2022). Extricating web pages from deep web using DEAIMA architecture. Theoretical Computer Science, 931, 93-103. Madan, K., & Bhatia, R. (2021). Crawling the Deep Web Using Asynchronous Advantage Actor Critic Technique. Journal of Web Engineering, 20(3), 879-902. Zheng, Q., Wu, Z., Cheng, X., Jiang, L., & Liu, J. (2013). Learning to crawl deep web. Information Systems, 38, 801-819. Barrio, P., & Gravano, L. (2017). Sampling strategies for information extraction over the deep web. Information Processing and Management, 53, 309-331. |
dc.rights.en.fl_str_mv |
Attribution 4.0 International |
dc.rights.uri.none.fl_str_mv |
http://creativecommons.org/licenses/by/4.0/ |
dc.rights.accessrights.none.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.coar.none.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
Attribution 4.0 International http://creativecommons.org/licenses/by/4.0/ http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.extent.none.fl_str_mv |
45 páginas |
dc.format.mimetype.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidad de los Andes |
dc.publisher.program.none.fl_str_mv |
Ingeniería de Sistemas y Computación |
dc.publisher.faculty.none.fl_str_mv |
Facultad de Ingeniería |
dc.publisher.department.none.fl_str_mv |
Departamento de Ingeniería de Sistemas y Computación |
publisher.none.fl_str_mv |
Universidad de los Andes |
institution |
Universidad de los Andes |
bitstream.url.fl_str_mv |
https://repositorio.uniandes.edu.co/bitstreams/00e054e6-1848-46c2-aa65-bf158a5d2176/download https://repositorio.uniandes.edu.co/bitstreams/6367e44b-a287-4c41-8f8d-ba76260ad97a/download https://repositorio.uniandes.edu.co/bitstreams/94a39639-0f10-41d8-b121-2537058ded2f/download https://repositorio.uniandes.edu.co/bitstreams/089f95a1-6677-4d8c-ba0f-9dfca341f406/download https://repositorio.uniandes.edu.co/bitstreams/1713fb88-a03c-4190-9a85-f0e798b63040/download https://repositorio.uniandes.edu.co/bitstreams/5f1c994f-23dc-440c-9b53-6c504b964e2a/download https://repositorio.uniandes.edu.co/bitstreams/0db6c57b-7c7a-4c40-8422-387a378bc78c/download https://repositorio.uniandes.edu.co/bitstreams/5bda4b8a-dd4d-4538-a76d-2787f090d52a/download |
bitstream.checksum.fl_str_mv |
791825a3055b25301e444b865a63cbc2 e111a065371c10a154bea6770d4a12ae 0175ea4a2d4caec4bbcc37e300941108 ae9e573a68e7f92501b6913cc846c39f 8183860ad13b26706851974af698d0c8 273a1fa613ce389c3a1e5a9e37a12683 d27799b29fcc2c3d7380ddb320d861cd 799bd2cdb8aaef58cfc7a8d42259c6df |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio institucional Séneca |
repository.mail.fl_str_mv |
adminrepositorio@uniandes.edu.co |
_version_ |
1828159291872247808 |
spelling |
Donoso Meisel, Yezyd Enriquevirtual::22046-1Ojeda Amaya, Lina MarÍaMurcia Goméz, SebastiánDonoso Meisel, Yezid Enrique2025-01-14T14:20:50Z2025-01-14T14:20:50Z2024-12-15https://hdl.handle.net/1992/75393instname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/En la era digital actual, la ciberseguridad representa un desafío crítico para instituciones como la Fuerza Aeroespacial Colombiana, que necesita proteger su infraestructura tecnológica y responder eficazmente a las amenazas emergentes. Este proyecto aborda la problemática mediante el diseño e implementación de un sistema automatizado para la extracción de información en la Deep Web, con el objetivo de desarrollar alertas tempranas que apoyen la toma de decisiones estratégicas. El sistema desarrollado incluye dos componentes principales: un crawler, basado en Aprendizaje por Refuerzo (RL), y un scraper, diseñado para interactuar con plataformas específicas.Pregrado45 páginasapplication/pdfspaUniversidad de los AndesIngeniería de Sistemas y ComputaciónFacultad de IngenieríaDepartamento de Ingeniería de Sistemas y ComputaciónAttribution 4.0 Internationalhttp://creativecommons.org/licenses/by/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Extracción de Información en la Deep Web para el Desarrollo de Alertas Tempranas para la Fuerza Aeroespacial ColombianaTrabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_7a1fTexthttp://purl.org/redcol/resource_type/TPFuerza Aeroespacial ColombianaCrawlerScraperIngenieríaDevasirvatham, W., & Thiyagarajan, J. D. (2022). Extricating web pages from deep web using DEAIMA architecture. Theoretical Computer Science, 931, 93-103.Madan, K., & Bhatia, R. (2021). Crawling the Deep Web Using Asynchronous Advantage Actor Critic Technique. Journal of Web Engineering, 20(3), 879-902.Zheng, Q., Wu, Z., Cheng, X., Jiang, L., & Liu, J. (2013). Learning to crawl deep web. Information Systems, 38, 801-819.Barrio, P., & Gravano, L. (2017). Sampling strategies for information extraction over the deep web. Information Processing and Management, 53, 309-331.202112324202015229Publicationhttps://scholar.google.es/citations?user=Razvs2MAAAAJvirtual::22046-10000-0003-1659-1522virtual::22046-1https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000094706virtual::22046-16b9d423b-11e8-4930-b0d2-061b34e9806bvirtual::22046-16b9d423b-11e8-4930-b0d2-061b34e9806bvirtual::22046-1ORIGINALExtraccion de Informacion en la Deep Web.pdfExtraccion de Informacion en la Deep Web.pdfapplication/pdf5947732https://repositorio.uniandes.edu.co/bitstreams/00e054e6-1848-46c2-aa65-bf158a5d2176/download791825a3055b25301e444b865a63cbc2MD51Formato Autorización y Entrega de Tesis.pdfFormato Autorización y Entrega de Tesis.pdfHIDEapplication/pdf297372https://repositorio.uniandes.edu.co/bitstreams/6367e44b-a287-4c41-8f8d-ba76260ad97a/downloade111a065371c10a154bea6770d4a12aeMD52CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8908https://repositorio.uniandes.edu.co/bitstreams/94a39639-0f10-41d8-b121-2537058ded2f/download0175ea4a2d4caec4bbcc37e300941108MD53LICENSElicense.txtlicense.txttext/plain; charset=utf-82535https://repositorio.uniandes.edu.co/bitstreams/089f95a1-6677-4d8c-ba0f-9dfca341f406/downloadae9e573a68e7f92501b6913cc846c39fMD54TEXTExtraccion de Informacion en la Deep Web.pdf.txtExtraccion de Informacion en la Deep Web.pdf.txtExtracted texttext/plain64690https://repositorio.uniandes.edu.co/bitstreams/1713fb88-a03c-4190-9a85-f0e798b63040/download8183860ad13b26706851974af698d0c8MD55Formato Autorización y Entrega de Tesis.pdf.txtFormato Autorización y Entrega de Tesis.pdf.txtExtracted texttext/plain2079https://repositorio.uniandes.edu.co/bitstreams/5f1c994f-23dc-440c-9b53-6c504b964e2a/download273a1fa613ce389c3a1e5a9e37a12683MD57THUMBNAILExtraccion de Informacion en la Deep Web.pdf.jpgExtraccion de Informacion en la Deep Web.pdf.jpgGenerated Thumbnailimage/jpeg8989https://repositorio.uniandes.edu.co/bitstreams/0db6c57b-7c7a-4c40-8422-387a378bc78c/downloadd27799b29fcc2c3d7380ddb320d861cdMD56Formato Autorización y Entrega de Tesis.pdf.jpgFormato Autorización y Entrega de Tesis.pdf.jpgGenerated Thumbnailimage/jpeg11006https://repositorio.uniandes.edu.co/bitstreams/5bda4b8a-dd4d-4538-a76d-2787f090d52a/download799bd2cdb8aaef58cfc7a8d42259c6dfMD581992/75393oai:repositorio.uniandes.edu.co:1992/753932025-01-15 03:04:15.324http://creativecommons.org/licenses/by/4.0/Attribution 4.0 Internationalopen.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.coPGgzPjxzdHJvbmc+RGVzY2FyZ28gZGUgUmVzcG9uc2FiaWxpZGFkIC0gTGljZW5jaWEgZGUgQXV0b3JpemFjacOzbjwvc3Ryb25nPjwvaDM+CjxwPjxzdHJvbmc+UG9yIGZhdm9yIGxlZXIgYXRlbnRhbWVudGUgZXN0ZSBkb2N1bWVudG8gcXVlIHBlcm1pdGUgYWwgUmVwb3NpdG9yaW8gSW5zdGl0dWNpb25hbCBTw6luZWNhIHJlcHJvZHVjaXIgeSBkaXN0cmlidWlyIGxvcyByZWN1cnNvcyBkZSBpbmZvcm1hY2nDs24gZGVwb3NpdGFkb3MgbWVkaWFudGUgbGEgYXV0b3JpemFjacOzbiBkZSBsb3Mgc2lndWllbnRlcyB0w6lybWlub3M6PC9zdHJvbmc+PC9wPgo8cD5Db25jZWRhIGxhIGxpY2VuY2lhIGRlIGRlcMOzc2l0byBlc3TDoW5kYXIgc2VsZWNjaW9uYW5kbyBsYSBvcGNpw7NuIDxzdHJvbmc+J0FjZXB0YXIgbG9zIHTDqXJtaW5vcyBhbnRlcmlvcm1lbnRlIGRlc2NyaXRvcyc8L3N0cm9uZz4geSBjb250aW51YXIgZWwgcHJvY2VzbyBkZSBlbnbDrW8gbWVkaWFudGUgZWwgYm90w7NuIDxzdHJvbmc+J1NpZ3VpZW50ZScuPC9zdHJvbmc+PC9wPgo8aHI+CjxwPllvLCBlbiBtaSBjYWxpZGFkIGRlIGF1dG9yIGRlbCB0cmFiYWpvIGRlIHRlc2lzLCBtb25vZ3JhZsOtYSBvIHRyYWJham8gZGUgZ3JhZG8sIGhhZ28gZW50cmVnYSBkZWwgZWplbXBsYXIgcmVzcGVjdGl2byB5IGRlIHN1cyBhbmV4b3MgZGUgc2VyIGVsIGNhc28sIGVuIGZvcm1hdG8gZGlnaXRhbCB5L28gZWxlY3Ryw7NuaWNvIHkgYXV0b3Jpem8gYSBsYSBVbml2ZXJzaWRhZCBkZSBsb3MgQW5kZXMgcGFyYSBxdWUgcmVhbGljZSBsYSBwdWJsaWNhY2nDs24gZW4gZWwgU2lzdGVtYSBkZSBCaWJsaW90ZWNhcyBvIGVuIGN1YWxxdWllciBvdHJvIHNpc3RlbWEgbyBiYXNlIGRlIGRhdG9zIHByb3BpbyBvIGFqZW5vIGEgbGEgVW5pdmVyc2lkYWQgeSBwYXJhIHF1ZSBlbiBsb3MgdMOpcm1pbm9zIGVzdGFibGVjaWRvcyBlbiBsYSBMZXkgMjMgZGUgMTk4MiwgTGV5IDQ0IGRlIDE5OTMsIERlY2lzacOzbiBBbmRpbmEgMzUxIGRlIDE5OTMsIERlY3JldG8gNDYwIGRlIDE5OTUgeSBkZW3DoXMgbm9ybWFzIGdlbmVyYWxlcyBzb2JyZSBsYSBtYXRlcmlhLCB1dGlsaWNlIGVuIHRvZGFzIHN1cyBmb3JtYXMsIGxvcyBkZXJlY2hvcyBwYXRyaW1vbmlhbGVzIGRlIHJlcHJvZHVjY2nDs24sIGNvbXVuaWNhY2nDs24gcMO6YmxpY2EsIHRyYW5zZm9ybWFjacOzbiB5IGRpc3RyaWJ1Y2nDs24gKGFscXVpbGVyLCBwcsOpc3RhbW8gcMO6YmxpY28gZSBpbXBvcnRhY2nDs24pIHF1ZSBtZSBjb3JyZXNwb25kZW4gY29tbyBjcmVhZG9yIGRlIGxhIG9icmEgb2JqZXRvIGRlbCBwcmVzZW50ZSBkb2N1bWVudG8uPC9wPgo8cD5MYSBwcmVzZW50ZSBhdXRvcml6YWNpw7NuIHNlIGVtaXRlIGVuIGNhbGlkYWQgZGUgYXV0b3IgZGUgbGEgb2JyYSBvYmpldG8gZGVsIHByZXNlbnRlIGRvY3VtZW50byB5IG5vIGNvcnJlc3BvbmRlIGEgY2VzacOzbiBkZSBkZXJlY2hvcywgc2lubyBhIGxhIGF1dG9yaXphY2nDs24gZGUgdXNvIGFjYWTDqW1pY28gZGUgY29uZm9ybWlkYWQgY29uIGxvIGFudGVyaW9ybWVudGUgc2XDsWFsYWRvLiBMYSBwcmVzZW50ZSBhdXRvcml6YWNpw7NuIHNlIGhhY2UgZXh0ZW5zaXZhIG5vIHNvbG8gYSBsYXMgZmFjdWx0YWRlcyB5IGRlcmVjaG9zIGRlIHVzbyBzb2JyZSBsYSBvYnJhIGVuIGZvcm1hdG8gbyBzb3BvcnRlIG1hdGVyaWFsLCBzaW5vIHRhbWJpw6luIHBhcmEgZm9ybWF0byBlbGVjdHLDs25pY28sIHkgZW4gZ2VuZXJhbCBwYXJhIGN1YWxxdWllciBmb3JtYXRvIGNvbm9jaWRvIG8gcG9yIGNvbm9jZXIuPC9wPgo8cD5FbCBhdXRvciwgbWFuaWZpZXN0YSBxdWUgbGEgb2JyYSBvYmpldG8gZGUgbGEgcHJlc2VudGUgYXV0b3JpemFjacOzbiBlcyBvcmlnaW5hbCB5IGxhIHJlYWxpesOzIHNpbiB2aW9sYXIgbyB1c3VycGFyIGRlcmVjaG9zIGRlIGF1dG9yIGRlIHRlcmNlcm9zLCBwb3IgbG8gdGFudG8sIGxhIG9icmEgZXMgZGUgc3UgZXhjbHVzaXZhIGF1dG9yw61hIHkgdGllbmUgbGEgdGl0dWxhcmlkYWQgc29icmUgbGEgbWlzbWEuPC9wPgo8cD5FbiBjYXNvIGRlIHByZXNlbnRhcnNlIGN1YWxxdWllciByZWNsYW1hY2nDs24gbyBhY2Npw7NuIHBvciBwYXJ0ZSBkZSB1biB0ZXJjZXJvIGVuIGN1YW50byBhIGxvcyBkZXJlY2hvcyBkZSBhdXRvciBzb2JyZSBsYSBvYnJhIGVuIGN1ZXN0acOzbiwgZWwgYXV0b3IgYXN1bWlyw6EgdG9kYSBsYSByZXNwb25zYWJpbGlkYWQsIHkgc2FsZHLDoSBkZSBkZWZlbnNhIGRlIGxvcyBkZXJlY2hvcyBhcXXDrSBhdXRvcml6YWRvcywgcGFyYSB0b2RvcyBsb3MgZWZlY3RvcyBsYSBVbml2ZXJzaWRhZCBhY3TDumEgY29tbyB1biB0ZXJjZXJvIGRlIGJ1ZW5hIGZlLjwvcD4KPHA+U2kgdGllbmUgYWxndW5hIGR1ZGEgc29icmUgbGEgbGljZW5jaWEsIHBvciBmYXZvciwgY29udGFjdGUgY29uIGVsIDxhIGhyZWY9Im1haWx0bzpiaWJsaW90ZWNhQHVuaWFuZGVzLmVkdS5jbyIgdGFyZ2V0PSJfYmxhbmsiPkFkbWluaXN0cmFkb3IgZGVsIFNpc3RlbWEuPC9hPjwvcD4K |