Clasificador de páginas web pornográficas basado en el contenido de las imágenes

RESUMEN: La World Wide Web, o simplemente web, es un sistema lógico de acceso y búsqueda de información disponible en Internet cuyas unidades informativas son las páginas web. La web ha facilitado la publicación de gran cantidad de información accesible desde cualquier lugar del mundo; sin embargo,...

Full description

Autores:
Ceballos, William Armando
Salazar, Luis Eduardo
Oviedo, Ana Isabel
Tipo de recurso:
Article of investigation
Fecha de publicación:
2009
Institución:
Universidad de Antioquia
Repositorio:
Repositorio UdeA
Idioma:
spa
OAI Identifier:
oai:bibliotecadigital.udea.edu.co:10495/26817
Acceso en línea:
http://hdl.handle.net/10495/26817
Palabra clave:
Páginas WEB
Web sites
Clasificación
Classification
Filtro de información
Máquinas de soporte vectorial
Pornografía en internet
Imagen
Rights
openAccess
License
https://creativecommons.org/licenses/by-nc-sa/4.0/
id UDEA2_2e52e9cbe73c68995f5d2861f54580eb
oai_identifier_str oai:bibliotecadigital.udea.edu.co:10495/26817
network_acronym_str UDEA2
network_name_str Repositorio UdeA
repository_id_str
dc.title.spa.fl_str_mv Clasificador de páginas web pornográficas basado en el contenido de las imágenes
title Clasificador de páginas web pornográficas basado en el contenido de las imágenes
spellingShingle Clasificador de páginas web pornográficas basado en el contenido de las imágenes
Páginas WEB
Web sites
Clasificación
Classification
Filtro de información
Máquinas de soporte vectorial
Pornografía en internet
Imagen
title_short Clasificador de páginas web pornográficas basado en el contenido de las imágenes
title_full Clasificador de páginas web pornográficas basado en el contenido de las imágenes
title_fullStr Clasificador de páginas web pornográficas basado en el contenido de las imágenes
title_full_unstemmed Clasificador de páginas web pornográficas basado en el contenido de las imágenes
title_sort Clasificador de páginas web pornográficas basado en el contenido de las imágenes
dc.creator.fl_str_mv Ceballos, William Armando
Salazar, Luis Eduardo
Oviedo, Ana Isabel
dc.contributor.author.none.fl_str_mv Ceballos, William Armando
Salazar, Luis Eduardo
Oviedo, Ana Isabel
dc.contributor.researchgroup.spa.fl_str_mv Simulación de Comportamientos de Sistemas (SICOSIS)
dc.subject.lemb.none.fl_str_mv Páginas WEB
Web sites
Clasificación
Classification
topic Páginas WEB
Web sites
Clasificación
Classification
Filtro de información
Máquinas de soporte vectorial
Pornografía en internet
Imagen
dc.subject.proposal.spa.fl_str_mv Filtro de información
Máquinas de soporte vectorial
Pornografía en internet
Imagen
description RESUMEN: La World Wide Web, o simplemente web, es un sistema lógico de acceso y búsqueda de información disponible en Internet cuyas unidades informativas son las páginas web. La web ha facilitado la publicación de gran cantidad de información accesible desde cualquier lugar del mundo; sin embargo, parte del contenido ofrecido como la pornografía, es considerado inapropiado para algunos usuarios. Para aportar al filtrado de pornografía en la web, este trabajo propone el desarrollo de un clasificador de páginas web basado en la evaluación de las imágenes presentes en el contenido de la página. La evaluación de las imágenes es realizada en tres vías: extracción de características de las regiones de piel, análisis de textura y descriptores de forma de la imagen. Los tres tipos de evaluación del contenido de las imágenes son utilizados para entrenar tres clasificadores con máquinas de soporte vectorial (SVM). Los resultados de clasificación son unidos en un ensamble realizado por un metaclasificador por medio de la siguiente política: si al menos uno de los tres clasificadores concluye que la imagen es pornográfica, entonces la imagen es considerada como tal. Al evaluar todas las imágenes contenidas en una página web, se utiliza la siguiente política: si la página web presenta un porcentaje de imágenes pornográficas superior al 30%, entonces la página es considerada como pornográfica. La implementación realizada es evaluada sobre un conjunto de 5000 páginas web diversas, obteniendo una exactitud del 84.6 % en el reconocimiento de contenido pornográfico a través del contenido de las imágenes.
publishDate 2009
dc.date.issued.none.fl_str_mv 2009
dc.date.accessioned.none.fl_str_mv 2022-03-23T16:09:32Z
dc.date.available.none.fl_str_mv 2022-03-23T16:09:32Z
dc.type.spa.fl_str_mv Artículo de investigación
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_2df8fbb1
dc.type.redcol.spa.fl_str_mv https://purl.org/redcol/resource_type/ART
dc.type.coarversion.spa.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/article
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/publishedVersion
format http://purl.org/coar/resource_type/c_2df8fbb1
status_str publishedVersion
dc.identifier.issn.none.fl_str_mv 1657-2831
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/10495/26817
dc.identifier.eissn.none.fl_str_mv 2539-2115
identifier_str_mv 1657-2831
2539-2115
url http://hdl.handle.net/10495/26817
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.ispartofjournalabbrev.spa.fl_str_mv Rev. Colomb. Comput.
dc.relation.citationendpage.spa.fl_str_mv 44
dc.relation.citationissue.spa.fl_str_mv 1
dc.relation.citationstartpage.spa.fl_str_mv 26
dc.relation.citationvolume.spa.fl_str_mv 10
dc.relation.ispartofjournal.spa.fl_str_mv Revista Colombiana de Computación
dc.rights.uri.spa.fl_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-sa/2.5/co/
dc.rights.accessrights.*.fl_str_mv Atribución-NoComercial-CompartirIgual 2.5 Colombia
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
http://creativecommons.org/licenses/by-nc-sa/2.5/co/
Atribución-NoComercial-CompartirIgual 2.5 Colombia
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.spa.fl_str_mv 19
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.publisher.spa.fl_str_mv Universidad Autónoma de Bucaramanga
dc.publisher.place.spa.fl_str_mv Bucaramanga, Colombia
institution Universidad de Antioquia
bitstream.url.fl_str_mv https://bibliotecadigital.udea.edu.co/bitstreams/5e8efa55-1ea6-476f-b762-cbda3a35286b/download
https://bibliotecadigital.udea.edu.co/bitstreams/45d86fa7-27c2-4fc9-b189-f060c3b512ec/download
https://bibliotecadigital.udea.edu.co/bitstreams/cf79e87f-bc6a-420f-b2db-5ecc83376402/download
https://bibliotecadigital.udea.edu.co/bitstreams/73294852-ae39-4a3c-8cb9-348c79c88438/download
https://bibliotecadigital.udea.edu.co/bitstreams/901f1180-7726-493f-9130-f915a8334d64/download
bitstream.checksum.fl_str_mv ad861a40208a93cbc85c05f104223aa7
e2060682c9c70d4d30c83c51448f4eed
8a4605be74aa9ea9d79846c1fba20a33
f8dc9d29f2617319f80f4a154e891df5
cdfcbd7756b265aba7f3e351b5e031b7
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional de la Universidad de Antioquia
repository.mail.fl_str_mv aplicacionbibliotecadigitalbiblioteca@udea.edu.co
_version_ 1851052564902051840
spelling Ceballos, William ArmandoSalazar, Luis EduardoOviedo, Ana IsabelSimulación de Comportamientos de Sistemas (SICOSIS)2022-03-23T16:09:32Z2022-03-23T16:09:32Z20091657-2831http://hdl.handle.net/10495/268172539-2115RESUMEN: La World Wide Web, o simplemente web, es un sistema lógico de acceso y búsqueda de información disponible en Internet cuyas unidades informativas son las páginas web. La web ha facilitado la publicación de gran cantidad de información accesible desde cualquier lugar del mundo; sin embargo, parte del contenido ofrecido como la pornografía, es considerado inapropiado para algunos usuarios. Para aportar al filtrado de pornografía en la web, este trabajo propone el desarrollo de un clasificador de páginas web basado en la evaluación de las imágenes presentes en el contenido de la página. La evaluación de las imágenes es realizada en tres vías: extracción de características de las regiones de piel, análisis de textura y descriptores de forma de la imagen. Los tres tipos de evaluación del contenido de las imágenes son utilizados para entrenar tres clasificadores con máquinas de soporte vectorial (SVM). Los resultados de clasificación son unidos en un ensamble realizado por un metaclasificador por medio de la siguiente política: si al menos uno de los tres clasificadores concluye que la imagen es pornográfica, entonces la imagen es considerada como tal. Al evaluar todas las imágenes contenidas en una página web, se utiliza la siguiente política: si la página web presenta un porcentaje de imágenes pornográficas superior al 30%, entonces la página es considerada como pornográfica. La implementación realizada es evaluada sobre un conjunto de 5000 páginas web diversas, obteniendo una exactitud del 84.6 % en el reconocimiento de contenido pornográfico a través del contenido de las imágenes.COL001613919application/pdfspaUniversidad Autónoma de BucaramangaBucaramanga, Colombiahttps://creativecommons.org/licenses/by-nc-sa/4.0/http://creativecommons.org/licenses/by-nc-sa/2.5/co/Atribución-NoComercial-CompartirIgual 2.5 Colombiainfo:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Clasificador de páginas web pornográficas basado en el contenido de las imágenesArtículo de investigaciónhttp://purl.org/coar/resource_type/c_2df8fbb1https://purl.org/redcol/resource_type/ARThttp://purl.org/coar/version/c_970fb48d4fbd8a85info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionPáginas WEBWeb sitesClasificaciónClassificationFiltro de informaciónMáquinas de soporte vectorialPornografía en internetImagenRev. Colomb. Comput.4412610Revista Colombiana de ComputaciónPublicationORIGINALCeballosWilliam_2009_ClasificadorPaginasPronograficas.pdfCeballosWilliam_2009_ClasificadorPaginasPronograficas.pdfArtículo de investigaciónapplication/pdf891767https://bibliotecadigital.udea.edu.co/bitstreams/5e8efa55-1ea6-476f-b762-cbda3a35286b/downloadad861a40208a93cbc85c05f104223aa7MD51trueAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81051https://bibliotecadigital.udea.edu.co/bitstreams/45d86fa7-27c2-4fc9-b189-f060c3b512ec/downloade2060682c9c70d4d30c83c51448f4eedMD52falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://bibliotecadigital.udea.edu.co/bitstreams/cf79e87f-bc6a-420f-b2db-5ecc83376402/download8a4605be74aa9ea9d79846c1fba20a33MD53falseAnonymousREADTEXTCeballosWilliam_2009_ClasificadorPaginasPronograficas.pdf.txtCeballosWilliam_2009_ClasificadorPaginasPronograficas.pdf.txtExtracted texttext/plain40545https://bibliotecadigital.udea.edu.co/bitstreams/73294852-ae39-4a3c-8cb9-348c79c88438/downloadf8dc9d29f2617319f80f4a154e891df5MD54falseAnonymousREADTHUMBNAILCeballosWilliam_2009_ClasificadorPaginasPronograficas.pdf.jpgCeballosWilliam_2009_ClasificadorPaginasPronograficas.pdf.jpgGenerated Thumbnailimage/jpeg9765https://bibliotecadigital.udea.edu.co/bitstreams/901f1180-7726-493f-9130-f915a8334d64/downloadcdfcbd7756b265aba7f3e351b5e031b7MD55falseAnonymousREAD10495/26817oai:bibliotecadigital.udea.edu.co:10495/268172025-03-27 00:23:20.012https://creativecommons.org/licenses/by-nc-sa/4.0/open.accesshttps://bibliotecadigital.udea.edu.coRepositorio Institucional de la Universidad de Antioquiaaplicacionbibliotecadigitalbiblioteca@udea.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=