Clasificador de páginas web pornográficas basado en el contenido de las imágenes
RESUMEN: La World Wide Web, o simplemente web, es un sistema lógico de acceso y búsqueda de información disponible en Internet cuyas unidades informativas son las páginas web. La web ha facilitado la publicación de gran cantidad de información accesible desde cualquier lugar del mundo; sin embargo,...
- Autores:
-
Ceballos, William Armando
Salazar, Luis Eduardo
Oviedo, Ana Isabel
- Tipo de recurso:
- Article of investigation
- Fecha de publicación:
- 2009
- Institución:
- Universidad de Antioquia
- Repositorio:
- Repositorio UdeA
- Idioma:
- spa
- OAI Identifier:
- oai:bibliotecadigital.udea.edu.co:10495/26817
- Acceso en línea:
- http://hdl.handle.net/10495/26817
- Palabra clave:
- Páginas WEB
Web sites
Clasificación
Classification
Filtro de información
Máquinas de soporte vectorial
Pornografía en internet
Imagen
- Rights
- openAccess
- License
- https://creativecommons.org/licenses/by-nc-sa/4.0/
| id |
UDEA2_2e52e9cbe73c68995f5d2861f54580eb |
|---|---|
| oai_identifier_str |
oai:bibliotecadigital.udea.edu.co:10495/26817 |
| network_acronym_str |
UDEA2 |
| network_name_str |
Repositorio UdeA |
| repository_id_str |
|
| dc.title.spa.fl_str_mv |
Clasificador de páginas web pornográficas basado en el contenido de las imágenes |
| title |
Clasificador de páginas web pornográficas basado en el contenido de las imágenes |
| spellingShingle |
Clasificador de páginas web pornográficas basado en el contenido de las imágenes Páginas WEB Web sites Clasificación Classification Filtro de información Máquinas de soporte vectorial Pornografía en internet Imagen |
| title_short |
Clasificador de páginas web pornográficas basado en el contenido de las imágenes |
| title_full |
Clasificador de páginas web pornográficas basado en el contenido de las imágenes |
| title_fullStr |
Clasificador de páginas web pornográficas basado en el contenido de las imágenes |
| title_full_unstemmed |
Clasificador de páginas web pornográficas basado en el contenido de las imágenes |
| title_sort |
Clasificador de páginas web pornográficas basado en el contenido de las imágenes |
| dc.creator.fl_str_mv |
Ceballos, William Armando Salazar, Luis Eduardo Oviedo, Ana Isabel |
| dc.contributor.author.none.fl_str_mv |
Ceballos, William Armando Salazar, Luis Eduardo Oviedo, Ana Isabel |
| dc.contributor.researchgroup.spa.fl_str_mv |
Simulación de Comportamientos de Sistemas (SICOSIS) |
| dc.subject.lemb.none.fl_str_mv |
Páginas WEB Web sites Clasificación Classification |
| topic |
Páginas WEB Web sites Clasificación Classification Filtro de información Máquinas de soporte vectorial Pornografía en internet Imagen |
| dc.subject.proposal.spa.fl_str_mv |
Filtro de información Máquinas de soporte vectorial Pornografía en internet Imagen |
| description |
RESUMEN: La World Wide Web, o simplemente web, es un sistema lógico de acceso y búsqueda de información disponible en Internet cuyas unidades informativas son las páginas web. La web ha facilitado la publicación de gran cantidad de información accesible desde cualquier lugar del mundo; sin embargo, parte del contenido ofrecido como la pornografía, es considerado inapropiado para algunos usuarios. Para aportar al filtrado de pornografía en la web, este trabajo propone el desarrollo de un clasificador de páginas web basado en la evaluación de las imágenes presentes en el contenido de la página. La evaluación de las imágenes es realizada en tres vías: extracción de características de las regiones de piel, análisis de textura y descriptores de forma de la imagen. Los tres tipos de evaluación del contenido de las imágenes son utilizados para entrenar tres clasificadores con máquinas de soporte vectorial (SVM). Los resultados de clasificación son unidos en un ensamble realizado por un metaclasificador por medio de la siguiente política: si al menos uno de los tres clasificadores concluye que la imagen es pornográfica, entonces la imagen es considerada como tal. Al evaluar todas las imágenes contenidas en una página web, se utiliza la siguiente política: si la página web presenta un porcentaje de imágenes pornográficas superior al 30%, entonces la página es considerada como pornográfica. La implementación realizada es evaluada sobre un conjunto de 5000 páginas web diversas, obteniendo una exactitud del 84.6 % en el reconocimiento de contenido pornográfico a través del contenido de las imágenes. |
| publishDate |
2009 |
| dc.date.issued.none.fl_str_mv |
2009 |
| dc.date.accessioned.none.fl_str_mv |
2022-03-23T16:09:32Z |
| dc.date.available.none.fl_str_mv |
2022-03-23T16:09:32Z |
| dc.type.spa.fl_str_mv |
Artículo de investigación |
| dc.type.coar.spa.fl_str_mv |
http://purl.org/coar/resource_type/c_2df8fbb1 |
| dc.type.redcol.spa.fl_str_mv |
https://purl.org/redcol/resource_type/ART |
| dc.type.coarversion.spa.fl_str_mv |
http://purl.org/coar/version/c_970fb48d4fbd8a85 |
| dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/article |
| dc.type.version.spa.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| format |
http://purl.org/coar/resource_type/c_2df8fbb1 |
| status_str |
publishedVersion |
| dc.identifier.issn.none.fl_str_mv |
1657-2831 |
| dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/10495/26817 |
| dc.identifier.eissn.none.fl_str_mv |
2539-2115 |
| identifier_str_mv |
1657-2831 2539-2115 |
| url |
http://hdl.handle.net/10495/26817 |
| dc.language.iso.spa.fl_str_mv |
spa |
| language |
spa |
| dc.relation.ispartofjournalabbrev.spa.fl_str_mv |
Rev. Colomb. Comput. |
| dc.relation.citationendpage.spa.fl_str_mv |
44 |
| dc.relation.citationissue.spa.fl_str_mv |
1 |
| dc.relation.citationstartpage.spa.fl_str_mv |
26 |
| dc.relation.citationvolume.spa.fl_str_mv |
10 |
| dc.relation.ispartofjournal.spa.fl_str_mv |
Revista Colombiana de Computación |
| dc.rights.uri.spa.fl_str_mv |
https://creativecommons.org/licenses/by-nc-sa/4.0/ |
| dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-sa/2.5/co/ |
| dc.rights.accessrights.*.fl_str_mv |
Atribución-NoComercial-CompartirIgual 2.5 Colombia |
| dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.coar.spa.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
| rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-sa/4.0/ http://creativecommons.org/licenses/by-nc-sa/2.5/co/ Atribución-NoComercial-CompartirIgual 2.5 Colombia http://purl.org/coar/access_right/c_abf2 |
| eu_rights_str_mv |
openAccess |
| dc.format.extent.spa.fl_str_mv |
19 |
| dc.format.mimetype.spa.fl_str_mv |
application/pdf |
| dc.publisher.spa.fl_str_mv |
Universidad Autónoma de Bucaramanga |
| dc.publisher.place.spa.fl_str_mv |
Bucaramanga, Colombia |
| institution |
Universidad de Antioquia |
| bitstream.url.fl_str_mv |
https://bibliotecadigital.udea.edu.co/bitstreams/5e8efa55-1ea6-476f-b762-cbda3a35286b/download https://bibliotecadigital.udea.edu.co/bitstreams/45d86fa7-27c2-4fc9-b189-f060c3b512ec/download https://bibliotecadigital.udea.edu.co/bitstreams/cf79e87f-bc6a-420f-b2db-5ecc83376402/download https://bibliotecadigital.udea.edu.co/bitstreams/73294852-ae39-4a3c-8cb9-348c79c88438/download https://bibliotecadigital.udea.edu.co/bitstreams/901f1180-7726-493f-9130-f915a8334d64/download |
| bitstream.checksum.fl_str_mv |
ad861a40208a93cbc85c05f104223aa7 e2060682c9c70d4d30c83c51448f4eed 8a4605be74aa9ea9d79846c1fba20a33 f8dc9d29f2617319f80f4a154e891df5 cdfcbd7756b265aba7f3e351b5e031b7 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositorio Institucional de la Universidad de Antioquia |
| repository.mail.fl_str_mv |
aplicacionbibliotecadigitalbiblioteca@udea.edu.co |
| _version_ |
1851052564902051840 |
| spelling |
Ceballos, William ArmandoSalazar, Luis EduardoOviedo, Ana IsabelSimulación de Comportamientos de Sistemas (SICOSIS)2022-03-23T16:09:32Z2022-03-23T16:09:32Z20091657-2831http://hdl.handle.net/10495/268172539-2115RESUMEN: La World Wide Web, o simplemente web, es un sistema lógico de acceso y búsqueda de información disponible en Internet cuyas unidades informativas son las páginas web. La web ha facilitado la publicación de gran cantidad de información accesible desde cualquier lugar del mundo; sin embargo, parte del contenido ofrecido como la pornografía, es considerado inapropiado para algunos usuarios. Para aportar al filtrado de pornografía en la web, este trabajo propone el desarrollo de un clasificador de páginas web basado en la evaluación de las imágenes presentes en el contenido de la página. La evaluación de las imágenes es realizada en tres vías: extracción de características de las regiones de piel, análisis de textura y descriptores de forma de la imagen. Los tres tipos de evaluación del contenido de las imágenes son utilizados para entrenar tres clasificadores con máquinas de soporte vectorial (SVM). Los resultados de clasificación son unidos en un ensamble realizado por un metaclasificador por medio de la siguiente política: si al menos uno de los tres clasificadores concluye que la imagen es pornográfica, entonces la imagen es considerada como tal. Al evaluar todas las imágenes contenidas en una página web, se utiliza la siguiente política: si la página web presenta un porcentaje de imágenes pornográficas superior al 30%, entonces la página es considerada como pornográfica. La implementación realizada es evaluada sobre un conjunto de 5000 páginas web diversas, obteniendo una exactitud del 84.6 % en el reconocimiento de contenido pornográfico a través del contenido de las imágenes.COL001613919application/pdfspaUniversidad Autónoma de BucaramangaBucaramanga, Colombiahttps://creativecommons.org/licenses/by-nc-sa/4.0/http://creativecommons.org/licenses/by-nc-sa/2.5/co/Atribución-NoComercial-CompartirIgual 2.5 Colombiainfo:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Clasificador de páginas web pornográficas basado en el contenido de las imágenesArtículo de investigaciónhttp://purl.org/coar/resource_type/c_2df8fbb1https://purl.org/redcol/resource_type/ARThttp://purl.org/coar/version/c_970fb48d4fbd8a85info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionPáginas WEBWeb sitesClasificaciónClassificationFiltro de informaciónMáquinas de soporte vectorialPornografía en internetImagenRev. Colomb. Comput.4412610Revista Colombiana de ComputaciónPublicationORIGINALCeballosWilliam_2009_ClasificadorPaginasPronograficas.pdfCeballosWilliam_2009_ClasificadorPaginasPronograficas.pdfArtículo de investigaciónapplication/pdf891767https://bibliotecadigital.udea.edu.co/bitstreams/5e8efa55-1ea6-476f-b762-cbda3a35286b/downloadad861a40208a93cbc85c05f104223aa7MD51trueAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81051https://bibliotecadigital.udea.edu.co/bitstreams/45d86fa7-27c2-4fc9-b189-f060c3b512ec/downloade2060682c9c70d4d30c83c51448f4eedMD52falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://bibliotecadigital.udea.edu.co/bitstreams/cf79e87f-bc6a-420f-b2db-5ecc83376402/download8a4605be74aa9ea9d79846c1fba20a33MD53falseAnonymousREADTEXTCeballosWilliam_2009_ClasificadorPaginasPronograficas.pdf.txtCeballosWilliam_2009_ClasificadorPaginasPronograficas.pdf.txtExtracted texttext/plain40545https://bibliotecadigital.udea.edu.co/bitstreams/73294852-ae39-4a3c-8cb9-348c79c88438/downloadf8dc9d29f2617319f80f4a154e891df5MD54falseAnonymousREADTHUMBNAILCeballosWilliam_2009_ClasificadorPaginasPronograficas.pdf.jpgCeballosWilliam_2009_ClasificadorPaginasPronograficas.pdf.jpgGenerated Thumbnailimage/jpeg9765https://bibliotecadigital.udea.edu.co/bitstreams/901f1180-7726-493f-9130-f915a8334d64/downloadcdfcbd7756b265aba7f3e351b5e031b7MD55falseAnonymousREAD10495/26817oai:bibliotecadigital.udea.edu.co:10495/268172025-03-27 00:23:20.012https://creativecommons.org/licenses/by-nc-sa/4.0/open.accesshttps://bibliotecadigital.udea.edu.coRepositorio Institucional de la Universidad de Antioquiaaplicacionbibliotecadigitalbiblioteca@udea.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
