Reconocimiento de escenas violentas en imágenes de CCTV utilizando aprendizaje profundo
El uso cada vez más generalizado de sistemas de videovigilancia para identificar acciones o situaciones violentas en lugares como bancos, hospitales o avenidas, ha provocado la necesidad de implementar un método que permita el reconocimiento automático de este tipo de escenas con el fin de evitar po...
- Autores:
-
Hernández Díaz, Kelly Gissela
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2021
- Institución:
- Universidad Militar Nueva Granada
- Repositorio:
- Repositorio UMNG
- Idioma:
- spa
- OAI Identifier:
- oai:repository.unimilitar.edu.co:10654/43682
- Acceso en línea:
- http://hdl.handle.net/10654/43682
- Palabra clave:
- COMPRESION DE IMAGENES
COMPRESION DE VIDEOS
VIOLENCIA
INTELIGENCIA ARTIFICIAL
violence recognition
image classification
deep learning
transfer learning
clasificación de imágenes
transferencia de aprendizaje
aprendizaje profundo
identificación de violencia
- Rights
- openAccess
- License
- http://creativecommons.org/licenses/by-nc-nd/4.0/
id |
UNIMILTAR2_d2f77af7d400498178f1ade6fd9be8c7 |
---|---|
oai_identifier_str |
oai:repository.unimilitar.edu.co:10654/43682 |
network_acronym_str |
UNIMILTAR2 |
network_name_str |
Repositorio UMNG |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Reconocimiento de escenas violentas en imágenes de CCTV utilizando aprendizaje profundo |
dc.title.translated.spa.fl_str_mv |
Recognition of violent scenes in CCTV images using deep learning |
title |
Reconocimiento de escenas violentas en imágenes de CCTV utilizando aprendizaje profundo |
spellingShingle |
Reconocimiento de escenas violentas en imágenes de CCTV utilizando aprendizaje profundo COMPRESION DE IMAGENES COMPRESION DE VIDEOS VIOLENCIA INTELIGENCIA ARTIFICIAL violence recognition image classification deep learning transfer learning clasificación de imágenes transferencia de aprendizaje aprendizaje profundo identificación de violencia |
title_short |
Reconocimiento de escenas violentas en imágenes de CCTV utilizando aprendizaje profundo |
title_full |
Reconocimiento de escenas violentas en imágenes de CCTV utilizando aprendizaje profundo |
title_fullStr |
Reconocimiento de escenas violentas en imágenes de CCTV utilizando aprendizaje profundo |
title_full_unstemmed |
Reconocimiento de escenas violentas en imágenes de CCTV utilizando aprendizaje profundo |
title_sort |
Reconocimiento de escenas violentas en imágenes de CCTV utilizando aprendizaje profundo |
dc.creator.fl_str_mv |
Hernández Díaz, Kelly Gissela |
dc.contributor.advisor.none.fl_str_mv |
Ballesteros Larrotta, Dora Maria |
dc.contributor.author.none.fl_str_mv |
Hernández Díaz, Kelly Gissela |
dc.contributor.other.none.fl_str_mv |
Renza Torres, Diego |
dc.subject.lemb.spa.fl_str_mv |
COMPRESION DE IMAGENES COMPRESION DE VIDEOS VIOLENCIA INTELIGENCIA ARTIFICIAL |
topic |
COMPRESION DE IMAGENES COMPRESION DE VIDEOS VIOLENCIA INTELIGENCIA ARTIFICIAL violence recognition image classification deep learning transfer learning clasificación de imágenes transferencia de aprendizaje aprendizaje profundo identificación de violencia |
dc.subject.keywords.spa.fl_str_mv |
violence recognition image classification deep learning transfer learning |
dc.subject.proposal.spa.fl_str_mv |
clasificación de imágenes transferencia de aprendizaje aprendizaje profundo identificación de violencia |
description |
El uso cada vez más generalizado de sistemas de videovigilancia para identificar acciones o situaciones violentas en lugares como bancos, hospitales o avenidas, ha provocado la necesidad de implementar un método que permita el reconocimiento automático de este tipo de escenas con el fin de evitar posibles riesgos a la seguridad e integridad de las personas. Por lo anterior, en el presente trabajo se propone un modelo de detección y clasificación de escenas violentas en imágenes de CCTV, basado en aprendizaje profundo. Específicamente, se utilizó el conjunto de datos CHU Surveillance Violence Dataset (CSVD), que corresponde a imágenes de videos de CCTV clasificadas en acciones tanto violentas como no violentas. Se evaluaron cuatro modelos pre-entrenados: VGG16, MobileNet, Inception y ResNet50, y mediante transferencia de aprendizaje se seleccionaron distintos puntos de congelamiento en cada una de sus arquitecturas. Adicionalmente, se emplearon tres optimizadores: Adam, Adadelta y SGD, con el fin de comparar su impacto en la clasificación de las imágenes. Para la evaluación del desempeño de los modelos a nivel de validación, se consideraron los valores obtenidos en las métricas Accuracy, Precision y Recall. Como resultado, el modelo proveniente de Inception logró un mejor rendimiento en general, a diferencia del modelo proveniente de ResNet50, que presentó los valores de métricas más bajos. |
publishDate |
2021 |
dc.date.issued.none.fl_str_mv |
2021-05-10 |
dc.date.accessioned.none.fl_str_mv |
2023-04-18T16:01:28Z |
dc.date.available.none.fl_str_mv |
2023-04-18T16:01:28Z |
dc.type.local.spa.fl_str_mv |
Tesis/Trabajo de grado - Monografía - Pregrado |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
dc.type.coar.*.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
format |
http://purl.org/coar/resource_type/c_7a1f |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/10654/43682 |
dc.identifier.instname.spa.fl_str_mv |
instname:Universidad Militar Nueva Granada |
dc.identifier.reponame.spa.fl_str_mv |
reponame:Repositorio Institucional Universidad Militar Nueva Granada |
dc.identifier.repourl.spa.fl_str_mv |
repourl:https://repository.unimilitar.edu.co |
url |
http://hdl.handle.net/10654/43682 |
identifier_str_mv |
instname:Universidad Militar Nueva Granada reponame:Repositorio Institucional Universidad Militar Nueva Granada repourl:https://repository.unimilitar.edu.co |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.relation.references.spa.fl_str_mv |
Albawi, S., Mohammed, T. A., & Al-Zawi, S. (2017). Understanding of a convolutional neural network. 2017 International Conference on Engineering and Technology (ICET). https://doi.org/10.1109/icengtechnol.2017.8308186 Alto, V. (2019, 5 julio). Neural Networks: parameters, hyperparameters and optimization strategies. Towards Data Science. Recuperado 14 de abril de 2022, de https://towardsdatascience.com/neural-networks-parameters-hyperparameters-and-optimization-strategies-3f0842fac0a5 Anber, S., Alsaggaf, W., & Shalash, W. (2022). A Hybrid Driver Fatigue and Distraction Detection Model Using AlexNet Based on Facial Features. Electronics, 11(2). https://doi.org/10.3390/electronics11020285 Bermejo Nievas, E., Deniz Suarez, O., Bueno García, G., & Sukthankar, R. (2011). Violence Detection in Video Using Computer Vision Techniques. Computer Analysis of Images and Patterns, 332–339. https://doi.org/10.1007/978-3-642-23678-5_39 Coming Lopez, D. J., & Lien, C. C. (2020). Real-Time Human Violent Activity Recognition Using Complex Action Decomposition. 2020 International Computer Symposium (ICS), 360–364. https://doi.org/10.1109/ics51289.2020.00078 Copeland, M. (2016, 29 julio). The Difference Between AI, Machine Learning, and Deep Learning? NVIDIA Blog. Recuperado 26 de marzo de 2022, de https://blogs.nvidia.com/blog/2016/07/29/whats-difference-artificial-intelligence-machine-learning-deep-learning-ai/ Deng, J., Dong, W., Socher, R., Li, L. J., Kai Li, & Li Fei-Fei. (2009). ImageNet: A large-scale hierarchical image database. 2009 IEEE Conference on Computer Vision and Pattern Recognition. https://doi.org/10.1109/cvpr.2009.5206848 Di, W., Bhardwaj, A., & Wei, J. (2018). Deep Learning Essentials: Your Hands-on Guide to the Fundamentals of Deep Learning and Neural Network Modeling. Packt Publishing. Ditsanthia, E., Pipanmaekaporn, L., & Kamonsantiroj, S. (2018). Video Representation Learning for CCTV-Based Violence Detection. 2018 3rd Technology Innovation Management and Engineering Science International Conference (TIMES-iCON), 1–5. https://doi.org/10.1109/times-icon.2018.8621751 Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning [Libro electrónico]. The MIT Press. Recuperado 20 de junio de 2022, de https://www.deeplearningbook.org/ Howard, A. G., Zhu, M., Chen, B., Kalenichenko, D., Wang, W., Weyand, T., Adam, H., & Andreetto, M. (2017). MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications. arXiv. https://arxiv.org/pdf/1704.04861.pdf IBM Cloud Education. (2020, 20 octubre). Convolutional Neural Networks. IBM. Recuperado 29 de marzo de 2022, de https://www.ibm.com/cloud/learn/convolutional-neural-networks Image Augmentation on the fly using Keras ImageDataGenerator. (2020, 11 agosto). Analytics Vidhya. Recuperado 22 de abril de 2022, de https://www.analyticsvidhya.com/blog/2020/08/image-augmentation-on-the-fly-using-keras-imagedatagenerator/#h2_6 International Business Machines. (s. f.). What is Computer Vision? IBM. Recuperado 26 de marzo de 2022, de https://www.ibm.com/topics/computer-vision Irfanullah, Hussain, T., Iqbal, A., Yang, B., & Hussain, A. (2022). Real time violence detection in surveillance videos using Convolutional Neural Networks. Multimedia Tools and Applications. https://doi.org/10.1007/s11042-022-13169-4 Jain, A., & Vishwakarma, D. K. (2020). State-of-the-arts Violence Detection using ConvNets. 2020 International Conference on Communication and Signal Processing (ICCSP), 813–817. https://doi.org/10.1109/iccsp48568.2020.9182433 Jana, A., & Gopalakrishna, M. T. (2016). Violence Detection in Surveillance Video-A survey. International Journal of Latest Research in Engineering and Technology (IJLRET), 11–17. https://www.researchgate.net/publication/321873996_Violence_Detection_in_Surveillance_Video-A_survey Kadre, S., & Konasani, V. R. (2021). Machine Learning and Deep Learning Using Python and TensorFlow (1.a ed.). McGraw-Hill Education. https://www.accessengineeringlibrary.com/content/book/9781260462296 Keras. (s. f.). Keras documentation: ModelCheckpoint. Recuperado 24 de abril de 2022, de https://keras.io/api/callbacks/model_checkpoint/ Kota, S. D. K. (2020, 17 mayo). Understanding Image Augmentation Using Keras(Tensorflow). Medium. Recuperado 22 de abril de 2022, de https://medium.com/analytics-vidhya/understanding-image-augmentation-using-keras-tensorflow-a6341669d9ca Leiva Tarazona, A., & Ramírez Ríos, A. (2021). Efectos de la inseguridad Ciudadana en el bienestar de la población. Ciencia Latina Revista Científica Multidisciplinar, 5(3), 3341-3352. https://doi.org/10.37811/cl_rcm.v5i3.535 Liang, T., Glossner, J., Wang, L., Shi, S., & Zhang, X. (2021). Pruning and quantization for deep neural network acceleration: A survey. Neurocomputing, 461, 370–403. https://doi.org/10.1016/j.neucom.2021.07.045 Morales, G., Salazar-Reque, I., Telles, J., & Díaz, D. (2019). Detecting Violent Robberies in CCTV Videos Using Deep Learning. IFIP Advances in Information and Communication Technology, 282–291. https://doi.org/10.1007/978-3-030-19823-7_23 Mu, G., Cao, H., & Jin, Q. (2016). Violent Scene Detection Using Convolutional Neural Networks and Deep Audio Features. Communications in Computer and Information Science, 451–463. https://doi.org/10.1007/978-981-10-3005-5_37 Muggah, R., & Aguirre, K. (2018). Citizen Security in Latin America: The Hard Facts. Irapagué Institute, Strategic Paper, 33, 1-63. Oficina de Análisis de Información y Estudios Estratégicos. (2019, diciembre). Evaluación del Sistema de videovigilancia de Bogotá D.C. https://scj.gov.co/sites/default/files/documentos_oaiee/Imapcto%20Videovigilancia%20en%20Bogot%C3%A1.pdf Okewu, E., Adewole, P., & Sennaike, O. (2019). Experimental Comparison of Stochastic Optimizers in Deep Learning. Computational Science and Its Applications – ICCSA 2019, 704–715. https://doi.org/10.1007/978-3-030-24308-1_55 Ongsulee, P. (2017). Artificial intelligence, machine learning and deep learning. 2017 15th International Conference on ICT and Knowledge Engineering (ICT&KE), 1–6. https://doi.org/10.1109/ictke.2017.8259629 Ramzan, M., Abid, A., Khan, H. U., Awan, S. M., Ismail, A., Ahmed, M., Ilyas, M., & Mahmood, A. (2019). A Review on State-of-the-Art Violence Detection Techniques. IEEE Access, 7, 107560–107575. https://doi.org/10.1109/access.2019.2932114 Rollins, J. B. (2015). Metodología Fundamental para la Ciencia de Datos. IBM Analytics. Recuperado 22 de marzo de 2022, de https://www.ibm.com/downloads/cas/WKK9DX51 Sarkar, D., Bali, R., & Ghosh, T. (2018). Hands-On Transfer Learning with Python: Implement Advanced Deep Learning and Neural Network Models Using TensorFlow and Keras. Packt Publishing, Limited. Sharma, M., & Baghel, R. (2020). Video Surveillance for Violence Detection Using Deep Learning. Advances in Data Science and Management, 411–420. https://doi.org/10.1007/978-981-15-0978-0_40 Soliman, M. M., Kamal, M. H., El-Massih Nashed, M. A., Mostafa, Y. M., Chawky, B. S., & Khattab, D. (2019). Violence Recognition from Videos using Deep Learning Techniques. 2019 Ninth International Conference on Intelligent Computing and Information Systems (ICICIS), 80–85. https://doi.org/10.1109/icicis46948.2019.9014714 Subsecretaría de Inversiones y Fortalecimiento de Capacidades Operativas. (2020). Ampliación concepto de Línea de Inversión Local para la dotación con recursos tecnológicos para la seguridad. http://www.sdp.gov.co/sites/default/files/anexo_1._dotacion_con_recursos_teconologicos_para_seguridad.pdf Tay, N. C., Connie, T., Ong, T. S., Goh, K. O. M., & Teh, P. S. (2018). A Robust Abnormal Behavior Detection Method Using Convolutional Neural Network. Lecture Notes in Electrical Engineering, 37–47. https://doi.org/10.1007/978-981-13-2622-6_4 Sudhakaran, S., & Lanz, O. (2017, August). Learning to detect violent videos using convolutional long short-term memory. In 2017 14th IEEE International Conference on Advanced Video and Signal Based Surveillance (AVSS) (pp. 1-6). IEEE. Ullah, F. U. M., Ullah, A., Muhammad, K., Haq, I. U., & Baik, S. W. (2019). Violence Detection Using Spatiotemporal Features with 3D Convolutional Neural Network. Sensors, 19(11), 2472. MDPI AG. http://dx.doi.org/10.3390/s19112472 Vasilev, I., Slater, D., Spacagna, G., Roelants, P., & Zocca, V. (2019). Python Deep Learning: Exploring Deep Learning Techniques and Neural Network Architectures with PyTorch, Keras, and TensorFlow (2.a ed.). Packt Publishing. Vijeikis, R., Raudonis, V., & Dervinis, G. (2022). Efficient Violence Detection in Surveillance. Sensors, 22(6). https://doi.org/10.3390/s22062216 Zhang, A., Lipton, C. Z., Li, M., & Smola, J. A. (2021). Dive into Deep Learning [Libro electrónico]. arXiv preprint arXiv:2106. 11342. Recuperado 27 de marzo de 2022, de https://d2l.ai/index.html Zhou, P., Ding, Q., Luo, H., & Hou, X. (2017). Violent Interaction Detection in Video Based on Deep Learning. Journal of Physics: Conference Series, 844. https://doi.org/10.1088/1742-6596/844/1/012044 |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.accessrights.*.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.creativecommons.spa.fl_str_mv |
Attribution-NonCommercial-NoDerivatives 4.0 International |
dc.rights.local.spa.fl_str_mv |
Acceso abierto |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ http://purl.org/coar/access_right/c_abf2 Attribution-NonCommercial-NoDerivatives 4.0 International Acceso abierto |
eu_rights_str_mv |
openAccess |
dc.format.mimetype.spa.fl_str_mv |
applicaction/pdf |
dc.coverage.sede.spa.fl_str_mv |
Calle 100 |
dc.publisher.program.spa.fl_str_mv |
Ingeniería en Telecomunicaciones |
dc.publisher.faculty.spa.fl_str_mv |
Facultad de Ingeniería |
dc.publisher.grantor.spa.fl_str_mv |
Universidad Militar Nueva Granada |
institution |
Universidad Militar Nueva Granada |
bitstream.url.fl_str_mv |
http://repository.unimilitar.edu.co/bitstream/10654/43682/1/HernandezDiazKellyGissela2022.pdf http://repository.unimilitar.edu.co/bitstream/10654/43682/2/license.txt |
bitstream.checksum.fl_str_mv |
2cf3ee19bacd25e617d4f79f166cc322 a609d7e369577f685ce98c66b903b91b |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional UMNG |
repository.mail.fl_str_mv |
bibliodigital@unimilitar.edu.co |
_version_ |
1837098494977900544 |
spelling |
Ballesteros Larrotta, Dora MariaHernández Díaz, Kelly GisselaIngeniero en TelecomunicacionesRenza Torres, Diego2023-04-18T16:01:28Z2023-04-18T16:01:28Z2021-05-10http://hdl.handle.net/10654/43682instname:Universidad Militar Nueva Granadareponame:Repositorio Institucional Universidad Militar Nueva Granadarepourl:https://repository.unimilitar.edu.coEl uso cada vez más generalizado de sistemas de videovigilancia para identificar acciones o situaciones violentas en lugares como bancos, hospitales o avenidas, ha provocado la necesidad de implementar un método que permita el reconocimiento automático de este tipo de escenas con el fin de evitar posibles riesgos a la seguridad e integridad de las personas. Por lo anterior, en el presente trabajo se propone un modelo de detección y clasificación de escenas violentas en imágenes de CCTV, basado en aprendizaje profundo. Específicamente, se utilizó el conjunto de datos CHU Surveillance Violence Dataset (CSVD), que corresponde a imágenes de videos de CCTV clasificadas en acciones tanto violentas como no violentas. Se evaluaron cuatro modelos pre-entrenados: VGG16, MobileNet, Inception y ResNet50, y mediante transferencia de aprendizaje se seleccionaron distintos puntos de congelamiento en cada una de sus arquitecturas. Adicionalmente, se emplearon tres optimizadores: Adam, Adadelta y SGD, con el fin de comparar su impacto en la clasificación de las imágenes. Para la evaluación del desempeño de los modelos a nivel de validación, se consideraron los valores obtenidos en las métricas Accuracy, Precision y Recall. Como resultado, el modelo proveniente de Inception logró un mejor rendimiento en general, a diferencia del modelo proveniente de ResNet50, que presentó los valores de métricas más bajos.1 INTRODUCCIÓN 1.1 PLANTEAMIENTO DEL PROBLEMA 1.2 JUSTIFICACIÓN 1.3 PREGUNTA DE INVESTIGACIÓN 1.4 OBJETIVOS 1.4.1 Objetivo General 1.4.2 Objetivos Específicos 1.5 METODOLOGÍA 2 MARCO TEÓRICO 2.1 INTELIGENCIA ARTIFICIAL 2.2 APRENDIZAJE AUTOMÁTICO 2.2.5. Redes Neuronales Artificiales (ANN) 2.3. COMPUTER VISION 2.4. APRENDIZAJE PROFUNDO 2.4.1. Red Neuronal Convolucional (CNN) 2.4.2. Arquitecturas CNN 2.4.3. Hiperparámetros del modelo 2.4.4. Transferencia de aprendizaje 2.5 MÉTRICAS DE EVALUACIÓN 2.5.1 Matriz de confusión 2.5.2 Accuracy 2.5.3 Recall 2.5.4 Precision 3 ESTADO DEL ARTE 3.1 TÉCNICAS DE DETECCIÓN DE VIOLENCIA UTILIZANDO APRENDIZAJE PROFUNDO 3.2 CONJUNTOS DE DATOS PARA LA DETECCIÓN DE VIOLENCIA 4 FASE 1: ENTENDIMIENTO DEL PROBLEMA 5 FASE 2: COMPRENSIÓN Y PREPARACIÓN DE LOS DATOS 5.1 CONJUNTO DE DATOS CSVD 5.2 SELECCIÓN DE IMÁGENES PARA ENTRENAMIENTO Y VALIDACIÓN 5.3 PREPARACIÓN DE LOS DATOS: AUMENTO DE IMÁGENES 5.3.1 Rotación 5.3.2 Brillo 5.3.3 Desplazamiento de canal 5.3.4 Efecto espejo horizontal 5.3.5 Zoom 6 FASE 3: MODELADO 6.1 DISEÑO DEL PROTOCOLO DE PRUEBAS 6.1.1 Tipo de arquitectura 6.1.2 Profundidad de la red 6.1.3 Algoritmo de optimización 6.1.4 Métricas de evaluación 6.1.5 Diseño del protocolo de pruebas 6.2 DISEÑO DE LOS MODELOS 6.2.1 Elección del modelo pre-entrenado 6.2.2 Elección del punto de transferencia 6.2.3 Adición de capas top (FC) y de clasificación 6.3 AUMENTO DE DATOS CON IMAGEDATAGENERATOR DE KERAS 6.4 ENTRENAMIENTO DE LOS MODELOS 6.4.1 Compilación del modelo 6.4.2 Punto de control del modelo 6.4.3 Función model.fit() 7 FASE 4: EVALUACIÓN DE LOS MODELOS 7.1 DESEMPEÑO A NIVEL DE VALIDACIÓN 7.2 EVALUACIÓN DEL IMPACTO DEL MODELO 7.3 EVALUACIÓN DEL IMPACTO DEL OPTIMIZADOR 7.4 EVALUACIÓN DEL IMPACTO DE LA PROFUNDIDAD 8 CONCLUSIONES 9 REFERENCIAS 10 ANEXO A. RESULTADOS OBTENIDOS DE LAS MÉTRICAS DE EVALUACIÓN PARA CADA MODELO 11 ANEXO B. GRÁFICAS DE DESEMPEÑO A LO LARGO DE LAS ÉPOCASThe increasingly widespread use of video surveillance systems to identify violent actions or situations in places such as banks, hospitals or avenues, has led to the need to implement methods for automatic recognition of such scenes in order to avoid possible risks to the safety and integrity of people. Therefore, this paper proposes a model for detection and classification of violent scenes in CCTV images, based on deep learning. Specifically, the CHU Surveillance Violence Dataset (CSVD), which corresponds to CCTV video images classified into both violent and non-violent actions, was used. Four pre-trained models were evaluated: VGG16, MobileNet, Inception and ResNet50, and through transfer learning, different freezing points were selected in each of their architectures. Additionally, three optimizers, Adam, Adadelta and SGD, were used to compare their impact on image classification. To evaluate the performance of the models at the validation level, the values obtained in the Accuracy, Precision and Recall metrics were considered. As a result, the model from Inception achieved a better overall performance, unlike the model from ResNet50, which presented the lowest metric values.PregradoL'utilisation de plus en plus répandue des systèmes de vidéosurveillance pour identifier des actions ou des situations violentes dans des lieux tels que les banques, les hôpitaux ou les avenues, a conduit à la nécessité de mettre en œuvre une méthode permettant la reconnaissance automatique de telles scènes afin d'éviter les risques éventuels pour la sécurité et l'intégrité des personnes. Par conséquent, cet article propose un modèle pour la détection et la classification des scènes violentes dans les images de vidéosurveillance, basé sur l'apprentissage profond. Plus précisément, le CHU Surveillance Violence Dataset (CSVD), qui correspond aux images vidéo CCTV classées en actions violentes et non violentes, a été utilisé. Quatre modèles pré-entraînés ont été évalués : VGG16, MobileNet, Inception et ResNet50, et différents points de gel dans chacune de leurs architectures ont été sélectionnés par apprentissage par transfert. En outre, trois optimiseurs, Adam, Adadelta et SGD, ont été utilisés pour comparer leur impact sur la classification des images. Pour évaluer la performance des modèles au niveau de la validation, les valeurs obtenues dans les métriques Accuracy, Precision et Recall ont été considérées. Par conséquent, le modèle provenant d'Inception a obtenu une meilleure performance globale, contrairement au modèle provenant de ResNet50, qui a présenté les valeurs métriques les plus faibles.applicaction/pdfspahttp://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Attribution-NonCommercial-NoDerivatives 4.0 InternationalAcceso abiertoReconocimiento de escenas violentas en imágenes de CCTV utilizando aprendizaje profundoRecognition of violent scenes in CCTV images using deep learningCOMPRESION DE IMAGENESCOMPRESION DE VIDEOSVIOLENCIAINTELIGENCIA ARTIFICIALviolence recognitionimage classificationdeep learningtransfer learningclasificación de imágenestransferencia de aprendizajeaprendizaje profundoidentificación de violenciaTesis/Trabajo de grado - Monografía - Pregradoinfo:eu-repo/semantics/bachelorThesishttp://purl.org/coar/resource_type/c_7a1fIngeniería en TelecomunicacionesFacultad de IngenieríaUniversidad Militar Nueva GranadaAlbawi, S., Mohammed, T. A., & Al-Zawi, S. (2017). Understanding of a convolutional neural network. 2017 International Conference on Engineering and Technology (ICET). https://doi.org/10.1109/icengtechnol.2017.8308186Alto, V. (2019, 5 julio). Neural Networks: parameters, hyperparameters and optimization strategies. Towards Data Science. Recuperado 14 de abril de 2022, de https://towardsdatascience.com/neural-networks-parameters-hyperparameters-and-optimization-strategies-3f0842fac0a5Anber, S., Alsaggaf, W., & Shalash, W. (2022). A Hybrid Driver Fatigue and Distraction Detection Model Using AlexNet Based on Facial Features. Electronics, 11(2). https://doi.org/10.3390/electronics11020285Bermejo Nievas, E., Deniz Suarez, O., Bueno García, G., & Sukthankar, R. (2011). Violence Detection in Video Using Computer Vision Techniques. Computer Analysis of Images and Patterns, 332–339. https://doi.org/10.1007/978-3-642-23678-5_39Coming Lopez, D. J., & Lien, C. C. (2020). Real-Time Human Violent Activity Recognition Using Complex Action Decomposition. 2020 International Computer Symposium (ICS), 360–364. https://doi.org/10.1109/ics51289.2020.00078Copeland, M. (2016, 29 julio). The Difference Between AI, Machine Learning, and Deep Learning? NVIDIA Blog. Recuperado 26 de marzo de 2022, de https://blogs.nvidia.com/blog/2016/07/29/whats-difference-artificial-intelligence-machine-learning-deep-learning-ai/Deng, J., Dong, W., Socher, R., Li, L. J., Kai Li, & Li Fei-Fei. (2009). ImageNet: A large-scale hierarchical image database. 2009 IEEE Conference on Computer Vision and Pattern Recognition. https://doi.org/10.1109/cvpr.2009.5206848Di, W., Bhardwaj, A., & Wei, J. (2018). Deep Learning Essentials: Your Hands-on Guide to the Fundamentals of Deep Learning and Neural Network Modeling. Packt Publishing.Ditsanthia, E., Pipanmaekaporn, L., & Kamonsantiroj, S. (2018). Video Representation Learning for CCTV-Based Violence Detection. 2018 3rd Technology Innovation Management and Engineering Science International Conference (TIMES-iCON), 1–5. https://doi.org/10.1109/times-icon.2018.8621751Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning [Libro electrónico]. The MIT Press. Recuperado 20 de junio de 2022, de https://www.deeplearningbook.org/Howard, A. G., Zhu, M., Chen, B., Kalenichenko, D., Wang, W., Weyand, T., Adam, H., & Andreetto, M. (2017). MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications. arXiv. https://arxiv.org/pdf/1704.04861.pdfIBM Cloud Education. (2020, 20 octubre). Convolutional Neural Networks. IBM. Recuperado 29 de marzo de 2022, de https://www.ibm.com/cloud/learn/convolutional-neural-networksImage Augmentation on the fly using Keras ImageDataGenerator. (2020, 11 agosto). Analytics Vidhya. Recuperado 22 de abril de 2022, de https://www.analyticsvidhya.com/blog/2020/08/image-augmentation-on-the-fly-using-keras-imagedatagenerator/#h2_6International Business Machines. (s. f.). What is Computer Vision? IBM. Recuperado 26 de marzo de 2022, de https://www.ibm.com/topics/computer-visionIrfanullah, Hussain, T., Iqbal, A., Yang, B., & Hussain, A. (2022). Real time violence detection in surveillance videos using Convolutional Neural Networks. Multimedia Tools and Applications. https://doi.org/10.1007/s11042-022-13169-4Jain, A., & Vishwakarma, D. K. (2020). State-of-the-arts Violence Detection using ConvNets. 2020 International Conference on Communication and Signal Processing (ICCSP), 813–817. https://doi.org/10.1109/iccsp48568.2020.9182433Jana, A., & Gopalakrishna, M. T. (2016). Violence Detection in Surveillance Video-A survey. International Journal of Latest Research in Engineering and Technology (IJLRET), 11–17. https://www.researchgate.net/publication/321873996_Violence_Detection_in_Surveillance_Video-A_surveyKadre, S., & Konasani, V. R. (2021). Machine Learning and Deep Learning Using Python and TensorFlow (1.a ed.). McGraw-Hill Education. https://www.accessengineeringlibrary.com/content/book/9781260462296Keras. (s. f.). Keras documentation: ModelCheckpoint. Recuperado 24 de abril de 2022, de https://keras.io/api/callbacks/model_checkpoint/Kota, S. D. K. (2020, 17 mayo). Understanding Image Augmentation Using Keras(Tensorflow). Medium. Recuperado 22 de abril de 2022, de https://medium.com/analytics-vidhya/understanding-image-augmentation-using-keras-tensorflow-a6341669d9caLeiva Tarazona, A., & Ramírez Ríos, A. (2021). Efectos de la inseguridad Ciudadana en el bienestar de la población. Ciencia Latina Revista Científica Multidisciplinar, 5(3), 3341-3352. https://doi.org/10.37811/cl_rcm.v5i3.535Liang, T., Glossner, J., Wang, L., Shi, S., & Zhang, X. (2021). Pruning and quantization for deep neural network acceleration: A survey. Neurocomputing, 461, 370–403. https://doi.org/10.1016/j.neucom.2021.07.045Morales, G., Salazar-Reque, I., Telles, J., & Díaz, D. (2019). Detecting Violent Robberies in CCTV Videos Using Deep Learning. IFIP Advances in Information and Communication Technology, 282–291. https://doi.org/10.1007/978-3-030-19823-7_23Mu, G., Cao, H., & Jin, Q. (2016). Violent Scene Detection Using Convolutional Neural Networks and Deep Audio Features. Communications in Computer and Information Science, 451–463. https://doi.org/10.1007/978-981-10-3005-5_37Muggah, R., & Aguirre, K. (2018). Citizen Security in Latin America: The Hard Facts. Irapagué Institute, Strategic Paper, 33, 1-63.Oficina de Análisis de Información y Estudios Estratégicos. (2019, diciembre). Evaluación del Sistema de videovigilancia de Bogotá D.C. https://scj.gov.co/sites/default/files/documentos_oaiee/Imapcto%20Videovigilancia%20en%20Bogot%C3%A1.pdfOkewu, E., Adewole, P., & Sennaike, O. (2019). Experimental Comparison of Stochastic Optimizers in Deep Learning. Computational Science and Its Applications – ICCSA 2019, 704–715. https://doi.org/10.1007/978-3-030-24308-1_55Ongsulee, P. (2017). Artificial intelligence, machine learning and deep learning. 2017 15th International Conference on ICT and Knowledge Engineering (ICT&KE), 1–6. https://doi.org/10.1109/ictke.2017.8259629Ramzan, M., Abid, A., Khan, H. U., Awan, S. M., Ismail, A., Ahmed, M., Ilyas, M., & Mahmood, A. (2019). A Review on State-of-the-Art Violence Detection Techniques. IEEE Access, 7, 107560–107575. https://doi.org/10.1109/access.2019.2932114Rollins, J. B. (2015). Metodología Fundamental para la Ciencia de Datos. IBM Analytics. Recuperado 22 de marzo de 2022, de https://www.ibm.com/downloads/cas/WKK9DX51Sarkar, D., Bali, R., & Ghosh, T. (2018). Hands-On Transfer Learning with Python: Implement Advanced Deep Learning and Neural Network Models Using TensorFlow and Keras. Packt Publishing, Limited.Sharma, M., & Baghel, R. (2020). Video Surveillance for Violence Detection Using Deep Learning. Advances in Data Science and Management, 411–420. https://doi.org/10.1007/978-981-15-0978-0_40Soliman, M. M., Kamal, M. H., El-Massih Nashed, M. A., Mostafa, Y. M., Chawky, B. S., & Khattab, D. (2019). Violence Recognition from Videos using Deep Learning Techniques. 2019 Ninth International Conference on Intelligent Computing and Information Systems (ICICIS), 80–85. https://doi.org/10.1109/icicis46948.2019.9014714Subsecretaría de Inversiones y Fortalecimiento de Capacidades Operativas. (2020). Ampliación concepto de Línea de Inversión Local para la dotación con recursos tecnológicos para la seguridad. http://www.sdp.gov.co/sites/default/files/anexo_1._dotacion_con_recursos_teconologicos_para_seguridad.pdfTay, N. C., Connie, T., Ong, T. S., Goh, K. O. M., & Teh, P. S. (2018). A Robust Abnormal Behavior Detection Method Using Convolutional Neural Network. Lecture Notes in Electrical Engineering, 37–47. https://doi.org/10.1007/978-981-13-2622-6_4Sudhakaran, S., & Lanz, O. (2017, August). Learning to detect violent videos using convolutional long short-term memory. In 2017 14th IEEE International Conference on Advanced Video and Signal Based Surveillance (AVSS) (pp. 1-6). IEEE.Ullah, F. U. M., Ullah, A., Muhammad, K., Haq, I. U., & Baik, S. W. (2019). Violence Detection Using Spatiotemporal Features with 3D Convolutional Neural Network. Sensors, 19(11), 2472. MDPI AG. http://dx.doi.org/10.3390/s19112472Vasilev, I., Slater, D., Spacagna, G., Roelants, P., & Zocca, V. (2019). Python Deep Learning: Exploring Deep Learning Techniques and Neural Network Architectures with PyTorch, Keras, and TensorFlow (2.a ed.). Packt Publishing.Vijeikis, R., Raudonis, V., & Dervinis, G. (2022). Efficient Violence Detection in Surveillance. Sensors, 22(6). https://doi.org/10.3390/s22062216Zhang, A., Lipton, C. Z., Li, M., & Smola, J. A. (2021). Dive into Deep Learning [Libro electrónico]. arXiv preprint arXiv:2106. 11342. Recuperado 27 de marzo de 2022, de https://d2l.ai/index.htmlZhou, P., Ding, Q., Luo, H., & Hou, X. (2017). Violent Interaction Detection in Video Based on Deep Learning. Journal of Physics: Conference Series, 844. https://doi.org/10.1088/1742-6596/844/1/012044Calle 100ORIGINALHernandezDiazKellyGissela2022.pdfHernandezDiazKellyGissela2022.pdfTrabajo de gradoapplication/pdf2616498http://repository.unimilitar.edu.co/bitstream/10654/43682/1/HernandezDiazKellyGissela2022.pdf2cf3ee19bacd25e617d4f79f166cc322MD51open accessLICENSElicense.txtlicense.txttext/plain; charset=utf-83420http://repository.unimilitar.edu.co/bitstream/10654/43682/2/license.txta609d7e369577f685ce98c66b903b91bMD52open access10654/43682oai:repository.unimilitar.edu.co:10654/436822023-04-18 11:01:29.622open accessRepositorio Institucional UMNGbibliodigital@unimilitar.edu.coRWwgYXV0b3IgZGUgbGEgb2JyYSAodGVzaXMsIG1vbm9ncmFmw61hLCB0cmFiYWpvIGRlIGdyYWRvIG8gY3VhbHF1aWVyIG90cm8gZG9jdW1lbnRvCmNvbiBjYXLDoWN0ZXIgYWNhZMOpbWljbyksIGFjdHVhbmRvIGVuIG5vbWJyZSBwcm9waW8sIGhhY2UgZW50cmVnYSBkZWwgZWplbXBsYXIgcmVzcGVjdGl2bwp5IGRlIHN1cyBhbmV4b3MgZW4gZm9ybWF0byBkaWdpdGFsIG8gZWxlY3Ryw7NuaWNvLgoKRUwgRVNUVURJQU5URSAtIEFVVE9SLCBtYW5pZmllc3RhIHF1ZSBsYSBvYnJhIG9iamV0byBkZSBsYSBwcmVzZW50ZSBhdXRvcml6YWNpw7NuCmVzIG9yaWdpbmFsIHkgbGEgcmVhbGl6w7Mgc2luIHZpb2xhciBvIHVzdXJwYXIgZGVyZWNob3MgZGUgYXV0b3IgZGUgdGVyY2Vyb3MsIHBvcgpsbyB0YW50bywgbGEgb2JyYSBlcyBkZSBleGNsdXNpdmEgYXV0b3LDrWEgeSB0aWVuZSBsYSB0aXR1bGFyaWRhZCBzb2JyZSBsYSBtaXNtYS4KCkVuIGNhc28gZGUgcHJlc2VudGFyc2UgY3VhbHF1aWVyIHJlY2xhbWFjacOzbiBvIGFjY2nDs24gcG9yIHBhcnRlIGRlIHVuIHRlcmNlcm8gZW4KY3VhbnRvIGEgbG9zIGRlcmVjaG9zIGRlIGF1dG9yIHNvYnJlIGxhIG9icmEgZW4gY3Vlc3Rpw7NuLCBFTCBFU1RVRElBTlRFIC0gQVVUT1IsCmFzdW1pcsOhIHRvZGEgbGEgcmVzcG9uc2FiaWxpZGFkLCB5IHNhbGRyw6EgZW4gZGVmZW5zYSBkZSBsb3MgZGVyZWNob3MgYXF1w60gYXV0b3JpemFkb3M7CnBhcmEgdG9kb3MgbG9zIGVmZWN0b3MgbGEgdW5pdmVyc2lkYWQgYWN0w7phIGNvbW8gdW4gdGVyY2VybyBkZSBidWVuYSBmZS4KCkFkZW3DoXMsICJMQSBVTklWRVJTSURBRCBNSUxJVEFSIE5VRVZBIEdSQU5BREEgY29tbyBpbnN0aXR1Y2nDs24gcXVlIGFsbWFjZW5hLCB5CnJlY29sZWN0YSBkYXRvcyBwZXJzb25hbGVzLCBhdGVuZGllbmRvIGxvIHByZWNlcHR1YWRvIGVuIGxhIGxleSAxNTgxIGRlIDIwMTIgeSBlbApEZWNyZXRvIDEzNzcgZGUgMjAxMywgcXVlIGRlc2Fycm9sbGFuIGVsIHByaW5jaXBpbyBjb25zdGl0dWNpb25hbCBxdWUgdGllbmVuIHRvZGFzCmxhcyBwZXJzb25hcyBhIGNvbm9jZXIsIGFjdHVhbGl6YXIgeSByZWN0aWZpY2FyIHRvZG8gdGlwbyBkZSBpbmZvcm1hY2nDs24gcmVjb2dpZGEKbywgcXVlIGhheWEgc2lkbyBvYmpldG8gZGUgdHJhdGFtaWVudG8gZGUgZGF0b3MgcGVyc29uYWxlcyBlbiBiYW5jb3MgbyBiYXNlcyBkZQpkYXRvcyB5IGVuIGdlbmVyYWwgZW4gYXJjaGl2b3MgZGUgZW50aWRhZGVzIHDDumJsaWNhcyBvIHByaXZhZGFzLCByZXF1aWVyZSBvYnRlbmVyCnN1IGF1dG9yaXphY2nDs24sIHBhcmEgcXVlLCBkZSBtYW5lcmEgbGlicmUsIHByZXZpYSwgZXhwcmVzYSwgdm9sdW50YXJpYSwgeQpkZWJpZGFtZW50ZSBpbmZvcm1hZGEsIHBlcm1pdGEgYSB0b2RhcyBudWVzdHJhcyBkZXBlbmRlbmNpYXMgYWNhZMOpbWljYXMgeQphZG1pbmlzdHJhdGl2YXMsIHJlY29sZWN0YXIsIHJlY2F1ZGFyLCBhbG1hY2VuYXIsIHVzYXIsIGNpcmN1bGFyLCBzdXByaW1pciwgcHJvY2VzYXIsCmNvbXBpbGFyLCBpbnRlcmNhbWJpYXIsIGRhciB0cmF0YW1pZW50bywgYWN0dWFsaXphciB5IGRpc3BvbmVyIGRlIGxvcyBkYXRvcyBxdWUKaGFuIHNpZG8gc3VtaW5pc3RyYWRvcyB5IHF1ZSBzZSBoYW4gaW5jb3Jwb3JhZG8gZW4gbnVlc3RyYXMgYmFzZXMgbyBiYW5jb3MgZGUKZGF0b3MsIG8gZW4gcmVwb3NpdG9yaW9zIGVsZWN0csOzbmljb3MgZGUgdG9kbyB0aXBvIGNvbiBxdWUgY3VlbnRhIGxhIFVuaXZlcnNpZGFkLgoKRXN0YSBpbmZvcm1hY2nDs24gZXMgeSBzZXLDoSB1dGlsaXphZGEgZW4gZWwgZGVzYXJyb2xsbyBkZSBsYXMgZnVuY2lvbmVzIHByb3BpYXMgZGUKbGEgVW5pdmVyc2lkYWQgZW4gc3UgY29uZGljacOzbiBkZSBpbnN0aXR1Y2nDs24gZGUgZWR1Y2FjacOzbiBzdXBlcmlvciwgZGUgZm9ybWEKZGlyZWN0YSBvIGEgdHJhdsOpcyBkZSB0ZXJjZXJvcyIuCgpTaSBzdSBkb2N1bWVudG8gZXMgZGUgYWNjZXNvIHJlc3RyaW5naWRvICwgc3UgdHJhYmFqbyBzZSBkZXBvc2l0YXLDoSBlbiBlbApSZXBvc2l0b3JpbyBVTU5HIMO6bmljYW1lbnRlIGNvbiBwcm9ww7NzaXRvcyBkZSBwcmVzZXJ2YWNpw7NuIGRvY3VtZW50YWwgeSBtZW1vcmlhCmluc3RpdHVjaW9uYWwsIGVudGVuZGllbmRvIHF1ZSwgc2Vyw6EgY29uc3VsdGFkbyBkZSBmb3JtYSBjb250cm9sYWRhIHNvbGFtZW50ZSBwb3IKbGEgY29tdW5pZGFkIE5lb2dyYW5hZGluYS4KClNpIHN1IGRvY3VtZW50byBlcyBkZSBhY2Nlc28gYWJpZXJ0bywgcGFyYSBwZXJtaXRpciBhbCBSZXBvc2l0b3JpbyBVTU5HIHJlcHJvZHVjaXIsCnRyYWR1Y2lyIHkgZGlzdHJpYnVpciBzdSBlbnbDrW8gYSB0cmF2w6lzIGRlbCBtdW5kbywgbmVjZXNpdGFtb3Mgc3UgY29uZm9ybWlkYWQgZW4KbG9zIHNpZ3VpZW50ZXMgdMOpcm1pbm9zOgoKWSBhdXRvcml6YSBhIGxhIFVOSVZFUlNJREFEIE1JTElUQVIgTlVFVkEgR1JBTkFEQSwgcGFyYSBxdWUgZW4gbG9zIHTDqXJtaW5vcwplc3RhYmxlY2lkb3MgZW46CgpMZXkgMjMgZGUgMTk4Mi0gTGV5IDQ0IGRlIDE5OTMgLUxleSAxOTE1IGRlIDIwMTggLSBEZWNpc2nDs24gQW5kaW5hIDM1MSBkZSAxOTkzLQpEZWNyZXRvIDQ2MCBkZSAxOTk1IHkgZGVtw6FzIG5vcm1hcyBnZW5lcmFsZXMgc29icmUgbGEgbWF0ZXJpYSwgdXRpbGljZSB5IHVzZSBwb3IKY3VhbHF1aWVyIG1lZGlvIGNvbm9jaWRvIG8gcG9yIGNvbm9jZXIsIGxvcyBkZXJlY2hvcyBwYXRyaW1vbmlhbGVzIGRlIHJlcHJvZHVjY2nDs24sCmNvbXVuaWNhY2nDs24gcMO6YmxpY2EsIHRyYW5zZm9ybWFjacOzbiB5IGRpc3RyaWJ1Y2nDs24gZGUgbGEgb2JyYSBvYmpldG8gZGVsIHByZXNlbnRlCmRvY3VtZW50by4KCkxhIHByZXNlbnRlIGF1dG9yaXphY2nDs24gc2UgaGFjZSBleHRlbnNpdmEgbm8gc8OzbG8gYSBsYXMgZmFjdWx0YWRlcyB5IGRlcmVjaG9zIGRlCnVzbyBzb2JyZSBsYSBvYnJhIGVuIGZvcm1hdG8gbyBzb3BvcnRlIG1hdGVyaWFsLCBzaW5vIHRhbWJpw6luIHBhcmEgZm9ybWF0byB2aXJ0dWFsLAplbGVjdHLDs25pY28sIGRpZ2l0YWwsIHkgY3V5byB1c28gc2UgZGUgZW4gcmVkLCBpbnRlcm5ldCwgZXh0cmFuZXQsIGludHJhbmV0LCBldGMuLAp5IGVuIGdlbmVyYWwgZW4gY3VhbHF1aWVyIGZvcm1hdG8gY29ub2NpZG8gbyBwb3IgY29ub2Nlci4KClNpIHRpZW5lIGFsZ3VuYSBkdWRhIHNvYnJlIGxvcyBUw6lybWlub3MgeSBjb25kaWNpb25lcywgcG9yIGZhdm9yLCBjb250YWN0ZSBjb24gZWwKYWRtaW5pc3RyYWRvciBkZWwgc2lzdGVtYSBiaWJsaW9kaWdpdGFsQHVuaW1pbGl0YXIuZWR1LmNvCgpBY2VwdGUgVMOpcm1pbm9zIHkgY29uZGljaW9uZXMgc2VsZWNjaW9uYW5kbyAiQWNlcHRvIiB5IHB1bHNhbmRvICJDb21wbGV0YXIgZW52w61vIi4K |