Robust video trackers against in-capture and post-capture distortions using video quality assessment based on natural scene statistics and deep learning
El trabajo investigativo realizado hasta el momento en Seguimiento de Objetos en Video (VOT) ha estudiado diversos factores de la imagen que afectan el rendimiento de VOT. Por ejemplo, factores como oclusión, aglomeración, confusión, la forma del objeto, velocidad variable, acercamiento, entre otros...
- Autores:
-
Gómez Nieto , Roger
- Tipo de recurso:
- Doctoral thesis
- Fecha de publicación:
- 2021
- Institución:
- Pontificia Universidad Javeriana Cali
- Repositorio:
- Vitela
- Idioma:
- eng
- OAI Identifier:
- oai:vitela.javerianacali.edu.co:11522/2047
- Acceso en línea:
- https://vitela.javerianacali.edu.co/handle/11522/2047
- Palabra clave:
- Evaluación de calidad de video
Seguimiento de objetos en video
Red neuronal convolucional
Predicción de rendimiento de seguidor de objetos
Distorsiones en el momento de la captura
Seguimiento de objetos en video robusto
Base de datos de videos auténticamente distorsionados
- Rights
- License
- https://creativecommons.org/licenses/by-nc-nd/4.0/
id |
Vitela2_0aac0ee10c0ab4b18fdb69d759e694a4 |
---|---|
oai_identifier_str |
oai:vitela.javerianacali.edu.co:11522/2047 |
network_acronym_str |
Vitela2 |
network_name_str |
Vitela |
repository_id_str |
|
dc.title.eng.fl_str_mv |
Robust video trackers against in-capture and post-capture distortions using video quality assessment based on natural scene statistics and deep learning |
title |
Robust video trackers against in-capture and post-capture distortions using video quality assessment based on natural scene statistics and deep learning |
spellingShingle |
Robust video trackers against in-capture and post-capture distortions using video quality assessment based on natural scene statistics and deep learning Evaluación de calidad de video Seguimiento de objetos en video Red neuronal convolucional Predicción de rendimiento de seguidor de objetos Distorsiones en el momento de la captura Seguimiento de objetos en video robusto Base de datos de videos auténticamente distorsionados |
title_short |
Robust video trackers against in-capture and post-capture distortions using video quality assessment based on natural scene statistics and deep learning |
title_full |
Robust video trackers against in-capture and post-capture distortions using video quality assessment based on natural scene statistics and deep learning |
title_fullStr |
Robust video trackers against in-capture and post-capture distortions using video quality assessment based on natural scene statistics and deep learning |
title_full_unstemmed |
Robust video trackers against in-capture and post-capture distortions using video quality assessment based on natural scene statistics and deep learning |
title_sort |
Robust video trackers against in-capture and post-capture distortions using video quality assessment based on natural scene statistics and deep learning |
dc.creator.fl_str_mv |
Gómez Nieto , Roger |
dc.contributor.advisor.none.fl_str_mv |
Benítez Restrepo, Hernan Darío Bovik, Alan |
dc.contributor.author.none.fl_str_mv |
Gómez Nieto , Roger |
dc.subject.none.fl_str_mv |
Evaluación de calidad de video Seguimiento de objetos en video Red neuronal convolucional Predicción de rendimiento de seguidor de objetos Distorsiones en el momento de la captura Seguimiento de objetos en video robusto Base de datos de videos auténticamente distorsionados |
topic |
Evaluación de calidad de video Seguimiento de objetos en video Red neuronal convolucional Predicción de rendimiento de seguidor de objetos Distorsiones en el momento de la captura Seguimiento de objetos en video robusto Base de datos de videos auténticamente distorsionados |
description |
El trabajo investigativo realizado hasta el momento en Seguimiento de Objetos en Video (VOT) ha estudiado diversos factores de la imagen que afectan el rendimiento de VOT. Por ejemplo, factores como oclusión, aglomeración, confusión, la forma del objeto, velocidad variable, acercamiento, entre otros, influencian la calidad del video y afectan la precisión del seguidor. Sin embargo, hasta el momento, no se ha definido una distinción clara entre los desafíos originados por la escena, tales como oclusión y aglomeración de objetos, con los desafíos impuestos directamente por la calidad del video. Estas distorsiones que afectan la calidad del video pueden generarse por etapas o fases presentes en la captura, compresión, procesamiento y transmisión del video. A pesar de la abundancia de métodos VOT en la literatura, aún se presenta una ausencia de estudios detallados que analicen el rendimiento de los VOT en videos que contengan distorsiones en captura y post-captura. El seguimiento de objetos en video es una tarea desafiante debido a la necesidad de trabajar con videos que tienen múltiples imperfecciones y distorsiones. Entre estas se encuentran rectángulos de inicialización del objeto mal ubicados, ruido en el sensor, latencia por transmisión de video, cambios de iluminación, y pérdida de datos por algoritmos de compresión. Un importante y actual campo de investigación es la interacción entre la calidad de video y el desempeño en la tarea. Esto al tener en cuenta que los videos usados en video-vigilancia están plagados con numerosas fuentes de distorsión, incluyendo borrosidad, ruido y artefactos que surgen de procesos como compresión, escalado, conversión de formato, entre otros. A menudo en un mismo video se encuentran múltiples distorsiones, las cuales interactúan, lo cual complica significativamente la tarea del seguidor de objetos. Aunque en el estado del arte se proponen numerosos algoritmos seguidores de objeto cada año, hacerlos robustos contra la amplia variedad de distorsiones no lineales, a menudo contenidas de forma simultánea, y además, poco entendidas, es un problema altamente complejo. A pesar de la buena precisión de los algoritmos seguidores recientes, estos no han demostrado ser lo suficientemente robustos a distorsiones de video en captura y postcaptura. Algo que no ha permitido el avance en la mejora de dicha robustez, es la ausencia de bases de datos de videos que presenten distorsiones en captura. Similarmente, no se reporta una evaluación sistemática de los seguidores del estado del arte en videos que adquieran distorsiones durante la captura y postcaptura. |
publishDate |
2021 |
dc.date.issued.none.fl_str_mv |
2021 |
dc.date.accessioned.none.fl_str_mv |
2024-06-08T16:56:11Z |
dc.date.available.none.fl_str_mv |
2024-06-08T16:56:11Z |
dc.type.coar.none.fl_str_mv |
http://purl.org/coar/resource_type/c_db06 |
dc.type.local.none.fl_str_mv |
Tesis/Trabajo de grado - Monografía - Doctorado |
dc.type.redcol.none.fl_str_mv |
https://purl.org/redcol/resource_type/TD |
format |
http://purl.org/coar/resource_type/c_db06 |
dc.identifier.uri.none.fl_str_mv |
https://vitela.javerianacali.edu.co/handle/11522/2047 |
url |
https://vitela.javerianacali.edu.co/handle/11522/2047 |
dc.language.iso.none.fl_str_mv |
eng |
language |
eng |
dc.rights.uri.none.fl_str_mv |
https://creativecommons.org/licenses/by-nc-nd/4.0/ |
dc.rights.creativecommons.none.fl_str_mv |
https://creativecommons.org/licenses/by-nc-nd/4.0/ |
dc.rights.accessrights.none.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-nd/4.0/ http://purl.org/coar/access_right/c_abf2 |
dc.format.extent.none.fl_str_mv |
158 p. |
dc.format.mimetype.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Pontificia Universidad Javeriana Cali |
publisher.none.fl_str_mv |
Pontificia Universidad Javeriana Cali |
institution |
Pontificia Universidad Javeriana Cali |
bitstream.url.fl_str_mv |
https://vitela.javerianacali.edu.co/bitstreams/91a80c1c-d0af-4752-8a63-e48e38b1d6eb/download https://vitela.javerianacali.edu.co/bitstreams/884e50b9-ba02-4fed-89e2-2b57e6e28ebc/download https://vitela.javerianacali.edu.co/bitstreams/272f1a3a-b637-4509-a873-f0278a1d2460/download https://vitela.javerianacali.edu.co/bitstreams/959fd467-ebb9-4245-8bf0-c2e94bebc6fe/download https://vitela.javerianacali.edu.co/bitstreams/ce7f41ad-3237-4c9a-9901-07483a3755da/download https://vitela.javerianacali.edu.co/bitstreams/1e636175-f498-4569-a5e4-cbd176371ab1/download https://vitela.javerianacali.edu.co/bitstreams/8fbb6e51-6c30-41fc-b6c4-b1337e592765/download |
bitstream.checksum.fl_str_mv |
8a4605be74aa9ea9d79846c1fba20a33 93185710646c70d009ca88db4207bdcc ca5e239483f0fa837c9371d1fb044e6a 8922a1862e8393c0c95f4c5129a78afd e5aa5b5e0d4202cd95fcd730e34b6ef3 d960583591fcd05c0b34ea55cf96d35f 7a79ddbde2c7db572112bccf2a0dcfa3 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Vitela |
repository.mail.fl_str_mv |
vitela.mail@javerianacali.edu.co |
_version_ |
1829956343802363904 |
spelling |
Benítez Restrepo, Hernan DaríoBovik, AlanGómez Nieto , Roger2024-06-08T16:56:11Z2024-06-08T16:56:11Z2021https://vitela.javerianacali.edu.co/handle/11522/2047El trabajo investigativo realizado hasta el momento en Seguimiento de Objetos en Video (VOT) ha estudiado diversos factores de la imagen que afectan el rendimiento de VOT. Por ejemplo, factores como oclusión, aglomeración, confusión, la forma del objeto, velocidad variable, acercamiento, entre otros, influencian la calidad del video y afectan la precisión del seguidor. Sin embargo, hasta el momento, no se ha definido una distinción clara entre los desafíos originados por la escena, tales como oclusión y aglomeración de objetos, con los desafíos impuestos directamente por la calidad del video. Estas distorsiones que afectan la calidad del video pueden generarse por etapas o fases presentes en la captura, compresión, procesamiento y transmisión del video. A pesar de la abundancia de métodos VOT en la literatura, aún se presenta una ausencia de estudios detallados que analicen el rendimiento de los VOT en videos que contengan distorsiones en captura y post-captura. El seguimiento de objetos en video es una tarea desafiante debido a la necesidad de trabajar con videos que tienen múltiples imperfecciones y distorsiones. Entre estas se encuentran rectángulos de inicialización del objeto mal ubicados, ruido en el sensor, latencia por transmisión de video, cambios de iluminación, y pérdida de datos por algoritmos de compresión. Un importante y actual campo de investigación es la interacción entre la calidad de video y el desempeño en la tarea. Esto al tener en cuenta que los videos usados en video-vigilancia están plagados con numerosas fuentes de distorsión, incluyendo borrosidad, ruido y artefactos que surgen de procesos como compresión, escalado, conversión de formato, entre otros. A menudo en un mismo video se encuentran múltiples distorsiones, las cuales interactúan, lo cual complica significativamente la tarea del seguidor de objetos. Aunque en el estado del arte se proponen numerosos algoritmos seguidores de objeto cada año, hacerlos robustos contra la amplia variedad de distorsiones no lineales, a menudo contenidas de forma simultánea, y además, poco entendidas, es un problema altamente complejo. A pesar de la buena precisión de los algoritmos seguidores recientes, estos no han demostrado ser lo suficientemente robustos a distorsiones de video en captura y postcaptura. Algo que no ha permitido el avance en la mejora de dicha robustez, es la ausencia de bases de datos de videos que presenten distorsiones en captura. Similarmente, no se reporta una evaluación sistemática de los seguidores del estado del arte en videos que adquieran distorsiones durante la captura y postcaptura.The current work in Video Object Tracking (VOT) has studied various image factors that affect VOT algorithm performance. For instance, factors such as occlusion, clutter, confusion, object shape, varying speed, and zooming, which influence video quality, affect tracking performance. Nonetheless, there is no clear distinction between scene-dependent challenges such as occlusion and clutter and the challenges imposed by traditional notions of “quality impairments” inherited from capture, compression, processing, and transmission. Despite the plethora of VOT methods in the literature, there is a lack of detailed studies analyzing the performance of videos with authentic in-capture and post-capture distortions. VOT is a challenging task because the videos analyzed can be distorted by impairments such as bounding box initialization error, sensor noise, latency by video transmission, illumination changes, and data loss caused by compression algorithms. An exciting direction of research is the interaction between visual quality and tracking task. Taking into account that Surveillance videos are fraught with numerous sources of distortions, including blur, noise, and artifacts arising from processes such as compression, scaling, and format conversion. Multiple interacting distortions are often present, which significantly complicates the tracking task. Although effective tracking algorithms have been implemented, the study of their performance with respect to a wide variety of generally nonlinear, often commingled, poorly understood distortions, in practice, is a complex problem. Despite numerous algorithms proposed in the past few decades, video tracking methods that explicitly include strategies to make them robust to in-capture and post-capture video distortions have not been widely explored. Hence, there is a lack of data sets designed for object tracking that present in-capture distortion and systematic evaluation of state-of-the-art video tracking algorithms under in-capture and post-capture video distortions.158 p.application/pdfengPontificia Universidad Javeriana Calihttps://creativecommons.org/licenses/by-nc-nd/4.0/https://creativecommons.org/licenses/by-nc-nd/4.0/http://purl.org/coar/access_right/c_abf2Evaluación de calidad de videoSeguimiento de objetos en videoRed neuronal convolucionalPredicción de rendimiento de seguidor de objetosDistorsiones en el momento de la capturaSeguimiento de objetos en video robustoBase de datos de videos auténticamente distorsionadosRobust video trackers against in-capture and post-capture distortions using video quality assessment based on natural scene statistics and deep learninghttp://purl.org/coar/resource_type/c_db06Tesis/Trabajo de grado - Monografía - Doctoradohttps://purl.org/redcol/resource_type/TDFacultad de Ingeniería y Ciencias. Doctorado en Ingeniería y Ciencias AplicadasPontificia Universidad Javeriana CaliDoctoradoLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://vitela.javerianacali.edu.co/bitstreams/91a80c1c-d0af-4752-8a63-e48e38b1d6eb/download8a4605be74aa9ea9d79846c1fba20a33MD51ORIGINALTesisDoctoral_Nieto2021_Robust Video Trackers_PUJC_Compressed.pdfTesisDoctoral_Nieto2021_Robust Video Trackers_PUJC_Compressed.pdfapplication/pdf29866982https://vitela.javerianacali.edu.co/bitstreams/884e50b9-ba02-4fed-89e2-2b57e6e28ebc/download93185710646c70d009ca88db4207bdccMD52Licencia_autorizacion (1).pdfLicencia_autorizacion (1).pdfapplication/pdf477777https://vitela.javerianacali.edu.co/bitstreams/272f1a3a-b637-4509-a873-f0278a1d2460/downloadca5e239483f0fa837c9371d1fb044e6aMD53TEXTTesisDoctoral_Nieto2021_Robust Video Trackers_PUJC_Compressed.pdf.txtTesisDoctoral_Nieto2021_Robust Video Trackers_PUJC_Compressed.pdf.txtExtracted texttext/plain100527https://vitela.javerianacali.edu.co/bitstreams/959fd467-ebb9-4245-8bf0-c2e94bebc6fe/download8922a1862e8393c0c95f4c5129a78afdMD512Licencia_autorizacion (1).pdf.txtLicencia_autorizacion (1).pdf.txtExtracted texttext/plain4899https://vitela.javerianacali.edu.co/bitstreams/ce7f41ad-3237-4c9a-9901-07483a3755da/downloade5aa5b5e0d4202cd95fcd730e34b6ef3MD514THUMBNAILTesisDoctoral_Nieto2021_Robust Video Trackers_PUJC_Compressed.pdf.jpgTesisDoctoral_Nieto2021_Robust Video Trackers_PUJC_Compressed.pdf.jpgGenerated Thumbnailimage/jpeg3592https://vitela.javerianacali.edu.co/bitstreams/1e636175-f498-4569-a5e4-cbd176371ab1/downloadd960583591fcd05c0b34ea55cf96d35fMD513Licencia_autorizacion (1).pdf.jpgLicencia_autorizacion (1).pdf.jpgGenerated Thumbnailimage/jpeg5321https://vitela.javerianacali.edu.co/bitstreams/8fbb6e51-6c30-41fc-b6c4-b1337e592765/download7a79ddbde2c7db572112bccf2a0dcfa3MD51511522/2047oai:vitela.javerianacali.edu.co:11522/20472024-06-25 05:13:47.017https://creativecommons.org/licenses/by-nc-nd/4.0/open.accesshttps://vitela.javerianacali.edu.coRepositorio Vitelavitela.mail@javerianacali.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |