Metodología de reducción de dimensión de tipo espectral con representación interactiva de datos

La reducción de dimensión (RD) es una metodología utilizada en muchos campos ligados al procesamiento de datos, y puede representar una etapa de preproceso o ser un elemento esencial para la representación y clasificación de datos. El objetivo principal de la RD es obtener una nueva representación d...

Full description

Autores:
Salazar Castro, José Alejandro
Tipo de recurso:
Fecha de publicación:
2018
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/63860
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/63860
http://bdigital.unal.edu.co/64456/
Palabra clave:
0 Generalidades / Computer science, information and general works
5 Ciencias naturales y matemáticas / Science
62 Ingeniería y operaciones afines / Engineering
Métodos espectrales de reducción de dimensión
Reducción de costo computacional
Representación interactiva de datos
Representación visual de información
Submatrices localmente lineales
Locally linear landmarks
Interactive dimensionality reduction
Reduction of computational cost
Spectral methods for dimensionality reduction
Visual representation of information
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_020e86a5109726ff3c115f134ac677bd
oai_identifier_str oai:repositorio.unal.edu.co:unal/63860
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
dc.title.spa.fl_str_mv Metodología de reducción de dimensión de tipo espectral con representación interactiva de datos
title Metodología de reducción de dimensión de tipo espectral con representación interactiva de datos
spellingShingle Metodología de reducción de dimensión de tipo espectral con representación interactiva de datos
0 Generalidades / Computer science, information and general works
5 Ciencias naturales y matemáticas / Science
62 Ingeniería y operaciones afines / Engineering
Métodos espectrales de reducción de dimensión
Reducción de costo computacional
Representación interactiva de datos
Representación visual de información
Submatrices localmente lineales
Locally linear landmarks
Interactive dimensionality reduction
Reduction of computational cost
Spectral methods for dimensionality reduction
Visual representation of information
title_short Metodología de reducción de dimensión de tipo espectral con representación interactiva de datos
title_full Metodología de reducción de dimensión de tipo espectral con representación interactiva de datos
title_fullStr Metodología de reducción de dimensión de tipo espectral con representación interactiva de datos
title_full_unstemmed Metodología de reducción de dimensión de tipo espectral con representación interactiva de datos
title_sort Metodología de reducción de dimensión de tipo espectral con representación interactiva de datos
dc.creator.fl_str_mv Salazar Castro, José Alejandro
dc.contributor.advisor.spa.fl_str_mv Castellanos Domínguez, César Germán (Thesis advisor)
Peluffo Ordóñez, Diego Hernán (Thesis advisor)
dc.contributor.author.spa.fl_str_mv Salazar Castro, José Alejandro
dc.subject.ddc.spa.fl_str_mv 0 Generalidades / Computer science, information and general works
5 Ciencias naturales y matemáticas / Science
62 Ingeniería y operaciones afines / Engineering
topic 0 Generalidades / Computer science, information and general works
5 Ciencias naturales y matemáticas / Science
62 Ingeniería y operaciones afines / Engineering
Métodos espectrales de reducción de dimensión
Reducción de costo computacional
Representación interactiva de datos
Representación visual de información
Submatrices localmente lineales
Locally linear landmarks
Interactive dimensionality reduction
Reduction of computational cost
Spectral methods for dimensionality reduction
Visual representation of information
dc.subject.proposal.spa.fl_str_mv Métodos espectrales de reducción de dimensión
Reducción de costo computacional
Representación interactiva de datos
Representación visual de información
Submatrices localmente lineales
Locally linear landmarks
Interactive dimensionality reduction
Reduction of computational cost
Spectral methods for dimensionality reduction
Visual representation of information
description La reducción de dimensión (RD) es una metodología utilizada en muchos campos ligados al procesamiento de datos, y puede representar una etapa de preproceso o ser un elemento esencial para la representación y clasificación de datos. El objetivo principal de la RD es obtener una nueva representación de los datos originales en un espacio de menor dimensión, de forma que se produzca información más depurada, reduzca el tiempo del procesado subsecuente o genere representaciones visuales inteligibles para el ser humano. Los métodos recientes y más sofisticados de RD exploran la topología de los datos, entre estos se encuentran los enfoques de tipo espectral. Particularmente, los métodos espectrales son altamente versátiles y han comprobado ser una buena alternativa para diversas aplicaciones. Estos métodos no permiten manipular directamente sus parámetros, y, por tanto, el usuario final queda sometido a las representaciones visuales resultantes, que en muchos de los casos requieren de un experto para su análisis, puesto que no se ajustan a las necesidades y los requerimiento del usuario. En este sentido, se genera implícitamente un incremento en tiempo y trabajo en la inspección visual, realizada como el último paso del análisis de datos. Una de las formas de generar representaciones más adecuadas para el usuario y que permiten deducir un mejor conocimiento es integrar la inteligencia natural del ser humano con la inteligencia de la máquina. Para esto, es necesario integrar propiedades de la visualización de información (VI), como la interactividad y la controlabilidad, de forma que el usuario tenga la facultad de variar los parámetros de los métodos de RD hasta obtener una representación que se adapte a sus necesidades. Los métodos espectrales requieren realizar un proceso de descomposición en valores y vectores propios, el cual suele presentar un costo computacional elevado, y, por tanto, resulta difícil la tarea de obtener una integración usuario-máquina más dinámica e interactiva. Por lo anterior, para el diseño de un sistema interactivo de VI basado en métodos espectrales de RD es necesario plantear una estrategia para disminuir el coste computacional requerido en el cálculo de los vectores y valores propios. En este trabajo de grado de maestría se propone una metodología de RD espectral con bajo costo computacional para la representación interactiva de datos. Para este fin, se propone utilizar submatrices localmente lineales como aproximación de una matriz de afinidad. Además, se propone un modelo interactivo que permita al usuario obtener una representación visual dinámica de los datos mediante una mezcla ponderada. Esto permite integrar la inteligencia natural con la computacional para la representación de datos de forma interactiva, dinámica y a bajo costo computacional
publishDate 2018
dc.date.issued.spa.fl_str_mv 2018
dc.date.accessioned.spa.fl_str_mv 2019-07-02T22:13:43Z
dc.date.available.spa.fl_str_mv 2019-07-02T22:13:43Z
dc.type.spa.fl_str_mv Trabajo de grado - Maestría
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TM
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/63860
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/64456/
url https://repositorio.unal.edu.co/handle/unal/63860
http://bdigital.unal.edu.co/64456/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Sede Manizales Facultad de Ingeniería y Arquitectura Departamento de Ingeniería Eléctrica, Electrónica y Computación Ingeniería Electrónica
Ingeniería Electrónica
dc.relation.references.spa.fl_str_mv Salazar Castro, José Alejandro (2018) Metodología de reducción de dimensión de tipo espectral con representación interactiva de datos. Maestría thesis, Universidad Nacional de Colombia - Sede Manizales.
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/63860/1/1127938442.2018.pdf
https://repositorio.unal.edu.co/bitstream/unal/63860/2/1127938442.2018.pdf.jpg
bitstream.checksum.fl_str_mv 08b087feb777865ad18497a7b52a8034
3c1f591bea931184214367e9fad1bd54
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1814090228691894272
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Castellanos Domínguez, César Germán (Thesis advisor)c792a029-43aa-4eb1-ac01-0b8ac24a537e-1Peluffo Ordóñez, Diego Hernán (Thesis advisor)9620abe1-e9f9-44f8-95d5-2e4223b151bd-1Salazar Castro, José Alejandro68195df6-864c-432f-a1f7-ba44f49f56af3002019-07-02T22:13:43Z2019-07-02T22:13:43Z2018https://repositorio.unal.edu.co/handle/unal/63860http://bdigital.unal.edu.co/64456/La reducción de dimensión (RD) es una metodología utilizada en muchos campos ligados al procesamiento de datos, y puede representar una etapa de preproceso o ser un elemento esencial para la representación y clasificación de datos. El objetivo principal de la RD es obtener una nueva representación de los datos originales en un espacio de menor dimensión, de forma que se produzca información más depurada, reduzca el tiempo del procesado subsecuente o genere representaciones visuales inteligibles para el ser humano. Los métodos recientes y más sofisticados de RD exploran la topología de los datos, entre estos se encuentran los enfoques de tipo espectral. Particularmente, los métodos espectrales son altamente versátiles y han comprobado ser una buena alternativa para diversas aplicaciones. Estos métodos no permiten manipular directamente sus parámetros, y, por tanto, el usuario final queda sometido a las representaciones visuales resultantes, que en muchos de los casos requieren de un experto para su análisis, puesto que no se ajustan a las necesidades y los requerimiento del usuario. En este sentido, se genera implícitamente un incremento en tiempo y trabajo en la inspección visual, realizada como el último paso del análisis de datos. Una de las formas de generar representaciones más adecuadas para el usuario y que permiten deducir un mejor conocimiento es integrar la inteligencia natural del ser humano con la inteligencia de la máquina. Para esto, es necesario integrar propiedades de la visualización de información (VI), como la interactividad y la controlabilidad, de forma que el usuario tenga la facultad de variar los parámetros de los métodos de RD hasta obtener una representación que se adapte a sus necesidades. Los métodos espectrales requieren realizar un proceso de descomposición en valores y vectores propios, el cual suele presentar un costo computacional elevado, y, por tanto, resulta difícil la tarea de obtener una integración usuario-máquina más dinámica e interactiva. Por lo anterior, para el diseño de un sistema interactivo de VI basado en métodos espectrales de RD es necesario plantear una estrategia para disminuir el coste computacional requerido en el cálculo de los vectores y valores propios. En este trabajo de grado de maestría se propone una metodología de RD espectral con bajo costo computacional para la representación interactiva de datos. Para este fin, se propone utilizar submatrices localmente lineales como aproximación de una matriz de afinidad. Además, se propone un modelo interactivo que permita al usuario obtener una representación visual dinámica de los datos mediante una mezcla ponderada. Esto permite integrar la inteligencia natural con la computacional para la representación de datos de forma interactiva, dinámica y a bajo costo computacionalAbstract: Dimensionality reduction (DR) is a methodology used in many fields linked to data processing, and may represent a preprocessing stage or be an essential element for the representation and classification of data. The main objective of DR is to obtain a new representation of the original data in a space of smaller dimension, such that more refined information is produced, as well as the time of the subsequent processing is decreased and/or visual representations more intelligible for human beings are generated. The recent and more sophisticated DR methods are those that explore the topology of the data, being the spectral approaches. In particular, the spectral methods are highly versatile and have proven to be a good alternative for various applications. In terms of information visualization (IV), DR methods have been widely used to generate visual representations generated by algorithms that work under pre-established criteria. These methods do not allow direct manipulation of their parameters, and, therefore, the end user is subject to the resulting visual representations, which in many cases require an expert for analysis. In this sense, an increase in time and work is implicitly generated in the visual inspection, in addition to the costs in the process of determining information useful to the user, which represents the ultimate goal of data processing. In addition, these representations do not conform to the needs and requirements of the user. To generate more appropriate representations for the user and that allows us to deduce a better knowledge is to integrate the natural intelligence of the human being with the intelligence of the machine. To this purpose, it is necessary to integrate properties of IV, such as interactivity and controllability, so that the user has the ability to vary the parameters of the DE methods until obtaining a representation that suits its needs. The spectral DR methods involve the calculation of an eigenvalue and eigenvector decomposition, which is usually high-computational-cost demanding, and, therefore, the task of obtaining a more dynamic and interactive user-machine integration is difficult. Therefore, for the design of an interactive IV system based on DR spectral methods, it is necessary to propose a strategy to reduce the computational cost required in the calculation of eigenvectors and eigenvalues. In this work, a methodology of spectral dimensionality reduction involving low-computational cost for the interactive representation of data is proposed. For this purpose, it is proposed to use locally linear submatrices and spectral embedding. This allows integrating natural intelligence with computational intelligence for the representation of data interactively, dynamically and at low computational cost. Additionally, an interactive model is proposed that allows the user to dynamically visualize the data through a weighted mixtureMaestríaapplication/pdfspaUniversidad Nacional de Colombia Sede Manizales Facultad de Ingeniería y Arquitectura Departamento de Ingeniería Eléctrica, Electrónica y Computación Ingeniería ElectrónicaIngeniería ElectrónicaSalazar Castro, José Alejandro (2018) Metodología de reducción de dimensión de tipo espectral con representación interactiva de datos. Maestría thesis, Universidad Nacional de Colombia - Sede Manizales.0 Generalidades / Computer science, information and general works5 Ciencias naturales y matemáticas / Science62 Ingeniería y operaciones afines / EngineeringMétodos espectrales de reducción de dimensiónReducción de costo computacionalRepresentación interactiva de datosRepresentación visual de informaciónSubmatrices localmente linealesLocally linear landmarksInteractive dimensionality reductionReduction of computational costSpectral methods for dimensionality reductionVisual representation of informationMetodología de reducción de dimensión de tipo espectral con representación interactiva de datosTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMORIGINAL1127938442.2018.pdfapplication/pdf41249102https://repositorio.unal.edu.co/bitstream/unal/63860/1/1127938442.2018.pdf08b087feb777865ad18497a7b52a8034MD51THUMBNAIL1127938442.2018.pdf.jpg1127938442.2018.pdf.jpgGenerated Thumbnailimage/jpeg4607https://repositorio.unal.edu.co/bitstream/unal/63860/2/1127938442.2018.pdf.jpg3c1f591bea931184214367e9fad1bd54MD52unal/63860oai:repositorio.unal.edu.co:unal/638602023-04-23 23:06:12.831Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co