Análisis del proceso de minería de datos sobre la base de datos Bioinformática de segmentos de la proteína p53, asociada a la actividad cancerígena

Se estudió la utilización de estrategias para afrontar el problema del desbalanceo y la alta dimensionalidad de los registros que habitualmente forman parte de las bases de datos en el área bioinformática. Se tomó como caso de estudio la base de datos de segmentos de la proteína p53, sobre dicha bas...

Full description

Autores:
Tipo de recurso:
Article of investigation
Fecha de publicación:
2011
Institución:
Universidad Pedagógica y Tecnológica de Colombia
Repositorio:
RiUPTC: Repositorio Institucional UPTC
Idioma:
spa
OAI Identifier:
oai:repositorio.uptc.edu.co:001/14040
Acceso en línea:
https://revistas.uptc.edu.co/index.php/ingenieria/article/view/1417
https://repositorio.uptc.edu.co/handle/001/14040
Palabra clave:
Rights
License
http://purl.org/coar/access_right/c_abf269
Description
Summary:Se estudió la utilización de estrategias para afrontar el problema del desbalanceo y la alta dimensionalidad de los registros que habitualmente forman parte de las bases de datos en el área bioinformática. Se tomó como caso de estudio la base de datos de segmentos de la proteína p53, sobre dicha base se construyen modelos con el fin de identificar si corresponden a patrones activos o inactivos. El problema del desbalanceo se abordó a través de una red neuronal no supervisada, y el de la selección de variables para reducir la alta dimensionalidad, a partir de una combinación de métodos con diferentes enfoques. Experimentos preliminares del modelo propuesto en datos estándar muestran resultados promisorios.