Tesista: Dora Alicia Alvarez Medina

Titulo de la tesis: Modelo de conglomerado en bases de datos con alta dimensionalidad e identificacion de valores atipicos

Director de la tesis: Dr. Hugo H. Hidalgo Silva

Descripción de la tesis: Una de las tareas básicas de la minería de datos es encontrar el conocimiento inmerso en los datos. Existen diferentes tareas y aplicaciones, que dependen del objetivo a alcanzar con la minería. En nuestra investigación estamos trabajando con análisis de conglomerado de documentos (minería de texto). Y nos basamos en el modelo de Generación de mapas topográficos (GTM), que mapea los datos a una dimensión menor, este modelo se basa en una función de probabilidad de distribución, se apoya en un espacio latente para reducir la dimensión simulando a PCA. Una de nuestas propuestas es trabajar con una función de distribución que posea algunas características de robustez que sea capaz de identificar los valores atípicos (valores poco representativos de la muestra, que en ocasiones son considerados como ruido).

E-mail: dalvarez@cicese.mx

Sitio web: http://usuario.cicese.mx/~dalvarez/