Tesista: Dora Alicia Alvarez Medina
Titulo de la tesis: Modelo de conglomerado en bases de datos con alta dimensionalidad e identificacion de valores atipicos
Director de la tesis: Dr. Hugo H. Hidalgo Silva
Descripción de la tesis: Una de las tareas básicas de la minería de datos es encontrar el conocimiento inmerso en los datos. Existen diferentes tareas y aplicaciones, que dependen del objetivo a alcanzar con la minería. En nuestra investigación estamos trabajando con análisis de conglomerado de documentos (minería de texto). Y nos basamos en el modelo de Generación de mapas topográficos (GTM), que mapea los datos a una dimensión menor, este modelo se basa en una función de probabilidad de distribución, se apoya en un espacio latente para reducir la dimensión simulando a PCA. Una de nuestas propuestas es trabajar con una función de distribución que posea algunas características de robustez que sea capaz de identificar los valores atípicos (valores poco representativos de la muestra, que en ocasiones son considerados como ruido).
E-mail: dalvarez@cicese.mx
Sitio web: http://usuario.cicese.mx/~dalvarez/
3 Responses
pecesama
May 10th, 2005 at 2:27 am
1Que significa simular a PCA?
Doris
May 10th, 2005 at 4:18 am
2En ingles PCA es Principal Components Analisis (Análsis de componentes principales)
pecesama
May 13th, 2005 at 8:44 am
3Pero ¿en qué consiste esa simulación?
RSS feed for comments on this post · TrackBack URI
Leave a reply
Recomendados
Pecesama.Net [Wiki]
Meta
Publicidad
Calendario
Categorias