Modelo De Visualización De Documentos

0 Comentarios ».

Resumen del Libro



En los ultimos anos de modernidad se ha generado una revolucion en la digitalizacion de la informacion: datos numericos y documentos. La mineria de texto es una respuesta a la necesidad de manipular el texto adecuadamente. La visualizacion de datos es una herramienta de la mineria de texto que permite obtener una representacion grafica de la informacion en alta dimension. En este documento se presenta un modelo de separacion de documentos por clases (topicos) e identificacion de estructuras: conglomerados (cluster), sub-conglomerados y valores atipicos (VA- Outliers). Se definen los conceptos de ruido y VA en documentos, tambien se propone una clasificacion de VA basados en el tipo de palabras utilizadas (de proposito particular, general o compartidas). De los diferentes algoritmos de proyeccion de datos el de generacion de mapas topograficos (GTM) ha tomado gran importancia en el marco probabilistico. Se presentan dos algoritmos: uno para la proyeccion y visualizacion de documentos (VL-ZIP) y otro para la separacion de clases. El algoritmo VL-ZIP considera aplicar la funcion de distribucion inflacion de ceros con Poisson (ZIP) y un nuevo espacio latente.


Autores



Opciones de descarga:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.