Ad verba per numeros

Segmentación en pasajes, Hojas de ruta
Monday, April 7, 2008, 05:06 PM
Una vez se han implementado los distintos estadísticos de ponderación que mencionaba en la entrada anterior deberíais disponer de un prototipo que recibe texto plano, lo separa en sentencias y frases y calcula el "peso" de cada n-grama.

Ahora habría que construir para cada sentencia un vector formado por los n-gramas de dicha sentencia y sus correspondientes pesos. También serán necesarios uno o más métodos para comparar dichos vectores. Para realizar esta comparación deberéis implementar las medidas de similitud que se describen entre las páginas 63 y 67 de este documento.

Al finalizar esta tarea debería ser posible calcular la similitud entre cualquier par de sentencias cualesquiera de un texto dado (un valor real comprendido entre 0 y 1).



Back Next