Ad verba per numeros

Segmentaci贸n en pasajes, Hojas de ruta
Monday, April 7, 2008, 05:06 PM
Una vez se han implementado los distintos estad铆sticos de ponderaci贸n que mencionaba en la entrada anterior deber铆ais disponer de un prototipo que recibe texto plano, lo separa en sentencias y frases y calcula el "peso" de cada n-grama.

Ahora habr铆a que construir para cada sentencia un vector formado por los n-gramas de dicha sentencia y sus correspondientes pesos. Tambi茅n ser谩n necesarios uno o m谩s m茅todos para comparar dichos vectores. Para realizar esta comparaci贸n deber茅is implementar las medidas de similitud que se describen entre las p谩ginas 63 y 67 de este documento.

Al finalizar esta tarea deber铆a ser posible calcular la similitud entre cualquier par de sentencias cualesquiera de un texto dado (un valor real comprendido entre 0 y 1).



Back Next