Ad verba per numeros
Una vez se han implementado los distintos estad铆sticos de ponderaci贸n que mencionaba en la entrada anterior deber铆ais disponer de un prototipo que recibe texto plano, lo separa en sentencias y frases y calcula el "peso" de cada n-grama.Ahora habr铆a que construir para cada sentencia un vector formado por los n-gramas de dicha sentencia y sus correspondientes pesos. Tambi茅n ser谩n necesarios uno o m谩s m茅todos para comparar dichos vectores. Para realizar esta comparaci贸n deber茅is implementar las medidas de similitud que se describen entre las p谩ginas 63 y 67 de este documento.Al finalizar esta tarea deber铆a ser posible calcular la similitud entre cualquier par de sentencias cualesquiera de un texto dado (un valor real comprendido entre 0 y 1).
Back Next
Back Next