Ad verba per numeros

Artículos
Thursday, February 28, 2008, 09:21 AM
Hablaba el otro día del problema de la expansión de consultas y de otro simétrico: la similitud de consultas que, tal vez, no contengan ningún término en común.

En una línea similar se mueven estos artículos aunque en este caso se pone énfasis en la aplicación de técnicas de clustering a los logs de consultas.

Beeferman, D., and A. Berger. 2000. Agglomerative clustering of a search engine query log. Proceedings of the sixth ACM SIGKDD international conference on Knowledge discovery and data mining 407-416.

Baeza-Yates, R., C. Hurtado, and M. Mendoza. 2004. Query recommendation using query logs in search engines.

Chien, S., and N. Immorlica. 2005. Semantic similarity between search engine queries using temporal correlation. Proceedings of the 14th international conference on World Wide Web 2-11.

Fonseca, B. M., P. B. Golgher, E. S. de Moura, and N. Ziviani. 2003. Using association rules to discover search engines related queries. Web Congress, 2003. Proceedings. First Latin American 66-71.

Wen, J. R., J. Y. Nie, and H. J. Zhang. 2001. Clustering user queries of a search engine. Proceedings of the tenth international conference on World Wide Web 162-168.

Wen, J. R., J. Y. Nie, and H. J. Zhang. 2002. Query clustering using user logs. ACM Transactions on Information Systems 20, no. 1:59-81.

Para una introducción relativamente corta pero exhaustiva de las distintas técnicas de clustering y su aplicación en la Web es más que recomendable el capítulo cuarto de "Mining the Web: Discovering Knowledge from Hypertext Data" (Chakrabarti 2003).



Back Next