Ad verba per numeros

Doctorado y máster, Investigación
Tuesday, September 18, 2007, 12:20 PM
Una de mis costumbres cuando imparto una asignatura o algún tipo de curso es hacer proselitismo, o como yo lo llamo "atraer al lado oscuro"; es decir, hacer ver a algunos de los alumnos que las líneas de investigación a las que me dedico son interesantes y convercerlos de que se "unan a la causa" de algún modo.

A raíz de esta actividad algunos de vosotros estáis metidos en mayor o menor medida en tareas investigadoras que, en sus fases iniciales, requieren estudiar el arte previo para lo cual es necesario buscar y "cribar" bibliografía.

A lo largo de las próximas semanas (o meses) intentaré plasmar por escrito algunas ideas y/o consejos fruto de la experiencia a este respecto. Hoy voy tan sólo a señalar algunas herramientas que, a mi modo de ver, son imprescindibles o muy útiles y esbozar algunas opiniones relativas al material bibliográfico.

En cuanto a las herramientas:

  • CiteSeer: Un buscador de artículos científicos; lleva mucho tiempo en funcionamiento aunque desde que apareció Google Scholar lo uso algo menos. La ventaja fundamental frente a Scholar radica en que cualquiera puede enviar una URL que pasará a ser indexada y, en consecuencia, los artículos disponibles pasarán al índice. Desventajas: en ocasiones no responde bien, las citas recibidas por los artículos están desactualizadas en muchos casos, muchos artículos de un autor no están indexados aun cuando estén disponibles en la Web, etc.
  • Google Scholar: A día de hoy mi favorito, indexa la mayoría de editoriales y ofrece varios enlaces por artículo de tal manera que, en la mayor parte de los casos, es posible localizar una versión libre; las citas recibidas están mucho más actualizadas y permite explorar mediante las mismas o buscar artículos relacionados. Aún así, hay ocasiones en las que existiendo una versión libre del artículo en la Web no figura en Scholar; para esos casos siempre se puede usar el "sabor clásico" de Google.
  • dblp: Un índice bibliográfico monotemático sobre informática, indexa la práctica totalidad de conferencias y revistas, si algo no aparece aquí puede decirse que no existe. En general siempre es posible encontrar un enlace al artículo pero, casi siempre, será de pago; para tratar de localizar versiones libres deberá recurrirse a Scholar, CiteSeer o Google.
  • ACL anthology: Base de datos de la Association for Computational Linguistics; artículos sobre lingüística computacional, procesamiento de lenguaje natural y temas afines.
  • arXiv: Una base de datos de preprints, esto es, artículos que aún no han aparecido en revista; no sólo contiene referencias sobre informática sino también sobre física, biología y otras materias. No todo lo que aparece es relevante pero algunos trabajos importantes sólo han sido publicados aquí, por ejemplo los artículos de Perelman relativos a la conjetura de Poincaré.
  • Cogprints: Similar a arXiv, también se ocupa de algunas áreas de la informática; lo he utilizado bastante menos.
  • The Collection of Computer Science Bibliographies: Me avergüenza decirlo pero acabo de saber de su existencia :(. Según sus estadísticas supera los 3 millones de artículos indexados así que parece un buen sitio donde consultar; por lo que he visto también ofrece enlaces a los artículos y, como de costumbre, si el artículo no es gratuito siempre puede buscarse en Google :)
  • Zotero: Ya he hablado de esta herramienta en una entrada anterior.
  • Buscadores de patentes: En muchas ocasiones información importante no está disponible en un artículo sino en una patente (obviamente, de EE.UU.) Recomiendo utilizar tres recursos fundamentalmente: el buscador original, el buscador de Google (que por alguna razón no encuentra todas las patentes relevantes) y un buscador específico (que, por curioso que parezca, encuentra más patentes relativas a un término que el propio servicio de patentes). ¡Atención! Es preciso saber que se pueden buscar patentes concedidas y solicitadas; a efectos "científicos" (que no comerciales) ambas nos son igualmente útiles.
Por el momento creo que ya es un número adecuado de recursos y va siendo hora de dar una primera opinión personal...

He mencionado en varios sitios la existencia de artículos libres y de pago. Por libres entiendo aquellos que se pueden obtener gratuitamente con independencia de que el origen sea la página personal del autor o exista una copia en una institución que lo ofrece de este modo; por artículos de pago entiendo aquellos que sólo se pueden descargar de sitios que requieren suscripción o pay-per-view. Ejemplos de estos últimos serían la ACM Digital Library, la versión equivalente de la IEEE Computer Society o sitios como ScienceDirect, Emerald o SpringerLink.

La cuestión es ¿qué hacer si un artículo sólo está disponible en versión de pago? Mi opinión es que, a no ser que tras leer el abstract y las referencias que otros autores hacen al mismo parezca que dicho artículo afecta de una manera profunda a nuestro trabajo, no merece la pena hacer el gasto. ¿En qué me baso para decir esto? Mi disertación tiene, aproximadamente, 400 referencias, salvo 4 o 5 libros todo son artículos, tuve que pagar por 1; es decir, tuve que hacer un gasto por el 0,25% de mis fuentes. ¿Mereció la pena? No me arrepiento: tan sólo fue una falsa alarma.

Pero al utilizar sólo artículos gratuitos ¿no estaremos acudiendo a material de "inferior calidad"? En mi opinión todo lo contrario, un buen artículo termina por estar disponible, creo que el propio autor es el primer interesado en, pasado un tiempo de "cortesía" con la editorial, hacer público su trabajo. A este respecto puede resultar interesante leer el artículo
Online or invisible
de Steve Lawrence.

¿Y qué sucede con los libros? Hablaré de ello en el futuro, por el momento basta con recordar el siguiente conjuro: "absysNET Opac REBIUN".



Back