miércoles, abril 15, 2009

Google

La información sobre la que busca Google es sólo la punta del iceberg :

Buen análisis el realizado en el artículo “Exploring a ‘Deep Web’ That Google Can’t Grasp” del New York Times. Nos viene a decir que las actuales búsquedas de Google, a pesar del vasto repositorio sobre el que trabajan (hablan de 1,000,000,000,000 de páginas), son tan sólo una pizca de toda la información existente en Internet.
El problema radica en cómo responder adecuadamente todas las consultas que realizamos sobre la caja de búsqueda. Es éste quizá el gran reto de la web semántica, eso que ya denominan Web 3.0. Introducirse en formularios que atacan bases de datos, en imágenes que pueden almacenar texto y en vídeos que guardan voz. Múltiples fuentes de datos con lógica variable en torno a ellas que manualmente, caso a caso, quizá fuera posible tratar y procesar, pero que tratadas como un todo, son un problema de difícil solución y de casuística demasiado variada.
Por mi parte siempre he pensado que lo que más ayudaría a esta labor son los microformatos, esos estándares que vendrían a establecer reglas comunes de juego sobre las que construir nuevos servicios.
Sin embargo, parece que no todos los jugadores están por la labor. Los más interesados son los que desean poner capas por encima de los sitios concretos, los que buscan una abstracción común a todos ellos que permita tratar a aquéllos independientemente de cómo hayan decidido resolver el acceso a sus propios datos. Empresas como Google, que viven del contenido ajeno y que construyen sobre él su gran imperio. Pero a menudo los más reticentes son precisamente esos sitios concretos, que ven amenazada su posición con la creación de estándares y con esas opciones de comparación que no siempre les van a dejar bien parados.
Una interesante guerra está servida. ¿Quién la ganará?

No hay comentarios: