Varios proyectos recientes que muestran información estadística sobre las plataformas sociales.
Entre ellos p.ej. http://simplymeasured.com/ . A partir de Tweets, amigos, etc…. estas webs ofrecen Dashboards para dar información acerca del éxito y el seguimiento de tus campañas en redes sociales.
No hay productos similares para la web abierta. La naturaleza de la información que se muestra en la web pública, respecto a las redes sociales, es de distinta naturaleza, y además el punto en el que se encuentra la información, pasa de concentrado en el caso de las redes sociales, a disperso en el caso de la web.
Para cualquier proyecto basado en la web abierta, un primer paso sería obtener una base de datos con el contenido de las webs, para a partir de criterios estadísticos poder clasificar.
No he encontrado ningún servicio en la web que ofrezca la posibilidad de acceso a contenido categorizado de la web.
En cambio, los principales motores de búsqueda, ofrecen Apis o servicios que permiten realizar búsquedas sobre su base de datos (como si lo realizaras como un usuario a través de la caja de texto del buscador):
Google:
Limita el número de peticiones que se hace desde una IP a través del uso de un Captcha, cuando las peticiones se realizan a través de Query URL con el formato : http://www.google.es/search?q=datos-a-buscar
Pues bien Google, hasta finales de 2010, disponía de un servicio de pago que permitía poder realizar un mayor volumen de queries. Este servicio ha sido suprimido y substituido por búsquedas sobre páginas determinadas.
Yahoo:
A través de su Proyecto BOSS (Build your Own Search Service), facilita también en versión de pago, un volumen de consultas de búsqueda.
Bing:
En cambio, el servicio de Microsoft BING, ofrece servicios de búsqueda API de forma gratuita. En este sentido Bing aún no tiene una posición suficientemente afianzada y por eso aún ofrece este tipo de servicio.
Como conclusión: es difícil ofrecer servicios estadísticos en la web abierta por la gran dispersión de contenidos. La web semántica parece que tiene que empezar a ofrecer conocimiento agregado a partir de la información dispersa. Proyectos como Wolphram Alpha intentan obtener conocimiento de la información no estructurada presente en la web abierta. En cambio el entorno de las redes sociales, permiten que en un único lugar puedas acceder a toda la información que debe de ser tratada para obtener conocimiento estadístico.