Adrian Holovaty fue uno de los pioneros de los mashups hiperlocales con su proyecto Chicago Crime Maps (designado por el New York Times como una de las mejores ideas de 2005) donde remezclaba las bases de datos públicas de la policía de Chicago sobre tipo, frecuencia y localización de crímenes en la ciudad con los mapas de Google Maps. Fue una de las primeras demostraciones del enorme valor de las bases de datos públicas cuando se utilizan inteligentemente generando visualizaciones que permiten a los ciudadanos obtener información detallada y precisa sobre su entorno urbano y comprender la dinámica socioeconómica de su entorno. Y por supuesto, este proceso se realiza “en Internet”, el entorno natural donde se gestiona la información hoy en día. Holovaty está trasladando ahora su experiencia a un nuevo proyecto y nueva compañía, EveryBlock, financiado por la Knight Foundation (y que el Sydney Morning Herald incluye entre las “10 cosas que cambiarán tu futuro”). EveryBlock será un sitio que agregará información y noticias locales de ciudades y promete que lo hará con una “gran profundidad”.
En Noviembre de 2007 Holovaty habló sobre como utilizar las bases de datos públicas utilizando la web 2.0 en la conferencia Making data webby que presentó dentro del Seminario de Visualización de Datos Aplicada a la Comunicación organizado en el MediaLab-Prado como parte del proyecto Visualizar. En esta charla explicó el enorme potencial que tiene el uso de bases de datos públicos y su explotación para buscar patrones de información utilizando herramientas de visualización. Este potencial se basa en dos conceptos básicos:
- Serendipia: descubrimientos deseables sucedidos por accidente. Diseñando el entorno de interacción entre datos y usuarios, necesariamente surgirán usos interesantes sin necesidad de planificarlos de modo estricto.
- Navegabilidad de los datos (“Data browseability”); algo que la gente desea y espera (“people want it, people expect it”) y que es imprescindible para lograr los “descubrimientos accidentales”.
Para lograr estos dos objetivos, la mitad de la batalla, en palabras de Holovaty, es conseguir datos estructurados. En este ámbito los periodistas y los medios cuentan con una enorme oportunidad dado que, en cierta forma, un periodista y un medio son básicamente recolectores de datos (”data collector”). Así, la principal ventaja competitiva de los medios reside en que recogen información, la verifican y se la proporcionan a la gente. La tragedia es que no han explotado las oportunidades que les proporciona esta actividad. En este sentido, Holovaty criticaba que el periodismo tradicional (trasladado a Internet) no use el hiperenlace para enriquecer las noticias con información complementaria relevante, como por ejemplo, enlazar una noticia de un delito con otras de delitos del mismo tipo o que han ocurrido en el mismo área geográfica. Para corregir estos problemas es necesario estructurar los datos, para lo que ofrece tres lecciones:
Lección 1: Estructura tus datos, incorpora metadatos, por que “everything has structure”. Por ejemplo, la razón del éxito de Flickr es la estructura que proporciona a “sus datos” (o sea las fotografías): quien hizo la fotografía, donde se hizo, con que cámara, donde, su tamaño, los colores...
Leción 2: Todos los datos tienen estructura. Ejemplos:
- delitos: donde, cuando, quien (el delicuente, el policia)…
- deportes, donde el periodismo ha puesto más esfuerzo en estructurar los datos.
- propiedad inmobiliaria: localización, precio, usos…
- obituarios: en las esquelas de los periódicos aparecen muchos “metadatos” (edad, causa, superviiventes, familia, …).
- bodas y nacimientos, que en muchos países y ciudades aparecen como breves noticias en la prensa local y suelen aparecer acompañados de metadatos similares a los de los fallecimientos.
Lección 3: Dale a tus datos “el tratamiento”. Esta sería la parte más sencilla, una vez estructurados los datos, para hacer los datos “webby”:
- Lista los campos de la base de datos.
- Identifica conceptos clave (selecciona los campos que aportan información relevante).
- Divide tus campos en intervalos, por ej., selecciona los intervalos de tiempo en que agregas tus datos o las unidades espaciales.
- Genera páginas web con listados para cada unidad o intervalo en que divides tus campos (en 3) e incluye enlaces permanentes para los conceptos (permiten referenciarlos en otros sitios, por ejemplo blogs) para generar dos propiedades: linkability y bookmarkability.
De este modo, los datos serán reutilizables de un modo sencillo y estandarizado por parte de otros usuarios (generando nuevos valores) y se optimizará su posicionamiento en los buscadores.