Google Refine 2.0, Herramienta para manejo de datos

Con la adquisición de Metaweb por parte de Google en julio de Freebase GridWorks, un proyecto de software de código abierto para la limpieza y mejora de los conjuntos de datos completa. Hoy estamos anunciando que el proyecto ha sido renombrado a Google Fefine y la versión 2.0 ya está disponible.

Refine Google es una herramienta de poder para trabajar con conjuntos de datos desordenados, incluyendo la limpieza de las incoherencias, transformándolas de un formato a otro, y se amplía con nuevos datos de los servicios web externos o de otras bases de datos. La versión 2.0 introduce una arquitectura de nuevas extensiones, un marco de reconciliación para vincular los registros de otras bases de datos (como Freebase), y un montón de comandos de transformación y expresiones nuevas.

Freebase GridWorks 1.0 ya ha sido bien recibida por el periodismo de datos y abrir los datos comunidades gobierno (se puede leer cómo el Chicago Tribune, ProPublica y data.gov.uk lo han utilizado) y estamos muy emocionados por lo que ellos y otros podrán que ver con esta nueva versión. Para obtener más información sobre lo que puede hacer con Google Filtrar 2.0, ver los screencasts siguientes:

The project is open source and its code and downloads are available here. Changes from version 1.1 to 2.0 are listed here.

Comentarios

Entradas populares de este blog

Los 5 vídeos más impresionantes de la semana #5

Enlaces rápidos (30-03-2010)