Google_Refine_2

Google Refine 2.0 es una herramienta gratuita de Google que permite organizar y transformar datos, ya sea de la web o de las propias bases de datos. Muchas veces la informaciรณn con la que se trabaja (sobre todo en Internet) estรก desorganizada y resulta difรญยญcil encontrar la manera de recolocarla para que tenga sentido. Y ahรญยญ es donde entra la herramienta de Google Refine, que tiene capacidad de trabajar hasta con cientos de miles de lรญยญneas de informaciรณn (si el ordenador tiene la potencia suficiente).

La aplicaciรณn es una nueva versiรณn de una antigua herramienta llamada Freebase Gridworks de Metaworks, que Google comprรณ en julio pasado. Su principal funciรณn es la de organizar datos que no estรฉn bien estructurados. Por poner un ejemplo, en el video de explicaciรณn se toman en consideraciรณn diferentes contratos en los que conceptos similares tienen un nombre distinto (TYM, tiempo-y-materiales, tiempo y materialโ€ยฆ). Google Refine permite agrupar diferentes grupos de forma manual o por medio de filtros.

Google_Refine_1

La aplicaciรณn tambiรฉn posibilita encontrar incoherencias en los datos, algo muy รบtil en el caso de manejar cifras (los datos pueden estar escritos en medidas muy distintas). Por otro lado, tambiรฉn trabaja con datos โ€œlimpiosโ€ย, pero que deseamos organizar en un formato distinto, como listas o tablas. Una funciรณn que puede resultar muy รบtil se llama โ€œreconciliaciรณnโ€ย, y permite asociar palabras de nuestros datos con palabras clave dentro de otras bases de datos. De esta forma, se puede aรฑadir mรกs informaciรณn a nuestros datos.

En definitiva, una herramienta muy รบtil para aquellos que trabajan normalmente con datos de Internet y con bases de datos, asรญยญ como para los que quieran construir pรกginas web que contengan listas o informaciones complejas. Google Refine es una aplicaciรณn de escritorio que se puede descargar de manera gratuita.

Mรกs info: Google Refine