Menú

Un empleado de IBM ha comentado recientemente que, en los tres próximos años, la humanidad generará muchos más datos que en el todo el resto de su historia. Sea cierto o no, el caso es que noticias recientes, como el estudio de IDC que prevé que en 2007 el tráfico que se transmita en un día por Internet será equivalente a 64.000 bibliotecas del Congreso de Estados Unidos, provocan que dicha predicción no resulte extraña.

En este contexto, no resulta extraño la creciente popularidad de una nueva rama de la informática: el “data mining” o minería de datos. Estas técnicas intentan obtener patrones y tendencias interesantes en las acciones almacenadas en grandes bases de datos. Las utilidades de la minería de datos son variadas: desde marketing (a una tienda le puede interesar qué productos suelen venderse conjuntamente para hacer ofertas) hasta la detección de las declaraciones de renta con más posibilidades de ser fraudulentas.

También puede aplicarse a sitios web como el que usted lee, pudiendo ver qué tipo de noticias son las que más interesan, qué columnistas tienen más éxito o qué recorridos realizan nuestros visitantes más habitualmente. Se puede emplear directamente, pero lo habitual es acompañarlo de otra técnica denominada "data warehousing", que consiste en la copia de múltiples bases de datos heterogéneas de una organización, de modo que facilite las consultas y análisis de los “mineros”.

Tras los grandes desastres de la nueva economía, es posible que el uso masivo de la investigación de los datos sea el próximo grial de los informáticos. Necesitados andamos de ello.

Daniel Rodríguez Herrera es editor de Programación en castellano.

En Tecnociencia

    0
    comentarios