FT
Herramientas tecnológicas
Por: Equipo DF
Publicado: Lunes 9 de mayo de 2011 a las 05:00 hrs.
La idea de amasar grandes cantidades de datos y escudriñarlos en busca de claves acerca de la conducta de los clientes no es nueva. El data mining ha sido usado hace tiempo por grandes empresas con acceso a suficiente poder de computación, como emisores de tarjetas de crédito y minoristas.
La caída en el costo de la tecnología y la generación de mucha más información digital ha abierto espacio a un grupo más amplio de empresas y hecho posible hacer juicios más informados sobre la conducta de los consumidores. Pero si “grandes datos” es de lo que se habla, una mejor descripción sería “datos desordenados”, dice Roger Ehrenberg de IA Ventures, un inversionista en etapas tempranas. Cosechar, limpiar y organizar datos duros de modo que puedan procesarse en gran parte de la batalla, dice.
Esto se ve más complicado por la expansión de datos no estructurados: información, como textos, que no están ordenados de un modo que un computador pueda procesar con facilidad. Con el volumen de texto y video generado por usuarios creciendo con rapidez, este se ha convertido en uno de los grandes focos del desarrollo tecnológico.
Entre las nuevas herramientas sobresale el procesamiento del lenguaje natural, que permite a un computador extraer significado de un texto, y aprendizaje de las máquinas, los bucles de retroalimentación contra los que las computadoras pueden probar sus conclusiones de grandes cantidades de datos con el fin de refinar progresivamente sus resultados.
El análisis de grandes conjuntos de datos también ha sido facilitado por dos de las fuerzas que han reformado la informática más en general: la expansión del hardware estandarizado, de bajo costo, y el surgimiento del software de código abierto. El auge del cloud computing (que centraliza el almacenamiento y capacidad de procesamiento en grandes centros de datos) también ha puesto los grandes datos al alcance de más empresas.