- Channel HP
- :
- Enterprise Business Blogs
- :
- Services
- :
- Blog Transformando las Tecnologias de Informacion | The HP Blog Hub
- :
- ¿Deberían los “grandes datos” residir en la nube?
- Suscribirse a un feed RSS
- Marcar como nuevo
- Marcar como leída
- Favorito
- Suscribir
- Enviar un correo electrónico a un amigo
- Página de impresión sencilla
- Informe de contenido inapropiado
¿Deberían los “grandes datos” residir en la nube?
¿Ha leído las predicciones sobre este año? Mientras que el año pasado todas eran sobre la nube, este año el tema de discusión número uno son los "grandes datos". Parece que el “cloud” ya es una noticia vieja para la mayoría de los analistas.
Definamos primero el término, para estar seguros de que lo que estamos hablando. De acuerdo con la Wikipedia, Big Data es un término aplicado a conjuntos de datos que superan la capacidad de las herramientas de software utilizadas comúnmente para ser capturados, gestionados y procesados en un tiempo razonable. Los tamaños de los grandes datos se encuentran constantemente en movimiento creciente, oscilando actualmente desde unas pocas docenas de terabytes hasta muchos petabytes de datos en un único conjunto. Algunos ejemplos incluyen registros web; RFID; redes de sensores; redes sociales; datos sociales (debido a la revolución de los datos sociales), texto y documentos de Internet; indexación de la búsqueda en Internet; registros de detalles de llamadas; astronomía, ciencia atmosférica, genómica, biogeoquímica, investigación biológica y otra investigación compleja y/o científica interdisciplinaria; vigilancia militar; registros médicos; archivos de fotografía; archivos de video y comercio electrónico a gran escala.
Administración de los datos
Bien, eso está claro. En realidad, el ‘universo digital’ del mundo agregó 1,8 Zettabytes en 2011 con un crecimiento exponencial continuo, y proyecta 8 zettabytes en 2015 y 35 Zettabytes en 2020 (a propósito, al preparar esta publicación, aprendí un término nuevo: zettabyte). El 70 por ciento de los datos es generado por las personas y el 85 por ciento consta de datos no estructurados. Llamamos a eso información humana. Cada segundo se agregan 97.000 tweets, cada minuto 12 millones de textos y cada día 294 millones de correos electrónicos.
¿Sabía que en la actualidad, un solo vuelo comercial a través de los EE.UU. genera 240 terabytes (TB) de datos de los sensores inalámbricos? El problema clave ya no es capturar los datos, sino almacenarlos. En un proyecto actualmente en curso, reunimos 1,35 TB en un experimento de 15 minutos con 1 millón de sensores inalámbricos. Con un enlace inalámbrico estable de 56MB, necesitamos alrededor de 42 horas para reunir y almacenar los datos, por lo que es necesario inventar nuevos mecanismos y enfoques de transferencia de datos. Es interesante observar que durante los últimos 10-15 años, hemos pasado de tener insuficientes datos para poder tomar decisiones a una sobrecarga completa. Ahora, a menudo no podemos tomar decisiones dado que no podemos diferenciar los datos relevantes del ruido.
Ya sea para la recuperación de desastres, para las copias de seguridad o para realizar análisis o cálculos con uso intensivo de computación, el tiempo y costo de almacenar los datos en la nube a menudo se olvida. Entonces, la primera pregunta que debe plantearse es si es necesario que los datos estén en la nube en primer lugar, o si no debe tomarse un enfoque híbrido, la integración de la cloud pública con recursos informáticos empresariales (ya sea una cloud privada o heredada). Veamos un ejemplo donde combinamos los datos de las redes sociales, ya en la nube, con la información empresarial.
Comprendiendo el comportamiento de su cliente
Si desea saber qué piensa el mundo sobre su producto, su marca, sus servicios, es mejor que dé un vistazo a los tweets, las entradas de blog y los foros. En el pasado, la gente se quejaba de lo malo que era un servicio en el bar local, hoy en día lo hace en Twitter. Ya no puede ignorar ese hecho si desea mantenerse competitivo.
Una encuesta que encomendamos entre ejecutivos senior de negocios y tecnología nos demostró que, en general, las empresas solo aprovechan el 5 por ciento de la información disponible, que el 48 por ciento no tiene una estrategia de información eficaz implementada y que solo el 2 por ciento puede entregar la información correcta en el momento correcto para respaldar los resultados empresariales el 100 por ciento de las veces.
Los datos de los medios sociales sobre los que hablé se encuentran en la nube, por definición. Pero, idealmente, las compañías desean correlacionar estos datos de forma cruzada con su propia información del cliente. En realidad, HPLabs hizo precisamente eso con su "Proyecto Fusión". Aprendió a predecir el comportamiento el cliente al fusionar los medios sociales con los datos de la empresa. Obviamente, a muchas compañías grandes no les interesa migrar todos los datos de sus clientes a la nube, por lo que es clave poder integrar los datos de múltiples fuentes en dicho análisis común.
El enfoque de HP
HP es consciente de la importancia de brindar la capacidad de buscar no solo a través de los datos estructurados, sino también de poder examinar la enorme cantidad de datos no estructurados. Al combinar la Plataforma analítica de Vertica concentrada en el análisis de los datos estructurados, con el enfoque de Computación basada en el significado de Autonomy, HP ahora le ofrece un entorno a través del cual puede entender realmente qué es lo que sucede. La combinación de múltiples fuentes de información le permite mantener los datos donde están aprovechando al máximo la información incorporada en ellos. Esto es lo que llamamos la Era de la Información Humana.
Entonces, los Big Data pueden tener aún una promoción exagerada, pero los datos están allí y las empresas deben tomar eso en cuenta. En la actualidad existen herramientas, como las que demostramos con el Proyecto Fusión, y hay mucho más por venir. Realmente queremos que considere esto porque puede darle una ventaja en los negocios. Y si no lo hace, su competidor podría hacerlo. Eso sería realmente una lástima, ¿no?
Haga click aquí para obtener más información





