Datos no estructurados, ¿cómo y dónde gestionarlos?

Uno de los mayores retos a los que se enfrentan las organizaciones es el de obtener el control de los datos no estructurados. Sin dicho control no se puede asegurar ni el cumplimiento normativo ni la protección de los datos. De esto hablamos con César Cid de Rivera, vicepresidente de ingeniería de ventas de Región Internacional de Commvault.

César Cid 2

¿Qué son los datos no estructurados y por qué son importantes?

Los datos no estructurados no siguen ningún modelo de datos convencional, es decir, son datos que no tienen formatos estrictos que permitan almacenarlos y gestionarlos fácilmente en una base de datos. Mientras que los datos estructurados suelen ser generados por los sistemas, los datos no estructurados suelen ser creados por las personas, e incluyen desde documentos de Word y PowerPoints, hasta archivos de vídeo y publicaciones en redes sociales.

La gran mayoría de los nuevos datos son no estructurados: estudios de empresas como Gartner e IDC sugieren que la cifra se sitúa en torno al 80% de todos los nuevos datos empresariales. Pero, ¿por qué son tan valiosos estos datos? Sencillamente, por la información que contienen y por cómo pueden utilizarse en beneficio de la empresa. Cada nuevo activo que se crea o correo electrónico que se envía entra en la categoría de datos no estructurados, está contribuyendo al crecimiento y al éxito de la empresa (o si no lo está, ¡debería estarlo!).

¿Qué importancia tiene el almacenamiento de datos no estructurados?

Como los datos no estructurados no siguen un formato determinado, su almacenamiento puede ser un reto para las empresas. El almacenamiento de un archivo de vídeo ocupa mucho más espacio que el de un documento de texto corto, por ejemplo, y mantener organizados tantos tipos de datos diferentes puede causar dolores de cabeza. Muchos equipos de TI pueden caer en la trampa de no hacer un seguimiento de estos datos, que a menudo tienen un perfil de riesgo que las organizaciones no comprenden, así como lagunas de seguridad desconocidas, lo que convierte los datos no gestionados en un problema tanto en su nube como en su centro de almacenamiento de datos.

Además, las organizaciones se enfrentan al reto de los dark pools de datos, ya que los datos pueden crearse básicamente en cualquier sistema o almacenamiento, pero pueden moverse a través de los diferentes sistemas y almacenamientos disponibles para los usuarios finales, incluso de forma automática. Esto crea nuevos retos y riesgos, ya que los datos se separan de donde fueron creados originalmente, y eso puede suponer un problema, ya que el departamento de TI pierde el control sobre qué datos son y dónde deben residir.

¿De qué formas pueden almacenarse los datos no estructurados y cuál es la más recomendable?

La forma clásica es almacenarlos en on-prem. Al estar almacenados físicamente en una ubicación propiedad de la empresa, cualquier dato sensible o crítico nunca debería salir de la misma. Los empleados pueden acceder a los datos más fácilmente incluso cuando surgen problemas de Internet, y los ciberatacantes lo tienen más difícil para acceder a los datos frente a aquellos almacenados en la nube.

Sin embargo, cuando los datos se almacenan on-premise, es responsabilidad del equipo de TI gestionarlos y protegerlos. Esto incluye la realización de backup de todos estos datos, lo que puede ser un reto si no se cuenta con una solución de gestión de datos.

Además, los centros de datos on-premise construidos hace años e incluso décadas, se están ampliando a infraestructuras en la nube. Esto significa añadir más complejidad y retos adicionales en términos de dispersión de datos, ya que es incuestionable el valor que las aplicaciones y cargas de trabajo en la nube añaden al negocio. Las empresas están decididas a trasladar las cargas de trabajo a la nube, y esto contribuye a lo que llamamos la brecha de integridad empresarial. Esta brecha es la diferencia entre el punto en el que se encuentran las organizaciones y el punto en el que necesitan estar para cumplir los objetivos de transformación digital.

¿Entonces deberíamos almacenarlos en la nube?

La nube ha sido, sin duda, un salvavidas para las empresas desde la pandemia, ya que ha permitido a muchos empleados trabajar fuera del entorno tradicional de la oficina. Sin embargo, esto ha supuesto que los empleados puedan acceder a los datos desde fuera de la seguridad de la oficina, lo que hace que la protección de estos datos sea más difícil que nunca. A estas alturas, es bien sabido que el paso a la nube y la minimización de los riesgos son las principales prioridades de los CIO hoy en día. Con la evolución de las TI, cuando se añaden más tecnologías para satisfacer las nuevas demandas y necesidades, los datos también pueden estar ubicados en múltiples entornos, incluyendo el almacenamiento distribuido multicloud y remoto. Esto significa de nuevo riesgos adicionales y posibles pérdidas de datos debido a la fragmentación y a la falta de gestión de los datos no estructurados.

Para estos datos no estructurados, muchos de ellos necesarios para las operaciones empresariales, la nube es una buena opción de almacenamiento, ya que las empresas no necesitan espacio in situ para mantener servidores físicos. Las soluciones SaaS, en particular, permiten a las organizaciones utilizar sólo lo que necesitan, cuando lo necesitan, pero es vital recordar que los proveedores de SaaS sólo son responsables de la accesibilidad a los datos, no de su recuperación; aunque no es exactamente un aspecto negativo de la nube, es algo que las empresas deben tener en cuenta.

Con la adopción de la nube, también estamos viendo un aumento de los ciberataques, que afectan a un gran número de organizaciones y gobiernos. Esto crea retos adicionales, ya que las empresas deben utilizar seguridad de datos, acceso y controles coherentes en todo el entorno para evitar que aumente el riesgo de ataques de ransomware, fugas de datos, violaciones o accesos no autorizados.

¿Y los entornos híbridos?

El almacenamiento híbrido en la nube es una opción muy popular para las empresas que pasan de un entorno on-premise a adoptar las ventajas de la nube. La nube es ágil, flexible y escalable, y es importante que los almacenes de datos tradicionales on-premise puedan adaptarse con éxito a estos atributos.

Los datos nunca han sido tan valiosos como ahora, pero también son vulnerables debido a este valor, ya que los datos se han convertido en la nueva moneda de cambio. En Commvault cerramos la brecha de integridad empresarial descrita anteriormente. Nuestra Plataforma de Servicios Inteligentes de Datos permite a las organizaciones acelerar el crecimiento, ya que proporcionamos flexibilidad, libertad de elección y capacidades integradas para resolver los retos que los clientes están experimentando al ampliar sus capacidades a entornos híbridos, heterogéneos y multicloud.

Commvault ofrece una experiencia de cliente unificada para satisfacer las necesidades de negocio tanto en on-premise como en la nube, incluyendo la gestión y protección de datos, la seguridad, el cumplimiento y la gobernanza de los datos, la transformación y la visión de los datos, sin comprometer la arquitectura del cliente. Esto permite a los clientes elegir cuándo, cómo y qué datos deben trasladarse a la nube, entender dónde residen los datos y qué políticas de retención de datos deben aplicarse, reduciendo así los riesgos y los costes.



A fondo

WP metallic Metallic