Es una noticia antigua que los datos no estructurados están creciendo a un ritmo considerable en comparación con cualquier otro tipo de datos.
It’s what we all do now – create docs. Make a copy and change it. Scan files. Take pics. Video anything. Track everything. Then, make lots (and lots) of copies just in case we ever need that doc again.
No importa cómo sea la estructura de tu sistema de archivos, la gente tenderá a volcar los archivos donde sea conveniente, hacer copias, nuevas versiones, enviárselas por correo electrónico a los demás, hacer una nueva versión a partir de la enviada por correo electrónico, guardarla, retocarla y empezar de nuevo.
Esto no sólo ocurre dentro de un único sistema NAS local tradicional, sino en toda la empresa.
¿Cuántas veces crees que estás almacenando una versión del mismo archivo? ¿Haciendo una copia de seguridad? ¿Replicándolo a distancia? Las respuestas a estas preguntas suelen ser chocantes, al igual que el coste del simple almacenamiento de ese archivo.
Por ejemplo, una presentación de clientes en PowerPoint.
The original presentation weighs in at about 10MB in size. It’s an excellent presentation, so your entire sales team adopts it. Every time they present it to a prospective customer, they take a copy and amend some details.
Every time, that copy is 95% – 98% identical to the original (and all other copies). Perhaps the customer name and logo is swapped. Some pricing may vary. The requirements slide might be different.
Sin embargo, el resultado es una multitud de presentaciones muy, muy similares, todas ellas ocupando unos 10MB de espacio de almacenamiento.
The IT team backs them all up daily, and stores those backups. They make more copies to store offsite.
La estimación de IDC para 2020 del impacto de este tipo de réplicas es de 1:9. Es decir, un original por cada 9 réplicas.
Eso significa que tu presentación original de 10MB está ocupando efectivamente más de 100MB en el almacenamiento total.
Eso no sólo crea un problema de almacenamiento
Eso es caro, pero mucho más impactante es el problema de gestión de datos que crea.
Which file version are your people working from? How do you track that file’s evolution? How many versions have you ended up with? Is anyone using them any longer?
Do those files contain sensitive data that only a restricted group of users should access? If so, how do you manage that, and what happens if files get moved to a directory with more open permissions?
The stats show that 90% of unstructured data goes completely unused after a year. And yet, this data must have been important – often critically so – to your company at some point.
Más allá del almacenamiento de datos, el valor de los mismos
People will behave as people do – they’ll create and save files anywhere and everywhere. You won’t stop that, and neither will we.
Pero podemos permitirle domar sus datos... para detener la replicación fuera de control y la multitud de versiones de archivos que le dan tanto dolor de cabeza en la gestión de datos.
CloudFS can globally de-duplicate so that across all of your sites, you aren’t storing the same file, or version thereof, over and over and over again. If you’re running that 1:9 ratio, there’s a storage savings of around 90%.
Como CloudFS es inmutable, no tienes que hacer una copia de seguridad de tus datos. Y si utilizas un almacén de objetos que se replica en 3 sentidos (piensa en AWS S3, Google GCS, Azure BLOB), entonces no necesitas replicarlo de forma remota.
Pero te damos la opción de hacer una "réplica en la nube" en caso de que no confíes en que mantengan tus datos disponibles siempre que los necesites.
Con los datos más controlados, hablemos de arrear a los usuarios.
Localizabilidad
Using the bat365 Data Services data management platform, you can search across CloudFS and any third party SMB or NFS system. Data Services search allows you to find files, and in the case of the third party system, see how many times you are storing them, how old they are and when they were last accessed.
Visibilidad
Data ServicesLa función de auditoría de CloudFS va mucho más allá de la búsqueda, ya que permite a los administradores ver las acciones de acceso, copia y movimiento, entre otras.
Piense en un caso de uso relacionado con el RGPD: ¿qué tan doloroso sería si le descubrieran copiando datos PII fuera de la EMEA a los Estados Unidos?
Data Services puede alertar al administrador, crear una pista de auditoría de quién miró el archivo, lo copió o lo movió.
Armado con esta información, puede autodenunciarse y demostrar que, aunque se ha producido una infracción técnica, no se ha producido ningún daño y esta filtración de datos no ha infringido el espíritu de la ley.
Dependiendo de su ubicación y de su industria, hay una serie de casos de uso para un registro de auditoría sustancial para la seguridad, la regulación, la retención legal, y muchos otros.
Alerta temprana
Ninguna solución de gestión de datos estaría completa sin utilizar su capacidad para rastrear las acciones de los archivos en tiempo real y reconocer comportamientos anómalos.
CloudFS es inmune al ransomware, por lo que el sistema de archivos en sí mismo no puede verse afectado... pero un aviso temprano de la actividad del ransomware puede ahorrar un valioso tiempo dedicado a identificar los archivos afectados y a recuperarlos utilizando instantáneas.
No pierdas de vista este espacio: Data Services tiene nuevas y emocionantes habilidades que llegarán muy pronto.
El almacenamiento se detiene en el espacio. La gestión de datos aporta valor.
Cuando el foco está en el almacenamiento de datos, no puede estar en el valor de los mismos. La rentabilidad del almacenamiento está ligada a la conservación de los volúmenes de datos, que es el mismo reto con el que luchan todas las organizaciones del planeta.
Con el increíble y continuo crecimiento de los datos no estructurados, nunca habrá suficiente espacio de almacenamiento, sólo decisiones difíciles sobre qué datos conservar y durante cuánto tiempo.
Cambiar el enfoque del almacenamiento de datos a la gestión de los mismos significa ampliar la lente para proteger y obtener valor de un activo, en lugar de consumir una mercancía y decidir qué datos son los que se pueden utilizar.
Esto, a su vez, le impulsa a encontrar formas de controlar el crecimiento innecesario de los datos, hacer que sea rápido y fácil encontrar todo lo que usted y su equipo necesitan, detectar y responder a las amenazas, observar cómo su gente utiliza sus datos y utilizar esas observaciones para desarrollar flujos de trabajo que predigan dónde se necesitarán los datos, y por quién, lograr el cumplimiento de la normativa e impulsar entornos de alto rendimiento potenciando la colaboración donde funciona.