Sala de Prensa

Las 10 razones por las que debe considerar Snowflake como su solución al almacenamiento de datos


Marzo 2022

¿Por qué Snowflake es el favorito en almacenamiento de datos en la nube?

Snowflake, al estar diseñado específicamente para la nube de datos, proporciona un almacenamiento de datos ilimitado, entregado como un servicio SaaS y en los tres principales proveedores de la nube: AWS, Azure y Google.

¿Cuáles son las razones principales por las que es diferente?

1. Arquitectura multicluster

La arquitectura de Snowflake consta de tres capas principales:

Almacenamiento

La elasticidad innata del almacenamiento en la nube significa que los datos se pueden almacenar, cifrar y comprimir de forma independiente.

Procesamiento

También llamados «Almacenes virtuales», estos pueden cargar datos simultáneamente y ejecutar consultas.

Servicios

Esta capa une los diferentes componentes de Snowflake y realiza las funciones solicitadas por el usuario. La capa de servicio en la nube se ejecuta en instancias de proceso de Snowflake.

Estas tres capas están diseñadas para ser escalables de forma independiente ya que están totalmente desacopladas. En otras palabras, los usuarios pueden escalar o asignar recursos a capas independientes y en función de la demanda, y posteriormente volver a la situación inicial una vez haya satisfecho dicha demanda. Este nivel de elasticidad «infinita» independiente y se puede realizar en caliente sin tener que parar el servicio, es lo que caracteriza a Snowflake y la hace diferente del resto de soluciones.

2. Almacenamiento en las 3 nubes principales

A diferencia de otras soluciones de almacenamiento de datos, Snowflake es compatible de forma exclusiva con Amazon Web Services, Microsoft Azure y Google Cloud Platform. Esto brinda a los profesionales de TI la máxima flexibilidad dentro de sus organizaciones para implementar la plataforma en la nube que mejor le convenga. Aún más importante, Snowflake ofrece una escalabilidad perfecta en las tres plataformas y es totalmente agnóstica, lo que significa que, independientemente de la nube en la que se encuentre su experiencia de usuario no cambia, va a ser similar.

3. Clonación

La tecnología de almacenamiento de datos única «Zero Copy» o clonación de Snowflake le permite copiar bases de datos masivas rápidamente. Cuando se realiza una copia, Snowflake crea un puntero a los datos de origen, capturando solo los cambios en esa base de datos recién copiada y no copiando la base de datos en su totalidad. Este método de clonación es rápido, rentable y ofrece beneficios masivos para escenarios de DevOps.

Por ejemplo, los problemas que se ven en producción se pueden reproducir rápidamente en un entorno de desarrollo o prueba simplemente copiando la base de datos de producción en una nueva base de datos. Gracias a la clonación, el proceso es casi instantáneo e incurre en casi ningún coste adicional por la copia de esa base de datos, sin importar el tamaño.

La función de clonación de Snowflake también es útil para crear entornos de desarrollo y pruebas como paso previo a su puesta en producción.

Además, ¡la copia no utiliza ningún espacio de almacenamiento en la nube adicional!

4. Time Travel

Puede realizar consultas a pasado, lo que es útil para solucionar problemas de carga de datos y para recuperar tablas o datos caídos accidentalmente.

¡Es como tener un botón “Deshacer” para tu base de datos en cualquier momento!

Puede almacenar hasta 90 días de cambios en los datos históricos. La cantidad de tiempo que almacena afecta sus costos de almacenamiento, por lo que si tiene tablas que cambian constantemente, es posible que no desee retener los datos durante tanto tiempo.

5. Cifrado de Datos

Snowflake almacena todos los datos cifrados automáticamente utilizando un cifrado fuerte AES 256 de extremo a extremo como método para proteger los datos y así evitar que éstos sean leidos por terceros estén o no en reposo. Es un buen mecanismo para minimizar ataques y así estar seguro de que sus datos están protegidos en todo momento.

6. Compresión

Cuando los datos se cargan en Snowflake, Snowflake reorganiza esos datos en su formato interno optimizado, comprimido y en columnas.

Las columnas se comprimen individualmente dentro de microparticiones y esto lo determina automáticamente mediante mecanismos de compresión de forma muy eficiente.

La ratio de compresión puede variar entre 3:1 hasta 10:1, y los costes de almacenamiento son calculados en base a los datos comprimidos por lo que el ahorro está garantizado.

7. Seguridad Integrada

La seguridad se integró en Snowflake Cloud Data desde el primer momento. Cuenta con numerosas funciones de seguridad que forman parte del núcleo de Snowflake, lo que te permite centrarte en analizar tus datos, no en protegerlos.

La seguridad está garantizada a todos los niveles: Acceso (comunicaciones), autenticación (usuarios), aplicaciones (basada en roles), encriptación, infraestructuras y en cumplimento con los controles operacionales gubernamentales más exigentes (NIST 800-53, SOC2, HIPAA, PCI, FedRAMP, …).

8. Carga de datos Semiestructurados

Al igual que muchos data lakes modernos, Snowflake ofrece la capacidad de extraer datos semiestructurados en tablas de bases de datos. Algunos ejemplos que se benefician de esta capacidad incluyen datos con esquemas en constante cambio o inconsistentes. Snowflake le permite extraer estos datos en una columna VARIANT y, a continuación, proporciona extensiones de nivel SQL para consultar esos datos de forma limpia y eficiente en vistas estructuradas. Los tipos de datos que se pueden cargar de forma nativa son Json, avro y parquet.

9. SaaS con administración minimizada

Snowflake no requiere de configuración hardware ni software, de tal forma que le permite simplemente cargar, compartir y consultar datos de forma inmediata. A diferencia de las bases de datos tradicionales, con el servicio Snowflake no hay necesidad de administrar actualizaciones, particiones, índices, copias de seguridad y demás tareas de administración.

Además, es un verdadero pago por uso: por un lado, el almacenamiento basado en el consumo y por otro, los costes de cómputo le permiten ajustar el coste total del servicio al segundo.

10. ANSI-SQL

Es una plataforma de datos ANSI-SQL como lenguaje estándar SQL que es se puede acceder a todos los sistemas de gestión de bases de datos (SGBD) relacionales comerciales. Al hilo de esta característica conviene destacar que:

  • Soporta UDF y UDAFs de Javascritp de forma sencilla.
  • Puede optimizar el plan de ejecución de una consulta mediante su interfaz.
  • Puede revisar el historial de cada consulta ejecutada hasta pasados los 14 días de su ejecución.

Conclusión

Estas características principales junto con su alta versatilidad y la simplicidad de su naturaleza convierten a Snowflake en una gran propuesta de valor, al tiempo que ayudan a diferenciarlo de otras soluciones.

Snowflake ofrece flexibilidad y escalabilidad a todos sus clientes, desde grandes organizaciones que buscan escalabilidad efectiva hasta startups más pequeñas que tienen presupuestos restringidos, pero no pueden comprometer las capacidades de almacenamiento de datos en la nube de calidad.

Y si está revisando las opciones para una base de datos de análisis, vale la pena echarle un vistazo a Snowflake ya que podría ser su respuesta a la sólida base de arquitectura de datos requerida para un análisis exitoso.

Por tanto, podemos afirmar que Snowflake es una solución para todos y para todo tipo de analíticas.