Dix fonctionnalités expérimentales à tester sur Snowflake

De l’accélération des requêtes à la réplication de comptes, voici dix fonctionnalités actuellement en bêta publique sur Snowflake.

Tables dynamiques, observabilité native, détection automatique des schémas de métadonnées… Autant de fonctionnalités sur lesquelles Snowflake est revenu cette semaine à l’occasion du Snowday 2022. Toutes en sont au stade de la bêta privée. D’autres, au contraire, sont en accès public. En voici dix, toutes ouvertes cette année.

Entrepôts plus grands

Option lancée en juin. Accessible à tous. Deux configurations : 5X-Large et 6X-Large. En disponibilité générale sur toutes les régions AWS et en avant-première sur les régions Azure. L’utilisation des crédits Snowflake double lorsqu’on passe à la taille d’entrepôt supérieure.

entrepôts plus grands

Service d’accélération des requêtes

Option lancée en mai. Accessible à partir de l’édition Enterprise. Elle fournit, pour les « grosses » requêtes, une capacité de débordement sur des ressources de calcul partagées. Commandes SQL prises en charge : SELECT, INSERT (avec instruction SELECT) et CREATE TABLE AS SELECT.

Entrepôts optimisés pour Snowpark

Option ouverte ce mois-ci. Accessible à tous. Avec elle, chaque nœud fournit 16 fois la quantité de mémoire et 10 fois la quantité de cache d’un entrepôt standard. Disponible pour le moment sur 9 régions AWS, 5 Azure et une Google Cloud (aux USA). Son lancement va de pair avec la disponibilité générale de Snowpark pour Python (en plus de Java et Scala).

crédits entrepôts optimisés

Type de données GEOMETRY

Ce type de données géospatiales, ouvert en août et accessible à tous, complète GEOGRAPHY. Ce dernier suit la norme WGS 84 et modélise la Terre comme si elle était une sphère parfaite. GEOMETRY représente quant à lui les caractéristiques dans un systèmes de coordonnées planes (euclidien, cartésien).

types de données géographiques

Réplication et basculement/restauration de compte

Option ouverte en août. Réplication des bases de données et des partages accessibles pour tous les comptes. Édition Business Critical ou supérieure requise pour la réplication d’autres objets et pour le basculement/la restauration automatiques. Toutes les régions AWS, Azure et Google Cloud la prennent en charge.

réplication

Connexion entre Snowpipe et Pub/Sub ou Azure Event Grid

Option ouverte en juin. Accessible à tous. Avec elle, Snowpipe (service d’alimentation de données en continu) peut envoyer des notifications d’erreur à ces deux services de messagerie cloud.
Pas de prise en charge inter-cloud pour le moment : Snowflake ne peut pousser des messages que vers le service fourni avec la plate-forme où il est hébergé (Google Cloud pour Pub/Sub, Azure pour Event Grid).

Traitement de données non structurées avec des UDF/UDTF Java

Ouvert depuis avril. Accessible à tous. Permet de lire et de traiter des données non structurées en zone de préparation. En utilisant soit des UDF (fonctions définies par l’utilisateur), soit des UDTF (fonctions de table définies par l’utilisateur).

Historique d’accès pour les colonnes

Option ouverte en octobre. Accessible à tous. Elle permet de visualiser, lors des opérations d’écriture, les flux de données entre les colonnes sources et de destination.

Procédures anonymes

Option ouverte en octobre. Accessible à tous. Elle utilise la commande SQL CALL pour créer et appeler ce type de procédures, similaire aux procédures stockées mais non conservées pour un usage ultérieur. L’exécution se fait avec les droits de l’appelant, le contexte de session et un accès aux variables et paramètres de session de l’appelant.

Diverses capacités pour le service d’optimisation de la recherche

Le service est accessible à partir de l’édition Enterprise. Parmi les derniers ajouts :

– Possibilité de définir les colonnes concernées dans une table
– Prise en charge des recherches impliquant sous-chaînes et expressions régulières (prédicats de type LIKE, CONTAINS, ENDSWITH…)
– Support des colonnes VARIANT, OBJECT et ARRAY (données semi-structurées), ainsi que des requêtes utilisant des fonctions géospatiales avec des objets GEOGRAPHY

Illustration principale © Snowflake