Guide pratique : comment bien choisir son Data Warehouse ?

Vous songez à changer de data warehouse ou à en acquérir un pour la première fois ? Ce petit guide vous aidera à évaluer les différentes options qui s’offrent à vous :  différences entre cloud et on-premise, astuces, questions à poser aux fournisseurs… Vous aurez toutes les clés en mains pour faire le bon choix.    

Avez-vous besoin d’un data warehouse ?   

Pour savoir si vous avez besoin d’un data warehouse, il convient tout d’abord d’en donner la définition. 

Un data warehouse (aussi appelé entrepôt de données) est une plateforme de gestion des données qui regroupe des données structurées issues de plusieurs sources dans un référentiel unique. Cela permet de centraliser toutes les données d’une entreprise afin d’effectuer des analyses de données dans le cadre d’une stratégie de Business Intelligence.   

Contrairement au data Lake, les data warehouses nécessitent des données structurées. Par conséquent, les données brutes qu’ils reçoivent doivent être filtrées, mises en forme et structurées, via un processus appelé ETL (Extract, Transform and Load) avant de pouvoir être stockées.   

Cette définition ne vous permet pas de déterminer si vous avez besoin d’un data warehouse ? Dans ce cas, demandez-vous :   

  • S’il y a des incohérences dans les données et les rapports de l’entreprise 
  • Si vous rencontrez des difficultés pour partager les données    
  • Si vous rencontrez des difficultés pour partager les données    

Si vous avez répondu « Oui » aux trois questions, un data warehouse est certainement ce qu’il vous faut. 

Parce qu’il permet d’agréger des données provenant de plusieurs sources, le data warehouse facilite l’analyse et la prise de décision data-driven. Et puisqu’un data warehouse standardise et stocke toutes les données de votre organisation sous un même format – la fameuse « single source of truth » – les utilisateurs finaux bénéficient d’une amélioration de la qualité et de la cohérence des données. Cela permet également un accès plus rapide aux données – un avantage lorsqu’il s’agit de traiter des problèmes urgents ainsi que pour transformer plus rapidement les données brutes en rapports et tableaux de bord exploitables par les différents départements de l’entreprise. 

Bien sûr, tous les data warehouses ne fonctionnent pas de la même manière, et mis à part des fonctionnalités critiques telles que le stockage de données, le choix du bon data warehouse dépend de plusieurs facteurs comme : ce que vous devez faire avec vos données, votre budget, et la taille de votre entreprise.    

Différentes architectures pour une solution sur mesure   

Lors de vos recherches, vous tomberez certainement sur les expressions suivantes : 

L’EDW (enterprise data warehouse ou data warehouse) est un entrepôt de données centralisé dont l’objectif est de faciliter la prise de décision au sein de l’entreprise grâce à des données organisées, unifiées et classées par sujets. 
    
Un data mart, parfois traduit par “magasin de données” est un sous-élément du data warehouse utilisé pour le reporting et l’analyse d’un secteur d’activité ou d’un département. Orienté sujet, ce modèle agrège les données d’un nombre limité de sources pour un domaine d’activité spécifique, tel que les ventes ou la finance.    

Un virtual warehouse (entrepôt virtuel), est quant à lui un ensemble de bases de données distinctes qui peuvent être interrogées ensemble, de sorte que les utilisateurs peuvent accéder à toutes les données comme si elles étaient stockées ensemble, dans un data warehouse, et cela indépendamment de leur format ou de l’emplacement réel.   

Data warehouse : cloud ou on-premise ?

Lors de l’achat d’un data warehouse, l’une des premières questions à laquelle vous devrez répondre sera : cloud ou on-premise ? Chacun a ses propres avantages et inconvénients, et la solution idéale dépend de vos besoins.   

Le data warehouse on-premise   

Ce type de data warehouse est hébergé par l’entreprise, sur ses propres infrastructures.  En raison du volume élevé de données à agréger et à organiser, cela nécessite généralement des ressources humaines et financières importantes pour le déploiement et le maintien du data warehouse.   

Le service informatique peut toutefois préférer cette option car elle lui donne un contrôle total sur l’ensemble du data warehouse, bien qu’en fonction du matériel et des logiciels utilisés par l’entreprise, une aide extérieure ponctuelle peut être nécessaire.   

Cette option est de moins en moins populaire aujourd’hui. D’après une étude Gartner, 75 % de toutes les bases de données des entreprises seront dans le cloud d’ici 2023, et cette tendance se confirme sur le marché des data warehouses. Si les solutions on-premise satisfont encore les entreprises déjà équipées, elles se tournent massivement vers le cloud pour le renouvellement ou le premier équipement. 

Data Warehouse Cloud 

Grâce à leur flexibilité et à leur rapport qualité-prix supérieure aux data warehouses on-premise, les data warehouses cloud sont devenus l’option la plus attractive pour les entreprises. Ces dernières peuvent ainsi collecter, stocker, interroger et analyser leurs données sans investissement lourd en matériel et infrastructure. Mais tous les data warehouses cloud ne fonctionnent pas de la même manière. Voici les 3 principaux modèles économiques que vous trouverez sur le marché.   

Bring Your Own License (BYOL) : Cette option permet aux entreprises d’utiliser leurs licences existantes de manière flexible. Le BYOL réduit les coûts et minimise les risques souvent associés au transfert des données vers le cloud.    

Data warehouse as a service (DWaaS) : Le data warehouse “SaaS” est un modèle d’externalisation dans lequel un fournisseur de services configure et gère les ressources matérielles et logicielles requises par un data warehouse. Le client fournit les données et paie pour le service, sans se soucier de la gestion du matériel ou des ressources humaines nécessaires au bon fonctionnement du data warehouse, ce qui fait du DWaaS un bon choix pour les organisations avec des ressources informatiques limitées. 

Data warehouse hybride : Les data warehouse hybrides combinent la puissance de stockage et la flexibilité du cloud avec le contrôle accordé par le on-premise. Une plate-forme hybride permet aux entreprises de bénéficier de certaines des dernières technologies sans perdre l’investissement réalisé dans leurs configurations actuelles.    

Les critères à prendre en compte avant d’acheter un data warehouse   

Maintenant que vous avez décidé d’acquérir un data warehouse, voici les critères à prendre en compte afin de choisir celui qui correspondra le mieux à vos besoins.   

Types de données   

Allez-vous stocker des données structurées ou non structurées ? Un data warehouse est habituellement utilisé pour le stockage de données structurées. Dans ce cas, une base de données relationnelle, où les informations sont organisées dans des tables avec des dépendances, est idéale. Si vous souhaitez toutefois utiliser un data warehouse pour des données non structurées, alors une base de données non relationnelle répondra probablement mieux à vos besoins.   

Performance   

De quelle vitesse de traitement avez-vous réellement besoin ? Plus les performances sont élevées, plus le prix du data warehouse est élevé. Cela ne veut pas dire que vous devez accepter des performances médiocres, mais vous devez bien évaluer la vitesse et à la puissance dont vous avez réellement besoin pour ne pas vous retrouver avec un data warehouse surdimensionné ou au contraire avec un data warehouse trop lent. La taille des données que vous avez à traiter sera un élément décisif dans le choix du niveau de performance de votre future data warehouse.  

Coût   

Les prix publics sont un bon point de départ pour avoir une idée du budget de votre data warehouse. Vous verrez que certains fournisseurs proposent un modèle de paiement à l’utilisation, tandis que d’autres proposent des tarifs forfaitaires. Une fois que vous aurez shortlisté quelques fournisseurs, assurez-vous de demander un devis exact et détaillé afin de pouvoir comparer les options car seul un devis sur-mesure, adapté à votre besoin vous permettra d’effectuer une comparaison fiable.  

Cloud ou on-premise, puissance, configuration… de nombreux éléments peuvent faire varier le prix. 

La plupart des fournisseurs sont transparents quant à leurs offres, mais assurez-vous que vous ne serez pas facturé pour des « extras » que vous considérez comme étant des fonctionnalités standards. Comme pour tous les achats informatiques, la meilleure façon d’éviter les coûts cachés est de rédiger un cahier des charges en énumérant tous les services et fonctionnalités dont vous avez besoin.   

Mise en œuvre   

Il y a plusieurs choses à considérer lors de la mise en œuvre d’un data warehouse. Le coût est un critère important mais le temps peut compter davantage, en fonction de vos objectifs. Un data warehouse 10 % moins cher mais 3 fois plus long à déployer peut en fin de compte être financièrement moins intéressant à cause des ressources mobilisées.  

Se pose ensuite la question de la facilité de mise en œuvre : pouvez-vous mettre en place vous-même votre data warehouse ou avez-vous besoin d’un consultant (ou d’une équipe de consultants) pour le faire ? Dans ce cas, avez-vous bien budgété ce poste avec devis à l’appui ? 

Évolutivité et flexibilité  

On ne change pas de data warehouse tous les 3 mois. Pour choisir un data warehouse, vous devez donc connaitre la quantité de données que vous traitez à l’instant T mais également avoir une estimation de la quantité de données que vous aurez à traiter d’ici quelques années. En fonction de l’utilisation de votre data warehouse actuel, de votre stratégie de Business Intelligence (BI) et de la croissance de votre entreprise, vous devriez être en mesure de planifier vos besoins. Vous pouvez aussi en discuter avec les fournisseurs qui vous feront des préconisations. 

Sécurité   

Votre data warehouse centralisera en permanence des informations provenant de diverses sources de données. Il est donc indispensable de les protéger en mettant en œuvre une politique de sécurité efficace. Cela inclut : des contrôles d’accès utilisateurs intelligents, une catégorisation appropriée des informations, des techniques de cryptage hautement sécurisées et d’autres méthodes actuelles pour protéger vos bases de données.  

Support et communauté  

Si vous rencontrez un problème avec votre data warehouse, vous aurez besoin d’assistance. Si deux fournisseurs de data warehouses proposent un prix et des fonctionnalités similaires, le choix peut se faire sur le support. Pour cela, consultez l’aide en ligne afin d’en estimer la qualité, et vérifiez si une assistance (téléphone, chat, email…) est incluse dans le contrat. Même si la documentation peut résoudre la plupart de vos problématiques, pouvoir contacter un service client est essentiel dans certains cas.

Élasticité   

Pour un data warehouse, l’élasticité est sa capacité à évoluer de manière fluide, sans affecter la disponibilité ou les performances. Cette caractéristique du cloud computing en fait un candidat idéal pour le stockage des données.  Un data warehouse cloud et élastique permet une analyse des données rapide tout en garantissant une grande flexibilité. L’élasticité est particulièrement importante pour les entreprises dont les besoins fluctuent régulièrement. 

Sauvegarde et restauration   

Bien que la perte complète de données reste rare avec un data warehouse, il est crucial de choisir une plate-forme avec un système de sauvegarde auquel vous pourrez accéder facilement. Les data warehouses cloud présentent un avantage à ce niveau-là.  

Comment ClicData peut vous aider à faire le bon choix ? 

ClicData propose un data warehouse intégré et intelligent qui rassemble toutes les données de votre entreprise en un seul endroit pour assurer la cohérence et la qualité des données dans le but de faciliter le reporting.   

Nous pouvons nous occuper de tout avec un plan dédié et héberger vos données sur notre serveur Cloud Azure, une base de données sécurisée, évolutive et complète avec toute la maintenance, la sauvegarde et la surveillance nécessaires au bon fonctionnement d’un data warehouse.  

Nous proposons aussi une option on-premise, avec un data warehouse hébergé sur votre propre serveur SQL.

Prêt à tester par vous-même un véritable data warehouse 100 % cloud ? Commencez votre essai gratuit maintenant ! Vous préférez échanger avec l’un de nos experts ? Contactez-nous ici.

Share this on