Définition Data Mart

videoimg

Définition Data Mart

381 lecteurs
Sommaire de l'article

Qu’est-ce qu’un Data Mart dans le contexte d’un entrepôt de données ?

Qu’est-ce qu’un Data Mart ?

Un Data Mart se concentre sur un domaine fonctionnel particulier au sein d’une organisation et constitue un sous-ensemble des données stockées dans l’entrepôt de données. Le data mart est une version simplifiée de l’entrepôt de données. Il est destiné à être utilisé par un service particulier ou un ensemble d’utilisateurs au sein d’une entreprise. Par exemple, les ventes, le marketing, les finances ou les RH. Il est généralement géré par un seul département au sein d’une entreprise.

Contrairement à un entrepôt de données, le data mart tire généralement ses données d’une poignée de sources seulement. Les data marts sont plus petits et plus flexibles que les entrepôts de données.

Pourquoi avons-nous besoin de Data Marts ? Data Mart ?

Le data mart augmente la vitesse de réponse des utilisateurs en réduisant la quantité de données. Il donne aux utilisateurs un accès facile aux données fréquemment demandées.
Le Data Mart est plus simple à mettre en œuvre que les entrepôts de données utilisés par les entreprises. Cependant, le coût de mise en œuvre du Data Mart est inférieur au coût de mise en œuvre d’un entrepôt de données complet.
Contrairement à un entrepôt de données, le Data Mart est plus flexible. En cas de changement de modèle, le data mart est construit plus rapidement en raison de sa petite taille.
Les data marts sont définis par un spécialiste en la matière. Un entrepôt de données est défini par des PME interdisciplinaires de différents domaines. En fin de compte, le data mart est beaucoup plus susceptible d’être modifié qu’un entrepôt de données.
Les données sont partitionnées, ce qui permet un contrôle d’accès avec des droits très spécifiques.
Les données peuvent être stockées en segments et segmentées sur différentes plateformes logicielles ou matérielles.

Les différents types de Data Mart

Il existe trois types de data marts :

  • Les Data Marts dépendants Les Data Marts dépendants sont construits en utilisant des informations provenant directement de sources opérationnelles ou de sources externes. Alternativement, les deux sources sont utilisées.
  • Indépendant : Un data mart qui est indépendant est construit sans avoir besoin d’un entrepôt de données central.
  • Hybride : Ce type de data mart peut être utilisé pour collecter des données à partir de systèmes opérationnels.

Un data mart dépendant collecte les données d’une organisation à partir d’un entrepôt de données. C’est un exemple de data mart qui a l’avantage de la centralisation. Si vous envisagez de créer une partie ou la totalité des data marts physiques, vous devez les configurer comme des data marts dépendants.

Un data mart dépendant dans l’entrepôt de données peut être construit de deux manières distinctes. Il peut s’agir d’un utilisateur capable d’utiliser à la fois l’entrepôt de données et l’entrepôt selon ses besoins ou d’un accès restreint à l’entrepôt de données uniquement. La deuxième option n’est pas la meilleure car elle aboutit souvent à ce que l’on appelle le data junkyard. Dans un dépotoir de données, les données proviennent d’un point commun mais elles sont ensuite détruites, et jetées dans la majorité des cas.

Mart de données indépendant

Un data mart indépendant est créé sans utiliser d’entrepôt de données central. Ce type d’entrepôt de données est une bonne alternative pour les petits groupes au sein d’une organisation.

Voir Aussi  Définition direct-attached storage (DAS)

Un data mart indépendant n’est pas associé à l’entrepôt de données de l’entreprise, ni à aucun autre entrepôt de données. Dans un entrepôt de données indépendant, les données sont saisies de manière autonome et l’analyse est également menée de manière indépendante.

La mise en œuvre de data marts séparés ne sert pas l’objectif de la construction de l’entrepôt de données. Il faut d’abord disposer d’une base de données centrale et cohérente regroupant les données de l’entreprise et pouvant être analysée par une variété d’individus aux intérêts divers, qui ont besoin d’un éventail d’informations.

Data Mart hybride

Un data mart hybride est un moyen de combiner des données provenant d’autres sources que l’entrepôt de données. C’est utile dans les situations où vous devez procéder à une intégration ad-hoc, comme lors de la création d’un nouveau produit ou d’un nouveau groupe dans votre organisation.

C’est l’illustration la plus parfaite d’un entrepôt de données qui convient à de multiples bases de données et qui est facile à mettre en œuvre pour toute entreprise. En outre, il ne nécessite qu’un minimum de nettoyage des données. Le data mart hybride peut gérer de grandes structures de stockage et constitue le meilleur choix en termes d’adaptabilité pour les applications centrées sur les données à petite échelle.

Comment mettre en œuvre le Data Mart

La mise en œuvre d’un Data Mart peut être un processus passionnant, mais difficile. Voici les étapes spécifiques à la mise en place de data marts :

Conception
La conception est la phase initiale de la mise en œuvre des data marts. Elle comprend toutes les activités entre le moment de l’initiation de la demande de données et la collecte des informations requises. On crée alors la disposition physique et logique du data mart.

L’étape de conception comprend les tâches suivantes :

  • Incorporer les exigences techniques et commerciales et identifier les sources de données.
  • Sélectionner le sous-ensemble de données approprié.
  • Créer la conception physique et logique de la structure du marché de données.

Les données peuvent être divisées conformément aux directives suivantes :

  • Date
  • Unité fonctionnelle ou opérationnelle
  • Géographie

Les données peuvent être partitionnées au niveau de l’application ou du SGBD. Mais, il est conseillé de partitionner les données au niveau de l’application car cela permettra de modifier le modèle de données chaque année lorsque l’environnement de l’entreprise change.

Quels sont les produits et les technologies dont vous avez besoin ?

Un stylo ordinaire et du papier sont tout ce dont vous avez besoin. Les outils d’aide à la création de diagrammes UML ou ER peuvent également vous aider à ajouter des métadonnées à vos conceptions physiques et logiques.

Construire

La deuxième étape de la mise en œuvre. Elle implique la création de la base de données physique et des structures logiques.

Cette étape comprend les tâches suivantes :

La mise en œuvre de la base de données physique créée au cours de la phase précédente. Par exemple, les objets du schéma de base de données tels que les tables, les vues, les index, les vues, etc. Sont créés.
De quelles technologies et produits avez-vous besoin ?

Voir Aussi  Game Development Définition

Vous avez besoin d’un système de gestion des données relationnelles pour créer un data mart efficace. Les SGBDR sont dotés d’une variété de fonctionnalités qui sont essentielles pour un Data Mart efficace.

Gestion du stockage Un SGBDR gère et stocke les informations pour créer, modifier et supprimer des données.
Accès rapide aux données Accès rapide aux données : À l’aide d’une requête SQL, vous êtes en mesure d’accéder rapidement aux données qui sont basées sur des conditions ou des filtres spécifiques.
Sécurité des données Protection des données : Le système SGBDR offre également la possibilité de récupérer les données après un dysfonctionnement du système, comme une coupure de courant. Il offre également une méthode pour récupérer les données à partir des sauvegardes dans le cas d’une défaillance imprévue du disque.
Support multi-utilisateurs Le système de gestion des données permet un accès simultané, ce qui signifie que plusieurs utilisateurs peuvent être en mesure de modifier et d’accéder aux informations sans interférer ou altérer les modifications apportées par un autre utilisateur.
Sécurité : Le système RDMS permet également aux utilisateurs de contrôler l’accès aux objets ainsi que certains types d’opérations.
Remplissage :
Dans la troisième phase, les données sont ajoutées au data mart.

L’étape de remplissage implique certaines des tâches suivantes :

  • la mise en correspondance des données sources avec les données à utiliser pour la cible.
  • Extraction de la source de données
  • Transformation et nettoyage des données
  • Chargement des données dans le data mart
  • Création et stockage des métadonnées
  • Quels sont les produits et les technologies dont vous avez besoin ?

Le processus d’alimentation des données avec un outil ETL (Extract Transform Load). Cet outil vous permet d’examiner les sources de données, d’établir une correspondance source/cible, de collecter les données, de les transformer, de les nettoyer, puis de les charger à nouveau dans l’entrepôt de données.

Au cours de ce processus, le logiciel crée également des métadonnées sur des éléments tels que l’origine des données, leur ancienneté, les modifications apportées aux données et la quantité de compression utilisée.

L’accès est la dernière étape, qui consiste à mettre les informations à profit en effectuant des requêtes sur les données, en créant des graphiques, des rapports et en les publiant. L’utilisateur pose des questions à la base de données et affiche ensuite les résultats des requêtes.

L’étape d’accès est nécessaire pour réaliser les fonctions suivantes :

Créer une couche méta capable de traduire les objets et les structures de la base de données en termes utilisés dans les affaires. Cela permet aux utilisateurs non techniques d’accéder facilement au marché des données.
Maintenir et mettre en place la structure de la base de données.
Configurer les interfaces et l’API selon vos spécifications.
De quelles technologies et produits avez-vous besoin ?

Il est possible d’accéder à Data Mart Data Mart en utilisant la ligne de commande ou l’interface graphique. L’interface graphique est la méthode préférée. L’interface graphique est préférée car elle permet de créer facilement des graphiques et est plus conviviale que la ligne de commande.

Gérer

Il s’agit de la dernière étape du processus de mise en œuvre. Cette étape concerne les tâches de gestion telles que

Voir Aussi  Facebook connexion automatique : rapidement configurer cette option

La gestion continue de l’accès des utilisateurs.
L’amélioration et la mise au point du système pour augmenter les performances.
La création et la gestion des nouvelles données dans le data mart.
l’élaboration de plans pour les scénarios de récupération et la garantie de la disponibilité du système en cas de panne.
Quels sont les produits et les technologies dont vous avez besoin ?

Vous pouvez utiliser l’interface graphique ou la ligne de commande pour gérer le data mart.

Meilleures méthodes d’implémentation des Data Marts
Voici les principales directives que vous devez respecter au cours du processus d’implémentation des Data Marts :

  • La source de données d’un mart doit être organisée par département.
  • Le processus d’implémentation du data mart doit être mesuré dans des intervalles de temps courts, c’est-à-dire des semaines, au lieu de mois ou d’années.
  • Il est crucial d’inclure tous les participants dans la phase de conception et de planification, car l’exécution réelle du data mart peut être compliquée.
  • Le coût de la mise en réseau du matériel et des logiciels, ainsi que la mise en œuvre du marché de données doivent être prévus avec précision dans votre budget.
  • Même si le marché de données est créé sur le même matériel, il peut nécessiter un logiciel différent pour traiter les demandes des utilisateurs. La puissance de traitement ainsi que les besoins en stockage des disques doivent être évalués pour une réponse rapide des utilisateurs.
  • Un Data Mart peut être situé à un endroit différent de l’entrepôt de données. C’est pourquoi il est essentiel de s’assurer qu’il dispose d’une capacité de réseau adéquate pour traiter le volume de données nécessaire au transfert des données de l’entrepôt de données.
  • Le coût de la mise en œuvre doit être budgétisé en fonction du temps nécessaire au processus de chargement. Le temps de chargement augmente avec le degré de difficulté des conversions.

Avantages et inconvénients d’un data mart

Avantages

Le Data Mart contient un sous-ensemble des données dont dispose l’entreprise. Les données sont précieuses pour un segment particulier de personnes au sein d’une entreprise.
C’est une alternative moins coûteuse qu’un entrepôt de données, dont la construction est coûteuse.
Le Data Mart permet un accès plus rapide aux données.
Le Data Mart est facile à utiliser car il a été spécifiquement créé pour répondre aux besoins des utilisateurs. Ainsi, un Data Mart peut contribuer à accélérer le processus commercial.
Le Data Mart nécessite moins de temps de mise en œuvre que les systèmes d’entrepôt de données. Il est plus facile de mettre en place un Data Mart car il n’est nécessaire de se concentrer que sur un sous-ensemble particulier de données.
Il comprend des données historiques qui permettent aux analystes d’identifier des modèles dans les données.
Avantages

Dans de nombreux cas, les entreprises créent de nombreux data marts non liés et disjoints, sans aucun avantage. Cela peut devenir un problème majeur à gérer.
Les data marts ne peuvent pas fournir une analyse des données à l’échelle de l’entreprise, car leurs ensembles de données sont de petite taille.

4.6/5 - (22 votes)
Marine
Marine

Passionnée par l'entreprenariat depuis plus de 10 ans, je suis à la tête d'une société française visant à favoriser la communication des entreprises. Également attiré par la finance, je partage mes conseils et expériences au travers mes articles de blog.

Retour en haut