Définition Datawarehouse

DataWarehouse.jpg
DataWarehouse.jpg

Définition Datawarehouse

663 lecteurs
Sommaire de l'article

Définition du Datawarehouse : 4 minutes

L’histoire du Datawarehouse

Le Datawarehouse aide les utilisateurs à comprendre et à améliorer l’efficacité de leur entreprise. L’entrepôt de données a été créé parce que les systèmes informatiques sont devenus plus compliqués et qu’une plus grande quantité de données devait être traitée. Mais le stockage des données n’est pas un concept nouveau.

Voici quelques-uns des développements les plus importants qui ont façonné le développement des entrepôts de données :

  • 1960- Dartmouth et General Mills, dans un projet de recherche commun, créent les concepts de dimensions ainsi que les faits.
  • 1970- Nielsen IRI introduit les marts de données dimensionnelles pour le commerce de détail.
  • 1983- Tera Data Corporation introduit un système de gestion de base de données spécifiquement conçu pour soutenir la prise de décision.

L’entreposage de données a débuté dans la seconde moitié des années 1980 lorsque Paul Murphy et Barry Devlin, employés d’IBM, ont créé le Business Data Warehouse.

Cependant, le concept réel a été formulé par Inmon Bill. Il est considéré comme le pionnier de l’entrepôt de données. Il a écrit sur une variété de sujets liés à la construction et à l’utilisation de l’entrepôt ainsi qu’à la fabrique d’informations d’entreprise.

Qu’est-ce qu’un entrepôt de données ? Comment fonctionne-t-il ?

Un entrepôt de données sert de dépôt d’informations provenant de diverses sources de données. Les informations provenant du système transactionnel ainsi que d’autres bases de données relationnelles sont transférées dans l’entrepôt de données.

Les données peuvent être :

  • Structurées
  • Semi-structurées
  • Des données non structurées

Les données sont transformées, traitées et consommées pour permettre aux utilisateurs d’accéder aux données traitées dans l’entrepôt de données via des outils de business intelligence, des clients SQL et des feuilles de calcul. Un entrepôt de données combine des informations provenant de plusieurs sources dans une seule base de données.

En combinant toutes ces données en un seul endroit central, une organisation est en mesure d’analyser les clients qu’elle sert d’une manière plus complète. Elle est ainsi assurée d’avoir examiné toutes les informations disponibles. L’entrepôt de données permet l’exploration des données. L’exploration de données est le processus consistant à rechercher des modèles dans les données qui pourraient augmenter les bénéfices et les ventes.

Voir Aussi  Définition Apache Cassandra

Les différents types d’entrepôts de données

Les trois types d’entrepôts de données les plus courants sont les suivants :

  • Enterprise Data Warehouse
  • L’entrepôt de données d’entreprise est un entrepôt central. Il offre un service d’aide à la décision à l’échelle de l’entreprise. Il fournit une méthode cohérente d’organisation et de représentation des données. Il permet également de catégoriser les données en fonction du sujet et de permettre l’accès aux données en fonction de ces divisions.

  • Magasin de données opérationnelles
  • L’Operational Data Store, également appelé ODS, n’est rien d’autre qu’un magasin de données nécessaire lorsque ni l’entrepôt de données ni les systèmes OLTP ne peuvent répondre aux exigences des entreprises en matière de reporting. Dans l’ODS, l’entrepôt de données est mis à jour en temps réel. C’est pourquoi il est utilisé pour des tâches de routine comme le stockage des dossiers des employés.

  • Data Mart :
  • Les data marts sont une partie supplémentaire de l’entrepôt de données. Il est conçu spécialement pour répondre à un type d’activité spécifique, comme les ventes, la finance ou les ventes. Dans un data mart autonome, il est possible de collecter des données directement à la source.

    Informations générales sur les entrepôts de données

    Dans le passé, les entreprises ont commencé à utiliser facilement les entrepôts de données. Cependant, au fil du temps, des applications plus sophistiquées des entrepôts de données ont vu le jour.

    Voici les étapes pour utiliser l’entrepôt de données :

    1. Base de données opérationnelle hors ligne

    Dans ce processus, les données sont transférées du système opérationnel vers un serveur. De cette façon, le chargement, le traitement et le reporting des données copiées n’affectent pas les performances du système opérationnel.

    2. Entrepôt de données hors ligne

    Les données de l’entrepôt de données sont mises à jour régulièrement à l’aide de la base de données opérationnelle. Les données de l’entrepôt de données sont transformées et mappées pour répondre aux objectifs de l’entrepôt de données.

    3. Entrepôt de données en temps réel

    Dans cette étape, les entrepôts de données sont maintenus chaque fois qu’une transaction se produit dans la base de données qui est opérationnelle. Par exemple, le système de réservation des chemins de fer ou des compagnies aériennes.

    Voir Aussi  Leboncoin mon compte : Accéder à mon compte et mes messages

    4. L’entrepôt de données intégré

    À ce stade, les entrepôts de données sont continuellement mis à jour lorsque le système opérationnel effectue une opération. L’entrepôt de données est alors capable de générer des transactions qui sont transmises au système opérationnel.

    Les composantes de l’entrepôt de données

    Les trois éléments des entrepôts de données sont

    • Le gestionnaire de charge : Le gestionnaire de charge peut également être appelé le composant frontal. Il est responsable de toutes les opérations qui impliquent l’extraction et le chargement des données dans les entrepôts. Ces opérations impliquent des transformations pour s’assurer que les données sont prêtes à être introduites dans l’entrepôt.
    • Gestionnaire d’entrepôt : Le gestionnaire d’entrepôt effectue les opérations associées à la gestion des données de l’entrepôt. Il est responsable de l’exécution de tâches telles que l’analyse des données pour en déterminer la cohérence, la création d’index et de vues, la création de dénormalisations et d’agrégats, la transformation et la combinaison des sources de données, ainsi que l’archivage et le regroupement des données.
    • Gestionnaire de requêtes Le gestionnaire de requêtes est le composant qui exécute le backend. Il gère toutes les opérations liées à l’administration des requêtes des utilisateurs. Les fonctions de ces éléments sont des requêtes dirigées vers des tables qui sont nécessaires pour planifier le traitement des requêtes.

    Les outils d’accès pour l’utilisateur final sont classés en cinq catégories distinctes :

  • Rapports de données
  • Outils d’interrogation
  • Outils de développement d’applications
  • Outils SIE
  • Outils d’exploration de données et OLAP
  • .

    Qui a besoin de l’entrepôt de données ?

    L’entrepôt de données est essentiel pour tous les types d’utilisateurs énumérés ci-dessous :

    • Les décideurs qui dépendent d’une énorme quantité d’informations.
    • Les utilisateurs qui emploient des méthodes complexes, conçues sur mesure, pour rassembler des informations à partir de sources de données multiples.
    • La technologie est également utilisée par ceux qui ont besoin d’un moyen simple d’accéder aux informations.
    • Elle est également importante pour ceux qui ont besoin d’une approche structurée pour prendre des décisions.
    • Si l’utilisateur recherche une performance rapide sur un grand nombre de données et qu’il est essentiel de disposer de graphiques, de rapports, de grilles ou de rapports, etc., l’entrepôt de données peut être utile.
    Voir Aussi  Z-Wave

    L’entrepôt de données est une bonne première étape pour découvrir les « modèles cachés » des flux et des groupes de données.

    Que fait un entrepôt de données ?

    Voici les domaines les plus fréquemment utilisés où les entrepôts de données sont employés :

    Compagnie aérienne :
    Le système de la compagnie aérienne est utilisé pour des raisons opérationnelles telles que l’affectation des équipages et l’analyse de la rentabilité des itinéraires, la promotion des programmes de fidélisation, etc.

    Banque :
    Certaines banques l’emploient pour réaliser des études de marché, des analyses de produits et de performances opérationnelles.

    Soins de santé :
    Le secteur des soins de santé utilise des entrepôts de données pour planifier et prévoir les résultats, préparer des rapports sur les traitements des patients et partager des informations avec les services d’aide médicale, les compagnies d’assurance, les services connexes, etc.

    Secteur public
    Dans le secteur public, les entrepôts de données sont utilisés pour la collecte de données. Ils aident les agences gouvernementales à maintenir et à analyser les dossiers de santé et de politique fiscale pour chaque personne.

    Secteur des assurances et des investissements :
    Dans ce secteur, les wharehouses sont surtout utilisés pour étudier les modèles de données, les tendances du comportement des clients et surveiller les tendances du marché.

    Chaîne d’approvisionnement
    Dans les chaînes de vente au détail, l’entrepôt est utilisé pour la distribution et le marketing. Il surveille également les articles ainsi que les habitudes d’achat des clients et les promotions. Il est également utilisé pour déterminer les politiques de prix.

    Télécommunications :
    Un entrepôt de données est utilisé dans ce secteur pour promouvoir les produits, les décisions de vente et les décisions de distribution.

    Industrie hôtelière :
    Cette industrie utilise des services d’entrepôt de données pour planifier et évaluer l’impact de ses campagnes de marketing et de promotion afin de cibler les clients en fonction de leurs réactions et de leurs habitudes de voyage.

    4.8/5 - (29 votes)
    Marine
    Marine

    Passionnée par l'entreprenariat depuis plus de 10 ans, je suis à la tête d'une société française visant à favoriser la communication des entreprises. Également attiré par la finance, je partage mes conseils et expériences au travers mes articles de blog.

    Retour en haut