data modeling

videoimg

data modeling

395 lecteurs
Sommaire de l'article

Modélisation des données

La modélisation des données consiste à décrire la structure d’un système logiciel complexe en créant un diagramme facile à lire à l’aide de symboles et de texte pour montrer comment les données vont circuler. Elle peut être utilisée pour garantir l’efficacité de l’utilisation des données et servir de modèle pour le développement d’un nouveau logiciel ou la réorganisation d’une application existante. En général, les modèles de données sont développés pendant les phases de conception et d’analyse du projet pour s’assurer que les besoins d’un nouveau programme sont parfaitement compris. Les modèles de données sont également utilisés plus tard dans le cycle de vie des données pour simplifier les conceptions de données qui ont été initialement développées par des programmeurs informatiques sur la base d’un coup de tête. Méthodes de modélisation des données
La modélisation des données est un processus de départ fastidieux, et à son tour, elle est considérée comme incompatible avec les méthodes de développement rapide. Étant donné que la programmation Agile est de plus en plus utilisée pour accélérer les projets de développement, les techniques de modélisation des données a posteriori sont adaptées dans certains cas. En général, le modèle de données est une illustration des connexions entre les données. Il aide les parties prenantes à identifier les erreurs et à apporter des corrections avant que le code de programmation ne soit écrit. La modélisation peut être utilisée dans des projets de rétro-ingénierie qui extraient des modèles de systèmes existants, ce qui est le cas avec les données NoSQL.

Les modélisateurs de données utilisent généralement plusieurs modèles pour représenter les mêmes données et s’assurer que toutes les entités, relations et flux de données des processus sont identifiés. Ils démarrent les nouveaux projets en obtenant des informations auprès des parties prenantes de l’entreprise. Les étapes de la modélisation des données peuvent être décomposées en deux parties : le développement de modèles de données conceptuels qui affichent des attributs spécifiques ainsi que les relations entre les entités et le modèle physique.

Voir Aussi  Cmocean : espace client du Crédit Mutuel Ocean sur www.cmocean.fr

Le modèle de données logique sert de base à la création d’un modèle de données réel, propre à la base de données et à l’application utilisées. Les modèles de données peuvent servir de base à la création d’un schéma élaboré pour les données.

Modélisation hiérarchique des données
Le domaine de la modélisation des données en tant que tel a été découvert dans les années 1960, parallèlement au développement des systèmes de gestion de bases de données (SGBD). La modélisation des données a permis aux organisations d’apporter de la cohérence, de l’homogénéité et un avancement bien ordonné au traitement des données. Les programmeurs et les utilisateurs finaux des applications pouvaient utiliser le modèle de données comme point de départ dans leurs interactions avec les concepteurs de données.

Les modèles hiérarchiques de données qui présentent les données sous forme d’arborescence ou d’arrangements un à plusieurs ont été les premiers à être développés et ont remplacé les systèmes à base de fichiers utilisés dans une variété de cas d’utilisation courants. Le système de gestion de l’information (IMS) d’IBM est le meilleur exemple de modèle hiérarchique, largement utilisé dans les entreprises, notamment dans le secteur bancaire. Bien que les modèles hiérarchiques de données aient été pour la plupart remplacés – à partir des années 1980 – par des modèles de données traditionnels de type relationnel, ce modèle est encore utilisé aujourd’hui avec le langage de balisage extensible (XML) et les systèmes d’information géographique (SIG). Des modèles de données en réseau ont également été développés au début des SGBD afin de donner aux concepteurs de données une vue d’ensemble de leur système. Un exemple en est la Conférence sur les langages de systèmes de données (CODASYL) qui a été créée dans la seconde moitié de 1950 pour guider le développement d’un langage de programmation standard de l’industrie qui pourrait être utilisé par différents types d’ordinateurs.

Voir Aussi  Les contacts utiles pour joindre le service Client Bouygues Télécom

Modélisation des relations entre les données
Bien qu’il soit moins complexe que les systèmes à base de fichiers, le modèle hiérarchique exige une compréhension approfondie du stockage physique des données utilisé. Comme alternative au modèle hiérarchique et au modèle de données relationnel, les développeurs n’ont pas besoin de concevoir des routes de données. Le concept de modélisation relationnelle des données a été abordé pour la première fois en 1970 dans un article universitaire publié par E. F. Codd, chercheur chez IBM. Le modèle relationnel de Codd a ouvert la voie à l’utilisation de bases de données relationnelles, dans lesquelles la segmentation des données est directement liée par des tables, contrairement au modèle hiérarchique dans lequel les données sont liées implicitement. Après son introduction, le modèle relationnel a été intégré au langage d’interrogation structuré (SQL) et a gagné en popularité dans le monde de l’informatique d’entreprise en tant que méthode évolutive de traitement des données.

Le modèle de la relation entre les entités
La modélisation des données relationnelles a fait un nouveau bond en avant au milieu des années 1970 lorsque l’utilisation des modèles entités-relations (ER) s’est généralisée. Ils sont étroitement intégrés aux modèles relationnels de données, les modèles ER utilisent des diagrammes pour représenter visuellement les aspects d’une base de données, et aident à la compréhension des modèles qui les sous-tendent.

Grâce à la modélisation relationnelle, les types de données sont définis et changent rarement au fil du temps. Les entités contiennent des attributs. Par exemple, les attributs de l’entité d’un employé peuvent inclure le prénom, le nom de famille, les années d’emploi, et ainsi de suite. Les relations sont représentées visuellement, ce qui facilite la communication des objectifs de conception des données aux différentes parties impliquées dans le processus de création et de maintenance des données. Dans le passé, les outils de modélisation, tels que ER/Studio d’Idera, Erwin Data Modeler ainsi que SAP PowerDesigner, ont été largement utilisés par les architectes de données pour créer des systèmes.

Voir Aussi  Définition Clé Privée

Les modèles graphiques de données sont bien connus des programmeurs qui ont utilisé des diagrammes ER et des modèles d’objets et des élèves de l’école élémentaire qui ont examiné des phrases.

Avec la popularité croissante de la programmation orientée objet dans les années 90, la modélisation orientée objet a été introduite comme une méthode différente de conception des systèmes. Bien qu’elles présentent une certaine ressemblance avec les méthodes ER, ces approches diffèrent en ce qu’elles se concentrent sur des abstractions d’objets du monde réel. Les objets sont organisés en hiérarchies de classes, et les objets au sein de ces hiérarchies de classes peuvent acquérir des attributs et des techniques de leurs classes parentes. Grâce à cette fonction d’héritage, les modèles de données orientés objets présentent des avantages par rapport aux modèles ER en ce qui concerne la garantie de l’intégrité des données et la facilitation de relations de données plus complexes. Des modèles de données spécifiquement conçus pour les besoins des entrepôts de données ont également été développés dans les années 90. Citons par exemple le schéma en étoile et les modèles tridimensionnels en flocon de neige.

Modèles graphiques de données
Une variante de la modélisation hiérarchique et de la modélisation basée sur le réseau est le modèle graphique de propriété qui, avec les bases de données graphiques, est de plus en plus utilisé pour décrire des relations compliquées entre des ensembles de données, notamment dans les logiciels de recommandation, de médias sociaux et de détection des fraudes.

En utilisant le modèle de données de graphe, les concepteurs peuvent décrire leur modèle comme un graphe connecté avec des nœuds et des connexions, comme ils le feraient avec le modèle de données ER ou objet. Le modèle de données de graphe peut être utilisé pour l’analyse de texte et pour la création de modèles capables de découvrir des connexions entre des points de données dans des documents.

4.3/5 - (21 votes)
Marine
Marine

Passionnée par l'entreprenariat depuis plus de 10 ans, je suis à la tête d'une société française visant à favoriser la communication des entreprises. Également attiré par la finance, je partage mes conseils et expériences au travers mes articles de blog.

Retour en haut