Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
tc_info:2020_cm_relation [2021/01/04 14:25] – edauce | tc_info:2020_cm_relation [2024/06/28 15:18] (Version actuelle) – modification externe 127.0.0.1 | ||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
+ | ===== Bases de données relationnelles ===== | ||
+ | On introduit dans ce chapitre le **modèle relationnel** qui sert de fondation à la conception de bases de données. | ||
+ | |||
+ | Les différents modèles utiles en représentation des connaissances reposent sur des notions de base de la théorie des ensembles : | ||
+ | * Ensemble finis | ||
+ | * Éléments partiellement (ou totalement) discernables | ||
+ | |||
+ | ==== 1 Structures de données ==== | ||
+ | |||
+ | === 1.1 Production des données === | ||
+ | |||
+ | Tout commence par une fiche à remplir… | ||
+ | |||
+ | {{https:// | ||
+ | |||
+ | * Un formulaire se présentant sous la forme d’un ensemble de rubriques à remplir. | ||
+ | * Le **modèle de fiche** définit le format des données à enregistrer: | ||
+ | * liste des rubriques du formulaire, | ||
+ | * domaine de valeurs attendues dans chaque rubrique. | ||
+ | * A toute fiche remplie correspond un **jeu de valeurs** (ou mesure) : | ||
+ | * liste de valeurs correspondant au contenu d’une fiche particulière. | ||
+ | |||
+ | <note tip> | ||
+ | Un jeu de valeurs sert à décrire : | ||
+ | * une personne réelle : assuré, client, étudiant, auteur, plaignant, contribuable, | ||
+ | * une personne morale : fournisseur, | ||
+ | * un objet physique : article, véhicule, composant, ingrédient, | ||
+ | * un objet contractuel ou administratif : fiche de paye, contrat, procès verbal, billet, dossier... | ||
+ | * un lieu : salle, local, manufacture, | ||
+ | * un événement : transaction, | ||
+ | * etc... | ||
+ | </ | ||
+ | |||
+ | === 1.2 Stockage des données === | ||
+ | |||
+ | * D’un point de vue informatique, | ||
+ | * correspondant à l’encodage des données recueillies sur un support numérique | ||
+ | * Une **structure de données** définit les données de manière logique, | ||
+ | * c’est à dire l’ordre dans lequel elles doivent être lues | ||
+ | * et la manière dont elles doivent être interprétées par les programmes qui les utilisent. | ||
+ | |||
+ | <note tip> | ||
+ | Exemples de structures de données (cours d' | ||
+ | * listes, | ||
+ | * listes de listes, | ||
+ | * dictionnaires, | ||
+ | * arbres,... | ||
+ | </ | ||
+ | |||
+ | * Les types des valeurs étant déterminés (selon les cas de taille fixe ou variable), | ||
+ | * la **structure de données** correspond au “véhicule” qui servira à transporter et échanger les données (entre programmes, entre ordinateurs). | ||
+ | * Différentes structures de données sont possibles pour l’encodage et le stockage d’un jeu de valeurs, voir : | ||
+ | * Données non structurées | ||
+ | * Données vectorielles | ||
+ | * Tuples | ||
+ | * Données structurées | ||
+ | * Données Hiérarchisées | ||
+ | |||
+ | === Tuples=== | ||
+ | |||
+ | |||
+ | Le **Tuple** est la structure de données de base servant pour le recueil, le transport et le stockage des données. | ||
+ | |||
+ | <note important> | ||
+ | * Un **Tuple** est une liste, **finie**, **ordonnée** et **de taille fixe** contenant une suite de valeurs. | ||
+ | * Chaque valeur peut obéir à un format différent | ||
+ | * On note //m// la taille du tuple (nombre de valeurs) | ||
+ | t=(a1,...,am) | ||
+ | **Exemple :** | ||
+ | (" | ||
+ | </ | ||
+ | |||
+ | < | ||
+ | === Données brutes === | ||
+ | *Textes, | ||
+ | *comptes rendus, | ||
+ | *série de notes, de valeurs sans format précis : | ||
+ | -> format texte en général. | ||
+ | |||
+ | < | ||
+ | Le format '' | ||
+ | * ASCII (caractères sans accent), | ||
+ | * utf8 (caractères accentués et spéciaux), | ||
+ | * ... | ||
+ | </ | ||
+ | |||
+ | === Données vectorielles=== | ||
+ | * Chaque jeu de valeurs est codé sous la forme d’un **vecteur** | ||
+ | * constitué de grandeurs entières ou réelles : | ||
+ | * toutes les valeurs sont quantitatives (numériques). | ||
+ | * C’est un encodage adapté aux grandeurs physiques : | ||
+ | * chaque champ du formulaire est codé dans un format numérique | ||
+ | * il est possible de représenter les données dans un espace vectoriel | ||
+ | |||
+ | <note important> | ||
+ | </ | ||
+ | |||
+ | <note tip> | ||
+ | **Exemple** : | ||
+ | Considérons une station météorologique enregistrant à intervalle réguliers les données de ses capteurs : | ||
+ | * thermomètre, | ||
+ | * baromètre, | ||
+ | * hygromètre | ||
+ | * et anémomètre. | ||
+ | Un jeu de valeurs sera constitué de //5 réels double précision// | ||
+ | * la température, | ||
+ | * la pression, | ||
+ | * l’humidité, | ||
+ | * la vitesse | ||
+ | * et la direction du vent. | ||
+ | </ | ||
+ | |||
+ | |||
+ | === Tuples=== | ||
+ | |||
+ | **NB**: | ||
+ | * Les données sont organisées sous la forme d’une liste de valeurs qualitatives ou quantitatives. | ||
+ | * Le tuple est la structure de base servant pour la transmission des données (simple, facile à coder et à échanger). | ||
+ | --></ | ||
+ | |||
+ | **NB**: un **tuple** est une séquence (ordonnée et finie) de valeurs, chaque valeur pouvant être de type qualitatif ou quantitatif, | ||
+ | |||
+ | |||
+ | <note tip> | ||
+ | **Exemple** : considérons une fiche servant à décrire un étudiant. L’étudiant doit remplir les rubriques nom, prénom et âge, numero de voie, nom de la voie, code postal, ville. Chaque rubrique correspond à un composant d’un 7-tuplet tel que: | ||
+ | * les composants 1, 2, 5 et 7 sont des chaînes de caractères | ||
+ | * les composants 3, 4 et 6 sont des entiers | ||
+ | </ | ||
+ | |||
+ | < | ||
+ | **Le format csv - “Comma Separated Values” ** | ||
+ | |||
+ | Chaque enregistrement est codé sur une ligne, chaque valeur étant séparé par un caractère séparateur (virgule, point-virgule, | ||
+ | |||
+ | Exemple : | ||
+ | Dubois, | ||
+ | |||
+ | Remarques : | ||
+ | * les données sont des chaînes de caractères | ||
+ | * les guillemets sont nécessaires lorsque la valeur contient le caractère séparateur (ici la virgule) | ||
+ | * les noms des attributs sont éventuellement indiqué sur une ligne séparée | ||
+ | </ | ||
+ | |||
+ | |||
+ | === Données indexées === | ||
+ | * Données organisées sous la forme d’une liste d’attributs. | ||
+ | * Chaque attribut est défini par un nom et un format (**type**). | ||
+ | * Chaque valeur est stockée sous la forme d’un couple (attribut : **valeur**). | ||
+ | |||
+ | <note tip> | ||
+ | **Exemple** : | ||
+ | |||
+ | Considérons une fiche servant à décrire un étudiant. L’étudiant doit remplir les rubriques nom, prénom et âge, numero de voie, nom de la voie, code postal, ville. | ||
+ | |||
+ | Chaque rubrique correspond à un attribut, où: | ||
+ | * nom, prenom, voie, et ville sont des attributs de type chaîne de caractères | ||
+ | * age et numero et code_postal sont des attributs de type entier | ||
+ | |||
+ | La structure de données sous-jacente est le **dictionnaire**, | ||
+ | </ | ||
+ | |||
+ | <note important> | ||
+ | Un **dictionnaire** est une liste non ordonnée de valeurs, chaque valeur étant associée à une clé unique (ici la clé est le nom de l’attribut). | ||
+ | </ | ||
+ | |||
+ | < | ||
+ | **Le format json - JavaScript Object Notation** | ||
+ | |||
+ | Exemple : | ||
+ | {" | ||
+ | |||
+ | Remarques : | ||
+ | * reprend la syntaxe vue en Python | ||
+ | * données numériques ou chaînes de caractères | ||
+ | </ | ||
+ | |||
+ | |||
+ | === Données Hiérarchisées=== | ||
+ | |||
+ | * Organisation des données correspondant à une structure d’**arbre**. | ||
+ | * Dans le cas d’un recueil de données, correspond à la définition de rubriques et sous-rubriques. | ||
+ | |||
+ | <note tip> | ||
+ | **Exemples** : | ||
+ | * La rubrique **adresse** peut contenir les sous-rubriques **numero**, **voie**, **code_postal** et **ville**. | ||
+ | * Un document contient des **chapitres**, | ||
+ | </ | ||
+ | |||
+ | < | ||
+ | |||
+ | Pour les données organisées de manière hiérarchique. Des balises servent à séparer les différents attributs. | ||
+ | |||
+ | Ex : | ||
+ | |||
+ | <nom> Dubois </ | ||
+ | < | ||
+ | < | ||
+ | <num> 28 </ | ||
+ | < | ||
+ | <code postal> 45000 </code postal> | ||
+ | < | ||
+ | </ | ||
+ | < | ||
+ | |||
+ | remarque : le format '' | ||
+ | { | ||
+ | " | ||
+ | " | ||
+ | " | ||
+ | { | ||
+ | " | ||
+ | " | ||
+ | " | ||
+ | " | ||
+ | }, | ||
+ | " | ||
+ | } | ||
+ | </ | ||
+ | |||
+ | |||
+ | === Tableaux de données === | ||
+ | |||
+ | Un tableau de données est une liste (finie et ordonnée) de tuples, chaque tuple obéissant à un même schéma R. | ||
+ | |||
+ | {{https:// | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | ==== 2. Schéma et relation ==== | ||
+ | |||
+ | 2 approches en modélisation : | ||
+ | * approche ensembliste (plus général) | ||
+ | * modèle relationnel (plus pratique) | ||
+ | |||
+ | <note important> | ||
+ | Le **Modèle relationnel** sert à représenter logiquement les **tableaux de données**. | ||
+ | </ | ||
+ | < | ||
+ | **Tableau de données** | ||
+ | |||
+ | Un tableau de données est une liste (finie et ordonnée) de tuples, chaque tuple obéissant à un même schéma R. | ||
+ | |||
+ | {{https:// | ||
+ | </ | ||
+ | |||
+ | Rappel: | ||
+ | * Un enregistrement est un jeu de valeurs organisé sous forme de **tuple** | ||
+ | * A un tuple on associe | ||
+ | {{public: | ||
+ | |||
+ | * Définir un **schéma** consiste à définir : | ||
+ | * une liste d' | ||
+ | * A chaque **attribut** correspond : | ||
+ | * un // | ||
+ | * un //domaine// de valeurs (type/ | ||
+ | |||
+ | * Soit R(A1,...,Am) un schéma. | ||
+ | * On note dom(Ai) le domaine associé à l' | ||
+ | * On dit d'un tuple t qu'il //obéit au schéma R// si les valeurs qu'il contient correspondent aux domaines des attributs du schéma. | ||
+ | |||
+ | |||
+ | |||
+ | <note important> | ||
+ | **Définition** | ||
+ | |||
+ | Soit R=(A1,...,Am) un schéma de données | ||
+ | |||
+ | Une **relation** r obéissant au schéma R est un // | ||
+ | </ | ||
+ | |||
+ | <note tip> | ||
+ | **Corollaire** : une relation est un **ensemble** de tuples : | ||
+ | r={t1,...,tn}={(a11,...,a1m),...,(an1,...,anm)} | ||
+ | |||
+ | * avec : | ||
+ | * ∀(i,j),aij∈dom(Aj), | ||
+ | * ∀i,ti∈dom(A1)×...×dom(Am) | ||
+ | * n : nombre de tuples | ||
+ | * m : nombre d' | ||
+ | </ | ||
+ | |||
+ | <note tip> | ||
+ | **Remarque :** | ||
+ | * Le **schéma** R représente le niveau abstrait (modélisation) | ||
+ | * La **relation** r représente un cas concret de réalisaton (à un schéma R peuvent correspondre une infinité de réalisations possibles : r, r′, r″, | ||
+ | </ | ||
+ | |||
+ | |||
+ | < | ||
+ | |||
+ | __[[public: | ||
+ | |||
+ | {{public: | ||
+ | |||
+ | __[[public: | ||
+ | |||
+ | {{public: | ||
+ | |||
+ | __[[public: | ||
+ | |||
+ | **Client**(nom, | ||
+ | |||
+ | </ | ||
+ | |||
+ | |||
+ | < | ||
+ | ** __Exemples de schémas relationnels__ :** | ||
+ | |||
+ | **Étudiant**(nom, | ||
+ | |||
+ | **Ouvrage**(titre, | ||
+ | |||
+ | **Véhicule**(immatriculation, | ||
+ | </ | ||
+ | |||
+ | ==== 3. Dépendances fonctionnelles ==== | ||
+ | |||
+ | * Au sein d'un schéma R, | ||
+ | * Il peut exister un ensemble de contraintes, | ||
+ | * portant sur les attributs (plus précisément sur les valeurs prises par les attributs). | ||
+ | * L' | ||
+ | * On parle de **contraintes d’intégrité**. | ||
+ | * Ces contraintes s’expriment sous la forme de **dépendances fonctionnelles**. | ||
+ | |||
+ | < | ||
+ | **Rappels d’algèbre de base:** | ||
+ | |||
+ | * **Relation binaire** : une relation binaire r portant sur deux domaines dom(A) et dom(B): | ||
+ | * est un sous-ensemble du produit cartésien dom(A)×dom(B). | ||
+ | * si (a,b)∈r, on note parfois arb ce qui signifie “a est en relation avec b”. | ||
+ | * **Fonction** : une fonction f:dom(A)→dom(B) est une relation binaire sur dom(A)×dom(B) telle que | ||
+ | * pour tout a∈dom(A), | ||
+ | * il existe un unique b tel que (a,b)∈f. | ||
+ | * On note b=f(a) , | ||
+ | * ce qui signifie qu'au sein de la relation f, b est déterminé de façon unique par le choix de a (autrement dit : “b dépend de a”) | ||
+ | </ | ||
+ | |||
+ | <note important> | ||
+ | **Dépendance fonctionnelle** | ||
+ | |||
+ | * Soit r une relation définie selon R(A1,...,Am) | ||
+ | * Soient X et Y deux sous-ensembles de R | ||
+ | * On dit que la relation r définit une // | ||
+ | * notée Xr→Y | ||
+ | * si les valeurs de r permettent de définir une fonction de dom(X) vers dom(Y). | ||
+ | </ | ||
+ | |||
+ | <note tip> | ||
+ | **__Exemple 1__** : | ||
+ | |||
+ | Soit la relation r: | ||
+ | ^ A ^ B ^ C ^ | ||
+ | | 1 | a | e | | ||
+ | | 2 | b | f | | ||
+ | | 2 | c | f | | ||
+ | | 3 | d | k | | ||
+ | | 4 | d | k | | ||
+ | |||
+ | * On a les dépendances suivantes : | ||
+ | * A→C | ||
+ | * B→C | ||
+ | * mais pas : A→B, B→A, ni C→A | ||
+ | * On a aussi : | ||
+ | * A,B→C | ||
+ | * mais pas : B,C→A, ni A,C→B, etc. | ||
+ | </ | ||
+ | |||
+ | <note tip> | ||
+ | **__Exemple 2__** : | ||
+ | |||
+ | * Soit le schéma : | ||
+ | * **Commande** (num_client, | ||
+ | * et l’ensemble de contraintes | ||
+ | $$ \begin{array}{rl}F &= \{\\ | ||
+ | & \text{num_client, | ||
+ | & \text{num_article, | ||
+ | &\} | ||
+ | \end{array} | ||
+ | $$ | ||
+ | * La première contrainte indique qu'il ne peut y avoir deux factures émises pour un même client à une date donnée. | ||
+ | * La seconde contrainte indique que le prix payé dépend de l’article et de la quantité commandée. | ||
+ | </ | ||
+ | |||
+ | <note tip> | ||
+ | **__Exemple 3__** : | ||
+ | * Soit le schéma : | ||
+ | * **Ouvrage** (titre, auteur, éditeur, prix, date_edition) | ||
+ | * et la contrainte : | ||
+ | * {titre, auteur, éditeur → prix, date_édition} | ||
+ | La contrainte signifie : | ||
+ | * “//pour une oeuvre chez un certain éditeur, une seule édition est possible (pas de réédition à une date ultérieure)// | ||
+ | * “// | ||
+ | |||
+ | </ | ||
+ | |||
+ | < | ||
+ | **Exercice :** | ||
+ | Soit le schéma : | ||
+ | |||
+ | * **Réservation**(code_appareil, | ||
+ | |||
+ | Exprimer la dépendance fonctionnelle : | ||
+ | * « //Un appareil ne peut pas être utilisé dans deux locaux différents au même moment //» | ||
+ | </ | ||
+ | |||
+ | * Il importe donc de bien réfléchir, | ||
+ | * du réalisme et du caractère limitant de certaines dépendances fonctionnelles, | ||
+ | * et du caractère éventuellement limitant du choix des attributs. | ||
+ | * Ainsi, le schéma décrivant les commandes (exemple 2) | ||
+ | * ne permet pas de commander des articles de nature différente au sein d'une même commande | ||
+ | * (un client, pour commander deux râteaux et une truelle, doit donc effectuer deux commandes, qui plus est à des dates différentes!). | ||
+ | |||
+ | < | ||
+ | |||
+ | Soit le schéma relationnel suivant : | ||
+ | |||
+ | **Billet**(num_train, | ||
+ | |||
+ | Définir des dépendances fonctionnelles sur cet ensemble d' | ||
+ | </ | ||
+ | |||
+ | ==== 4. Clé d'une relation==== | ||
+ | |||
+ | === 4.1 Définitions === | ||
+ | * Soit un schéma R(A1,...,Am). | ||
+ | <note important> | ||
+ | **Clé** | ||
+ | |||
+ | * Une **clé** K : | ||
+ | * est un ensemble **minimal** d' | ||
+ | * tel que toute relation r de schéma R définit une dépendance fonctionnelle de dom(K) dans dom(R), | ||
+ | * cette dépendance est notée K→R. | ||
+ | </ | ||
+ | < | ||
+ | * **Remarques** : | ||
+ | * Si un schéma R possède une clé K, alors tous les éléments d’une relation r de schéma R sont discernables : la valeur de la clé permet d’identifier de façon unique chaque élément de l’ensemble. | ||
+ | * Au sein d'un schéma, il est souvent possible de définir plusieurs clés à partir des attributs. Le concepteur du modèle choisit une clé parmi les clés possibles. Cette clé est appelée **clé primaire**. | ||
+ | * Graphiquement, | ||
+ | {{public: | ||
+ | </ | ||
+ | |||
+ | < | ||
+ | **__Exemple 1__** : | ||
+ | |||
+ | {{public: | ||
+ | |||
+ | </ | ||
+ | |||
+ | < | ||
+ | **__Exemple 2__** : | ||
+ | |||
+ | {{public: | ||
+ | |||
+ | *Pour certains schémas, | ||
+ | * il est courant de définir comme clé un entier **identifiant de façon unique** chaque élément de l' | ||
+ | * La clé est alors constituée de cet attribut unique. | ||
+ | {{public: | ||
+ | |||
+ | **Représentation [[public: | ||
+ | {{public: | ||
+ | |||
+ | </ | ||
+ | |||
+ | === 4.2 Axiomes d' | ||
+ | |||
+ | Soit K une clé candidate. On démontre que K→R à l'aide des //axiomes d' | ||
+ | |||
+ | <note tip> **Axiomes d' | ||
+ | |||
+ | - **Réflexivité** : Y⊆X⇒X→Y | ||
+ | - **Augmentation** : X→Y⇒X,Z→Y,Z | ||
+ | - **Transitivité** : X→Y et Y→Z⇒X→Z | ||
+ | - **Pseudo-transitivité** : X→Y et Y,W→Z⇒X,W→Z | ||
+ | - **Union** : X→Y et X→Z⇒X→Y,Z | ||
+ | - **Décomposition** : X→Y,Z⇒X→Y et X−>Z | ||
+ | </ | ||
+ | |||
+ | < | ||
+ | |||
+ | Soit le schéma relationnel suivant : | ||
+ | |||
+ | **Billet**(num_train, | ||
+ | |||
+ | Montrer que l' | ||
+ | </ | ||
+ | |||
+ | ==== 4. Normalisation d'un schéma==== | ||
+ | __**Tables mal construites**__ | ||
+ | < | ||
+ | ** Exemple : fournisseurs de composants électroniques: | ||
+ | |||
+ | Fournisseur(nom_f, composant_,adresse_f, prix) | ||
+ | |||
+ | * **Problèmes :** | ||
+ | * **Redondance** : l’adresse des fournisseurs est répétée plusieurs fois | ||
+ | * **Inconsistance** : mauvaise mise à jour => adresses différentes pour un même fournisseur. | ||
+ | * **Problème Insertion** : on ne peut pas insérer dans la table un fournisseur qui ne fournit rien | ||
+ | * **Problème suppression** : si un fournisseur ne fournit plus rien, on perd son adresse | ||
+ | * Solution? | ||
+ | |||
+ | * Couper la table en 2? | ||
+ | <note warning> | ||
+ | Fournisseurs(nom_f, adresse_f) | ||
+ | Catalogue(composant, prix) | ||
+ | </ | ||
+ | --> Impossible de retrouver les prix pratiqués par les différents fournisseurs. | ||
+ | |||
+ | |||
+ | * Nouveau Schéma : | ||
+ | <note tip> | ||
+ | Fournisseurs(nom_f, adresse_f) | ||
+ | Catalogue(nom_f, composant, prix) | ||
+ | </ | ||
+ | --> Il est possible de reconstruire la table initiale en effectuant une jointure entre ces 2 tables sur l’attribut '' | ||
+ | |||
+ | |||
+ | </ | ||
+ | |||
+ | < | ||
+ | **Exercice** : Les tables suivantes sont-elles bien ou mal construites? | ||
+ | |||
+ | * **Enseignement** (__id_enseignant__, | ||
+ | |||
+ | * **Arrêt** (__num_train__, | ||
+ | |||
+ | * **Facture** (__id_client, | ||
+ | </ | ||
+ | |||
+ | ==== 5. Formes Normales ===== | ||
+ | **__Les Formes normales__** | ||
+ | * Restreignent les dépendances admises dans un schéma relationnel | ||
+ | * Permettent d’éviter la duplication de l’information au sein des relations | ||
+ | * Définissent une méthode | ||
+ | * de **décomposition** d’un schéma relationnel redondant | ||
+ | * en plusieurs schémas //liés entre eux//: | ||
+ | |||
+ | === 5.1 2ème forme normale (2FN) === | ||
+ | <note important> | ||
+ | **Dépendance fonctionnelle élémentaire (DFE) ** | ||
+ | * Soit R un schéma relationnel | ||
+ | * Soit X un ensemble d’attributs ⊆ R | ||
+ | * Soit A un attribut de R | ||
+ | * Il existe une DFE entre X et A ssi : | ||
+ | * X→A | ||
+ | * Il n’existe aucun sous-ensemble Y ⊆ X tel que Y→A | ||
+ | </ | ||
+ | |||
+ | <note important> | ||
+ | **2ème forme normale (2FN) ** | ||
+ | |||
+ | * Un schéma R est en 2FN : | ||
+ | * ssi la clé primaire de R est en DFE avec tous les autres attributs. | ||
+ | * Donc : il n’y a pas d’attributs qui ne dépendent que d’une partie de la clé. | ||
+ | </ | ||
+ | |||
+ | <note tip> | ||
+ | **Exemple :** | ||
+ | Fournisseur(nom_f,composant_,adresse_f,prix) | ||
+ | nom_f→adresse_f | ||
+ | nom_f,composant→prix | ||
+ | ⇒ Pas 2FN!! | ||
+ | </ | ||
+ | |||
+ | === 5.2 Normalisation 2FN === | ||
+ | * Lorsqu’un schéma relationnel n’est pas en deuxième forme normale, __il doit être **normalisé**__: | ||
+ | |||
+ | < | ||
+ | **Normalisation 2FN** : | ||
+ | * Pour obtenir un schéma 2FN: | ||
+ | * on “// | ||
+ | * La normalisation consiste: | ||
+ | * à créer une nouvelle table pour chaque DFE ainsi trouvée. | ||
+ | |||
+ | * Soit : | ||
+ | R(A1,...,Ai,...,An_,B1,...,Bj,...,Bm) | ||
+ | * avec : | ||
+ | AiDFE→Bj | ||
+ | A1,...,Ai,...,AnDFE→B1,...,Bj−1,Bj+1...,Bm | ||
+ | * Alors le schéma de table doit être modifié comme suit : | ||
+ | R1(A1,...,Ai,...,An_,B1,...,Bj−1,Bj+1...,Bm) | ||
+ | R2(Ai_,Bj) | ||
+ | |||
+ | <note important> | ||
+ | |||
+ | Même si aucun attribut ne dépend plus de la clé primaire initiale, il est important de la conserver dans une table spécifique (elle sert à “lier” les valeurs dispersées dans les différentes tables). | ||
+ | </ | ||
+ | </ | ||
+ | |||
+ | <note tip> | ||
+ | **__Exemple__** | ||
+ | * __Avant__: | ||
+ | Fournisseur(nom_f,composant_,adresse_f, prix) | ||
+ | nom_f→adresse_f | ||
+ | nom_f, composant→prix | ||
+ | * __Après__: | ||
+ | Catalogue(nom_f,composant_,prix) | ||
+ | Fournisseur(nom_f_,adresse_f) | ||
+ | |||
+ | < | ||
+ | **Remarque :** le schéma est maintenant constitué de deux tables. | ||
+ | * Les tables ont un attribut commun : //nom_f// (clé primaire de la table Fournisseur). | ||
+ | * La clé primaire de la table des Fournisseurs est dupliquée dans la table des prix (appelée ici **Catalogue**). | ||
+ | * On dit que //nom_f// est une **clé étrangère** de la table des prix (l’attribut fait référence à la clé primaire d’une autre table, en l’occurrence la table des fournisseurs - voir [[public: | ||
+ | </ | ||
+ | </ | ||
+ | |||
+ | === 5.3 3ème forme normale (3FN) === | ||
+ | |||
+ | <note important> | ||
+ | **Dépendance Fonctionnelle Directe (DFD) :** | ||
+ | |||
+ | La dépendance fonctionnelle entre 2 attributs Ai et Aj est //directe// s’il n’existe pas de Ak tel que : | ||
+ | Ai→Ak→Aj | ||
+ | </ | ||
+ | |||
+ | <note important> | ||
+ | **3ème Forme Normale (3FN)** | ||
+ | |||
+ | Un schéma est 3FN : | ||
+ | * S’il est 2FN | ||
+ | * Si tous les attributs sont en DFD avec la clé. | ||
+ | </ | ||
+ | |||
+ | < | ||
+ | **Exemple :** | ||
+ | |||
+ | Commande(num_commande_,nom_f, adresse_f, composant, quantité) | ||
+ | num_commande→nom_f, composant, quantité | ||
+ | nom_f→adresse_f | ||
+ | |||
+ | Le schéma n’est pas 3FN!! (dépendance transitive entre num_commande et adresse) | ||
+ | </ | ||
+ | |||
+ | |||
+ | === 5.4 Normalisation 3FN === | ||
+ | * Lorsqu’un schéma relationnel n’est pas en troisième forme normale, __il doit être **normalisé**__: | ||
+ | |||
+ | < | ||
+ | **Normalisation 3FN** | ||
+ | * On crée une table pour chaque DFD trouvée au sein des attributs n' | ||
+ | |||
+ | |||
+ | Soit : | ||
+ | R(A1,...,Am_,B1,...,Bi,...,Bj,...,Bn) | ||
+ | avec : | ||
+ | A1,...,AmDFD→B1,...,Bi,...,Bj−1,Bj+1,...,Bn | ||
+ | BiDFD→Bj | ||
+ | Alors : | ||
+ | R1(A1,...,Am_,B1,...,Bi,...,Bj−1,Bj+1,...,Bn) | ||
+ | R2(Bi_,Bj) | ||
+ | |||
+ | <note important> | ||
+ | ** Attention ** | ||
+ | |||
+ | Comme précédemment, | ||
+ | </ | ||
+ | |||
+ | </ | ||
+ | |||
+ | < | ||
+ | |||
+ | __Avant__ : | ||
+ | * **Commande** (__num_commande__, | ||
+ | * avec : | ||
+ | * num_commande → nom_f, composant, quantité | ||
+ | * nom_f → adresse_f | ||
+ | |||
+ | __Après__ : | ||
+ | * **Commande** (__num_commande__, | ||
+ | * **Client** (__nom_f__, adresse_f) | ||
+ | |||
+ | L’attribut nom_f est maintenant clé primaire de la table Client et clé étrangère de la table Commande. | ||
+ | </ | ||
+ | |||
+ | ==== 6. Modèle ensembliste ==== | ||
+ | |||
+ | |||
+ | <note tip> | ||
+ | Pour leur conception, les bases de données sont ici vues comme des ensembles constitués de plusieurs populations d' | ||
+ | </ | ||
+ | |||
+ | Une base de donnée est constituée de plusieurs ensembles d' | ||
+ | |||
+ | __Exemple 1 :__ | ||
+ | * Ensembles d' | ||
+ | * Ensembles de commandes | ||
+ | * Ensembles d' | ||
+ | * Ensembles de clients | ||
+ | |||
+ | __Exemple 2 :__ | ||
+ | * Ensembles d' | ||
+ | * Ensembles de séances | ||
+ | * Ensembles de cours | ||
+ | * Ensembles de copies | ||
+ | |||
+ | On parle plus généralement d' | ||
+ | |||
+ | |||
+ | |||
+ | <note tip> | ||
+ | ** Le modèle entité/ | ||
+ | |||
+ | Le modèle entité/ | ||
+ | |||
+ | Le modèle entités/ | ||
+ | |||
+ | </ | ||
+ | |||
+ | === Généralités === | ||
+ | |||
+ | Une **entité** x | ||
+ | * est une représentation d'un objet du monde réel, | ||
+ | * appartenant au système/à l' | ||
+ | * Une entité est décrite par une ou plusieurs valeurs caractéristiques, | ||
+ | |||
+ | Les informations conservées au sujet des entités d'un ensemble sont les **attributs**. | ||
+ | * Chaque **attribut** : | ||
+ | * a un **nom** unique dans le contexte de cet ensemble d' | ||
+ | * Exemples de noms concrets : // | ||
+ | * prend ses valeurs dans un domaine bien spécifié, | ||
+ | * également appelé le **type** de l' | ||
+ | * Le domaine d'un attribut est noté dom(Aj)=Dj. | ||
+ | * Exemples : | ||
+ | * dom(couleur)=rouge,vert,bleu,jaune, | ||
+ | * dom(nom)=ensemble des chaînes de caractères, | ||
+ | * dom(salaire)= entiers naturels | ||
+ | * etc... | ||
+ | <note important> | ||
+ | * Un attribut Aj est une fonction à valeur sur Dj : | ||
+ | Aj:E→Dj | ||
+ | x↦Aj(x) | ||
+ | </ | ||
+ | |||
+ | <note tip> | ||
+ | * Un attribut peut être : | ||
+ | * simple ou composé. | ||
+ | * Exemple : une //adresse// peut être décrite par une simple chaîne de caractères, | ||
+ | * obligatoire ou facultatif (Dj peut ou non contenir la valeur ø ). | ||
+ | * atomique ou non (Un attribut peut posséder 0, 1 voire plusieurs valeurs...) | ||
+ | </ | ||
+ | |||
+ | |||
+ | Un **ensemble d' | ||
+ | E={x1,…,xn} | ||
+ | Il regroupe (ou associe) plusieurs entités ayant des caractéristiques communes (descriptibles à l'aide du même ensemble d' | ||
+ | |||
+ | <note tip> | ||
+ | **Exemples** : | ||
+ | * les employés d'une firme, | ||
+ | * les cours de Centrale Méditerranée, | ||
+ | * une collection de disques, | ||
+ | * etc… | ||
+ | </ | ||
+ | |||
+ | * Les éléments d’un ensemble d’entités sont // | ||
+ | * les attributs (A1,...,Am) servent à décrire les éléments de l’ensemble. | ||
+ | * Le schéma R de l’ensemble E est une // | ||
+ | * Soit : | ||
+ | R:X→D1×...×Dm | ||
+ | xi↦(A1(xi),…,Am(xi)) | ||
+ | |||
+ | <note tip> | ||
+ | ** représentation graphique ** : | ||
+ | |||
+ | {{public: | ||
+ | |||
+ | </ | ||
+ | |||
+ | < | ||
+ | ** Exemples **: | ||
+ | |||
+ | {{public: | ||
+ | |||
+ | |||
+ | </ | ||
+ | |||
+ | | ||
+ | |||
+ | === Définitions === | ||
+ | |||
+ | Modéliser une base de données, c'est : | ||
+ | * Identifier les différents ensembles en interaction | ||
+ | * Identifier les liens de dépendance entre les différents ensembles | ||
+ | |||
+ | < | ||
+ | {{public: | ||
+ | </ | ||
+ | < | ||
+ | {{public: | ||
+ | </ | ||
+ | < | ||
+ | {{public: | ||
+ | </ | ||
+ | <note tip> | ||
+ | Les liens entre les différents ensembles sont appelés des **associations** | ||
+ | </ | ||
+ | |||
+ | === Association === | ||
+ | |||
+ | <note important> | ||
+ | Une association exprime des relations de dépendance entre deux ou plusieurs ensembles d’entités. | ||
+ | |||
+ | **Définition** : Une **association** entre les ensembles E1, ..., Ek est un sous-ensemble du produit E1×...×Ek. | ||
+ | |||
+ | Il s'agit donc d'un ensemble de k-uplets {...,(x1,…,xk),…} | ||
+ | |||
+ | où k est le degré de l' | ||
+ | * k=2 : association binaire | ||
+ | * k=3 : association ternaire | ||
+ | * etc… | ||
+ | |||
+ | </ | ||
+ | |||
+ | === Rôles des associations === | ||
+ | * // | ||
+ | * // | ||
+ | * // | ||
+ | * // | ||
+ | * ... | ||
+ | |||
+ | |||
+ | === Contraintes de cardinalité === | ||
+ | |||
+ | <note tip> | ||
+ | Pour chaque ensemble participant à une association, | ||
+ | |||
+ | On donne en général un intervalle [binf,bsup] qui définit le nombre d' | ||
+ | |||
+ | </ | ||
+ | |||
+ | |||
+ | === Représentation graphique === | ||
+ | |||
+ | **Associations binaires** | ||
+ | |||
+ | |{{public: | ||
+ | |{{public: | ||
+ | |{{public: | ||
+ | |||
+ | **Associations ternaires** | ||
+ | |||
+ | | {{public: | ||
+ | |||
+ | |||
+ | === Types d' | ||
+ | |||
+ | **Associations de 1 à plusieurs (fonctionnelle)** | ||
+ | |||
+ | Relation non symétrique entre les deux ensembles : […,1] d'un côté, […,N] de l' | ||
+ | Relation de type contenant/ | ||
+ | Il s'agit du type d' | ||
+ | |||
+ | <note tip> | ||
+ | On dit parfois que l’ensemble dont la participation est unique est dit “à gauche” de l’association fonctionnelle, | ||
+ | |||
+ | “à gauche” → “à droite” | ||
+ | </ | ||
+ | |||
+ | |{{public: | ||
+ | |{{public: | ||
+ | |||
+ | **Associations de plusieurs à plusieurs (croisée)** | ||
+ | |||
+ | Dans une association “croisée”, | ||
+ | |||
+ | |{{public: | ||
+ | |{{public: | ||
+ | |||
+ | === Modèles Entité Associations valués === | ||
+ | |||
+ | <note important> | ||
+ | Dans le cadre du modèle entité/ | ||
+ | * les attributs des ensembles d' | ||
+ | * Soit A un attribut de l' | ||
+ | A:E→dom(A) | ||
+ | * les attributs des associations sont des // | ||
+ | * Soit B un attribut de l' | ||
+ | B:E×F→dom(B) | ||
+ | </ | ||
+ | |||
+ | ** Mesures ** | ||
+ | * Les mesures sont les données saisies sur les éléments d'un ensemble. Chaque mesure est associée à un attribut. | ||
+ | * Le schéma de l' | ||
+ | * Les éléments de l' | ||
+ | * Une //clé// est un ensemble d' | ||
+ | |||
+ | <note tip> **TODO** | ||
+ | |||
+ | Ensembles discernables / non discernables | ||
+ | </ | ||
+ | ** Opérateurs ** | ||
+ | * On s’intéresse ici aux associations qui représentent une “opération” (inscription, | ||
+ | * Lors d’une mise à jour de la base, certains événements tels que l’emprunt ou le retour d’un ouvrage, l’affectation d’un employé à un poste, | ||
+ | * Il est possible de garder une trace des événements passés en mettant un (ou plusieurs) attributs sur une association. | ||
+ | * Ainsi, certaines associations peuvent être " | ||
+ | * avoir lieu à une date | ||
+ | * ou prendre place sur une durée précise (prêt, | ||
+ | * On peut ainsi mémoriser : | ||
+ | * " | ||
+ | * " | ||
+ | |||
+ | |||
+ | |||
+ | <note tip> | ||
+ | **Exemple** | ||
+ | " | ||
+ | |{{public: | ||
+ | </ | ||
+ | |||
+ | <note tip> | ||
+ | **Exemple** | ||
+ | * Chaque coureur est décrit par ses nom, prénom, nationalité et numéro de maillot. | ||
+ | * Chaque coureur appartient à une équipe qui possède un numéro, un sponsor associé. | ||
+ | * Chaque coureur participe à une ou plusieurs étapes. Une étape se caractérise par son numéro, son type (contre la montre/ | ||
+ | * A chaque étape est associée un classement d' | ||
+ | |||
+ | |{{public: | ||
+ | |||
+ | </ | ||
+ | |||
+ | ==== 7. Traduction vers le modèle relationnel ==== | ||
+ | |||
+ | Il est possible de traduire un modèle entité/ | ||
+ | |||
+ | <note tip> | ||
+ | Lors de la réalisation d'une base de données, on passe en général par les étapes suivantes: | ||
+ | - Conception de la base sous forme d'un modèle entité/ | ||
+ | - Traduction sous la forme d'un modèle relationnel. | ||
+ | - Normalisation (voir [[https:// | ||
+ | - Mise en œuvre informatique. | ||
+ | </ | ||
+ | |||
+ | Un petit nombre de règles permettent de traduire un modèle entité/ | ||
+ | * Selon ces règles, à la fois les ensembles d' | ||
+ | * Les liaisons et dépendances entre schémas de relation sont assurés par la définition des **clés étrangères** (attributs communs à plusieurs tables). | ||
+ | |||
+ | === Schéma de base et clé étrangère === | ||
+ | |||
+ | <note important> | ||
+ | * Un schéma (ou modèle) de bases de données est un ensemble fini de schémas de relation. | ||
+ | * Une base de données est un ensemble fini de relations. | ||
+ | * Les liens et associations entre relations entre s’expriment sous la forme de **clés étrangères** | ||
+ | </ | ||
+ | |||
+ | <note tip> | ||
+ | **Définition** | ||
+ | |||
+ | * Au sein d'un schéma relationnel R, Une clé étrangère est un attribut (ou un groupe d' | ||
+ | * La présence d'une clé étrangère au sein d'une relation r de schéma R introduit une contrainte d' | ||
+ | * la valeur des attributs de la clé étrangère d'un tuple de r doit être trouvée dans la table s correspondante. | ||
+ | * On indique la présence d'une clé étrangère à l'aide de pointillés : {…, __C__l__é__ __é__t__r__a__n__g__è__r__e__, | ||
+ | </ | ||
+ | |||
+ | |||
+ | **Exemple ** | ||
+ | < | ||
+ | **Schéma de base relationnelle** : | ||
+ | |||
+ | * **Clients** ( __nom_client__, | ||
+ | * **Commandes** ( __num_Commande__, | ||
+ | * **Fournisseurs** ( __nom_fournisseur__, | ||
+ | * **Catalogue** ( __nom_fournisseur, | ||
+ | </ | ||
+ | |||
+ | === Traduction des associations de plusieurs à plusieurs === | ||
+ | |||
+ | Une association croisée ne contient que des contraintes de cardinalité de type [..,N]. Soit R une telle association et E1, ..., Ek les ensembles participant à l' | ||
+ | |||
+ | <note important> | ||
+ | **Règle de traduction :** | ||
+ | * Chaque ensemble Ei est traduit par un schéma relationnel (contenant les mêmes attributs) | ||
+ | * L' | ||
+ | * les clés primaires des ensembles participant à l’association | ||
+ | * (éventuellement) les attributs propres à l' | ||
+ | </ | ||
+ | |||
+ | <note tip> | ||
+ | {{public: | ||
+ | |||
+ | ** Traduction :** | ||
+ | * **Pays** (__nom_pays__, | ||
+ | * **Matière_première** ( __nom_matière__, | ||
+ | * **Exportation** (__n__o__m__ __p__a__y__s, | ||
+ | |||
+ | </ | ||
+ | |||
+ | <note tip> | ||
+ | {{public: | ||
+ | **Traduction** : | ||
+ | * **Appareil** (__code_appareil__, | ||
+ | * **Séance** (__date, heure, local__) | ||
+ | * **Réservation** (__c__o__d__e __a__p__p__a__r__e__i__l, | ||
+ | |||
+ | </ | ||
+ | |||
+ | === Traduction des associations de un à plusieurs === | ||
+ | |||
+ | Soit une association fonctionnelle R. On suppose qu'il existe au moins un ensemble A de cardinalité unique [1,1] participant l’association. | ||
+ | |||
+ | <note important> | ||
+ | **Règle de traduction** | ||
+ | * Chaque ensemble participant est traduit sous forme de schéma relationnel | ||
+ | * L' | ||
+ | </ | ||
+ | |||
+ | <note tip> | ||
+ | **Exemple** : | ||
+ | {{public: | ||
+ | </ | ||
+ | |||
+ | <note tip> | ||
+ | **Remarque** : lorsque l’association est valuée, les attributs de l’association sont également injectés dans la table représentant l’ensemble de gauche. | ||
+ | {{public: | ||
+ | </ | ||
+ | |||
+ | <note tip> | ||
+ | **Exemple** | ||
+ | {{public: | ||
+ | **Traduction** : | ||
+ | * **Groupe_TD**( __num_groupe__, | ||
+ | * **Entreprise** ( __nom_entreprise__, | ||
+ | * **Etudiant** ( __num_etudiant__, | ||
+ | </ | ||
+ | |||
+ | === Exemple complet === | ||
+ | |||
+ | < | ||
+ | **Schéma de base relationnelle** : | ||
+ | |||
+ | * **Clients** ( __nom_client__, | ||
+ | * **Commandes** ( __num_Commande__, | ||
+ | * **Fournisseurs** ( __nom_fournisseur__, | ||
+ | * **Catalogue** ( __nom_fournisseur, | ||
+ | </ | ||
+ | < | ||
+ | ** Réalisation ** : | ||
+ | |||
+ | **Clients** : | ||
+ | ^__nom_client__^adresse_client^solde^ | ||
+ | |Durand|7, rue des Lilas|335, | ||
+ | |Dubois|44, av. du Maréchal Louis|744, | ||
+ | |Duval|5, place du marché|33, | ||
+ | |||
+ | **Commandes** : | ||
+ | ^__num_Commande__^ __n__o__m__ __c__l__i__e__n__t^ composant^ quantité^ | ||
+ | |6674|Dubois|micro controller|55| | ||
+ | |6637|Dubois|radio tuner|2| | ||
+ | |6524|Durand|transistor|4| | ||
+ | |6443|Duval|micro controller|7| | ||
+ | |||
+ | **Fournisseurs** : | ||
+ | ^__nom_fournisseur__^ adresse_fournisseur^ | ||
+ | |Sage|33, College street, London| | ||
+ | |MoxCom|77 Ashley square, | ||
+ | |||
+ | **Catalogue** : | ||
+ | ^__nom_fournisseur__^ __composant__^ prix^ | ||
+ | |Sage|transistor|4, | ||
+ | |MoxCom|micro controller|3, | ||
+ | |MoxCom|radio tuner|7,0| | ||
+ | </ |