tc_info:cm6

Pour leur conception, les bases de données sont ici vues comme des ensembles constitués de plusieurs populations d'objets en interaction, participant au bon fonctionnement d'un certain système. Établir un schéma de base de données consiste à décrire ces différentes populations d'objets, mais surtout et principalement à décrire les dépendances et les interactions entre ces populations.

Une base de donnée est constituée de plusieurs ensembles d'objets et d'opérateurs participant au bon fonctionnement d'un système:

Exemple 1 :

  • Ensembles d'employés
  • Ensembles de commandes
  • Ensembles d'articles
  • Ensembles de clients

Exemple 2 :

  • Ensembles d'étudiants
  • Ensembles de séances
  • Ensembles de cours
  • Ensembles de copies

On parle plus généralement d'ensembles d'entités.

Le modèle entité/association

Le modèle entité/associations est une méthode de description des relations entre ensembles d’entités. Il s’appuie sur le prédicat selon lequel tous les éléments des ensembles d’entités sont discernables.

Le modèle entités/associations repose sur un langage graphique de description des données, indépendant du support et de la mise en œuvre informatique.

Définitions

Modéliser une base de données, c'est :

  • Identifier les différents ensembles en interaction
  • Identifier les liens de dépendance entre les différents ensembles
Les liens entre les différents ensembles sont appelés des associations

Association

Une association exprime des relations de dépendance entre deux ou plusieurs ensembles d’entités.

Définition : Une association entre les ensembles $E_1$, …, $E_k$ est un sous-ensemble du produit $E_1 \times ... \times E_k$.

Il s'agit donc d'un ensemble de k-uplets $\{..., (t_1,…,t_k), …\}$ t.q. $t_1 \in E_1,…, t_k \in E_k$.

où $k$ est le degré de l'association :

  • k=2 : association binaire
  • k=3 : association ternaire
  • etc…

Rôles des associations

  • Attribution : propriété, réservation, participation, supervision, auteur, rôle, pilote, …
  • Événements : achat, vente, séance, épreuve, appel, consultation, réunion, transaction, transport …
  • Aggrégation/Composition : tout/parties, contenant/contenu, supérieur/subordonné, pays/région, …
  • Relations entre membres : parenté, collaboration, cercle d'amis, …

Contraintes de cardinalité

Pour chaque ensemble participant à une association, on précise dans combien d'instances de l'association chaque entité peut apparaître.

On donne en général un intervalle $[b_\text{inf},b_\text{sup}]$ qui définit le nombre d'apparitions autorisées pour chaque rôle de l'association

Représentation graphique

Associations binaires

Associations ternaires

Types d'associations

Associations de 1 à plusieurs (fonctionnelle)

Relation non symétrique entre les deux ensembles : […,1] d'un côté, […,N] de l'autre. Relation de type contenant/contenu, propriétaire/objet possédé, occupant/occupé, actif/passif etc… Il s'agit du type d'association le plus "courant".

On dit parfois que l’ensemble dont la participation est unique est dit “à gauche” de l’association fonctionnelle, et celui dont la participation est multiple est “à droite”, autrement dit la pointe de la flèche désigne l’ensemble de “droite”:

“à gauche” → “à droite”

Associations de plusieurs à plusieurs (croisée)

Dans une association “croisée”, les tous les lien de l’association sont de cardinalité multiple […,N]

Modèles Entité Associations valués

Dans le cadre du modèle entité/association :
  • les attributs des ensembles d'entités sont des mesures:
    • Soit $A$ un attribut de l'ensemble d'entités $\mathcal{E}$

$$ A : \mathcal{E} \rightarrow D(A) $$

  • les attributs des associations sont des opérateurs :
    • Soit $B$ un attribut de l'association sur $\mathcal{E} \times \mathcal{F}$

$$ B : \mathcal{E}\times \mathcal{F}\rightarrow D(B) $$

Mesures

  • Plusieurs mesures peuvent être opérées sur les objets d'un ensemble. Chaque mesure est un attribut
  • Le schéma de l'ensemble est l'ensemble des attributs servant à le mesurer
  • Les éléments de l'ensemble sont discernables ssi il existe un jeu de mesures différent pour chaque objet de l'ensemble
  • Une clé est un jeu de mesures minimal (permettant de distinguer les objets) appartenant au schéma
TODO

Ensembles discernables / non discernables

Opérateurs

  • On s’intéresse ici aux associations qui représentent une “opération” (inscription, achat, embauche, affectation…).
  • Lors d’une mise à jour de la base, certains événements tels que l’emprunt ou le retour d’un ouvrage, l’affectation d’un employé à un poste, ou la liste des anciens clients disparaissent.
  • Il est possible de garder une trace des événements passés en mettant un (ou plusieurs) attributs sur une association.
  • Ainsi, certaines associations peuvent être "datées", c'est à dire
    • avoir lieu à une date
    • ou prendre place sur une durée précise (prêt,accès temporaire, statut temporaire…)
  • On peut ainsi mémoriser :
    • "Monsieur Dupont a été employé au département logistique de tant à tant."…
    • "L'étudiant X a été élève Centrale Marseille de telle année à telle année"…
Exemple "Monsieur Dupont a été employé au département logistique de tant à tant."…
Exemple
  • Chaque coureur est décrit par ses nom, prénom, nationalité et numéro de maillot.
  • Chaque coureur appartient à une équipe qui possède un numéro, un sponsor associé.
  • Chaque coureur participe à une ou plusieurs étapes. Une étape se caractérise par son numéro, son type (contre la montre/étape simple), ses points de départ et d'arrivée, sa date.
  • A chaque étape est associée un classement d'arrivée pour chaque coureur, avec la durée totale de course.

Il est possible de traduire un modèle entité/association vers un modèle relationnel (en perdant quelques propriétés).

Lors de la réalisation d'une base de données, on passe en général par les étapes suivantes:
  1. Conception de la base sous forme d'un modèle entité/association.
  2. Traduction sous la forme d'un modèle relationnel.
  3. Normalisation (voir Normalisation d'un schéma)
  4. Mise en œuvre informatique.

Un petit nombre de règles permettent de traduire un modèle entité/association vers un modèle relationnel.

  • Selon ces règles, à la fois les ensembles d'entités et les associations sont transformés en schémas relationnels.
  • Les liaisons et dépendances entre schémas de relation sont assurés par la définition des clés étrangères (attributs communs à plusieurs tables).

Schéma de base et clé étrangère

  • Un schéma (ou modèle) de bases de données est un ensemble fini de schémas de relation.
  • Une base de données est un ensemble fini de relations.
  • Les liens et associations entre relations entre s’expriment sous la forme de clés étrangères
Définition
  • Au sein d'un schéma relationnel $R$, Une clé étrangère est un attribut (ou un groupe d'attributs) qui constitue la clé primaire d'un schéma $S$ distinct de $R$.
  • La présence d'une clé étrangère au sein d'une relation $r$ de schéma $R$ introduit une contrainte d'intégrité sur les données :
    • la valeur des attributs de la clé étrangère d'un tuple de $r$ doit être trouvée dans la table s correspondante.
  • On indique la présence d'une clé étrangère à l'aide de pointillés : {…, Clé étrangère, …}

Exemple

Schéma de base relationnelle :
  • Clients ( nom_client, adresse_client, solde)
  • Commandes ( num_Commande, nom client, composant, quantité)
  • Fournisseurs ( nom_fournisseur, adresse_fournisseur)
  • Catalogue ( nom_fournisseur, composant, prix )

Traduction des associations de plusieurs à plusieurs

Une association croisée ne contient que des contraintes de cardinalité de type [..,N]. Soit $R$ une telle association et $E_1$, …, $E_k$ les ensembles participant à l'association.

Règle de traduction :
  • Chaque ensemble $E_i$ est traduit par un schéma relationnel (contenant les mêmes attributs)
  • L'association $R$ est traduite sous la forme d'un schéma relationnel contenant:
    • les clés primaires des ensembles participant à l’association
    • (éventuellement) les attributs propres à l'association,

Traduction :

  • Pays (nom_pays, superficie, population, PIB )
  • Matière_première ( nom_matière, unité, prix )
  • Exportation (nom pays, nom matière, quantité)
Traduction :
  • Appareil (code_appareil, type, marque, modèle)
  • Séance (date, heure, local)
  • Réservation (code appareil,date, heure, local)

Traduction des associations de un à plusieurs

Soit une association fonctionnelle $R$. On suppose qu'il existe au moins un ensemble $A$ de cardinalité unique [1,1] participant l’association.

Règle de traduction
  • Chaque ensemble participant est traduit sous forme de schéma relationnel
  • L'association $R$ est traduite sous forme de clé étrangère : l'ensemble $A$ reçoit la clé primaire du (ou des) ensemble(s) dont la participation est multiple.
Exemple :
Remarque : lorsque l’association est valuée, les attributs de l’association sont également injectés dans la table représentant l’ensemble de gauche.
Exemple Traduction :
  • Groupe_TD( num_groupe, LV1, LV2)
  • Entreprise ( nom_entreprise, Adresse)
  • Etudiant ( num_etudiant, Nom, Prénom, Date_naiss, num groupe, intitulé, date, durée, nom entreprise)

Exemple complet

Schéma de base relationnelle :
  • Clients ( nom_client, adresse_client, solde)
  • Commandes ( num_Commande, nom client, nom fournisseur, composant, quantité, montant)
  • Fournisseurs ( nom_fournisseur, adresse_fournisseur)
  • Catalogue ( nom_fournisseur, composant, prix )
Réalisation :

Clients :

nom_clientadresse_clientsolde
Durand7, rue des Lilas335,00
Dubois44, av. du Maréchal Louis744,00
Duval5, place du marché33,00

Commandes :

num_Commande nom client composant quantité
6674Duboismicro controller55
6637Duboisradio tuner2
6524Durandtransistor4
6443Duvalmicro controller7

Fournisseurs :

nom_fournisseur adresse_fournisseur
Sage33, College street, London
MoxCom77 Ashley square,Mumbay

Catalogue :

nom_fournisseur composant prix
Sagetransistor4,4
MoxCommicro controller3,7
MoxComradio tuner7,0

SQL

Exemple de définition de table avec clé étrangère en SQL :
  CREATE TABLE Commande (
    num_commande INTEGER NOT NULL,
    nom_client VARCHAR(30),
    nom_fournisseur VARCHAR(30),
    composant VARCHAR(30),
    quantité INTEGER,
    montant DECIMAL(12,2) NOT NULL,
    PRIMARY KEY (num_commande),
    FOREIGN KEY (nom_client) REFERENCES Client,
    FOREIGN KEY (nom_fournisseur, composant) REFERENCES Catalogue);

Interroger une base de données , c’est sélectionner certaines données parmi l'ensemble des données proposés.

Exemples :

  • Donner la liste des pays exportateurs de pétrole
  • Liste des musiciens jouant à la fois du piano et du violon
  • Liste des artistes français disque d'or en 1977
  • Liste des suspects châtain taille moyenne présents à Poitiers la nuit du 12 au 13 février

C’est également croiser et recouper les informations présentes dans des bases

  • pour faire ressortir des corrélations (exemple : type d'habitat/intentions de vote),
  • pour des enquêtes de consommation, du marketing ciblé …

C’est enfin personnaliser l'accès à l'information : ne retenir que les informations utiles à un instant et pour une personne donnée.

  • Emploi du temps de l'élève X pour la semaine Y.
  • Factures impayées du client Z
L’algèbre relationnelle
  • propose un certain nombre d’opérations ensemblistes :
    • Intersection,
    • Union,
    • Projection,
    • Différence,
  • qui, à partir d'un ensemble de relations, permettent de construire de nouvelles relations.
  • La relation nouvellement construite contient le résultat de la requête

Extraction d'information à partir d'une table unique :

  • projection $\pi$ = extraction de colonnes
  • sélection $\sigma$ = extraction de lignes

7.4.1 Projection : π

Projection
  • Soit $r$ une relation de schéma $R$.
  • Soit $S$ un ensemble d'attributs, avec $S$ ⊆ $R$

La projection $\pi_S(r)$ est une nouvelle relation de schéma $S$ obtenue à partir des éléments de $r$ restreints au schéma $S$ $$\pi_S(r) = \{t(S)|t \in R\}$$

(avec $t(S)$ la restriction de $t$ au schéma $S$)

Exemple Catalogue :
nom_fournisseuradresse_fournisseurcomposant prix
Sage33, College street, Londontransistor4,4
MoxCom77 Ashley square,Mumbaymicro controller3,7
MoxCom77 Ashley square,Mumbayradio tuner7,0

Requete : Donner la liste des fournisseurs (avec leur adresse): $$u = \pi_\text{nom_fournisseur, adresse_fournisseur} (\text{Catalogue})$$

$\rightarrow$ u :

nom_fournisseuradresse_fournisseur
Sage33, College street, London
MoxCom77 Ashley square,Mumbay

7.4.2 Sélection : σ

Condition sur R
  • On considère le schéma $R (A_1, …, A_n)$
  • Une condition $F$ sur $R$ :
    • est un ensemble de contraintes sur les valeurs des attributs $A_1$, …, $A_n$
    • construites à l'aide d'opérateurs booléens classiques :
      • ∧(et),
      • ∨(ou),
      • ¬(non),
      • =, ≠, >,<, ≥ ,≤, …
      • et de valeurs numériques ou de texte.
Exemples : $$ F = (A_1 = 3) ∧ (A_1 > A_2) ∧ (A_3 ≠ 4)$$ $$ F = (A_1 = 2) ∨ (A_2 = "Dupont")$$
Sélection
  • Soit $r$ une relation de schéma $R$
  • Soit $F$ une condition sur $R$

La sélection $σ_F(r)$ est une nouvelle relation de schéma $R$ , constituée de l'ensemble des enregistrements de $r$ qui satisfont la condition $F$.

$$σ_F(r) = \{ t ∈ r | F( t ) \text{est vrai} \}$$

Exemple :

Requête : Donner la liste des fournisseurs qui vendent des micro-controleurs

$$u = Π_\text{nom_fournisseur}( σ_\text{Composant = micro controller} ( \text{Fournisseur} ))$$ u :

nom_f
Moxcom
Exemple

Pays :

nom_payssuperficiepopulation PIB/hab
Algérie2.300.00031.300.0001630$
Niger1.200.00011.400.000890$
Arabie Saoudite2.150.00024.300.0008110$

Requête : Donner la liste des pays dont le PIB/hab est > 1000$ $$u = Π_\text{nom_pays}( σ_\text{PIB/hab > 1000 } ( \text{Pays} ))$$

u :

nom_pays
Algérie
Arabie Saoudite

7.4.3 Structure d'une requête SQL

SELECT    A1,A2,, An    // liste d’attributs
FROM      R               // nom de la TABLE
WHERE     F               // condition sur les attributs

cette requête est semblable à :

  • une sélection algébrique $σ_F$
  • suivie par une projection algébrique $Π_{A1, …, An}$

soit : $$Π_{A1, …, An}( σ_F ( R ))$$

Exemples :

  • Qui fournit des transistors ?
    SELECT nom_fournisseur
    FROM Fournisseur
    WHERE composant = ’transistor’;
  • Liste de toutes les commandes de transistors :
    SELECT *
    FROM Commandes
    WHERE composant = ’transistor’
  • Qui fournit des micro-controleurs à moins de 5$?
    SELECT nom_fournisseur
    FROM Catalogue
    WHERE composant = ’micro controller’ AND prix < 5

Principe : recoupement d'informations présentes dans plusieurs tables :

  • Croisement des critères de sélection : Jointure
  • Recherche ciblée : Division

7.5.1 La jointure : ⋈

Union de deux éléments :
  • Soient les relations r et s de schémas R et S.
  • On note R ⋂ S la liste des attributs communs aux deux schémas et R ⋃ S la liste des attributs appartenant à R ou à S.
  • soit t ∈ r et q ∈ s tels que t(R ⋂ S) = q(R ⋂ S)

On note t ⋃ q le tuple formé des valeurs de t et de q étendues au schéma R ⋃ S

Produit cartésien
  • Soient r et s (de schémas R et S), avec R ⋂ S = Ø

Le produit cartésien r × s est une nouvelle table de schéma R ⋃ S combinant les tuples de r et de s de toutes les façons possibles : $$r × s = \{t \cup q : t \in r, q \in s\}$$

  • La jointure est une opération qui consiste à effectuer un produit cartésien des tuples de deux relations pour lesquelles certaines valeurs correspondent.
  • Le résultat de l'opération est une nouvelle relation.
Jointure
  • Soient r et s (de schémas R et S), avec R ⋂ S ≠ Ø
  • La jointure r ⋈ s est une nouvelle table de schéma R ⋃ S combinant les tuples de r et de s ayant des valeurs communes pour les attributs communs.

$$r ⋈ s = \{t \cup q : t∈ r, q∈ s, t(R \cap S) = q(R \cap S)\}$$

Exemple

Matière_première :

nom_matièreunitéprix
pétrolebaril45$
gazGJ3$
uraniumlb12$

Exportations :

nom_paysnom_matièrequantité
Algériepétrole180.000
Algériegaz20.000
Nigeruranium30.000
Arabie Saouditepétrole2.000.000
Arabie Saouditegaz750.000

Matière_première ⋈ Exportations :

nom_paysnom_matièrequantitéunitéprix
Algériepétrole180.000baril45$
Algériegaz20.000GJ3$
Nigeruranium30.000lb12$
Arabie Saouditepétrole2.000.000baril45$
Arabie Saouditegaz750.000GJ3$

Exemples de requêtes

  • Donner la liste des PIB/hab des pays exportateurs de pétrole” :

$$Π_\text{PIB/hab}( σ_\text{nom_matière = pétrole} ( \text{Pays} ⋈ \text{Exportations} ))$$

Schéma de base relationnelle :
  • Clients ( nom_client, adresse_client, solde)
  • Commandes ( num_Commande, nom client, nom fournisseur, composant, quantité, montant)
  • Fournisseurs ( nom_fournisseur, adresse_fournisseur)
  • Catalogue ( nom_fournisseur, composant, prix )
  • Donner le nom et l'adresse des clients qui ont commandé des micro controleurs” :

$$Π_\text{nom_client,adresse_client}( σ_\text{composant = 'micro-controller'} ( \text{Client} ⋈ \text{Commandes} ))$$

7.5.2 Requêtes multi-tables en SQL

SELECT    A1,A2,, An       // liste d’attributs
FROM      R1,, Rm          // liste de TABLES
WHERE     F1 ANDAND Fl    // liste de conditions sur les attributs 
                             // (en particulier conditions sur les attributs 
                             // sur lesquel  s’effectue la jointure)

Pour exprimer la jointure sur l’attribut 'Aj' commun aux tables 'R1' et 'R2', on écrira : 'R1.Aj = R2.Aj'

Exemples :

SELECT PIB_par_hab 
FROM Pays NATURAL JOIN Exportations
WHERE nom_matiere = 'petrole'
SELECT PIB_par_hab 
FROM Pays, Exportations
WHERE nom_matiere = 'petrole'
AND Pays.nom_pays = Exportations.nom_pays
SELECT PIB_par_hab 
FROM Pays
WHERE nom_pays IN (
  SELECT  nom_pays 
  FROM Exportations
  WHERE nom_matiere = 'petrole'
  )

7.5.3 La division

Division
  • Soient r (de schémas R) et s (de schémas S), avec S ⊆ R :

La division r ÷ s est la relation (table) u de schéma R-S maximale contenant des tuples tels que u × s ⊆ r (avec × représentant le produit cartésien)

$$r ÷ s = \{ t | ∀ q ∈ s, t \cup q ∈ r\}$$

→ on cherche les éléments de t qui “correspondent” à s

  • Certaines requêtes, peuvent être le résultat de la combinaison de plusieurs critères de recherche
  • La combinaison de résultats est généralement réalisée à l'aide des opérations ensemblistes classiques (intersection, union…) pour exprimer «et», «ou», «non»…
  • Pour alléger les formules, il est possible d'utiliser des tables intermédiaires.
Union
  • Soient r1 et r2 deux tables de schéma R.

L'union r1 U r2 est une nouvelle table de schéma R constituée de l'ensemble des enregistrements qui appartiennent à r1 ou à r2: $$r1 \cup r2 = { t ∈ r1} \cup { t ∈ r2}$$

Intersection
  • Soient r1 et r2 deux tables de schéma R.

L'intersection r1 ⋂ r2 est une nouvelle table de schéma R constituée de l'ensemble des enregistrements qui appartiennent à r1 et à r2: $$r1 \cap r2 = \{ t ∈ r1\} \cap \{ t ∈ r2\}$$

Différence
  • Soient r1 et r2 deux tables de schéma R.

La différence r1 - r2 est une nouvelle table de schéma R constituée de l'ensemble des enregistrements qui appartiennent à r1 mais pas à r2: $$r1 - r2 = \{ t ∈ r1\} - \{ t ∈ r2\}$$

Exemples :

  • Donner la liste des pays qui exportent à la fois du gaz et du pétrole :

$$\pi _{Pays} σ_\text{matière = gaz} (\text{Exportations}) \cap \pi _{Pays} σ_\text{matière = pétrole} (\text{Exportations})$$ en SQL :

SELECT pays FROM Exportations
WHERE matière = 'gaz'
INTERSECT (     SELECT pays FROM EXPORTATIONS
                WHERE matière = 'pétrole');
  • Donner la liste des pays qui exportent du gaz mais pas du pétrole :

$$\pi _{Pays} σ_\text{matière = gaz} (\text{Exportations}) - \pi _{Pays} σ_\text{matière = pétrole} (\text{Exportations})$$ en SQL :

SELECT pays FROM Exportations
WHERE matière = 'gaz'
EXCEPT (     SELECT pays FROM EXPORTATIONS
            WHERE matière = 'pétrole');

* Donner la liste des clients qui commandent uniquement des produits 'Moxcom' : $$\pi_{nom\_client}Client - \pi_{nom\_client} \sigma_{fournisseur \neq 'Moxcom'} Client ⋈ Commande$$ en SQL :

SELECT nom_client FROM Client
EXCEPT (    SELECT client FROM Client NATURAL JOIN Commande
            WHERE fournisseur <> 'Moxcom');
  • tc_info/cm6.txt
  • Dernière modification : 2018/12/13 10:01
  • de edauce