De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

Databases I Relationele Algebra Martin Caminada / Wiebren de Jonge Vrije Universiteit, Amsterdam definitieve versie 2002.

Verwante presentaties


Presentatie over: "Databases I Relationele Algebra Martin Caminada / Wiebren de Jonge Vrije Universiteit, Amsterdam definitieve versie 2002."— Transcript van de presentatie:

1 Databases I Relationele Algebra Martin Caminada / Wiebren de Jonge Vrije Universiteit, Amsterdam definitieve versie 2002

2 Overzicht

3 Queries voorbeeld query: “Geef de namen en geboortedata van de employees die bij department engineering werken” een query is een vraag naar specifieke informatie uit de database (merk op: in de database-wereld worden update-opdrachten veelal ook tot het begrip “query” gerekend)

4 Voorbeeld Database DEPARTMENT D#NAMEBUDGET D1engineering500,000 D2sales200,000 DEPENDENT EMPLOYEEE#NAME REL E#NAME BDATE D# E3Mary daughter E1John 28-08-1964 D1 E3Sue wife E2Joe 04-04-1968 D1 E4Suzie daughter E3Jack 03-09-1969 D1 E4Tom son E4Will 21-03-1971 D2 E4Mary wife E5Bridget 22-01-1972 D2

5 Resultaat query “Geef de namen en geboortedata van de employees die bij department engineering werken” NAMEBDATE John28-08-1964 Joe 04-04-1968 Jack03-09-1969

6 Te behandelen querytalen u relationele algebra u domeincalculus u tupelcalculus u SQL

7 Relationele Algebra u idee: querytaal bestaande uit operaties, gedefinieerd op één of meerdere tabellen, die elk weer opnieuw een tabel opleveren u operaties: –select (  ) –project (  ) –intersection (  ) –union (  ) / outer union –difference (-) –carthesisch product (  ) –theta join (|> <|) –division (÷)

8 Voorbeeld Select (  ) “Geef alle employees die werken bij department D2”  DNO=“D2” EMPLOYEE E#NAME BDATE D# E4Will 21-03-1971 D2 E5Bridget 22-01-1972 D2

9 Select:  cond (REL) u select condition is van de vorm: –attribuutnaam comp waarde –attribuutnaam comp attribuutnaam met comp  { ‘  ’, ‘  ’, ‘  ’, ‘  ’, ‘  ’, ‘  ’ } (select condition werkt dus op één individueel tupel!) u select condition mag AND, OR of NOT bevatten (voorbeeld:  DNO=“D1” AND BDATE < “01-01-1965” EMPLOYEE)

10 Voorbeeld Project (  ) “Geef voor elke employee z’n naam en geboortedatum”  NAME, BDATE EMPLOYEE NAME BDATE John 28-08-1964 Joe 04-04-1968 Jack 03-09-1969 Will 21-03-1971 Bridget 22-01-1972

11 Project:  attr_1, attr_2 … attr_n (REL) u geeft voor ieder tupel uit REL een tupel met uitsluitend de attributen attr_1, attr_2 … attr_n u attr_1, attr_2 … attr_n moeten attributen zijn van relatie REL u dubbele tupels worden geëlimineerd

12 Voorbeeld Theta Join (|><|) “Geef de namen van de dependents van Will” EMP(E_E#, E_NAME, BDATE, D#)  EMPLOYEE DPD(D_E#, D_NAME, REL)  DEPENDENT EMP_DPD  EMP |><| E_E#=D_E# DPD RESULT   D_NAME (  E_NAME = “Will” (EMP_DPD)) NAME Suzie Tom Mary

13 Tussenresultaat na theta join EMP_DPD E_E#E_NAME BDATE D# D_E# D_NAME REL E3Jack 03-09-1969 D1 E3 Mary daughter E3Jack 03-09-1969 D1 E3 Sue wife E4Will 21-03-1971 D2 E4 Suzie daughter E4Will 21-03-1971 D2 E4 Tom son E4Will 21-03-1971 D2 E4 Mary wife

14 Theta Join:REL1 |><| cond REL2 u voegt tupels van verschillende relaties bij elkaar. resultaat: tupels met attributen van beide relaties u REL1 en REL2 mogen geen attributen met dezelfde naam hebben u join condition is van de vorm: attribuutnaam_rel1 comp attribuutnaam_rel2 met comp  { ‘  ’, ‘  ’, ‘  ’, ‘  ’, ‘  ’, ‘  ’ } u join condition mag meerdere voorwaarden bevatten (cond_1 AND cond_2 AND … AND cond_n) u equijoin: theta join met join conditie(s) uitsluitend ‘=‘

15 Voorbeeld Natural Join (  ) “Geef de namen van de dependents van Will” EMP(E#, E_NAME, BDATE, D#)  EMPLOYEE DPD(E#, D_NAME, REL)  DEPENDENT EMP_DPD  EMP  DPD RESULT   D_NAME  E_NAME=“Will” EMP_DPD

16 Tussenresultaat na natural join EMP_DPD E#E_NAME BDATE D# D_NAME REL E3Jack 03-09-1969 D1 Mary daughter E3Jack 03-09-1969 D1 Sue wife E4Will 21-03-1971 D2 Suzie daughter E4Will 21-03-1971 D2 Tom son E4Will 21-03-1971 D2 Mary wife

17 Natural Join:REL1  REL2 u voegt tupels van verschillende relaties bij elkaar u join conditie: attributen met dezelfde naam moeten dezelfde waarde(n) hebben (alternatief: join attributen expliciet specificeren: EMP  (E#), (E#) DPD) u join conditie kan gebaseerd zijn op meerdere attributen: REL1(A, B, C, D)  REL2(C, D, E, F) u attributen met dezelfde naam komen slechts één keer in het resultaat voor

18 Voorbeeld Cartesisch Product (  ) “Geef de namen van de dependents van Will” EMP(E_E#, E_NAME, BDATE, D#)  EMPLOYEE DPD(D_E#, D_NAME, REL)  DEPENDENT EMP_DPD   E_E# = D_E# (EMP  DPD) RESULT   D_NAME (  E_NAME=“Will” (EMP_DPD))

19 Cartesisch Product:REL1  REL2 u voegt tupels van verschillende relaties bij elkaar. resultaat: tupels met attributen van beide relaties u REL1 en REL2 mogen geen attributen met dezelfde naam hebben u cartesisch product kan gezien worden als join zonder join condition

20 Voorbeeld Verschil (  ) “Geef de E#’s en namen van de ongehuwde engineering-employees” DPM(D#, DPM_NAME, BUDGET)  DEPARTMENT EMP(E#, EMP_NAME, BDATE, D#)  EMPLOYEE DPD(E#, DPD_NAME, REL)  DEPENDENT ENGINEERS   DPM_NAME=“engineering” ( EMP  DPM) MARRIED   REL=“husband” OR REL=“wife” ( EMP  DPD) RESULT   (  E#,EMP_NAME ENGINEERS)  (  E#,EMP_NAME MARRIED) E#EMP_NAME E1John E2Joe

21 Vereniging (  ) / Doorsnede (  ) / Verschil (  ) u geeft respectievelijk wiskundige vereniging, doorsnede en verschil van twee relaties u voorwaarde: “union compatible” REL1(A1, A2, … An) en REL2(B1, B2, … Bm) zijn union compatible indien: –ze dezelfde graad hebben (d.w.z. n=m), en –dom(Ai) = dom(Bi) voor iedere 1  i  n u merk op: relationele algebra bevat geen complement operator

22 Voorbeeld Database PROJECT J#NAME J1build-intranet J2market-research EMP_PROJ EMPLOYEEE#J# E#NAME BDATE D# E2J1 E1John 28-08-1964 D1 E3J1 E2Joe 04-04-1968 D1 E3J2 E3Jack 03-09-1969 D1 E4J2 E4Will 21-03-1971 D2 E5J2 E5Bridget 22-01-1972 D2

23 Voorbeeld Division (  ) “Geef de E#’s van de employees die werken aan alle projecten” EMP_PROJ  (  J# PROJECT))) E#J# E2J1 E3J1J#E# E3J2  J1=E3 E4J2J2 E5J2

24 Division:REL1  REL2 u REL1  REL2 met REL1(A1, A2, … An, B1, B2, … Bm) en REL2(B1, B2, … Bm) geeft de waarden van A1, A2, … An die in REL1 voorkomen in combinatie met alle waarden (tupels) die in REL2 voorkomen u alternatieve definitie (domeincalculus): {a1, a2, … an |  b1, b2, … bm: (REL2(b1, b2, … bm)  REL1(a1, a2, … an, b1, b2, … bm))}

25 Relationeel compleet u de verzameling operaties { , , , ,  } is relationeel compleet: andere operaties (zoals |><|, ,  of  ) kunnen hierin worden uitgedrukt

26 Herschrijven doorsnede (  ) R  S  (R  S)  ((R  S)  (S  R))

27 Herschrijven theta join (|><|) R |><| cond S   cond (R  S)

28 Herschrijven division (  ) (neem JNRS   J# PROJECT) ALL_PROJ_EMPS  EMP_PROJ  JNRS geeft hetzelfde resultaat als: ALL_EMPS   E# EMP_PROJ NOT_WORKING_ON  (ALL_EMPS  JNRS)  EMP_PROJ ALL_PROJ_EMPS  ALL_EMPS   E# NOT_WORKING_ON

29 Voorbeeld Outer Join (=|><|) “Geef van iedere employee zijn E# en (indien aanwezig) de naam van zijn/haar echtgenoot(e)” EMP(E_E#, E_NAME, BDATE, D#)  EMPLOYEE DPD(D_E#, D_NAME, REL)  DEPENDENT ECHTGENOTEN   REL=“husband” OR REL=“wife” DPD  E_E#, D_NAME (EMP =|><| E_E# = D_E# ECHTGENOTEN)

30 Tussenresultaat direct na outer join E#E_NAME BDATE D# D_E# D_NAME REL E1John 28-08-1964 D1 null null null E2Joe 04-04-1968 D1 null null null E3Jack 03-09-1969 D1 E3 Sue wife E4Will 21-03-1971 D2 E4 Mary wife E5Bridget 22-01-1972 D2 null null null

31 Resultaat outer join E_E# D_NAME E1 null E2 null E3 Sue E4 Mary E5 null

32 (Left) Outer Join:REL1 =|><| REL2 u REL1 =|><| REL2 bevat: –de tupels die zouden worden geproduceerd door een theta join –de tupels uit REL1 waarvoor er geen bijbehorend tupel uit REL2 bestaat dat voldoet aan de join-condition; deze tupels worden aangevuld met null-waarden voor de attributen van REL2 u ook bij de outer join geldt als voorwaarde dat REL1 en REL2 geen attributen met dezelfde naam bevatten

33 Voorbeeld Database SECRETARY NAME SSN BDATE ADDRESS TSPEED Sue 001 21-08-1971 Singel 30 80 Mary 002 18-12-1968 Damrak 18 90 SALESMAN NAME SSN BDATE ADDRESS LIMIT John 003 08-08-1969 Rokin 21 50 000 Joe 004 09-10-1970 Nes 87 75 000 ENGINEER NAME SSN BDATE ADDRESS SPECIAL Jack 005 02-02-1972 NZVBW 13 electronics Jill 006 01-01-1971 NZABW 15 software

34 Voorbeeld Outer Union “Geef van alle employees (= secretary, salesman of engineer) de naam, ssn en (indien aanwezig) typesnelheid” EVERYBODY  SECRETARY OUTER_UNION SALESMAN OUTER_UNION ENGINEER RESULT   NAME, SSN, TSPEED (EVERYBODY)

35 Tussenresultaat (direct na outer unions) EVERYBODY NAME SSN BDATE ADDRESS TSPEED LIMIT SPECIAL Sue 001 21-08-1971 Singel 30 80 null null Mary 002 18-12-1968 Damrak 18 90 null null John 003 08-08-1969 Rokin 21 null 50 000 null Joe 004 09-10-1970 Nes 87 null 75 000 null Jack 005 02-02-1972 NZVBW 13 null null electronics Jill 006 01-01-1971 NZABW 15 null null software

36 Eindresultaat RESULT NAME SSN TSPEED Sue 001 80 Mary 002 90 John 003 null Joe 004 null Jack 005 null Jill 006 null

37 REL1 Outer Union REL2  REL1 OUTER_UNION REL2: –gedefinieerd op relaties die partially compatible zijn (d.w.z. slechts sommige attributen zijn union compatible) –levert relatie op met tupels met attributen van REL1 of REL2 (of beide) –tupels die uit REL1 afkomstig zijn hebben null-waarden voor attributen die uitsluitend in REL2 zitten –tupels die uit REL2 afkomstig zijn hebben null-waarden voor attributen die uitsluitend in REL1 zitten Outer Union mag alleen als je in het resultaat een Primary Key kunt definiëren

38 Keys Stel, je hebt: EMP(E#, E_NAME, BDATE, E_D#)  EMPLOYEE DPM(D_D#, D_NAME, BUDGET)  DEPARTMENT Wat wordt dan de key van: u EMP |><| E_D# = D_D# DPM antwoord: E_E# u EMP  DPM antwoord: (E_E#, D_D#) u  E_D# = D_D# (EMP  DPM) antwoord: E_E# in relaties die resultaat zijn van relationele algebra operaties kun je (zolang er geen null-waarden zijn) altijd een primary key definiëren

39 Voorbeeld Aggregate functions “Geef het gemiddelde department-budget” F AVERAGE BUDGET DEPARTMENT AVERAGE_BUDGET 350 000 “Geef per D# het aantal employees” D# F COUNT E# EMPLOYEE D#COUNT_E# D1 3 D2 2

40 Agg. Functions: grouping_attr F function_list REL u grouping attributes behoren allen tot REL u functies: –count –minimum –maximum –sum –average u resulterende relatie bevat een tupel voor iedere verschillende waarde van de grouping attributes

41 Voorbeeld complexe queries (I) ZOEKENDE NAAM ADRES GESL GJAARMINJ MAXJ Teun Nes 30 M 19501950 1960 Truus Amstel 80 V 19531950 1960 Bep Rokin 42 V 19591950 1960 Anita NZVBW 18 V 19801975 1980 Wim Singel 23 M 19551950 1960 Sjon Damstr 9 M 19751975 1980 “Geef de namen en adressen van alle eventuele paren (d.w.z. personen van tegenovergesteld geslacht die binnen elkaars gewenste leeftijdscategorie vallen)”

42 Voorbeeld complexe queries (I) M_ZOEKENDE(M_NAAM, M_ADRES, M_GJAAR, M_MINJ, M_MAXJ)   NAAM, ADRES, GJAAR, MINJ, MAXJ  GESL=“M” ZOEKENDE V_ZOEKENDE(V_NAAM, V_ADRES, V_GJAAR, V_MINJ, V_MAXJ)   NAAM, ADRES, GJAAR, MINJ, MAXJ  GESL=“V” ZOEKENDE COMBINATIE  M_ZOEKENDE |><| V_MINJ  M_GJAAR  V_MAXJ V_ZOEKENDE AND M_MINJ  V_GJAAR  M_MAXJ PAAR   M_NAAM, M_ADRES, V_NAAM, V_ADRES COMBINATIE

43 Voorbeeld complexe queries (I) M_ZOEKENDE M_NAAM M_ADRESM_GJAAR M_MINJ M_MAXJ TeunNes 30 1950 19501960 WimSingel 23 1955 19501960 SjonDamstr 9 1975 19751980 V_ZOEKENDE V_NAAM V_ADRES V_GJAARV_MINJ V_MAXJ Truus Amstel 80 1953 19501960 Bep Rokin 42 1959 19501960 Anita NZVBW 18 1980 19751980

44 Voorbeeld complexe queries (I) PAAR M_NAAM M_ADRESV_NAAMV_ADRES Teun Nes 30 TruusAmstel 80 Teun Nes 30 BepRokin 42 Wim Singel 23 TruusAmstel 80 Wim Singel 23 BepRokin 42 Sjon Damstr 9 AnitaNZVBW 18

45 Voorbeeld complexe queries (II) CAN_SUPPLY SUPPLIERPART PRICE s1 p1 3 s1 p2 3NEEDED s2 p1 2PART s2 p2 3 p1 s2 p3 4 p2 s3 p1 4 p3 s3 p2 3 s3 p3 3“Geef voor iedere supplier s3 p4 8die alles kan leveren wat we nodig hebben z’n totaalprijs”

46 Voorbeeld complexe queries (II) “Geef voor iedere supplier die alles kan leveren wat we nodig hebben z’n totaalprijs” TOTAL_SUPPLIERS  (  SUPPLIER, PART CAN_SUPPLY)  NEEDED CAN_SUPPLY_RELEVANT  CAN_SUPPLY  TOTAL_SUPPLIERS  NEEDED RESULT  SUPPLIER F SUM PRICE CAN_SUPPLY_RELEVANT

47 Voorbeeld complexe queries (II) SUPPLIERPART s1 p1 s1 p2 s2 p1 PART s2 p2 p1 SUPPLIER s2 p3  p2 =s2 s3 p1 p3s3 s3 p2 s3 p3 s3 p4

48 Voorbeeld complexe queries (II) SUPPLIERPRICE PART s1 3 p1 s1 3 p2 s2 2 p1PART s2 3 p2 p1 SUPPLIER PRICE s2 4 p3  p2 = s3 4 p1 p3 s3 3 p2 s3 3 p3 s3 8 p4zo moet het dus niet...

49 Voorbeeld complexe queries (II) CAN_SUPPLY SUPPLIERPART PRICE s1 p1 3 NEEDED s1 p2 3 PART s2 p1 2 p1 s2 p2 3 p2 s2 p3 4 p3 s3 p1 4 s3 p2 3 s3 p3 3TOTAL_SUPPLIERS s3 p4 8SUPPLIER s2 s3

50 Voorbeeld complexe queries (II) CAN_SUPPLY_RELEVANT SUPPLIERPART PRICE s2 p1 2 s2 p2 3 RESULT s2 p3 4 SUPPLIER SUM_PRICE s3 p1 4s2 9 s3 p2 3s310 s3 p3 3

51 Voorbeeld complexe queries (III) DRAAITFAN_VAN STATIONARTIESTPERSOONARTIEST CountryCarpenters JanOP CountryParton PietMeeuwis NoordzeeHazes JoostBorsato NoordzeeBorsato JoostCarpenters NoordzeeMeeuwis Radio10MeeuwisLUISTERT_NAAR Radio10ElvisPERSOONSTATION Radio10Abba JanRadio10 PietNoordzee JoostRadio10 JoostNoordzee

52 Voorbeeld complexe queries (III) “Geef de artiesten die gedraaid worden op de stations waar Joost naar luistert”  ARTIEST (  STATION  PERSOON=“Joost” LUISTERT_NAAR  DRAAIT) alternatief:  ARTIEST  PERSOON=“Joost” ( LUISTERT_NAAR  DRAAIT)

53 Voorbeeld complexe queries (III) “Geef de fans van artiesten die nergens gedraaid worden” GELIEFDE_ART   ARTIEST FAN_VAN GEDRAAIDE_ART   ARTIEST DRAAIT GEMISTE_ART  GELIEFDE_ART  GEDRAAIDE_ART RESULT   PERSOON (FAN_VAN  GEMISTE_ART)

54 Voorbeeld complexe queries (III) “Geef de personen die tenminste naar ieder radiostation luisteren waar Piet ook naar luistert (eventueel ook nog naar andere stations)” PIET_STATIONS   STATION  PERSOON=“Piet” LUISTERT_NAAR RESULT  LUISTERT_NAAR  PIET_STATIONS

55 Thuis u nalezen: 7.4 t/m 7.7 u voorbereiden: 9.4 u huiswerk: –opgave 5 –opgave 12 (gewijzigd)


Download ppt "Databases I Relationele Algebra Martin Caminada / Wiebren de Jonge Vrije Universiteit, Amsterdam definitieve versie 2002."

Verwante presentaties


Ads door Google