Download de presentatie
De presentatie wordt gedownload. Even geduld aub
GepubliceerdAlbert Segers Laatst gewijzigd meer dan 10 jaar geleden
1
Fundamentals of spatial data warehousing for geographic knowledge discovery Michiel Rook, 15/9/2003
2
Introductie (1) Door technologische vooruitgang nieuwe eisen Evolutie van GIS volgt grofweg zelfde pad als overige IT Databases gebruiken voor besluitvorming Maar, – Meerdere, onafhankelijke databases – Lastig te integreren
3
Introductie (2) Behoefte aan – Gebruik data van huidige systemen – Snelle antwoorden – Simpele GUI – Verschillende niveaus van aggregatie, detail en tijd – (Gedeeltelijke) Automatische analyse Kortom, uit verschillende bronnen moet nuttige informatie gehaald worden
4
Data Warehouse (1) Beslissingsondersteunend Integratie van meerdere,verschillende bronnen Non-volatile, Read-only Meerdere detailniveaus
5
Data Warehouse (2) 1 van de belangrijkste buzzwords van afgelopen 10 jaar Combineren, transformeren en aggregeren van data is moeilijk en kost veel tijd – Incompatibiliteit – Ontbrekende data – Schaalverschillen Mogelijk erg groot
6
Data Warehouse vs. Database DatabaseData Warehouse BronKopie TransactiesAnalyse GedetailleerdAggregatie Applicatie-gerichtBusiness-gericht GenormaliseerdRedudancy
7
Data Mart Subset van Data Warehouse Gespecialiseerd op 1 onderwerp Hoog niveau, veel aggregatie, weinig detail
8
Data Mart vs. Data Warehouse Data WarehouseData Mart Voor analyseVoor analyse op hoger niveau AggregatieExtreme aggregatie Business-gerichtOnderwerp-gericht DenormalisatieExtreme denormalisatie Grote databaseKleine database
9
Multi-dimensioneel (1) N-dimensionele matrix – N onafhankelijke variabelen – 1 afhankelijke variabele (measure) Elke dimensie heeft members – Maanden = {Januari,Februari,Maart,…} – Hiërarchisch rangschikken Jaar > kwartaal > maand > week > dag
10
Multi-dimensioneel (2) Measures – bijv. totale omzet van vlees in 2002 in filiaal X ‘The reason why multidimensional systems appear intuitive is because they do business the way we do’
11
Multi-dimensioneel (3) Afhankelijk van sterke denormalisering – Redundancy – Grote databases – … maar wel sneller
12
Multidimensioneel (4) Veel dimensies, meerdere niveaus – Groot aantal ‘datacubes’ te berekenen Deelverzameling berekenen Betere methodes voor indexeren
13
OLAP (1) On-Line Analytical Processing Interactief bekijken en analyseren Multidimensioneel Visualisatie ‘Datacubes’
14
OLAP (2) ROLAP (Relational OLAP) MOLAP (Multidimensional OLAP) HOLAP (Hybrid OLAP) SOLAP (Spatial OLAP) Werkt het beste op ‘kleinere’ databases
15
Data Mining (1) Knowledge discovery uit data Automatisch ontdekken van trends en patronen Verschillende technieken – Neurale netwerken – Beslissingsbomen – Genetische algoritmen – Rule induction – Nearest neighbour
16
Data Mining (2) Beste prestaties op grote datasets – Volume – Complexiteit regels ‘There must be sufficient types and data in a database, before data mining software can discover any useful pattern’
17
Architecturen 4 ‘standaard’ architecturen – Generic – Federated – Multi-tiered – No Warehouse
18
Architecturen: Generic (1) Simpel en veel gebruikt Gecentraliseerd Clients gebruiken eigen software – OLAP – Data Mining – EIS
19
Architecturen: Generic (2)
20
Architecturen: Federated (1) Standaard ‘three-tiered’ architectuur Deels gedecentraliseerd Subset van data in data marts
21
Architecturen: Federated (2)
22
Architecturen: Multi-tiered (1) Typisch ‘four-tiered’ (meer is mogelijk) DW met data op schaal/detailniveau van bronnen DW(‘s) met geaggregeerde data Handig als resultaat van integratie waardevol is
23
Architecturen: Multi-tiered (2)
24
Architecturen: No Warehouse (1) No Warehouse = Virtual Warehouse Integratie wordt real-time gedaan Hogere responstijd
25
Architecturen: No Warehouse (2)
26
Physical DW vs. Virtual DW PhysicalVirtual Op diskNiet op disk Integratie voorafReal-time (‘on the fly’) Alle data integrerenOn-demand integratie SnellerExtreme denormalisatie Grote databaseKleine database
27
Spatial Data Warehousing (1) Combineren van GIS en DW geeft interessante resultaten Maar, GIS alleen niet genoeg voor beslissingsondersteuning Ruimtelijke en semantische data al geintegreerd Maar, tools nog steeds te beperkt
28
Spatial Data Warehousing (2) Numerieke measure – Inkomen per gemeente Ruimtelijke measure – Gebieden met zelfde hoogte
29
Spatial Data Warehousing (3) Integreren van ruimtelijke data is lastig – Elke kaart en overlay moet correct zijn – Consistente precisie – Juiste referentie systeem – Verschillende detailniveaus
30
Aggregeren van spatial data Aggregatie kan meerdere vormen aannemen – Geometrisch: polygons -> polygon – Niet-geometrisch: polygons -> naam – Combinatie: polygons -> naam + polygon
31
Problemen (1) Problemen bij importeren – Slechte documentatie van bronsystemen – Referentiesystemen zijn veranderd – Semantieken en begrippen zijn hergedefinieerd – Precisie van meetinstrumenten is veranderd – Historische gegevens ontbreken Mogelijk geen antwoord op vragen
32
Problemen (2) Niet altijd een probleem bij – Gereguleerde databases (kadaster) – Stricte kwaliteitseisen (topografische databases) Anders – Geen/ontbrekende historische data (eigenlijk geen DW) – Onbekende kwaliteit
33
Problemen (3) Gebrek aan data is onvermijdelijk Moeten we mee leven 80% van de moeite gaat in het bouwen van SDW Resultaat is vaak niet wat men hoopt
34
Research (1) Betere integratie, interoperability – Automatisch integreren a.d.h.v. metadata – Checken van constraints – Automatisch generaliseren Betere planning – Implementatie van warehouse – Inzicht in beperkingen van resultaten
35
Research (2) Beter omgaan met grote databases – Query optimizers – Spatio-temporal indexing and partitioning – Data update mechanisms Scalability – Incrementele updates – Detail niveaus
36
Research (3) Query building – Complexiteit van spatio-temporal querying – GUI mist die complexiteit Web technology – XML
37
Conclusie DW’s combineren data uit heterogene databases en ondersteunen door analyse de besluitvoering Spatial Data Warehouse Spatial OLAP Jong topic, nog veel onderzoek en ontwikkeling
Verwante presentaties
© 2024 SlidePlayer.nl Inc.
All rights reserved.