Fundamentals of spatial data warehousing for geographic knowledge discovery Michiel Rook, 15/9/2003.

Slides:



Advertisements
Verwante presentaties
Performance management
Advertisements

Stijn Hoppenbrouwers Software Engineering les 1 Algemene inleiding en Requirements Engineering.
Microsoft Dynamics Entrepreneur Solution 2008 Product Demo.
LI in de gezondheidszorg UMC St Radboud Ziekenhuis
E-RADEN Roadmap. AGENDA • Overzicht van nieuwe ontwikkelingen 2009 • Interfaces • Document Types : Meta-data • E-raden gratis ? • Perspectieven.
Metadata proces april 2009 train de trainers. Waar in het werkproces metadata Binnen de organisatie zal afgesproken moeten worden van welke data er metadata.
Stand van zaken Digitalisering Nederlandse Volkstellingen, Luuk Schreven (NIWI)
EDC ervaringen op de werkvloer – fase I/IIa
Gegevensbeheer Karin Diederiks KOAC•NPC.
Easy Bis Bestuursdienst Informatie Systeem Van agendapunt tot besluit Met automatische internet publicatie.
Welstand.info Systeem – Léon van BerloBegincolloquium – 16 December 2003 Welkom Introductie Afstudeerplan Plan van aanpak Relatie andere projecten WELKOM.
Bedrijfspresentatie.
BESTURINGS SYSTEMEN Vincent Naessens.
You, Jet and Excel. Smart reporting.
D4A en Toegankelijkheid
Schatgraven in Gegevensbergen
Automation and Drives PROFINET technologie A&D AS/PT2/MC, 08/2005 Trends & functionaliteit PROFINET  Real-time communicatie  Veldunits  Motion Control.
BI voor Microsoft Dynamics AX
Activiteit 1.6 Bepalen niet-functionele eisen
Exploratie van de ontwerpruimte 3. Prototypes, emulatie en simulatie Prof. dr. ir. Dirk Stroobandt Academiejaar
1 Orientatie InformatieSystemen K.M.van Hee hgl. architectuur van informatiesystemen dir. Deloitte & Touche Bakkenist TU/e 2001.
Specialismen Analyse en verificatie van protocollen Analyse van Petri-netten Component-specificatie Web-based information systems (Query)talen voor Web.
ISA (InformatieSysteemArchitectuur) Geert-Jan Houben.
1 Beslissingsondersteuning Marakas H12 t/m H16 Robert de Hoog 8 november 2000.
Schatten Robert de Hoog College 25 januari College Projectmanagement 25 januari Onderwerpen De methode van DeMarco Functiepunt analyse Complexiteits.
Databases I (H. 1) Wiebren de Jonge Vrije Universiteit, Amsterdam Voorlopige versie 2003.
Hoofdstuk 2 Het onderzoeksonderwerp formuleren en verduidelijken Methoden en technieken van onderzoek, 5e editie, Mark Saunders, Philip Lewis, Adrian.
Inleiding Kennistechnologie §Hoofdstuk 1: Introductie §Hoofdstuk 2: Kennissystemen in context §Hoofdstuk 3: Kennisacquisitie.
Designing Knowledge Systems b Hoofdstuk 11 van Knowledge Engineering and Management. The CommonKADS Methodology. b A.Th. Schreiber, J.M. Akkermans, A.A.Anjewierder,
Effiecient Mining of Spatiotemporal Patterns GDM 2003 Dènis de Keijzer.
Geo-Exploration Visualisatie als tool voor Geo-Exploration.
Location Based Services GIA – Najaar 2004 Martijn Baede.
Motion planning with complete knowledge using a colored SOM Jules Vleugels, Joost N. Kok, & Mark Overmars Presentatie: Richard Jacobs.
Spatial subgroup mining
Van JBF via Degelijkheid naar Pro-actief Beheer
Schatten Robert de Hoog College 9 mei College Projectmanagement 9 mei Onderwerpen De methode van DeMarco Functiepunt analyse Kleine projecten.
Integratie Eduarte 22 januari 2013
Afstudeerpresentatie Richard Lekkerkerk,13 september 2011
INTERNATIONAL INSTITUTE FOR GEO-INFORMATION SCIENCE AND EARTH OBSERVATION Inwinning van 3D topografie Sander Oude Elberink George Vosselman 28 april 2006.
Het nieuwe werken Visie Peter Fingar. Het werk verandert: –Meer informatie gericht: gebruiken, verwerken en actie Transactie-informatie Omgevingsinformatie.
Technische Architectuur
Relationele Databases
PADS4 maakt het eenvoudig om informatie te verspreiden naar een specifiek publiek op de juiste plaats en het juiste moment PADS4 is een professionele oplossing.
Spreker | Plaats | datum Sturen op gezondheid Diana Delnoij | 24 januari 2013.
Risk Based Testing van pakketsoftware
Hoofdstuk 7 ERP-systemen: human resources Enterprise Resource Planning © Pearson Education, 2007; Enterprise Resource Planning door Mary Sumner.
Business Intelligence
Join Indices … as a tool for Spatial Datamining. Inhoud Inleiding Spatial Relations (Spatial) Join Index Implementatie Conclusie.
ADLIB Information Systems Software voor Bibliotheken, Musea en Archieven OKBN bijeenkomst 24 februari 2003 René van den Heuvel.
Karel Vlieghe - Utrecht 29 januari 2005 Veranderscenario’s voor e-Learning systemen Evolutie van e-Learning systemen door de jaren heen.
Minor Project- en Programmamanagement
1 KPN Mobiel – Introductie Repository Object Browser & Designer 10 Designer 10g & Repository Object Browser Maandag 28 februari 2005 Lucas Jellema (AMIS)
+ Praktijkscasus Business Intelligence Dashboard in de thuiszorg.
REAL-TIME COMPLIANCE FICTION OR REAL ERIC MULDER.
De Ruimtemonitor Vlaanderen SADL Thérèse Steenberghen Diederik Tirry 25 januari 2012.
KNVI Congres Introductie BI.
‘Business at the speed of change’
Standaarden en spelregels voor de Slimme Stad
Grip & Controle op digitalisering
Innovatie met IBM Cloud Orchestrator.
Moving objects in a geo-DBMS
Moving objects in a geo-DBMS
AmsterdaMaps Delen is beter dan vermenigvuldigen
Metingen in de afvalwaterketen:
Moving objects in a geo-DBMS
OUTCOME-INDICATOREN WMO
Voorspelling van criminele carrières door 2-dimensionale extrapolatie
CitaVista 2018 Utrecht, 31 januari 2019.
Transcript van de presentatie:

Fundamentals of spatial data warehousing for geographic knowledge discovery Michiel Rook, 15/9/2003

Introductie (1) Door technologische vooruitgang nieuwe eisen Evolutie van GIS volgt grofweg zelfde pad als overige IT Databases gebruiken voor besluitvorming Maar, – Meerdere, onafhankelijke databases – Lastig te integreren

Introductie (2) Behoefte aan – Gebruik data van huidige systemen – Snelle antwoorden – Simpele GUI – Verschillende niveaus van aggregatie, detail en tijd – (Gedeeltelijke) Automatische analyse Kortom, uit verschillende bronnen moet nuttige informatie gehaald worden

Data Warehouse (1) Beslissingsondersteunend Integratie van meerdere,verschillende bronnen Non-volatile, Read-only Meerdere detailniveaus

Data Warehouse (2) 1 van de belangrijkste buzzwords van afgelopen 10 jaar Combineren, transformeren en aggregeren van data is moeilijk en kost veel tijd – Incompatibiliteit – Ontbrekende data – Schaalverschillen Mogelijk erg groot

Data Warehouse vs. Database DatabaseData Warehouse BronKopie TransactiesAnalyse GedetailleerdAggregatie Applicatie-gerichtBusiness-gericht GenormaliseerdRedudancy

Data Mart Subset van Data Warehouse Gespecialiseerd op 1 onderwerp Hoog niveau, veel aggregatie, weinig detail

Data Mart vs. Data Warehouse Data WarehouseData Mart Voor analyseVoor analyse op hoger niveau AggregatieExtreme aggregatie Business-gerichtOnderwerp-gericht DenormalisatieExtreme denormalisatie Grote databaseKleine database

Multi-dimensioneel (1) N-dimensionele matrix – N onafhankelijke variabelen – 1 afhankelijke variabele (measure) Elke dimensie heeft members – Maanden = {Januari,Februari,Maart,…} – Hiërarchisch rangschikken Jaar > kwartaal > maand > week > dag

Multi-dimensioneel (2) Measures – bijv. totale omzet van vlees in 2002 in filiaal X ‘The reason why multidimensional systems appear intuitive is because they do business the way we do’

Multi-dimensioneel (3) Afhankelijk van sterke denormalisering – Redundancy – Grote databases – … maar wel sneller

Multidimensioneel (4) Veel dimensies, meerdere niveaus – Groot aantal ‘datacubes’ te berekenen Deelverzameling berekenen Betere methodes voor indexeren

OLAP (1) On-Line Analytical Processing Interactief bekijken en analyseren Multidimensioneel Visualisatie ‘Datacubes’

OLAP (2) ROLAP (Relational OLAP) MOLAP (Multidimensional OLAP) HOLAP (Hybrid OLAP) SOLAP (Spatial OLAP) Werkt het beste op ‘kleinere’ databases

Data Mining (1) Knowledge discovery uit data Automatisch ontdekken van trends en patronen Verschillende technieken – Neurale netwerken – Beslissingsbomen – Genetische algoritmen – Rule induction – Nearest neighbour

Data Mining (2) Beste prestaties op grote datasets – Volume – Complexiteit regels ‘There must be sufficient types and data in a database, before data mining software can discover any useful pattern’

Architecturen 4 ‘standaard’ architecturen – Generic – Federated – Multi-tiered – No Warehouse

Architecturen: Generic (1) Simpel en veel gebruikt Gecentraliseerd Clients gebruiken eigen software – OLAP – Data Mining – EIS

Architecturen: Generic (2)

Architecturen: Federated (1) Standaard ‘three-tiered’ architectuur Deels gedecentraliseerd Subset van data in data marts

Architecturen: Federated (2)

Architecturen: Multi-tiered (1) Typisch ‘four-tiered’ (meer is mogelijk) DW met data op schaal/detailniveau van bronnen DW(‘s) met geaggregeerde data Handig als resultaat van integratie waardevol is

Architecturen: Multi-tiered (2)

Architecturen: No Warehouse (1) No Warehouse = Virtual Warehouse Integratie wordt real-time gedaan Hogere responstijd

Architecturen: No Warehouse (2)

Physical DW vs. Virtual DW PhysicalVirtual Op diskNiet op disk Integratie voorafReal-time (‘on the fly’) Alle data integrerenOn-demand integratie SnellerExtreme denormalisatie Grote databaseKleine database

Spatial Data Warehousing (1) Combineren van GIS en DW geeft interessante resultaten Maar, GIS alleen niet genoeg voor beslissingsondersteuning Ruimtelijke en semantische data al geintegreerd Maar, tools nog steeds te beperkt

Spatial Data Warehousing (2) Numerieke measure – Inkomen per gemeente Ruimtelijke measure – Gebieden met zelfde hoogte

Spatial Data Warehousing (3) Integreren van ruimtelijke data is lastig – Elke kaart en overlay moet correct zijn – Consistente precisie – Juiste referentie systeem – Verschillende detailniveaus

Aggregeren van spatial data Aggregatie kan meerdere vormen aannemen – Geometrisch: polygons -> polygon – Niet-geometrisch: polygons -> naam – Combinatie: polygons -> naam + polygon

Problemen (1) Problemen bij importeren – Slechte documentatie van bronsystemen – Referentiesystemen zijn veranderd – Semantieken en begrippen zijn hergedefinieerd – Precisie van meetinstrumenten is veranderd – Historische gegevens ontbreken Mogelijk geen antwoord op vragen

Problemen (2) Niet altijd een probleem bij – Gereguleerde databases (kadaster) – Stricte kwaliteitseisen (topografische databases) Anders – Geen/ontbrekende historische data (eigenlijk geen DW) – Onbekende kwaliteit

Problemen (3) Gebrek aan data is onvermijdelijk Moeten we mee leven 80% van de moeite gaat in het bouwen van SDW Resultaat is vaak niet wat men hoopt

Research (1) Betere integratie, interoperability – Automatisch integreren a.d.h.v. metadata – Checken van constraints – Automatisch generaliseren Betere planning – Implementatie van warehouse – Inzicht in beperkingen van resultaten

Research (2) Beter omgaan met grote databases – Query optimizers – Spatio-temporal indexing and partitioning – Data update mechanisms Scalability – Incrementele updates – Detail niveaus

Research (3) Query building – Complexiteit van spatio-temporal querying – GUI mist die complexiteit Web technology – XML

Conclusie DW’s combineren data uit heterogene databases en ondersteunen door analyse de besluitvoering Spatial Data Warehouse Spatial OLAP Jong topic, nog veel onderzoek en ontwikkeling