Spatial subgroup mining

Slides:



Advertisements
Verwante presentaties
SQL deel 2: datamodel ontwerp
Advertisements

Specialisatiemodule Bouw/Infra
Module 7 – Hoofdstuk 5 (1) SQL – een begin.
Meerdere tabellen: Relaties en Joins
Record Linkage: Simulatie Resultaten Adelaide Ariel Biolink NL 28 maart 2014.
PHP & MYSQL LES 03 PHP & DATABASES. PHP & MYSQL 01 PHP BASICS 02 PHP & FORMULIEREN 03 PHP & DATABASES 04 CMS: BEST PRACTICE.
Hogeschool HZ Zeeland 19 augustus 2003augustus 2003 Data Structuren & Algoritmen Week 1.
Databases Informatica Ga verder met een muisklik. SQL FCO DBMS NE FA
Hogeschool van Amsterdam - Interactieve Media – Internet Development – Jochem Meuwese - -
Het selecteren van data uit meerdere gekoppelde tabellen
Hogeschool van Amsterdam - Interactieve Media – Internet Development – Jochem Meuwese - -
Databases.
Specialisatiemodule ICT
Base: bewerkingen 2 soorten - Oplopend- Aflopend.
Representing Time in GIS Sander Florisson GIA 2004.
Computervaardigheden en Programmatie Universiteit AntwerpenDatabank - Gevorderden 5.1 Computervaardigheden en Programmatie 1rste BAC Toegepaste Biologische.
Over dingen die voorbijgaan Richard Philips Anet Gebruikersdag 15 juni 2011.
Datastructuren Zoekbomen
Spatial Association. Spatial Association Rule X → Y X → Y P 1 ..  P m → Q1 ..  Qn (c%) P 1 ..  P m → Q1 ..  Qn (c%) Los predicaat: 1-predicate.
Databanken by Steven Stinis.
Download en installeer de gereedschappen
Hogeschool van Amsterdam - Interactieve Media – Internet Development – Jochem Meuwese - -
Normalisatie Relationeel databaseontwerp:
Fast and Effective Query Refinement B. Velez, R. Weiss, M.A. Sheldon, D.K. Gifford SIGIR 1997.
Opleiding AI cursus Databases
Inleidend probleem Data structuur (hiërarchie van classes)
Eenvoudige data-analyse: beschrijvende statistische
Effiecient Mining of Spatiotemporal Patterns GDM 2003 Dènis de Keijzer.
Fundamentals of spatial data warehousing for geographic knowledge discovery Michiel Rook, 15/9/2003.
1 Complexiteit Bij motion planning is er sprake van drie typen van complexiteit –Complexiteit van de obstakels (aantal, aantal hoekpunten, algebraische.
Location Based Services GIA – Najaar 2004 Martijn Baede.
Motion planning with complete knowledge using a colored SOM Jules Vleugels, Joost N. Kok, & Mark Overmars Presentatie: Richard Jacobs.
Workshop PHP Een productencatalogus Met database.
Eindhoven Technische Universiteit Ondersteuning van het Ontwerpproces Bauke de Vries.
Blok 7: netwerken Les 1 Christian Bokhove
Databases.
Laat software voor je werken
SQL ( SERVER ) Les #02: T-SQL. A GENDA Herhaling les 4 Views SELECT…INTO Beheren van tabellen: CREATE ALTER DROP Opdracht voor de volgende les.
Computervaardigheden Hoofdstuk 4 — Databank (Basis)
Business Intelligence
3D modellen van de Nederlandse Ondergrond
Join Indices … as a tool for Spatial Datamining. Inhoud Inleiding Spatial Relations (Spatial) Join Index Implementatie Conclusie.
Wereld GIS Dag 2005 Geografie & Technologie Onderdelen van een GIS n Geografie n Een computer n Gegevens n Iemand die de boel bedient Geografisch Informatie.
Les 0 Structured Query Language SQL. Programma Les 0 – Introductieopdracht Les 1 Les 2 Les 3 Schriftelijke toets.
ANALYSE 3 INFANL01-3 WEEK CMI Informatica.
ANALYSE 3 INFANL01-3 WEEK CMI Informatica.
ANALYSE 3 INFANL01-3 WEEK CMI Informatica.
Analyse 3 INFANL01-3 week 2 CMI Informatica.
ANALYSE 3 INFANL01-3 WEEK 8 CMI Informatica. ANALYSE 3- INFANL01-3 ▸ Vorige les ▸ Herhaling ▸ Normaliseerregels ▸ Omzetten ERD ▸ Group by en SET ▸ Proeftentamen.
Week 6 BIMAIV03 les B1. DML en DDL ata D anipulation M anguage L ata D efinition D anguage L.
ANALYSE 3 INFANL01-3 WEEK CMI Informatica.
ANALYSE 3 INFANL01-3 WEEK 6 CMI Informatica. ANALYSE 3- INFANL01-3 ▸ Vorige les ▸ Subqueries met correlaties ▸ Subqueries zonder correlaties ▸ Views ▸
Wat is SQL (1)? SQL (Structured Query Language):  is een zeer krachtige taal met een beperkt vocabulaire (aantal ‘woorden’)  is declaratief (‘WAT’ niet.
Databases.
Informatica-Actief Thema: Databases en informatiemodellering
LauwersCollege Buitenpost Informatica
VeiligheidsRegioTwente
Moving objects in a geo-DBMS
Moving objects in a geo-DBMS
Databases.
Eenvoudige data-analyse: beschrijvende statistische
Promotie-onderzoek naar een 3D datamodellering
Moving objects in a geo-DBMS
SQL Les February 2019.
SQL Les 3 17 February 2019.
SQL Les 3 23 February 2019.
SQL Les 1 5 April 2019.
SQL Les 4 12 May 2019.
Software Development fundamentals
Unified Modeling Language
Transcript van de presentatie:

Spatial subgroup mining Marlies Mooijekind

Overzicht Spatial subgroup mining: spatial patterns SubgroupMiner Spatial data Spatial subgroups Subgroup mining algoritme Applicatie

Spatial subgroup mining Subgroup: deelverzameling van een populatie met bepaalde eigenschappen Werkeloosheid is hoog voor jonge mannen met een lage opleiding Subgroup mining: subgroups vinden waarvan de target variabele afwijkt om afhankelijkheid tussen target variabele en explanatory variabelen te analyseren

Subgroup patterns Deviation pattern: beschrijft subgroup met een afwijking van target variabele t.o.v. hele populatie Association pattern: identificeert een paar van subgroups waartussen en associatie is. Trend pattern: identificeert subgroups met een trend in target variabele

SubgroupMiner Subgroup mining systeem: multirelationale hypotheses efficiënte database integratie, deel van zoek algoritme in spatial database system (SDBS) visualisatie resultaten in GIS

Sterke punten SubgroupMiner Data access: geen data transformatie, geen fouten Geen Pre-processing: joins alleen berekenen wanneer nodig Visualisatie: Visualisatie GIS en data mining gebruiken dezelfde data

Representatie spatial data Object-relational database Spatial data base S: verzameling relaties R1,…,Rn elke relatie Ri is gelinkt met een relatie Rk via een geometrische attribuut Gi of een attribuut Ai van Ri Geometrisch attribuut Gi: geordende verzameling x-y-coördinaten (punten, lijnen, polygonen)

Representatie spatial data Verschillende objecten (straten, gebouwen) opgeslagen in verschillende relaties Ri (geografische lagen) Elke laag heeft verzameling attributen A1,…,Am (thematische data) en maximaal 1 geometrisch attribuut Gi

Querying multirelational spatial data Extra operatie spatial join Linkt twee relaties op basis van hun geometrische attribuut Afstand of topologische relatie (disjoint, overlap, covers, inside, intersect, interacts) Index structures (KD-trees, quadtrees) voor efficiënt spatial joins

Pre-processing (1) SDBS: multirelational met non-atomic data types (punten, lijnen,polygonen) Veel spatial data mining aanpakken: singlerelational data met atomic data types Pre-processen: alle attributen die nodig zijn in 1 tabel joinen met alleen atomic data types

Pre-processing (2) Nadelen: Voordeel: sneller tijdens analyse beperkt hypothese ruimte inefficiënt voor opslag en rekentijd: onderzoekt hele hypothese ruimte overtollige data Voordeel: sneller tijdens analyse SubgroupMiner geen pre-processing: tabellen dynamisch joinen, attributen selecteren tijdens zoeken

Spatial subgroup Subverzameling van analyse objecten beschreven door een verzameling expressies: operaties op de spatial referenties van objecten Voorbeeld: alle vegetatie records dichtbij een rivier spatial predikaat minimum afstand op coördinaten van objecten vegetatie records en rivieren

Hypothesis language (1) Multirelational subgroup: concept set C = {Ci} concept Ci = {Ci.A1=v1,…, Ci.An=vn} C = { {records.river_distance=medium, records.indigofera=3}, {soil.type=‘Ql11-1a’} }

Hypothesis language (2) Multirelational subgroup: set of links L = {Li} link Li = Cj.Am θ Ck.Al tussen twee concepts Cj en Ck θ is ‘=‘, afstand, topologische relatie (disjoint, overlap, covers, inside, intersect) L = {{spatially_interacts(records.geometry, soil.geometry)}}

SubgroupMiner Integratie met spatial database systeem: subgroups omschrijven in een query taal query uitvoeren op spatial database teruggekregen subgroups uit database evalueren: hoeveel afwijking van target variabele

Subgroups in query-taal SQL: FROM: relaties (tabellen) WHERE: links en selectors (attribuut-waarde) C = { {records.river_distance=medium, records.indigofera=3}, {soil.type=‘Ql11-1a’} } L = {{spatially_interacts(records.geometry, soil.geometry)}}

Subgroup mining algoritme (1) Iteraties van general naar specific In elke iteratie: parents subgroups uitbreiden op allerlei manieren gespecialiseerde subgroups evalueren nieuwe parent subgroups selecteren voor volgende iteratie

Subgroup mining algoritme (2) Subgroup uitbreiden: selector of link toevoegen Subgroup evalueren: quality function gebaseerd op afwijking van target variabele en (relatieve) grootte van subgroup Subgroup selecteren: quality hoog

Subgroup mining algoritme (3) Stop criteria mining: maximum search depth geen enkele subgroup met hoge quality

Applicatie (1) Analyse van vegetatie data van Nigeria 132 vegetaties records: 1 per site, elk record beschrijft welke planten voorkomen terrein informatie: vorm oppervlak, afwatering bodem informatie: graad van erosie, inwortel diepte thematische lagen: rivieren, steden

Applicatie (2) Doel is onderzoeken van geschikte conditie voor het bestaan van een plantensoort: ander plantensoorten ecologische condities: regenval, bodem type niet-lokale condities: afstand tot rivier

Applicatie (3) Resultaten

Applicatie (4) Resultaten

Visualisatie(1)

Visualisatie(2) Plot P(T|C) tegen P(T)

Conclusies Subgroups SubgroupMiner Subgroup mining algoritme Database integratie Geen pre-processing Visulatie in GIS Subgroup mining algoritme Spatial joins duur: cach search results