Download de presentatie
De presentatie wordt gedownload. Even geduld aub
GepubliceerdErna Kok Laatst gewijzigd meer dan 9 jaar geleden
1
Join Indices … as a tool for Spatial Datamining
2
Inhoud Inleiding Spatial Relations (Spatial) Join Index Implementatie Conclusie
3
Inleiding (1) Datamining is –Samenvatten –Classificeren –Clusterdetectie –Zoeken van associaties en afhankelijkheden –Zoeken naar trends en afwijkingen
4
Inleiding (2) Spatial Data Mining = DM + spatial criteria Implementatie lastig Gebrek aan SDM tools
5
Vooruitgang (1) Veel over Spatial Analysis in pre-GIS tijden Globale/locale autocorrelatie Geostatistiek
6
Vooruitgang (2) GeoMiner (uitbreiding op DBMiner) DBScan met R* bomen Uitbreidingen van ID3 en DBLearn STING Spatial Data Warehousing
7
Waarom Join Index? Belangrijk verschil tussen SDM en DM: –Spatial Relations Standaard structuur Spatial Join Operator vervangen door Join Index
8
Spatial Relations Autocorrelatie Intra-theme, Inter-theme Topologisch –Intersection, Contains, etc. Metrisch
9
Join Index RS C
10
Spatial Join Index (1) Obj1Obj2Distance R-1S-92.34 R-1S-13.45 R-2S-117.23 R-3S-183.44 R-3S-163.68
11
Spatial Join Index (2) Objecten –R,S,… Join Indices –C Elk paar C(obj1,obj2) matcht met criterium
12
Bouwen van Join Index Aparte join index voor elk predicaat Eén join index, kolommen voor elk predicaat Benadering van spatial criteria –Kolom met afstand tussen objecten –Alleen afstand < MAX_DIST (scope)
13
Contiguity Matrix Matrix M –M(i,j) = 1 als objecten contiguous zijn –M(i,j) = 0 anders Vaak “sparse” matrix Analoog aan Join Index Join Indices opslaan als contiguity matrices
14
Voordelen Spatial Analysis integreren in systemen –DLL, IPC, Webservices Gebruik maken van kracht van SQL Hogere performance –Pre-computing, Spatial Data Structures
15
Performance
16
Implementatie (1) SELECT R.name, R.population FROM R, S, Indices_dist_RS as I WHERE I.obj1 = R.id AND I.obj2 = S.id AND I.distance < 50
17
Implementatie (2)
18
Implementatie (3) Join Index is fysieke representatie van Spatial Relations Relational DB voldoet Simpel concept voor gebruikers
19
Implementatie (4) Weak integration –Tijdens data selectie in DM Strong integration –Low level, minder portable –Hogere performance
20
Object References Unieke “Object Identifier” ontbreekt in RDBMS Keys kunnen wijzigen Oplossing? Constraints of triggers Spatial databases veranderen niet veel
21
Join Index Set (1) Meerdere Spatial Relations Hoe hiermee omgaan? Twee oplossingen –Een ‘Join Index Set’ per relation –Eentje voor alle relations
22
Join Index Set (2) VoordelenNadelen Meerdere sets Geen overhead Inëfficient bij multi- criteria queries Eén setSnelVeel lege waardes
23
Extensibility van tools Spatial joins op basis van afstand –Ondersteuning ontbreekt Join extern berekenen –Opslaan als simpele tabel –Of in formaat van applicatie
24
Conclusie Spatial relationships van groot belang Compatible met contiguity matrices Te representeren als tabel, SQL Nog veel research te doen in SDM
Verwante presentaties
© 2024 SlidePlayer.nl Inc.
All rights reserved.