Modelling spatial dependencies for mining geospatial data Marlies Mooijekind.

Slides:



Advertisements
Verwante presentaties
Defining a standard JSON-based exchange format for learning metadata Manon Haartsen.
Advertisements

Agenda Blok 1 - Evolutie van Cloud Computing
Project Software Engineering Universiteit AntwerpenPlanning 4.1 Hoe snel loopt iemand de 100 meter ?
HM-ES-th1 Les 9 Hardware/Software Codesign with SystemC.
Pieter Adriaans IvI-ILLC Universiteit van Amsterdam NIOC open problemen in de studie van rekenen en informatie.
1 Co-Design at Chess-iT Guus Bosman. 2 Afstuderen bij Chess Net.Footworks tot augustus 2003 Afstuderen augustus 2003 tot maart 2004 Chess full-time vanaf.
MASTERPROJECT M1 · Groep Equilibrium Marieke Steenbeeke Rick van Veghel Tim de Veen MASTERPROJECT M1 ZERO ENERGY BUILDING Previous weeks · Zero.
Teams on the frontline Geert Stroobant De Heide - Balans
Copyright © 2008 Tele Atlas. All rights reserved. Zet uw Business Data op de kaart: Locaties in eTOM ®
Project Combat Casper Bommelé Marc Eekhout Michel van der Hut
Programmeren in Java met BlueJ
COSTA Common Set of Tools for Assimilation of Data OpenDA/COSTA voor operationele modellen en kalibratie rivier toepassingen Nils van Velzen Simona gebruikersdag.
Nieuwe wegen in ontwerpen met CAD
F. Mol, W.M. Ankum, B.W. Mol, F. van der Veen, P.J. Hajenius Incidentie van EUG en Chlamydia trachomatis infectie in Nederland.
Presentatie IA Solutions 2005: Programma generatie voor: PLC en SCADA Een update van deze PPT is te downloaden op: Rob Kits - Technisch.
Beyond Big Grid – Amsterdam 26 september 2012 Enquette 77 ingevulde enquettes, waarvan 60 met gebruikservaring = Mainly Computer Science.
AAHA (voor intern gebruik)
Omgevingen zijn dan geïmplementeerd als Symbol Tables. Symbol Table mapt een symbool met een Binding Meerdere noties van binding –Meerdere manieren te.
Informatica Universiteit AntwerpenScripting 5.1 Informatica 1rste BAC Biologie Hoofdstuk 5 Scripting.
Ben Raes en Sam Decrock1 Tracking algoritmes Tracking Algoritmes Richting van ons project.
Spatial Association. Spatial Association Rule X → Y X → Y P 1 ..  P m → Q1 ..  Qn (c%) P 1 ..  P m → Q1 ..  Qn (c%) Los predicaat: 1-predicate.
Specialismen Analyse en verificatie van protocollen Analyse van Petri-netten Component-specificatie Web-based information systems (Query)talen voor Web.
1/1/ / faculty of Computer Science eindhoven university of technology 5B040:Computerarchitectuur 2M200:Inleiding Computersystemen Sessie 8(2): Multi-processing.
ontwik idee - keling dag 3 goals today Develop “criteria” to help you evaluate & select your ideas Some tools from Tassouls book to help you do this.
Neurale Netwerken Kunstmatige Intelligentie Rijksuniversiteit Groningen Mei 2005.
Pieter Adriaans Maarten van Someren
ERIC Combine search terms with Boolean operators Next = click.
Creatieve workshop Wiki: Scroll naar beneden: docentenpagina: Pia Terstroet.
Extending science Prof.dr.ir. Taeke M. de Jong TUDelft Faculty of Architecture Dep. Urbanism Chairs: Technical Ecology Regional Design assignment methodology.
Databases I (H.3) Het Entity-Relationship Model Wiebren de Jonge Vrije Universiteit, Amsterdam versie 2003.
Jo van den Brand & Tjonnie Li Kromlijnige coördinaten: 19 oktober 2010 Gravitatie en kosmologie FEW cursus.
Netwerk Algorithms: Shortest paths1 Shortest paths II Network Algorithms 2004.
Location Based Services GIA – Najaar 2004 Martijn Baede.
Spatial classificatie
Spatial subgroup mining
Flocking using Global Roadmaps Niels Gorisse Motion Planning 26 februari 2003 University Utrecht.
Algorithms and Application for spatial data mining Ronnie Bathoorn.
Hoorcollege 8 Game object structuren. Arrays in games Grid-gebaseerd speelveld (zoals Tetris) Lijst van spelers Lijst van inventory items Lijst van alle.
Hibernate Object relational mapping
Uitwerking opgave 1.2 1f uit: Wiskunde in beweging – Theo de Haan.
Hidden Markov Models Introductie Project: 1. Initializatie 2. Training.
JAVA1 H 22. COLLECTIONS FRAMEWORK. 1. INLEIDING. Collections framework Is een verzameling van data structuren, interfaces en algoritmen Meest voorkomende.
Computertechniek 2 – ARM assembler Hogeschool van Utrecht / Institute for Computer, Communication and Media Technology 1  D3EEMS1  programmed I/O: de.
Clemens Duyvesteijn ExxonMobil Chemical / Refining
Geheugen, distributie en netwerken Netwerken: de basis voor distributie van gegevens en taken (processen) –bestaan zo’n 40 jaar, zeer snelle ontwikkeling.
Hoorcollege SDM1 7 Maart 2006 Mario van Vliet - 1 -
De PROFIBUS, PROFINET & IO-Link dag 2011 Share our Vision for Automation.
Neurale Netwerken Kunstmatige Intelligentie Rijksuniversiteit Groningen Mei 2005.
Motivation One secret for success in organizations is motivated and enthusiastic employees The challenge is to keep employee motivation consistent with.
1 Over het examen (1): Modus Mondeling met schriftelijke voorbereiding 4 uur, 3 onderdelen: –Modellering (  schriftelijk, dan mondeling) –Queries / relationeel.
Contributie van videomateriaal voor broadcast Klaas-Pieter Looren de Jong.
Dutch Automatic Speech Recognition Using Kohonen Neural Networks Delft University of Technology Faculty of Information Technology and Systems Knowledge-Based.
Advanced Modulation and Coding : Estimation and decision theory 1 Geavanceerde Modulatie en Codering Estimatie- en Decisietheorie.
SRON EO strategie – NL gebruikersgemeenschap SRON invulling Wetenschappelijk thema: “Atmosfeer” Ilse Aben (lead scientist Atmosfeer) National Institute.
Marcel Crok | De staat van het klimaat Lezing KNAW klimaatbrochure Seminar | Maandag 12 december | Nieuwspoort Den Haag.
Blended Learning. content Waarom wij e-learning hebben gebruikt Demo van de module Voorlopige resultaten van effecten op gebruikers.
Debye Instituut for Nanomaterial Science (P) Afdeling Nanophotonics - zonnecellen, nanomaterialen (Schropp) - ultrasnelle processen (Dijkhuis/Krol) - Bose-Einstein.
1/1/ / faculty of Computer Science eindhoven university of technology 5B040:Computerarchitectuur 2M200:Inleiding Computersystemen Sessie 9(2): Virtual.
Major/minor Kwantitatieve methoden (HIR) Predoctoraal traject (HIR) Minor Business Research (TEW/MBE) maart 2014.
Link Popularity Het principe van linkpopulariteit kun je als volgt samenvatten: hoe meer webpagina's er naar een bepaalde webpagina linken, des te belangrijker.
C++ C++ als een verbetering van C Abstracte datatypen met classes Constructoren en destructoren Subklassen binding van functies 1.
Usability metrics Gebruiksvriendelijkheid ISO Effectiveness Efficiency Satisfaction Learnability Flexibility En nu? Inleiding Hoe gaan we de gebruiksvriendelijkheid.
Ant Systems for dynamic problems. Ants caught in a traffic jam Casper Joost Eyckelhof.
What the aibos could learn from the midsize league Overview of past research activities at the University of Amsterdam Speaker Jürgen Sturm.
WISKUNDIG MODELLEREN KUNST OF KUNDE? 11 november 2009 Jaap Praagman CQM.
EQUA Moeten we requirements serieus nemen?. Traditioneel Iteratief Agile Open Source Frank Peeters Petra Heck
De invloed van sociale succesfactoren in Agile Software Development
1 OMI Modelleren van content. 2 Vocabulary Content “gevangen” in begrippenapparaat: Vocabulary: lijst met termen nauwelijks semantiek Ontology:
Kracht van de Kaart In het Sociale Domein Intro workshop Geonovum 23 april 2015.
1 KPN Mobiel – Introductie Repository Object Browser & Designer 10 Designer 10g & Repository Object Browser Maandag 28 februari 2005 Lucas Jellema (AMIS)
Transcript van de presentatie:

Modelling spatial dependencies for mining geospatial data Marlies Mooijekind

Inhoud n Spatial data mining n Spatial data n Predicting Locations n Technieken (vergelijking) –SAR –PLUMS n Conclusies

Spatial data mining n Spatial patterns belangrijk n 2 historische gevallen: –1855 Aziatische cholera in Londen –1909 inwoners van Colorado Springs n Spatial data mining = automatisch zoeken van mogelijke bruikbare patronen

Spatial data mining n Klassieke data mining algoritmes –onafhankelijke en identieke distributie –geen rekening met spatial autocorrelation –slechte resultaten n Spatial data first law: everything is related to everything else but nearby things are more related than distant things

Eigenschappen spatial data n Spatial autocorrelation –everything is related to everything else but nearby things are more related n Spatial heterogeneity –variatie in spatial data is een functie van zijn locatie

Technieken voor spatial data mining n Spatial statistics techniques: –expliciet spatial autocorrelation modelleren –veel rekenwerk n PLUMS (Predicting Locations Using Map Similarity)

Predicting Locations Using Map Similarity n Zoekt parameter space van modellen af m.b.v. map similarity measure n Nauwkeurigheid vergelijkbaar met spatial statistics techniques n Fractie van de rekenkosten n Generiek framework

Vergelijking technieken n Location prediction –nestlocaties –crime prevention

Voorbeeld: nestlocaties n Model bouwen voor voorspellen van locatie van nesten van rood- gevleugelde merel n Data van twee wetlands Dar en Stubble uit 1995 en 1996: –Dar 1995, Dar 1996, Stubble 1995, Stubble 1996

Model bouwen n Deel van data als learning/training data voor bouwen van learned model n Andere deel als testing data voor het testen van learned model n Learned model voor het voorspellen van locaties

Data n Onafhankelijk variabelen: –duurzaamheid van vegetatie –afstand tot open water –waterdiepte –etc. n Afhankelijke variabele –aanwezigheid van nest Deze variabelen gebruiken voor bouwen van model

Eigenschappen data n Spatial autocorrelation

Eigenschappen data n Spatial heterogeneity

Dus... n Negeren van spatial autocorrelation en spatial heterogeneity levert slechte resultaten

Classification accuracy measure n Standaard: percentage correct geclassificeerd objecten

Spatial accuracy measure n Spatial accuracy: hoe ver liggen voorspellingen van werkelijke posities n Average Distance to Nearest Prediction (ADNP) A k = echte nestlocaties P = map layer met voorspelde nestlocaties A k.nearest(P) = dichtstbijzijnde voorspelling bij A k

Location prediction n Spatial framework S bestaande uit sites {s 1,…,s n } n Verzamling explanatory functions –fx k : S  R k, k=1,…,K. n Dependent function f y : S  R y n Familie F van learning model functions R 1 ...  R K  R y

Location prediction n Vind een functie f ^ y  F n Doel: maximaliseer similarity(map s i  S (f ^ y (fx,…,fx k )), map(f y (s i )) = (1-  )classification_accuracy(f ^ y,f y ) + (  )spatial_accuracy(f ^ y,f y )

Location prediction van nestlocaties n Constraints –waarden van explanatory functions fx k s en dependent function f y hebben spatial autocorrelation –domein R k van explanatory functions is 1-D reële getallen –domein dependent variabele R y = {0,1}

Spatial autoregressive model (SAR) n Spatial statistics technique n Uitbreiding op linear regression n Modelleert expliciet spatial autocorrelation m.b.v. neigbourhood relationship contiguity matrix

Linear regression modelling n n-vector y met observaties n n  m matrix X met explanatory data n Classical linear regression modelleert relatie tussen y en X als y = X  +  n  = (  1 …  m ) n errorvector  = N(0,  2 )

Spatial autocorrelation kwantificeren n Veel measures voor kwantificeren spatial autocorrelation n Alle spatial autocorrelation measures afhankelijk van keuze contiguity matrix W

Neigbourhood relationship contiguity matrix

Spatial autoregressive model (SAR) n Relaties y i = f(y j ) modelleren, i  j n y =  Wy + X  +  n Spatial dependencies van error/dependent variabele direct in regressie model gemodelleerd met  Wy n W en  schatten m.b.v. maximum likelihood theory of Bayesian statistics n Veel rekenwerk

Linear regression versus SAR n Dar 1995 learning data n Comparison in space: Stubble 1995

Linear regression versus SAR n Dar 1995 learning data n Comparison in time: Dar 1996

Framework PLUMS

Keuzes in PLUMS n Map similarity –ADNP, nearest neighbour index etc. n Search algorithm –Greedy, simulated annealing etc. n Function family –Generalized linear, non-linear etc. n Discrezation of parameter space –Uniform, non-uniform etc.

Voorbeeld implementatie n Map similarity: ANDP n Discrezation: uniform grid met cell- grootte  n Function family: generalized linear model n Search algorithm: greedy search

Greedy search n Neemt een seed-value tuple van paramaters, bijv. (a,b,c) n Ondezoekt buren in directe omgeving van huidige tuple, bijv. (a+ ,b,c), (a- ,b,c), (a,b+ ,c), (a,b- ,c), (a,b,c+  ), (a,b,c-  ) n Herhaal voor buur met hoogste map similarity n Stopt in lokaal maximum

PLUMS en SAR n Dar 1995 learning data n Comparison in space: Stubble 1995

Conclusie n PLUMS –framework voor spatial data mining –bij location prediction sneller dan SAR –toekomst: andere data mining technieken in framework