Voorspelling van criminele carrières door 2-dimensionale extrapolatie

Slides:



Advertisements
Verwante presentaties
Statistische uitspraken over onbekende populatiegemiddelden
Advertisements

Vierde bijeenkomst Kleinste kwadraten methode Lineaire regressie
Performance management
Filmpje voor servicedesk
Hoofdstuk 10 Onderzoeken met SPSS en MS Excel
Risico’s en gevaren van techniek
Betrouwbaarheid en validiteit: Alleen een kwestie van goed meten ?
Kwaliteitskenmerken van een PvA
Samenvatting Hoofdstuk 3 (§2 Vlakken)
Business Intelligence: DATA MINING
Schatgraven in Gegevensbergen
Pieter Adriaans Niels Netten (Maarten van Someren)
Hok Kwan Kan Primary supervisor: dr. Katrien Antonio
Volumeberekening van omwentelingslichamen
vwo D Samenvatting Hoofdstuk 9
vwo C Samenvatting Hoofdstuk 13
Measuring of Organisation Structures D.S. PUGH Nele Van Dooren 2 de Bachelor Sociologie 28 maart 2006.
Jan Talmon Medische Informatica Universiteit Maastricht
Jong geleerd, fout gedaan?
Transport en locatie warehouse
vwo A Samenvatting Hoofdstuk 14
De grafiek van een lineair verband is ALTIJD een rechte lijn.
Thesisseminarie 4 Resultaten Correlatie en multiple regressie
Gegevensverwerving en verwerking
Meervoudige lineaire regressie
1212 /n Metingen aan de hoogte van een toren  D  wordt gemeten met onzekerheid S  =0.1 o. Vraag 1: Op welke afstand D moet je gaan staan om H zo nauwkeurig.
NAHSA Nijmegen Area High School Array. Inleiding Wat willen we meten Hoe willen we dit doen Wat is de rol van universiteit en scholen in dit project Wat.
H4 Marktonderzoek Verschillende informatiebehoeften in verschillende fasen: Analyse fase Strategische fase Implementatie fase Evaluatie fase.
Voorspellende analyse
Voorspellende analyse
Spatial subgroup mining
havo A Samenvatting Hoofdstuk 3
H2 Lineaire Verbanden.
Hoofdstuk 4 – Gegevens analyseren
De vangnetpopulatie in de Ziektewet: kenmerken en risicofactoren voor langdurig verzuim Het onderzoek.
The [31,21,5] error correcting cyclic code Door: Finbar S. Bogerd.
havo B Samenvatting Hoofdstuk 1
Deel 2: Onzekerheid in redeneren
ribWBK11t Toegepaste wiskunde Lesweek 01
Join Indices … as a tool for Spatial Datamining. Inhoud Inleiding Spatial Relations (Spatial) Join Index Implementatie Conclusie.
In de weer voor het klimaat
ANALYSE 3 INFANL01-3 WEEK CMI Informatica.
Empirical librarianship ceci n’est pas un texte De bibliotheek als onderzoeker Workshop - template kaartjes Jeroen Bosman & Bianca Kramer Universiteitsbibliotheek.
ANALYSE 3 INFANL01-3 WEEK CMI Informatica.
Hogeschool Rotterdam, Opleiding Vastgoed & Makelaardij drs. ing. M.M.A. Scheepers Collegejaar college.
Stelsels van vergelijkingen H5 deel 3 Hoofdstuk 10 Opgave 61, 62, 63.
Managen analyseren 6 adviseren creëren organiseren begeleiden In kaart brengen Organisaties communicatieve r maken Iets doen ontstaan Mensen.
Briefing Opdrachtanalyse en Vooronderzoek
Wat vinden jongeren belangrijk? Cliëntenraad GGZ Kinderen en Jeugd.
Data Mining without Discrimination Valorisatiepanel 4 december – Faculty Club – Universiteit Leiden.
De rol van patiënt factoren bij zelfmanagement ondersteuning in de huisartspraktijk Irene Bos-Touwen.
Wiskunde G3 Samenvatting H2: Parabolen
Disclosure belangen NHG spreker
Rendementsverbetering derde klas MBO niveau 4
Bevorderingsrichtlijnen van de Bernardus: soepel of streng
Extrapolatie met variabele tijdbasis
havo A Samenvatting Hoofdstuk 10
Een frequent attender is meer dan de som van zijn morbiditeiten
Directe belichting in ray tracing
Keuzevoorlichting havo wiskunde AB.
Het voorspellen van agressie tijdens de behandeling van forensisch psychiatrische patiënten a.d.h.v. DE hcr-20.
Praktijkbeproeving ODS (Open Data Standaarden)
De grafiek van een lineair verband is ALTIJD een rechte lijn.
3 vmbo-KGT Samenvatting Hoofdstuk 10
havo B Samenvatting Hoofdstuk 1
Bewijs: de eigenschap van de som van de hoeken in een driehoek
Voorspellende analyse
Hoofdstuk 10 Onderzoeken met SPSS en MS Excel
Extra uitleg H4 Domein Markten
Python – For loop + strings
Transcript van de presentatie:

Voorspelling van criminele carrières door 2-dimensionale extrapolatie T.K. Cocx, tcocx@liacs.nl 5/8/2019 W. Kosters et al.

? 5/8/2019 T.K. Cocx, tcocx@liacs.nl

2-Dimensionale Extrapolatie ? ? 2-Dimensionale Extrapolatie 5/8/2019 T.K. Cocx, tcocx@liacs.nl

Onderzoeksgebied Criminele Carrière Informatica Sociologie Psychologie Criminologie Recht 5/8/2019 T.K. Cocx, tcocx@liacs.nl

Criminele Carrières 5/8/2019 T.K. Cocx, tcocx@liacs.nl

Analyse Doel Analyse 5/8/2019 T.K. Cocx, tcocx@liacs.nl

Practische Factoren Aard Hoeveelheid Zwaarte Duur 5/8/2019 T.K. Cocx, tcocx@liacs.nl

Strategische analyse wordt al gedaan Paradigma Vier factoren Afstandsmaat Strategische analyse wordt al gedaan Clustering Predictie 5/8/2019 T.K. Cocx, tcocx@liacs.nl

Alignment 5/8/2019 T.K. Cocx, tcocx@liacs.nl

Afstanden tussen carrières Aard Zwaarte 5/8/2019 T.K. Cocx, tcocx@liacs.nl

Clustering en classificatie Clustering wordt gedaan op basis van afstand Vorm van ‘multi-dimensional scaling’ Iteratieve eigenschap is vereist Na clustering: classes worden toegewezen aan ontstane clusters. Met de hand 11 classes Classificatie kan nu worden gedaan door k-means 5/8/2019 T.K. Cocx, tcocx@liacs.nl

Resultaten: Clustering en Classificatie Year 4 Year 3 Year 2 Year 1 5/8/2019 T.K. Cocx, tcocx@liacs.nl

2-Dimensionale Extrapolatie De knikker in de trechter en het voorspellen van een criminele carrière zijn twee voorbeelden van hetzelfde probleem: Extrapolatie van een tijdsequentie in een vlak. Year 1 Year 2 Year 3 Year 4 ? 5/8/2019 T.K. Cocx, tcocx@liacs.nl

Reguliere Wiskundige Extrapolatie Een variabele (vaak tijd, x) is gegeven. Een Variabele (Waarde, Temperatuur, gewicht, etc, y) is afhankelijk van die variabele 5/8/2019 T.K. Cocx, tcocx@liacs.nl

2-Dimensionale Extrapolatie Een variabele (vaak tijd, t) is gegeven. Twee variabelen (x, y) zijn afhankelijk van die variabele. Soms (als bij criminele carrière predictie) zijn x en y zonder betekenis. Alleen de locatie van punten ten opzichte van elkaar zijn van belang. Een relatief onder-onderzocht gebied in de wiskunde. 5/8/2019 T.K. Cocx, tcocx@liacs.nl

Mogelijke oplossingen Neem aan dat y van x afhangt Roteer figuur zodat de t-order optimaal op de x-as valt Standaard tweedegraads extrapolatie Zelfde als optie hiervoor Standaard derdegraads extrapolatie 2-Dimensionale Extrapolatie Spline interpolatie items t en t+1 Extrapoleer na tlast Verschillende methodes Neem aan dat x en y onafhankelijk van elkaar van t afhangen Extrapoleer apart Combineer in {x,y}-stelsel 5/8/2019 T.K. Cocx, tcocx@liacs.nl

Spline Extrapolatie Er zijn twee keuzes voor spline extrapolatie: Straight line cont. Polynomial cont. 5/8/2019 T.K. Cocx, tcocx@liacs.nl

Toekomstige Class Calculatie Selecteer n bestaande data punten dichtstbij de ge-extrapoleerde curve. Hoe dichterbij het ‘laatst bekende’ punt, hoe accurater. Bereken te verwachten waarden van de attributen dmv een gewogen gemiddelde. Classificeer het nieuwe individu op basis van die gegevens. 5/8/2019 T.K. Cocx, tcocx@liacs.nl

Overview van methode Two-dimensional High-dimensional Crimes committed Four factors Distance Matrix Clustering Combined Extrapolation Classification Prediction # crimes Class Prediction 5/8/2019 T.K. Cocx, tcocx@liacs.nl

Implementatie 5/8/2019 T.K. Cocx, tcocx@liacs.nl

Cluster Reductie 5/8/2019 T.K. Cocx, tcocx@liacs.nl

Resultaten Gebruikmakend van meta data uit de originele HKS database (Ong. 1 miljoen verdachten) 5/8/2019 T.K. Cocx, tcocx@liacs.nl

Effect van aantal referentie punten Hoeveel referentiepunten zijn er nodig? 30-50 is genoeg 5/8/2019 T.K. Cocx, tcocx@liacs.nl

Effect van bekende tijdseenheden Hoeveel bekende tijdseenheden (jaren) zijn nodig voor een accurate voorspelling? 3-5 is genoeg 5/8/2019 T.K. Cocx, tcocx@liacs.nl

Privacy issues Data mining algemene waarheid uit een hoop data In dit onderzoek: vertaal deze waarheid naar een individueel geval  privacy and statistische issues spelen een rol Vergelijkbaar met data mining op financiële transacties Dat wordt gezien als acceptabel Zo lang weinig false positives Zo lang gebruikers op de hoogte zijn van de betrouwbaarheid Onze aanpak is geen risico voor niet-verdachten alleen (bestaande) carrière vervolging 5/8/2019 T.K. Cocx, tcocx@liacs.nl

Conclusie Criminele carrière analyse kan een basis zijn voor carrière predictie. Gebruikmakend van het concept van 2-dimensionale extrapolatie kan een vervolging van een criminele carrière door een clustering voorspeld worden Gebruikmakend van ‘straight line spline’ extrapolatie met het maximum aantal bestaande elementen voorspelt de toekomstige class van een individu met 88.7% nauwkeurigheid. 5/8/2019 T.K. Cocx, tcocx@liacs.nl

Verhoor 5/8/2019 T.K. Cocx, tcocx@liacs.nl