Voorspelling van criminele carrières door 2-dimensionale extrapolatie T.K. Cocx, tcocx@liacs.nl 5/8/2019 W. Kosters et al.
? 5/8/2019 T.K. Cocx, tcocx@liacs.nl
2-Dimensionale Extrapolatie ? ? 2-Dimensionale Extrapolatie 5/8/2019 T.K. Cocx, tcocx@liacs.nl
Onderzoeksgebied Criminele Carrière Informatica Sociologie Psychologie Criminologie Recht 5/8/2019 T.K. Cocx, tcocx@liacs.nl
Criminele Carrières 5/8/2019 T.K. Cocx, tcocx@liacs.nl
Analyse Doel Analyse 5/8/2019 T.K. Cocx, tcocx@liacs.nl
Practische Factoren Aard Hoeveelheid Zwaarte Duur 5/8/2019 T.K. Cocx, tcocx@liacs.nl
Strategische analyse wordt al gedaan Paradigma Vier factoren Afstandsmaat Strategische analyse wordt al gedaan Clustering Predictie 5/8/2019 T.K. Cocx, tcocx@liacs.nl
Alignment 5/8/2019 T.K. Cocx, tcocx@liacs.nl
Afstanden tussen carrières Aard Zwaarte 5/8/2019 T.K. Cocx, tcocx@liacs.nl
Clustering en classificatie Clustering wordt gedaan op basis van afstand Vorm van ‘multi-dimensional scaling’ Iteratieve eigenschap is vereist Na clustering: classes worden toegewezen aan ontstane clusters. Met de hand 11 classes Classificatie kan nu worden gedaan door k-means 5/8/2019 T.K. Cocx, tcocx@liacs.nl
Resultaten: Clustering en Classificatie Year 4 Year 3 Year 2 Year 1 5/8/2019 T.K. Cocx, tcocx@liacs.nl
2-Dimensionale Extrapolatie De knikker in de trechter en het voorspellen van een criminele carrière zijn twee voorbeelden van hetzelfde probleem: Extrapolatie van een tijdsequentie in een vlak. Year 1 Year 2 Year 3 Year 4 ? 5/8/2019 T.K. Cocx, tcocx@liacs.nl
Reguliere Wiskundige Extrapolatie Een variabele (vaak tijd, x) is gegeven. Een Variabele (Waarde, Temperatuur, gewicht, etc, y) is afhankelijk van die variabele 5/8/2019 T.K. Cocx, tcocx@liacs.nl
2-Dimensionale Extrapolatie Een variabele (vaak tijd, t) is gegeven. Twee variabelen (x, y) zijn afhankelijk van die variabele. Soms (als bij criminele carrière predictie) zijn x en y zonder betekenis. Alleen de locatie van punten ten opzichte van elkaar zijn van belang. Een relatief onder-onderzocht gebied in de wiskunde. 5/8/2019 T.K. Cocx, tcocx@liacs.nl
Mogelijke oplossingen Neem aan dat y van x afhangt Roteer figuur zodat de t-order optimaal op de x-as valt Standaard tweedegraads extrapolatie Zelfde als optie hiervoor Standaard derdegraads extrapolatie 2-Dimensionale Extrapolatie Spline interpolatie items t en t+1 Extrapoleer na tlast Verschillende methodes Neem aan dat x en y onafhankelijk van elkaar van t afhangen Extrapoleer apart Combineer in {x,y}-stelsel 5/8/2019 T.K. Cocx, tcocx@liacs.nl
Spline Extrapolatie Er zijn twee keuzes voor spline extrapolatie: Straight line cont. Polynomial cont. 5/8/2019 T.K. Cocx, tcocx@liacs.nl
Toekomstige Class Calculatie Selecteer n bestaande data punten dichtstbij de ge-extrapoleerde curve. Hoe dichterbij het ‘laatst bekende’ punt, hoe accurater. Bereken te verwachten waarden van de attributen dmv een gewogen gemiddelde. Classificeer het nieuwe individu op basis van die gegevens. 5/8/2019 T.K. Cocx, tcocx@liacs.nl
Overview van methode Two-dimensional High-dimensional Crimes committed Four factors Distance Matrix Clustering Combined Extrapolation Classification Prediction # crimes Class Prediction 5/8/2019 T.K. Cocx, tcocx@liacs.nl
Implementatie 5/8/2019 T.K. Cocx, tcocx@liacs.nl
Cluster Reductie 5/8/2019 T.K. Cocx, tcocx@liacs.nl
Resultaten Gebruikmakend van meta data uit de originele HKS database (Ong. 1 miljoen verdachten) 5/8/2019 T.K. Cocx, tcocx@liacs.nl
Effect van aantal referentie punten Hoeveel referentiepunten zijn er nodig? 30-50 is genoeg 5/8/2019 T.K. Cocx, tcocx@liacs.nl
Effect van bekende tijdseenheden Hoeveel bekende tijdseenheden (jaren) zijn nodig voor een accurate voorspelling? 3-5 is genoeg 5/8/2019 T.K. Cocx, tcocx@liacs.nl
Privacy issues Data mining algemene waarheid uit een hoop data In dit onderzoek: vertaal deze waarheid naar een individueel geval privacy and statistische issues spelen een rol Vergelijkbaar met data mining op financiële transacties Dat wordt gezien als acceptabel Zo lang weinig false positives Zo lang gebruikers op de hoogte zijn van de betrouwbaarheid Onze aanpak is geen risico voor niet-verdachten alleen (bestaande) carrière vervolging 5/8/2019 T.K. Cocx, tcocx@liacs.nl
Conclusie Criminele carrière analyse kan een basis zijn voor carrière predictie. Gebruikmakend van het concept van 2-dimensionale extrapolatie kan een vervolging van een criminele carrière door een clustering voorspeld worden Gebruikmakend van ‘straight line spline’ extrapolatie met het maximum aantal bestaande elementen voorspelt de toekomstige class van een individu met 88.7% nauwkeurigheid. 5/8/2019 T.K. Cocx, tcocx@liacs.nl
Verhoor 5/8/2019 T.K. Cocx, tcocx@liacs.nl