Datamining Politie Meldingen Universiteit van Amsterdam Datamining Politie Meldingen Lennard Kuijten Bram Stoeller Leren & Beslissen
Datamining Politie Meldingen Doelstelling en Hoofdvragen Data verkennen Data herstructureren Leermodellen Resultaten Evaluatie Conclusie Doelstelling en Hoofdvragen Data verkennen Data herstructureren Leermodellen Resultaten Evaluatie Conclusie Lennard Kuijten & Bram Stoeller
Doelstelling en Hoofdvragen Doelstellingen Politie Gelderland Midden Incidenten voorspellen Personeel effectiever inzetten Incidenten voorkomen of beter afhandelen Hoofdvragen Verbanden tussen incidenten? Voorspellers incidenten? Voorspellers geweldsincidenten? Doelstelling en Hoofdvragen Data verkennen Data herstructureren Leermodellen Resultaten Evaluatie Conclusie Lennard Kuijten & Bram Stoeller
Data verkennen Database Attributen begrijpen Hiërarchische structuur Incidenten Weer Attributen begrijpen Hiërarchische structuur Locatie Feedback opdrachtgever Doelstelling en Hoofdvragen Data verkennen Data herstructureren Leermodellen Resultaten Evaluatie Conclusie Lennard Kuijten & Bram Stoeller
Data verkennen Statistische analyses Plots Verdelingen Spreidingen / Lijsten Plots Doelstelling en Hoofdvragen Data verkennen Data herstructureren Leermodellen Resultaten Evaluatie Conclusie Lennard Kuijten & Bram Stoeller
Data herstructureren Attribuutselectie Recordselectie Discretiseren Waarden Attributen Maandata Anomalistisch (Fw) Synodisch (Schijngestalten) Doelstelling en Hoofdvragen Data verkennen Data herstructureren Leermodellen Resultaten Evaluatie Conclusie Lennard Kuijten & Bram Stoeller
Data herstructureren Waarden Attributen datum incident 1 jan Geweld Diefstal Vernieling 2 jan … datum incident Aantal 1 jan Geweld 4 Diefstal 6 Vernieling 2 2 jan 3 3 jan 1 … datum Geweld Diefstal Vernieling Voorspelling 1 jan 4 6 2 3 2 jan 1 3 jan … Doelstelling en Hoofdvragen Data verkennen Data herstructureren Leermodellen Resultaten Evaluatie Conclusie Lennard Kuijten & Bram Stoeller
Data herstructureren Waarden Attributen datum incident 1 jan Geweld Diefstal Vernieling 2 jan … datum incident Aantal 1 jan Geweld 4 Diefstal 6 Vernieling 2 2 jan 3 3 jan 1 … datum Geweld Diefstal Vernieling Voorspelling 1 jan 4 6 2 3 2 jan 1 3 jan … Doelstelling en Hoofdvragen Data verkennen Data herstructureren Leermodellen Resultaten Evaluatie Conclusie Lennard Kuijten & Bram Stoeller
Data herstructureren Waarden Attributen datum incident 1 jan Geweld Diefstal Vernieling 2 jan … datum incident Aantal 1 jan Geweld 4 Diefstal 6 Vernieling 2 2 jan 3 3 jan 1 … datum Geweld Diefstal Vernieling Voorspelling 1 jan 4 6 2 3 2 jan 1 3 jan … Doelstelling en Hoofdvragen Data verkennen Data herstructureren Leermodellen Resultaten Evaluatie Conclusie Lennard Kuijten & Bram Stoeller
Leermodellen Machinaal leren Overfitting Cross Validation Modellen Wat is het? Wat kan het? Overfitting Cross Validation Modellen Naive Bayes Neuraal Netwerk (Multilayer Perceptron) Doelstelling en Hoofdvragen Data verkennen Data herstructureren Leermodellen Resultaten Evaluatie Conclusie Lennard Kuijten & Bram Stoeller
Resultaten Triviale verbanden Overfitting Geen correlaties Enig resultaat Doelstelling en Hoofdvragen Data verkennen Data herstructureren Leermodellen Resultaten Evaluatie Conclusie Lennard Kuijten & Bram Stoeller
Resultaten Triviale Verbanden Doelstelling en Hoofdvragen Data verkennen Data herstructureren Leermodellen Resultaten Evaluatie Conclusie Lennard Kuijten & Bram Stoeller
Resultaten Overfitting Doelstelling en Hoofdvragen Data verkennen Data herstructureren Leermodellen Resultaten Evaluatie Conclusie Lennard Kuijten & Bram Stoeller
Resultaten Geen correlaties gevonden Doelstelling en Hoofdvragen Data verkennen Data herstructureren Leermodellen Resultaten Evaluatie Conclusie Lennard Kuijten & Bram Stoeller
Resultaten Enig resultaat Correlatie coëfficiënt = 0,11 Formule aannemelijk Waarschijnlijk false positive Praktische relevantie nihil predict = 0.0247 * Aandachtsvestigingen + -0.1257 * Aantasting veiligheid + 0.0541 * Conflict/bemiddeling + 0.0647 * Geweld + 0.1818 * Openbare orde + 0.0169 * CGem + -0.0656 * WKGem + -0.0004 * DrukGem + 4.6792 Doelstelling en Hoofdvragen Data verkennen Data herstructureren Leermodellen Resultaten Evaluatie Conclusie Lennard Kuijten & Bram Stoeller
Evaluatie Specifiek gericht op dagdelen / geweld Accuraatheid modellen Daarbinnen niets gevonden Accuraatheid modellen Selectie modellen Impact op doelstellingen/hoofdvragen Triviale verbanden Geen significant voorspellers Doelstelling en Hoofdvragen Data verkennen Data herstructureren Leermodellen Resultaten Evaluatie Conclusie Lennard Kuijten & Bram Stoeller
Conclusie Geen verbanden binnen data aanwezig Wel specifieke aanpak op hoofdvragen gericht Geen verbanden/voorspellers gevonden Plausibel: geen afhankelijkheden Advies toekomstig onderzoek Specifiekere (persoon)gegevens Langere termijn verbanden (trends) Doelstelling en Hoofdvragen Data verkennen Data herstructureren Leermodellen Resultaten Evaluatie Conclusie Lennard Kuijten & Bram Stoeller
Dit was een datamining project van Lennard Kuijten en Bram Stoeller Universiteit van Amsterdam Dit was een datamining project van Lennard Kuijten en Bram Stoeller Universiteit van Amsterdam Politie Gelderland Midden