De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

Business Intelligence: DATA MINING ‘Graven in Criminele Carrières’ Tim Cocx, 2009.

Verwante presentaties


Presentatie over: "Business Intelligence: DATA MINING ‘Graven in Criminele Carrières’ Tim Cocx, 2009."— Transcript van de presentatie:

1 Business Intelligence: DATA MINING ‘Graven in Criminele Carrières’ Tim Cocx, 2009

2 7/14/2014Tim Cocx, Data ‘flood’ Steeds meer gegevens worden gegenereerd! (data) Bank, telecom, andere zakelijke transacties... Wetenschappelijke data: astronomie, biologie Web, tekst, en E-commerce.

3 7/14/2014Tim Cocx, Gevolgen en mogelijkheden Twee keer zoveel data werd gemaakt in 2002 als in 1999 (~30% gegroeid) Gevolg: heel weinig van deze gegevens worden ook daadwerkelijk ooit door een mens bekeken!! – Alleen google heeft al 1/3 van de hele mensheid aan Word-documenten op geslagen! Daarom: Automatische technieken nodig om nog wat nuttigs met de gegevens te doen. Maar ook: Opdoen van kennis die ‘we’ nog niet eerder hadden.

4 Enter: Business Intelligence Tim Cocx, Die Hele Grote Database Business Inelligence Data Warehouse Querying Die Belangrijke Rapportage Data Mining OLAPAlarmbellen BI 2.0 ? Offline herinrichten

5 OLAP Behoefte af te stappen van gedetailleerde vragen. – Geef mij alle koffie opbrengsten USA van 2006 – Geef mij alle koffie opbrengsten USA van 2007 – Geef mij….. – En nu van Europa – En nu van Nederland – En nu van Snacks – En nu van de 100% Halal kipfrikadel Tim Cocx, 20095

6 OLAP Dit kan dus handiger Software tools die mbv data warehouse de gegevens handig presenteren. Selecteer ‘dimensies’ en ‘data’ – Dimensie: Regio & product-type – Data: verkoopcijfers – Presenteer in (2-dimensionaal) tabelletje Tim Cocx, 20096

7 OLAP Dus: OLAP is heel handig om veel informatie snel overzichtelijk te krijgen. Nadelen: – Iemand weten de juiste vragen te stellen. Kan heel lastig zijn. – Die iemand moet worden betaald. – Die iemand moet aan het werk zijn. – De rapportages moeten gelezen en geïnterpreteerd worden Tim Cocx, 20097

8 Data Mining Oplossing: Data mining – Computergestuurd proces. – Automatische vragen. – Automatische analyses – Automatische response Nadeel – Nog steeds interpretatie nodig Heel belangrijk Tim Cocx, 20098

9 7/14/2014Tim Cocx, Data mining Data mining is 1 van de moderne speerpunten binnen Business Intelligence

10 7/14/2014Tim Cocx, Data mining: definitie Data mining is het automatische proces van het vinden van – Valide (= waar), – Nieuwe, – mogelijk bruikbare – En uiteindelijk begrijpelijke patronen in data.

11 7/14/2014Tim Cocx, Data mining en andere wetenschappen Databases Computer Statistiek Visualisatie Machine Leren Data Mining Business Inelligence

12 Classificatie # potenVleugelsType mondStaart# kinderen 5neemondnee1 7/14/2014Tim Cocx, Voorspellen van klasse van dit dier Zoogdier Vis Insect Vogel, etc Antwoord: Zeester  Asteroidea

13 7/14/2014Tim Cocx, Clustering Grote tabel met alle dieren en hun eigenschappen: Pokemon Vogels Vissen Zoogdieren

14 7/14/2014Tim Cocx, Associaties Alle boodschappenmandjes Albert Heijn in december. Uitvinden welke producten vaak samen verkocht worden (handige reclame!)

15 7/14/2014Tim Cocx, Afwijking detectie Omgekeerd van hiervoor: geen algemene waarheden vinden, maar afwijkingen daarvan Alle banktransacties en hun kenmerken Het automatisch vinden van zwart geld (anders dan standaard) Het automatisch vinden van witwas praktijken

16 7/14/2014Tim Cocx, ‘Link’ analyse Aan de hand van telefoontjes criminele netwerken vaststellen:

17 Text mining Welke s gaan over hetzelfde onderwerp? – Wat zijn de belangrijke deelconcepten – Terrorisme – Reclame-matching – Search engine Kan ik een betoog automatisch structureren uit een tekst? – Omgekeerde van Rationale Welk document is door wie geschreven? Tim Cocx,

18 Beroemde succesverhalen Succes ligt vaak in combinatie van methodieken: ENRON – Mega energieconcern USA – Door grootschalige fraude omgevallen – Bewijsvoering tegen directie mbv textmining en linkanalyse tot stand gekomen Tim Cocx,

19 Beroemde succesverhalen Tim @

20 7/14/2014Tim Cocx, Mijn onderzoek: DALE Data Assistance for Law Enforcement Project ingediend bij NWO – Organisatie van de staat om wetenschappelijk onderzoek te financieren. Samenwerking met het KLPD (nationale politie) Data mining toepassen op de data verzameld door alle Nederlandse korpsen. Onder andere: relaties tussen misdaden, drugs- s vergelijken en criminele carrières.

21 7/14/2014Tim Cocx, Onderzoeksgebied Criminele Carriere Onderzoek Sociologie Psychologie Criminologie Rechten Informatica

22 7/14/2014Tim Cocx, Criminele Carrieres: wat zijn het?

23 7/14/2014Tim Cocx, Doel van analyse Analyse

24 7/14/2014Tim Cocx, ‘Afstanden’ tussen criminelen Hoe verder criminelen van elkaar staan: hoe minder hun carrières op elkaar lijken. Afstand 0  precies dezelfde carrières Afstand 1  maximaal verschillende carrières 11 / 2 0

25 7/14/2014Tim Cocx, De vier factoren AardDuurFrequentieZwaarte

26 7/14/2014Tim Cocx, Landelijke HKS Database met de alle strafbladen van Nederland Ongeveer plegers. Bevat alle overtredingen van personen die na 1995 een misdrijf begaan hebben. Bevat naast de misdaden ook gegevens over leeftijden, woonplaats, afkomst ed. geanonimiseerd!

27 7/14/2014Tim Cocx, Voorspelling Het zou fijn zijn als er van een beginnende crimineel een voorspelling gemaakt kon worden over zijn carriere. Jaar 1 Jaar 2 Jaar 3 Jaar 6?

28 7/14/2014Tim Cocx, Verschillende Manieren Verschillende methoden leiden tot verschillende uitkomsten Welke is de beste?

29 7/14/2014Tim Cocx, Uitkomsten Methode 4 is de beste. Bij 3 beschikbare jaren kunnen we een carrière met 89% nauwkeurigheid voorspellen! Alarmbellen bij de politie Andere aparte uitkomsten in relaties tussen misdaadkenmerken: – Drugssmokkel en drugsverslaving – Verkeersmisdrijven en buiten de randstad – Joyriden en overtreden arbeidswet

30 Data mining: waarschuwing Privacy – Mogen de gegevens wettelijk / ethisch wel voor dit doel gebruikt worden? Interpretatie – Weet de ‘lezer’ wel hoe de gegevens tot stand zijn gekomen? – Begrijpt hij de teksten / plaatjes wel? Statistische validiteit – De ‘waarheid’ wordt opgeleverd met zekere betrouwbaarheid Mogen individuen op basis daarvan ‘gediscrimineerd’ worden? Bij 90%? Bij 98%? Bij 99.99%? Tim Cocx,

31 7/14/2014Tim Cocx, Ondervraging


Download ppt "Business Intelligence: DATA MINING ‘Graven in Criminele Carrières’ Tim Cocx, 2009."

Verwante presentaties


Ads door Google