Schatgraven in Gegevensbergen

Slides:



Advertisements
Verwante presentaties
Les 2 klassediagrammen II
Advertisements

Laurens van der Maaten IKAT / ROB
Van uitleggen leer je het meest
- Inhoud Artificial Intelligence - Inhoud Wat is AI? OorsprongReasoningLearning • Wat is Artificial Intelligence.
Goochelen met googlen Workshop Taalacademie ITTA 24 januari 2014 Amersfoort Peter den Hollander Docent Nederlands Docent Communicatievaardigheden Directeur.
Opdrachttaak kennissystemen:
Hogeschool HZ Zeeland 19 augustus 2003augustus 2003 Data Structuren & Algoritmen Week 1.
EDC ervaringen op de werkvloer – fase I/IIa
Learning analytics: de docent
Welkom bij de cursus Handig met Internet! Handig met Internet -Wat doet u al met internet? -Wat wilt u nog meer met internet doen? -Hoe kunt u beter.
Pieter Adriaans Niels Netten (Maarten van Someren)
Q-KENNIS Een kennis-systeem is veelal gebaseerd op het ontsluiten van aanwezige kennis en ter faciliterering van de ontwikkeling van nieuwe kennis. Het.
Infografiek: vergelijken van (S)CRM apps Lien Vandervelde – 3EPM2.
Mind De waarneming bestaat uit parallelle reeksen indrukken. Deze indrukken zijn eigenschapwaarden die uitgezet kunnen worden in meerdere dimensies. Een.
Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van SPSS Guido Valkeneers.
Op de koffie bij de kabouters
Jan Talmon Medische Informatica Universiteit Maastricht
Eric Sieverts Sector Innovatie & Ontwikkeling Universiteitsbibliotheek Utrecht Instituut voor Media- & Informatie Management Hogeschool van Amsterdam Moderne.
Jong geleerd, fout gedaan?
Gegevensverwerving en verwerking
Neurale Netwerken Kunstmatige Intelligentie Rijksuniversiteit Groningen Mei 2005.
Neurale Netwerken Kunstmatige Intelligentie Rijksuniversiteit Groningen April 2005.
Neurale Netwerken Kunstmatige Intelligentie Rijksuniversiteit Groningen April 2005.
Overzicht samenvatting en discussie hc1 t/m hc4 samenvatting en discussie hc1 t/m hc4 inleiding tot de rest van het vak inleiding tot de rest van het vak.
Geest, brein en cognitie Filosofie van de geest en Grondslagen van de cognitiewetenschap Fred Keijzer.
De neurale basis van structuur in taal Gideon Borensztajn
1 Beslissingsondersteuning Marakas H12 t/m H16 Robert de Hoog 8 november 2000.
T U Delft Parallel and Distributed Systems group PGS Fundamentele Informatica in345 Deel 2 College 5 Cees Witteveen.
Eenvoudige data-analyse: beschrijvende statistische
Inleiding Kennistechnologie §Hoofdstuk 7: Kennisrepresentaties 1: Eigenschappen en representatievormen §Hoofdstuk 8: Kennisrepresentaties 2: Eenvoud en.
Inleiding Kennistechnologie §Hoofdstuk 1: Introductie §Hoofdstuk 2: Kennissystemen in context §Hoofdstuk 3: Kennisacquisitie.
Location Based Services GIA – Najaar 2004 Martijn Baede.
Motion planning with complete knowledge using a colored SOM Jules Vleugels, Joost N. Kok, & Mark Overmars Presentatie: Richard Jacobs.
Spatial subgroup mining
Methodologie & Statistiek I Verband tussen twee variabelen 3.1.
30 juni Deze morgen Vorige bijeenkomst: –een concepthierarchie van kernbegrippen in Logic & Language vakgebied (o.b.v. glossary) Vandaag: –Jon:
Vak voor Vak een Learning Analytics dashboard. het Learning Analytics dashboard  Visueel  High-Level  Dynamisch  Data-driven: gebaseerd op (historische)
T TNO Bouw Hans Schevers, Promovendus Productmodellen in de bouw.
Een Theoretische en Empirische Analyse van Benaderingen in Symbolische Probleem Oplosmethoden.
The Commons Game. Prinses op de ERT Bespreek de volgende punten in 4-tallen: 1. Het spel Was het gedrag van de spelers succesvol? Is er een winnende.
T U Delft Parallel and Distributed Systems group PGS Fundamentele Informatica in345 Deel 2 College 2 Cees Witteveen.
Psychologische Test.
Hoofdstuk X Het correlatievraagstuk & SPSS toepassing
AI Kaleidoscoop Werkcollege 1: AI Overzicht Radu Serban
Neurale Netwerken Genetische Algorithmen
Automatische multiclass en multilabel tekstclassificatie bij veel klassen Presentatie onderzoek in kader van afstudeerproject van Maarten Luykx.
AI111  Algemeen  Voorbeeld  Concept Learning (Version Space)  Bias Leeswijzer: Hoofdstuk AI Kaleidoscoop College 11: Machinaal.
1 e-Books & i-Papers Rik Min researcher Centre for Telematics and Information Technology (CTIT) & Faculty of Educational Science and Technology (EDTE)
Onze school, Albeda colege Schiedam Nieuwland.
Welkom Informatie, Multimedia & Management mens, organisaties en informatietechnologie.
Polymorphisme en Interfaces: inleiding
MBR AtT1 College 7 : covering theorie (Deel 2) model MAB-diagnose: College 6: Covering theorie College 7: Algoritme voor covering theorie werkelijk.
Docentinstructie: Het is aan te bevelen de eerste dia’s klassikaal te tonen en met uitleg te bespreken. Als na zes dia’s een korte demo van Celsius/Fahrenheit.
Search engines welk instrument voor welke taak eric sieverts Universiteitsbibliotheek Utrecht Instituut voor Media en Informatiemanagement / HvA Eric Sieverts.
Tentamen Data Mining Voorbereiding. Tentamen  4 januari 2016  14:00 – 17:00  zaal
Op naar een STER bestuur… Avond 1: De meerwaarde van een Bestuur. Avond 2: Hoe organiseren we een Scouting Vereniging. Avond 3: Vinden, Binden, Boeien.
Hoe positioneer ik mijn uitgeverij 10 do’s en dont’s Windkracht62 1 WINDKRACHT (0) Ian Muller.
Data Mining without Discrimination Valorisatiepanel 4 december – Faculty Club – Universiteit Leiden.
Informatica Welkom! 25 February, Les C-5. informatica Extra stof Data mining 2 Les C-5.
Wat voor soort docent ben je aan het worden?
Big Data woensdag 15 februari 2017.
Musical Style Analysis using Statistical Pattern Recognition
Het virtuele punt Stel je voor, je bent een hele grote kaart;
Eenvoudige data-analyse: beschrijvende statistische
Kennismakingsspellen
Tot de enterprisekennismanagementsoftware behoort ook de verkoop van contentmanagement- en portallicenties. Deze verkopen zijn jaarlijks met 35 procent.
Voeg hier een foto van het product in
Eigenschappen in verband met evenwijdigheid en loodrechte stand van rechten in het vlak © André Snijers.
Voorspelling van criminele carrières door 2-dimensionale extrapolatie
Artificiele Intelligentie (versie 03/11/05)
Transcript van de presentatie:

Schatgraven in Gegevensbergen Data Mining: Schatgraven in Gegevensbergen Peter van der Putten ALP Group, LIACS & KiQ Ltd 6 April 2004 Company Profile ·         An independent British technology vendor with an international focus (active in the UK, Europe, US and Asia) ·         Founded in 1990 by retail banking people (senior management at TSB and Cap Gemini Ernst & Young) ·         An innovator in addressing fundamental market nods in CRM ·         A strongly business-oriented approach to active decision management   Purpose of briefing We believe that our vision on Active Decision Management will be the next big thing after analytical CRM, and we would like to inform Gartner about it. The company recently secured venture capital investment which is being used to: ·         complete the current product development plan; ·         accelerate marketing and general brand awareness; ·         provide a platform from which to undertake future development; ·         and to establish and support alliances with distribution partners (systems integrators, consultancies, and product vendors). We feel the Gartner Analysts can help us achieve these goals, and provide useful feedback for future developments. Proposed Briefing Agenda ·         Introductions ·         Presentation of KiQ’s architecture for intelligent and consistent mutlti-channel customer interaction;Fly-by-Wire ·         Strategic (future) alliances ·         Discussion

Agenda (ovb) College: 1400 -1500 Pauze: 1500 -1515 Practicum: 1515 -1615 Bespreken: 1615 -1645

Bronnen van (kunstmatige) intelligentie Redeneren versus leren Leren uit data: Klantgegevens Beurskoersen Pianomuziek Foto’s van verdachten Websites op het internet Robotwaarnemingen Etc.

Data Mining & Knowledge Discovery in Databases Werkdefinitie Het ontdekken van interessante, nuttige en verborgen kennis in grote hoeveelheden data met intelligente patroonherkenningstechnieken Data mining is een interdisciplinair vakgebied: Kunstmatige intelligentie, machine learning, information retrieval, statistiek, statistische patroonherkenning, econometrie, cognitieve psychologie, neuroscience, etc.

Voorbeelden van data mining taken Zoeken Matching: het zoeken naar best matchende objecten / patronen Voorspellen classificatie: het toekennen van een bekende klasse aan een object (‘nominale/categoriale voorspelling’) predictie/regressie: het voorspellen van een numerieke kenmerk voor een object (‘numerieke voorspelling’) Beschrijven clusteren: het vinden van groepen van objecten (groepen/klassen van te voren niet bekend) rule discovery: het afleiden van interessante regels en verbanden (‘associatieregels’)

Zoeken in de patroonruimte Zoeken naar best matchende patronen / objecten Elk object is een punt in de ‘patroonruimte’. Dimensies zijn de eigenschappen van het object, bvb leeftijd en inkomen voor een klantendatabase, of aantal keren ‘Matej’ en ‘Kezman’ op een webpagina. Patroonruimtes zijn vaak hoogdimensionaal (10 tot duizenden dimensies) bvb. inkomen bvb. leeftijd

Voorbeelden van voorspelalgoritmen Beslisbomen (decision trees) Nabuuralgoritmen (nearest neighbor) Neurale netwerken Good old statistics Genetische algoritmen / evolutionairy computing Artificial Immune Systems …..

Voorbeeld voorspel algoritme 1: Decision Trees (Beslisbomen) Vraag-antwoord spel

Decision trees in de patroonruimte Doel classifier is onderscheid te maken tussen klasse ‘cirkel’ en klasse ‘vierkant’ op basis van leeftijd en inkomen. Decision tree heeft lijnstukken loodrecht op assen beschikbaar Elk lijnstuk stelt een beslissing voor (splitsing in de boom) bvb. inkomen bvb. leeftijd

Decision trees in de patroonruimte Lijnstukken loodrecht op assen beschikbaar Elk lijnstuk stelt een beslissing voor (splitsing in de boom) bvb. inkomen bvb. leeftijd

Voorbeeld voorspel algoritme 2: Nearest Neighbour Data zelf is het voorspellingsmodel, dus geen abstracte representatie zoals een boom oid Voor een gegeven object x zoek die n objecten waarvan de klasse bekend is en die het meest lijken op x Voorspel voor object x de klasse die het meest voorkomt bij de best lijkende objecten

Nearest Neighbor in de patroonruimte Voorspellen = nieuw geval Elk willekeurig complex scheidingsvlak mogelijk Voorwaarde: er moet wel genoeg data aanwezig zijn bvb. inkomen bvb. leeftijd

Nearest Neighbor in de patroonruimte Voorspellen Elk willekeurig complex scheidingsvlak mogelijk Voorwaarde: er moet wel genoeg data aanwezig zijn bvb. inkomen bvb. leeftijd

Voorspel algoritme 3: Neurale Netwerken Geinspireerd door werking neuronen in hersenen (McCullough & Pitts 1943 (!)) Invoer (bvb klantkenmerken) wordt gecodeerd op invoerlaag, activatie stroomt door netwerk over verbindingen en leidt tot uitvoer op output laag (bvb interesse in product) Netwerk leert verbanden (gewicht verbindingen) aan de hand van voorbeelden en leerregel

Neurale Netwerken Voorbeeld simpel netwerk (2 lagen) Interesse in product = leeftijd * gewichtleeftijd + inkomen * gewichtinkomen leeftijd inkomen gewichtleeftijd gewichtinkomen interesse in product

Neurale netwerken in de patroonruimte Voorspellen Simpel netwerk: slechts een lijn beschikbaar Meerlaags netwerk: Elk willekeurig scheidingsvlak mogelijk bvb. inkomen bvb. leeftijd

Beslisboom demo in WEKA, Een open source mining tool

Beschrijvende data mining: Clusteren Het vinden van groepen van objecten Binnen een groep (cluster, segment) lijken objecten op elkaar, groepen onderling zijn juist verschillend Toepassingen bvb: Welke verschillende soorten wodkadrinkers bestaan er? Voor een gegeven ziekte, zijn er verschillende groepen patienten te onderscheiden die elk een verschillende behandeling nodig hebben? Etc.

Clusteren in de patroonruimte Clusteren is het vinden van groepen in de patroon ruimte In 2 of 3 dimensionale patroonruimtes zou je de data set kunnen visualiseren en het herkennen van clusters aan een gebruiker kunnen overlaten bvb. inkomen bvb. leeftijd

Clusteren in de patroonruimte Clusteren is het vinden van groepen in de patroon ruimte In 2 of 3 dimensionale patroonruimtes zou je de data set kunnen visualiseren en het herkennen van clusters aan een gebruiker kunnen overlaten Met meer dimensies kan dat niet bvb. inkomen bvb. leeftijd

Beschrijvende data mining: associatie regels Ontdekken van regelmatigheden Vorm: als A en B dan C Voorbeeld: als aardappelen en boerenkool dan worst Belangrijke maten Support regel: hoe vaak komen aardappelen en boerenkool (A,B) voor (hoeveelheid ‘bewijs’) Confidence regel: hoe vaak komt worst dan voor / support (geldt A,B  C altijd?)

Associatie regel demo in WEKA,

Wat is behandeld? Leren versus redeneren Definitie data mining Overzicht data mining taken Voorbeeldalgoritmen voor voorspelling Voorbeeldalgoritme associatieregels Demo’s in WEKA En nu: pauze en practicum (305)