Download de presentatie
De presentatie wordt gedownload. Even geduld aub
GepubliceerdSaskia Pieters Laatst gewijzigd meer dan 9 jaar geleden
1
Vakgroep Informatietechnologie – IBCN Gepersonaliseerde en contextafhankelijke profielen op Android mobiele toestellen Pieter Van Lysebetten, Sam Govaert Promotor: prof. dr. ir. Filip De Turck Begeleiders: Philip Leroux, Klaas Roobroeck
2
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 2 Overzicht Situering Probleemstelling Doelstelling Methodologie Raamwerk Evaluatie Demo Conclusie
3
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 3 Overzicht Situering Probleemstelling Doelstelling Methodologie Raamwerk Evaluatie Demo Conclusie
4
Probleemstelling Groot aantal applicaties Breed gamma aan applicaties op Android OS Gebruikers kunnen zelf applicaties downloaden Web 2.0 zelf apps ontwikkelen en verdelen duizenden apps beschikbaar op het net Thesisbespreking – Sam Govaert, Pieter Van Lysebetten Vakgroep Informatietechnologie – Onderzoeksgroep (naam) p. 4
5
Probleemstelling Vaak contextafhankelijk Plaatsafhankelijk AlarmClock slaapkamer Mappy auto, trein Tijdsafhankelijk QuickOffice tijdens werkuren Youtube avond, weekend Persoonsafhankelijk Mail, QuickOffice zakenman Facebook, Youtube student Thesisbespreking – Sam Govaert, Pieter Van Lysebetten Vakgroep Informatietechnologie – Onderzoeksgroep (naam) p. 5
6
Probleemstelling Thesisbespreking – Sam Govaert, Pieter Van Lysebetten Vakgroep Informatietechnologie – Onderzoeksgroep (naam) p. 6 Contacten ook contextafhankelijk Plaatsafhankelijk Collega’s en klanten op het werk Familie en vrienden thuis, op cafe Tijdsafhankelijk Collega’s en klanten tijdens de werkuren Familie en vrienden avond, weekend “Profiel”-afhankelijk Collega’s en klanten werk Familie en vrienden thuis, op kot
7
Probleemstelling Data bevat meer semantiek dan we denken Verschillende relaties tussen attributen (applicatie, plaats, tijd, snelheid, enz.) Doelstelling Voorstellen van een raamwerk voor gepersonaliseerde en contextafhankelijke profielen 1. Ontdekken van profielen 2. Ontdekken van structuren, patronen en verbanden in het gebruik van applicaties en contacten Thesisbespreking – Sam Govaert, Pieter Van Lysebetten Vakgroep Informatietechnologie – Onderzoeksgroep (naam) p. 7
8
Doelstelling (1) Ontdekken van profielen Gepersonaliseerd en automatisch herkend Bvb voor een kotstudent: thuis, kot, school, trein Op basis van contextuele parameters Thuis: vaste locatie, lage verplaatsingssnelheid,... Trein: eerder een bewegingsfunctie, hoge snelheid,... Herkennen van profieleigenschappen Bvb typische locatie, gemiddelde snelheid,... Instellen van profielopties Bvb geluidsmodus (normaal, stil, enkel trillen,...) p. 8
9
Doelstelling (2) Ontdekken van patronen en verbanden Applicaties die vaak samen gebruikt worden Bvb Twitter en Facebook, GPS en Weer Patronen in het applicatiegebruik: Tijdspatronen, plaatspatronen, snelheidspatronen,... –Vb tijdspatroon: vaak rond 20u op Facebook Patronen afhankelijk van meerdere parameters –Bvb: zetten van de alarmklok voor slapengaan »Tijdsafhankelijk? Plaatsafhankelijk?... Combinatie van tijd, plaats, snelheid,... Verbanden: na applicatie X vaak applicatie Y p. 9
10
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 10 Overzicht Situering Probleemstelling Doelstelling Methodologie Raamwerk Evaluatie Demo Conclusie
11
Methodologie Onderzoeksdomeinen Data Mining Clustering / Custer Analysis Neurale Netwerken Support Vector Machines Association Rules Decision Trees Adaptive Resonance Theory (ART) Feature Discovery (Competitive Learning) Artificial Intelligence (AI) Rule based systems Thesisbespreking – Sam Govaert, Pieter Van Lysebetten Vakgroep Informatietechnologie – Onderzoeksgroep (naam) p. 11
12
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 12 Methodologie: technieken Evaluatie van Clustering-algoritmes Zoeken van locatieclusters, snelheidsclusters, … 2 overwegingen 1. Dient te werken voor verschillende topologieën 2. Aantal clusters vooraf niet bekend (gepersonaliseerd) –K-Means Clustering vereist aantal (=K)
13
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 13 Methodologie: technieken Evaluatie van Clustering-algoritmes Competitive Networks Niet in staat aantal clusters zelf te bepalen ART Networks Wel in staat aantal clusters zelf te bepalen ART1 vrij primitief en niet geschikt voor ons doel Weinig info over andere ART-modellen Expectation-Maxization Algoritme Meer geschikt voor onze doelstelling 1. Aantal profielen vooraf niet bekend (gepersonaliseerd) –K-Means Clustering vereist aantal (=K)
14
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 14 Methodologie: technieken Expectation-Maximization Algoritme Gaussiaanse distributie (normaalverdeling) In kansrekening vaak gebruikt als eerste benadering Parameters van normaalverdeling worden geschat –op basis van maximum likelihood Clusters van zeer uiteenlopende vormen ontdekken Aantal clusters wordt automatisch gezocht Dient niet vooraf opgegeven te worden Verschillende Java frameworks te vinden Weka, OpenRDS, Shoal Gekozen voor Weka (meest gebruikt)
15
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 15 Methodologie: technieken Expectation-Maximization Algoritme Voorbeeld
16
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 16 Methodologie: technieken Expectation-Maximization Algoritme Voorbeeld
17
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 17 Methodologie: technieken Verwantschapsanalyse (associatieregels) Zoeken van allerlei correlaties tussen variabelen Vb supermarkt: {boter, brood} melk Zoeken van zoveel mogelijk verbanden in data {Werk, Maandag, 15u} QuickOffice Probleem: werkt met discrete waarden Tijd: 13u55 ≈ 14u00 ≈ 14u05... Lengtegraad, breedtegraad en snelheid ook continu Oplossing: clustering als voorbewerking
18
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 18 Methodologie: aanpak A. Ontdekken van clusters en profielen Eerste voorbewerking op data Enige structuur vinden in ongestructureerde data Doel 1. Voorbewerking voor het zoeken van patronen in het gebruik van applicaties en contacten 2. Levert de persoonlijke profielen op B. Ontdekken van patronen en verbanden Op basis van de gevonden clusters en profielen Dmv 3 classificatie-algoritmes
19
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 19 A. Clustering en profielgeneratie Eerste-niveau clustering: attributen
20
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 20 A. Clustering en profielgeneratie Eerste-niveau clustering: attributen
21
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 21 A. Clustering en profielgeneratie Eerste-niveau clustering: attributen
22
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 22 A. Clustering en profielgeneratie Eerste-niveau clustering: attributen
23
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 23 A. Clustering en profielgeneratie Eerste-niveau clustering: attribuut locatie
24
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 24 A. Clustering en profielgeneratie Eerste-niveau clustering: attribuut locatie
25
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 25 A. Clustering en profielgeneratie Eerste-niveau clustering: attribuut locatie
26
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 26 A. Clustering en profielgeneratie Eerste-niveau clustering: attribuut locatie
27
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 27 A. Clustering en profielgeneratie Eerste-niveau clustering: attribuut locatie
28
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 28 A. Clustering en profielgeneratie Eerste-niveau clustering: weekdag, snelheid
29
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 29 A. Clustering en profielgeneratie Eerste-niveau clustering: tijd
30
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 30 A. Clustering en profielgeneratie Eerste-niveau clustering: attributen combineren
31
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 31 A. Clustering en profielgeneratie Eerste-niveau clustering: attributen combineren
32
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 32 A. Clustering en profielgeneratie Eerste-niveau clustering: profielen
33
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 33 A. Clustering en profielgeneratie Eerste-niveau clustering: attributen Tweede-niveau clustering: applicaties We beschouwen applicaties tussen twee standby-operaties als een cluster
34
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 34 B. Ontdekken van patronen Classificatie “Training” op basis van ‘getransformeerde’ data 1. Clusters –Attribuutclusters en applicatieclusters 2. Profielen –Clusters over alle attributen samen 3. Recent geopende applicaties “Testing” ahv 3 classificatie-algoritmes Elk algoritme levert een rangorde van applicaties op basis van huidige gegevens op Android-toestel –Tijdstip, weekdag, plaats, actieve applicaties,...
35
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 35 B. Ontdekken van patronen ASSOCIATIE- REGELS INTRACLUSTER- CORRELATIE GRAFEN- ALGORITME PROFIELAFHANKELIJKE PATRONEN + profieleigenschappen (gemiddelde snelheid,...) STATISTISCH ALGORITME KORTETERMIJN- GEHEUGEN
36
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 36 B. Ontdekken van patronen ASSOCIATIE- REGELS GRAFEN- ALGORITME STATISTISCH ALGORITME
37
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 37 B. Ontdekken van patronen ASSOCIATIE- REGELS GRAFEN- ALGORITME STATISTISCH ALGORITME applicatiekansen
38
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 38 B. Ontdekken van patronen ASSOCIATIE- REGELS Classificatie- functie f() GRAFEN- ALGORITME STATISTISCH ALGORITME applicatiekansen
39
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 39 B. Ontdekken van patronen ASSOCIATIE- REGELS Classificatie- functie f() GRAFEN- ALGORITME STATISTISCH ALGORITME applicatiekansen bvb: max of gewogen som
40
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 40 B. Ontdekken van patronen ASSOCIATIE- REGELS Classificatie- functie f() GRAFEN- ALGORITME STATISTISCH ALGORITME applicatiekansen totale applicatiekansen bvb: max of gewogen som
41
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 41 Overzicht Situering Probleemstelling Doelstelling Methodologie Raamwerk Evaluatie Demo Conclusie
42
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 42 Raamwerk Evaluatie performantie van de technieken Clustering (Expectation-Maximization via Weka) Zeer veel data te analyseren –Eerst een tweetal weken trainingsdata verzamelen Meerdere attributen (tijd, plaats,...) Meerdimensionale attributen –Locatie is tweedimensionaal –Profiel is vijfdimensionaal! Sommige attributen bevatten weinig structuur –Bvb tijdstip Vertraging van het clusteralgoritme Algoritmes veel te zwaar voor het mobiel toestel Client-Server Architectuur
43
Raamwerk Onderzoek op Android Weka-library initieel geporteerd voor Android Problemen met externe libraries op Android –Android heeft eigen virtuele machine (Dalvik) –Vooral problemen met GUI-elementen Weka-library geporteerd Web services Vergelijking tussen REST en SOAP –REST flexibeler en performanter –Google heeft gebruik van SOAP stopgezet Gekozen voor REST Thesisbespreking – Sam Govaert, Pieter Van Lysebetten Vakgroep Informatietechnologie – Onderzoeksgroep (naam) p. 43
44
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 44 Raamwerk Client-Server Architectuur Android Client Service –Monitoren van gegevens op toestel –(Intern) opslaan van de getrackte gegevens –Communicatie met de server –Events (bvb aanbevelingen) naar widget sturen Widget –Visualiseren van informatie »Applicaties, contacten, profieleigenschappen –Profieleigenschappen opgeslagen op SD-kaart
45
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 45 Raamwerk Client-Server Architectuur Server Clustering Classificatie –Associatieregels –Profielvenster (grafenalgoritme) –Kortetermijngeheugen Communicatie tussen client en server REST web services –Spring Android REST Template
46
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 46 Overzicht Situering Probleemstelling Doelstelling Methodologie Raamwerk Evaluatie Demo Conclusie
47
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 47 Evaluatie Testopstelling Modelling Tool Modelleren van het applicatiegebruik van een persoon –Bouwblokken met verschillende eigenschappen »Coördinaten »Applicatieprobabiliteiten »Patronen in het applicatiegebruik »Realistische afwijkingen (random-factor) Model wordt dan vertaald naar ARFF-dataformaat Eigen metriek (NIP) Ahv true positives en false negatives Geoptimaliseerd zodat een random recommender altijd een metriek van 0% oplevert
48
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 48 Evaluatie Resultaten Vergelijking tussen recommenders RecommenderNIP Random Recommender0 % Simple Recommender10.57 % Associatieregels84.41 % Gewogen Classificatie83.49 % Max Classificatie84.66 %
49
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 49 Evaluatie Resultaten Vergelijking tussen recommenders Associatieregels op zich reeds goede resultaten –Meeste patronen uit Profielvenster zullen hier ook gevonden worden –Profielvenster wel zeer bruikbaar voor de profielen RecommenderNIP Random Recommender0 % Simple Recommender10.57 % Associatieregels84.41 % Gewogen Classificatie83.49 % Max Classificatie84.66 %
50
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 50 Evaluatie Overige uitgevoerde testen Korte evaluatie van de profielherkenning Enkele eenvoudige case studies Performantie van de serverdiensten Performantie van de Android client Vertragingen op GUI-niveau Batterijverbruik Netwerkbelasting tussen client en server Associatieregels op zich reeds goede resultaten –Meeste patronen uit Profielvenster zullen hier ook gevonden worden –Profielvenster wel zeer bruikbaar voor de profielen
51
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 51 Overzicht Situering Probleemstelling Doelstelling Methodologie Raamwerk Evaluatie Demo Conclusie
52
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 52 Demo Databestand Persoon met 9-to-5-job Thuis Trein naar werk Werk Trein naar huis Thuis Patronen Bij slapengaan –Alarmklok zetten Bij opstaan –Alarmklok wijzigen –Agenda nakijken Applicaties vaak tesamen –Email en Facebook ...
53
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 53 Demo Databestand Persoon met 9-to-5-job Thuis Trein naar werk Werk Trein naar huis Thuis Patronen Bij slapengaan –Alarmklok zetten Bij opstaan –Alarmklok wijzigen –Agenda nakijken Applicaties vaak tesamen –Email en Facebook ...
54
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 54 Demo Databestand Persoon met 9-to-5-job Thuis Trein naar werk Werk Trein naar huis Thuis Patronen Bij slapengaan –Alarmklok zetten Bij opstaan –Alarmklok wijzigen –Agenda nakijken Applicaties vaak tesamen –Email en Facebook ... id en gegevens over profiel
55
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 55 Demo Databestand Persoon met 9-to-5-job Thuis Trein naar werk Werk Trein naar huis Thuis Patronen Bij slapengaan –Alarmklok zetten Bij opstaan –Alarmklok wijzigen –Agenda nakijken Applicaties vaak tesamen –Email en Facebook ... id en gegevens over profiel laatst gebeld in profiel
56
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 56 Demo Databestand Persoon met 9-to-5-job Thuis Trein naar werk Werk Trein naar huis Thuis Patronen Bij slapengaan –Alarmklok zetten Bij opstaan –Alarmklok wijzigen –Agenda nakijken Applicaties vaak tesamen –Email en Facebook ... id en gegevens over profiel laatst gebeld in profiel
57
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 57 Demo Databestand Persoon met 9-to-5-job Thuis Trein naar werk Werk Trein naar huis Thuis Patronen Bij slapengaan –Alarmklok zetten Bij opstaan –Alarmklok wijzigen –Agenda nakijken Applicaties vaak tesamen –Email en Facebook ... id en gegevens over profiel laatst gebeld in profiel
58
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 58 Demo Databestand Persoon met 9-to-5-job Thuis Trein naar werk Werk Trein naar huis Thuis Patronen Bij slapengaan –Alarmklok zetten Bij opstaan –Alarmklok wijzigen –Agenda nakijken Applicaties vaak tesamen –Email en Facebook ... id en gegevens over profiel laatst gebeld in profiel applicaties
59
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 59 Overzicht Situering Probleemstelling Doelstelling Methodologie Raamwerk Evaluatie Demo Conclusie
60
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 60 Conclusie Raamwerk voorgesteld Gepersonaliseerde en contextafhankelijke profielen Aanbevelingen van applicaties en contacten Technieken Clustering: Expectation-Maximization-algoritme Patroonherkenning: associatieregels leveren beste resultaten Performantie en architectuur Technieken te zwaar voor Android client POC via Client-Server architectuur
61
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 61 Conclusie Onderwerpen voor verder onderzoek Dynamisch evalueren van profielen Eventueel door verschillende schalen te gebruiken Hier kan ART wel geschikt zijn Optimalisatie van de recommendatie Complexere classificatiefuncties
62
Thesisverdediging– Pieter Van Lysebetten, Sam Govaert Vakgroep Informatietechnologie – IBCN p. 62 Vragen
Verwante presentaties
© 2024 SlidePlayer.nl Inc.
All rights reserved.