De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

Ontwikkeling van aanbevelingsalgoritmen voor online social games Jan Heuninck.

Verwante presentaties


Presentatie over: "Ontwikkeling van aanbevelingsalgoritmen voor online social games Jan Heuninck."— Transcript van de presentatie:

1 Ontwikkeling van aanbevelingsalgoritmen voor online social games Jan Heuninck

2 Overzicht Massive Media Masterproef –Onderzoek –Implementatie Conclusie 2

3 Massive Media Online mediagroep –Netlog Sociale netwerksite 76 miljoen leden (juni 2011) –Gatcha! Online gameplatform Netlog & Facebook 3

4 Masterproef Doel –Onderzoek en implementatie van aanbevelingsalgoritmen –Games aanbevelen aan de gebruiker –Snelheid en performantie! 4

5 Masterproef Twee luiken –Onderzoek Gatcha!-data Collaborative filtering Evaluatie –Implementatie 5

6 Gatcha!-data 6Masterproef > Onderzoek

7 Gatcha!-data 7Masterproef > Onderzoek Game-afhankelijk

8 Gatcha!-data 8Masterproef > Onderzoek

9 Collaborative filtering Algemeen –Aanbevelingen genereren a.d.h.v. data van alle gebruikers –Toch gepersonaliseerd –Score voorspellen en ranglijst opstellen –Gebruikt bij o.a. Amazon en Netflix 9Masterproef > Onderzoek

10 Collaborative filtering Implementatie –Geheugengebaseerd Aanbevelingen rechtstreeks genereren Geen trainingsfase Slecht schaalbaar –Modelgebaseerd Eerst model opbouwen Rekenintensief, maar periodiek On the fly 10Masterproef > Onderzoek

11 Collaborative filtering Gelijkaardigheidsmetrieken (1) –Euclidische afstand Meetkunde Afstand in tweedimensionaal vlak –Pearson correlatiecoëfficiënt Lineaire onafhankelijkheid tussen 2 vectoren Brengt ratinggedrag van de gebruiker in rekening 11Masterproef > Onderzoek

12 Collaborative filtering Gelijkaardigheidsmetrieken (2) –Cosinusgelijkaardigheid Hoek tussen 2 vectoren –Jaccard-coëfficiënt Doorsnede / unie van 2 sets 12Masterproef > Onderzoek

13 Collaborative filtering 13Masterproef > Onderzoek

14 Collaborative filtering 14Masterproef > Onderzoek

15 Onderzoek Evaluatie –Algemeen –Evaluatiemetrieken –Parameters –Resultaten 15Masterproef

16 Evaluatie Algemeen –In samenwerking met IBCN –Training- en testset –Scores voorspellen en vergelijken met werkelijke waarde –Rekencluster Universiteit Gent 16Masterproef > Onderzoek

17 Evaluatie Evaluatiemetrieken –ROC-curve Kwaliteit beoordelen –Mean absolute error (MAE) Afwijking voorspelling t.o.v. werkelijke waarde 17Masterproef > Onderzoek

18 18Masterproef > Onderzoek Evaluatie

19 Parameters –User-based / Item-based –Gelijkaardigheidsmetriek –Expliciete en/of impliciete ratings –Cut-off waarde 19Masterproef > Onderzoek

20 Evaluatie Resultaten –User-based collaborative filtering Extreem lange uitvoeringstijd Slechte resultaten 20Masterproef > Onderzoek

21 Evaluatie Resultaten –Item-based collaborative filtering Gecombineerde ratings (50-50) Pearson correlatiecoëfficiënt Goede resultaten (AUC en MAE) 21Masterproef > Onderzoek

22 Masterproef Onderzoek Implementatie –Werkwijze –Optimalisatie –Uitvoeringssnelheid 22

23 Werkwijze 1.Python code → PHP code 2.Code integreren in Gatcha! 3.Optimalisatie –Gearman –Memcached –Database 23Masterproef > Implementatie

24 Optimalisatie Gearman –Open source –Jobs distribueren over meerdere processen –Voordelen Snellere uitvoering van taken Parallelle uitvoering Grote schaalbaarheid 24Masterproef > Implementatie

25 Optimalisatie Gearman –Gebruik Ophalen/converteren data Gelijkaardigheden berekenen 25Masterproef > Implementatie

26 Optimalisatie Memcached –Open source –Caching –Gebruikt door Netlog, Facebook en Twitter –Query’s, objecten en HTML cachen –Database ontlasten 26Masterproef > Implementatie

27 Optimalisatie Database –Intensief gebruik maken van MySQL –Geheugengebruik minimaliseren –Opslag Geconverteerde ratings Item-gelijkaardigheidsmodel 27Masterproef > Implementatie

28 Uitvoeringssnelheid Voorbeeld –berekenen van de impliciete ratings Masterproef > Implementatie28 4u50:070u09:52 30 x sneller!

29 Conclusie Item-based collaborative filtering Pearson correlatiecoëfficiënt Belang van impliciete ratings Performance boost door databank en optimalisatietechnieken 29

30 Vragen? 30


Download ppt "Ontwikkeling van aanbevelingsalgoritmen voor online social games Jan Heuninck."

Verwante presentaties


Ads door Google