Blogs Annette Ficker Tim Oosterwijk Opdrachtgever: Matthieu Jonckheere Begeleider: Maria Vlasiou Presentatie Modelleren B – Blogs Annette Ficker en Tim Oosterwijk
Opbouw presentatie Probleemstelling Elementen Opbouw model Situaties Toetsen Regressie Conclusie Presentatie Modelleren B – Blogs Annette Ficker en Tim Oosterwijk Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie
Blogs Onze definitie van een blog Doet er stiekem niet toe Plaats op het internet Omgekeerd chronologische volgorde Subjectieve (vaak persoonlijke) inhoud Communicatie vanuit twee kanten Doet er stiekem niet toe Presentatie Modelleren B – Blogs Annette Ficker en Tim Oosterwijk Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie
Probleemstelling Ontwikkel een model dat de populariteit van een gegeven blog kan beschrijven en voorspellen Presentatie Modelleren B – Blogs Annette Ficker en Tim Oosterwijk Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie
Elementen Het aantal bezoekers Het aantal unieke bezoekers Het aantal links naar het blog Het aantal links vanuit het blog De gemiddelde lengte van de shortest path Het aantal bookmarks Het aantal trackbacks Het aantal verschillende landen waar de bezoekers vandaan komen Presentatie Modelleren B – Blogs Annette Ficker en Tim Oosterwijk Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie
Waarom Deze elementen zijn volgens literatuuronderzoek gerelateerd aan populariteit Aantal andere ook, maar om uiteenlopende redenen niet gebruikt in model Presentatie Modelleren B – Blogs Annette Ficker en Tim Oosterwijk Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie
Opbouw model Werk per aspect Splits meetdata chronologisch in tweeën Gebruik een voor die data geschikte statistische toets om significante wijziging te detecteren Indien aanwezig: lineaire regressie Puntentotaal berekenen Presentatie Modelleren B – Blogs Annette Ficker en Tim Oosterwijk Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie
Meetdata Chronologische volgorde Gelijkmatige verdeling Presentatie Modelleren B – Blogs Annette Ficker en Tim Oosterwijk Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie
Wat gaan we doen? Opsplitsen in twee delen Statistische toets: verandering gemiddelde? Regressie Presentatie Modelleren B – Blogs Annette Ficker en Tim Oosterwijk Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie
Welke statistische toets? Aanname: onafhankelijkheid meetdata Intuïtie: Afhankelijkheid Maar: grote wereld met “Small World Property” Plausibele aanname Presentatie Modelleren B – Blogs Annette Ficker en Tim Oosterwijk Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie
Welke statistische toets? Nagaan: beide steekproefmonsters normaal verdeeld? Aan de hand van CLS (>60) Anders: Shapiro-Wilks toets Presentatie Modelleren B – Blogs Annette Ficker en Tim Oosterwijk Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie
Welke statistische toets? Indien niet beide normaal verdeeld: Uitschieters verwijderen m.b.v. vuistregel Wilcoxon Rank-Sum toets Presentatie Modelleren B – Blogs Annette Ficker en Tim Oosterwijk Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie
Welke statistische toets? Indien beide normaal verdeeld: Uitschieters eruit halen m.b.v. algoritme Opnieuw normale verdeling toetsen! Nagaan: variantie beide steekproefmonsters gelijk? Aan de hand van F-toets Presentatie Modelleren B – Blogs Annette Ficker en Tim Oosterwijk Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie
Welke statistische toets? Indien gelijke variantie: Two sample t-test with equal variance Indien ongelijke variantie: Two sample t-test with unequal variance Presentatie Modelleren B – Blogs Annette Ficker en Tim Oosterwijk Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie
FlowChart Presentatie Modelleren B – Blogs Annette Ficker en Tim Oosterwijk Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie
Tussensamenvatting Acht elementen: per element bekijken Meetdata chronologisch in tweeën Statistische toets vergelijkt gemiddelden Hebben nu bepaald welke statistische toets wanneer gebruikt dient te worden Presentatie Modelleren B – Blogs Annette Ficker en Tim Oosterwijk Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie
Werking statistische toetsen Uit te leggen: Centrale Limiet Stelling Shapiro-Wilks toets F-toets t-toets met gelijke variantie t-toets met ongelijke variantie Wilcoxon Rank-Sum toets … saai! Verslag en literatuur! Presentatie Modelleren B – Blogs Annette Ficker en Tim Oosterwijk Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie
Wat nu? Significant verschil gemiddelden gedetecteerd Lineaire regressie toepassen! Richtingscoëfficiënt grove indicator verandering Presentatie Modelleren B – Blogs Annette Ficker en Tim Oosterwijk Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie
Lineaire regressie Gegeven verzameling meetpunten Vind kromme die er zo goed mogelijk bij past Minimaliseren kwadratische verschillen Lineaire regressie: y=ax+b Presentatie Modelleren B – Blogs Annette Ficker en Tim Oosterwijk Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie
Lineaire regressie Richtingscoëfficiënt positief: stijging! Richtingscoëfficiënt negatief: daling… Indien niet door statistische toets heen gekomen: richtingscoëfficiënt 0 Presentatie Modelleren B – Blogs Annette Ficker en Tim Oosterwijk Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie
Puntensysteem Het aantal unieke bezoekers 5 Het aantal links naar het blog 5 De gemiddelde lengte van de shortest path 3 Het aantal bezoekers 2 Het aantal bookmarks 2 Het aantal links vanuit het blog 1 Het aantal trackbacks 1 Het aantal verschillende landen waar de bezoekers vandaan komen 1 Presentatie Modelleren B – Blogs Annette Ficker en Tim Oosterwijk Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie
Werking Indien statistische toets verschil en positieve richtingscoëfficiënt: optellen Indien statistische toets verschil en negatieve richtingscoëfficiënt: aftrekken Indien statistische toets geen verschil: niks Presentatie Modelleren B – Blogs Annette Ficker en Tim Oosterwijk Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie
Criterium Indien puntentotaal > 10: stijging populariteit Indien puntentotaal < -10: daling populariteit Anders: geen significante wijziging Presentatie Modelleren B – Blogs Annette Ficker en Tim Oosterwijk Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie
Klaar! Acht aspecten: per aspect bekijken Chronologisch meetdata in tweeën Statistische toets daarvoor geschikt checkt significante wijziging gemiddelden Indien ja: lineaire regressie indicator Punten toekennen / aftrekken Criterium: 10 punten Presentatie Modelleren B – Blogs Annette Ficker en Tim Oosterwijk Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie
Einde presentatie Vragen? Annette Ficker Tim Oosterwijk Presentatie Modelleren B – Blogs Annette Ficker en Tim Oosterwijk