Welkom
Wat gaan we doen? • Data leren gebruiken als startpunt van verhalen • Naar de IATI set kijken van buitenlandse zaken
In de IATI set • Zitten ‘alle’ ontwikkelingshulp uitgaves sinds 2005 • Per land • Per sector • Per organisatie • Per dag • Per transactie • enz
Veel hulpmiddelen maar nog geen verhalen
We zoomen in op de belangrijkste thema’s
En laten jullie op zoek gaan naar interessante vragen en verhalen
Maar in de eerste weken leren we daarnaast Excel gevolgd door een toets (die ook meetelt voor het cijfer)
Wat is data?
[[[[[[[[[]]]]]]
Dit lijken 4 makkelijke stappen • Maar hou er rekening mee dat onze data niet mals is
[[[[[[[[[]]]]]]
Beginnen vanuit de data of de vraag?
[[[[[[[[[]]]]]]
Data verkrijgen API: application programming interface Scrapen: Het extraheren van gegevens in een document of website OCR-software: Het gebruiken van software om afbeeldingen die tekst bevatten om te zetten in computer tekst WOB: Wet openbaarheid van bestuur Bestanden: Gewoon een bestandje waar het allemaal in staat
[[[[[[[[[]]]]]][[[[[[
Scrapen Programma’s vertellen waar je naar op zoek bent. Levert bijna nooit perfecte resultaten Google docs functie importHTML kan gebruikt worden om in simpele vorm te scrapen
Opschonen • Data is vaak ingevuld door mensen • Mensen maken – typfouten – dubbele spaties – onregelmatig afkorting gebruik • Daarnaast is vaak niet alles relevant
Leer de data begrijpen – Wat betekenen deze cijfers? – Hoe zijn ze verkregen? – Kan ik deze bron vertrouwen? – Wat is het jargon dat gebruikt wordt?
Onze vraag? Bij welke opleiding kunnen mannelijke studenten het beste kijken als ze op zoek zijn naar een vrouwelijke student, liefst ook nog een die later veel gaat verdienen (en voor de dames doen we hetzelfde natuurlijk)
eslacht
Samenvattend • Data! • Data, informatie, kennis, wijsheid • The inverted piramid of datajournalism – Compile – Clean – Context – Combine – Communicate
En nu jullie • Maar eerst 20 minuten roken/koffie drinken!
Excel • Excel is niet sexy • Maar toch kun je hier 90% van je werk hierin doen. • Voor sommige zal dit makkelijk zijn, anderen wat minder. Probeer elkaar te helpen.
Excel! • Vandaag kijken we naar: – Formules – Filteren – Sorteren – Als we tijd hebben ook naar • Draaitabellen • Combineren
Basis • =A1+A2 • Autosom • Functies
Tijd voor wat data! • data-beschikbaar.html data-beschikbaar.html • We gaan voor de bovenste set! (Academy awards)
Filteren/Sorteren • Filteren (data weglaten die niet boeit) • Sorteren (op volgorde zetten) • Handig functie is subtotal •=SUBTOTAL(101,H2:H504)
Opdrachten • Oscar set: – Wat is de film met de laagste IMDB score die erin staat – Wat is de langste film die wel genomineerd is, maar niet gewonnen
Maar wat als? • Ik wil weten hoeveel Actie films er in staan? • Wat de gemiddelde lengte is per genre? • Of winaars een hogere imdb score hebben dan genomieerden?
Draaitabel! • Ideaal voor het snel samenvatten van data
Vlookup (combineren) •
Samenvattend • Excel is niet sexy, maar wel handig – Formules – Functies – Filteren – Sorteren – Draaitabel – Combineren
Volgende week • Komt (waarschijnlijk) Ellen van One World langs • Gaan we groepen maken • Verdelen we de thema’s in de data set • Gaan we verder met Excel
Nog vragen? • Naast: – Komt deze presentatie online te staan? (JA)