Kennismiddag Open Data 7 november 2016, Den Haag

Slides:



Advertisements
Verwante presentaties
Ontwikkeling van het Netwerk Naamkunde
Advertisements

Vertaling van Miriam Zweverink Project No Presentatie 2009 Tool 4 en 5 Vaardigheden Check (Aannemer) (Machinist)
Digitale Studiemaatjes
Netwerken. Wat is een netwerk? Je spreekt van een netwerk van zodra twee of meer computers met elkaar verbonden zijn. Je kan thuis een klein netwerkje.
Volkstelling 1971: Privacy problemen en Remote Execution Luuk Schreven (NIWI/CBS)
Introductie Doel Programma Microdatagebruik van/bij CBS – historie – heden – bestanden – toekomst.
MicroDataServices CBS
Op 23 september 2011 nam de Vlaamse Regering akte van de conceptnota “open data”. De conceptnota schetst de beleidscontext en het regelgevend kader voor.
De Virtuele Volkstelling 2001 in historisch perspectief
CBS Microdatamiddag 8 november 2007 Voorburg 1 Martin Luppes Speerpuntprogramma Internationale Economische Relaties (SIER) Integratie van microdata uit.
Primaire OnderzoeksData In Utrecht Makkelijk toegankelijk een podium voor uw waardevolle onderzoeksdata.
Sneeuwschuivers en leren sneeuwschuiven myResearch Portal en het belang van workflow data analyse Richard L. Zijdeman DAI: info:eu-repo/dai/nl/
Dataverzamelingsmethoden
Hoofdstuk 11 Kwantitatieve gegevens analyseren Methoden en technieken van onderzoek, 5e editie, Mark Saunders, Philip Lewis, Adrian Thornhill, Marije.
Microdatagebruikersmiddag
Ruimtelijke statistieken Cijfers zonder grenzen Maarten Alders 26 mei 2011.
Microdatamiddag 8 november 2007 microdata. 2 Tweede bijeenkomst evaluatie 1e bijeenkomst wens tot vervolg plenair én parallel sociale data én economische.
Nabijheidsstatistiek
D igitale S tad E indhoven DSE. DSE D oelstellingen (Tot nu tot) Burgers en non profit instellingen uit Zuidoost Brabant de gelegenheid geven webpagina's.
Social Medicine CQ-index: betrouwbaarheid en validiteit voor allochtone bevolkingsgroepen Karien Stronks afd. Sociale Geneeskunde AMC/UvA Onderzoekersforum.
Roadmap Toekomstbeeld 2016 Informatievoorziening Zorg en Ondersteuning
Het KB e-Depot Waarom, wat en voor wie
0 1 Eliminatie…. en wat dan? Ton Rotteveel Plantenziektenkundige Dienst.
Martine de Mooij en Remco Kaashoek
Bronnenonderzoek PWS-seminar V5 13 juli 2014
PADS4 maakt het eenvoudig om informatie te verspreiden naar een specifiek publiek op de juiste plaats en het juiste moment PADS4 is een professionele oplossing.
SCIENTIFIC INSTITUTE OF PUBLIC HEALTH CLINICAL BIOLOGY DEPARTMENTDr. ANNE VAN NEROM Rol van de Bevoegde Overheid bij incidenten.
Govroam Presentatie tijdens DSA-bijeenkomst over Public WiFi 3 juni 2014, door Paul Francissen.
6 stappen in Risico management
28 mei Symposium Statistical Auditing Slide 1 Steekproefmethoden bij EU audits Paul van Batenburg.
Wat kun je doen met de digitale Volkstellingen? Luuk Schreven (NIWI-KNAW)
Bibliotheekintroductie UA-bibliotheek Campus Drie Eiken Oktober 2007 Marjan Andries- Barbara Lejeune.
CBS als kennispartner Digitale dagen Welkom bij de laatste digitale dag 2.
CBS en regionaal maatwerk
SOCIAL WORK (DT) naam: Martine Bink med: med.hro.nl/binmd kamer: L
Hogeschool Rotterdam, Opleiding Vastgoed & Makelaardij drs. ing. M.M.A. Scheepers Collegejaar college.
Leeswijzer bij de bijlagen   In deze bijlagen bij het NVZ-strategiedocument Zorg voor 2020 zijn de belangrijkste grafieken en brondocumenten voor u geselecteerd.
In het hoger onderwijs Identity Management. partner in IGI Group Peter Jurg.
Decentralisaties en gegevensverwerking. Even voorstellen Henk Wolsink Teamleider Algemeen Juridische Zaken gemeente Hengelo Adhoc werkgroep privacy provinciebreed.
FOKKE en SUKKE helpen bij het veldwerk. Gebruik van een statistisch pakket SPSS Opslaan en bewerken data –selecteren –wegen –hercoderen –Ontwerpen van.
GELEKT, WAT NU? HET MELDINGSPROCES. WORKSHOP - PROGRAMMA TE BEANTWOORDEN VRAGEN DEZE MIDDAG WAT IS EEN DATALEK? ERVARINGEN? CASE: GELEKT, WAT NU? HET.
Gids door Doccle Doccle. De Cloud 2 1.Wat is de Cloud? 2.Voordelen van de Cloud 3.Nadelen van de Cloud 4.Doccle is geen cloudapplicatie.
Gij zult openbaren: privacy en de open overheid
Datacenter versus Cloud
Regionale statistieken Caroline van Houwelingen Taakgroep Analyse Ruimte & Vastgoed Centraal Bureau voor de Statistiek.
Open Data PMA 3 december 2015 Om het onderwerp open data wat levendiger te maken willen we een korte presentatie geven, met daarin: een concreet voorbeeld.
Titelindeling Subtitel.
Dataverzamelingsmethoden
Secundaire data en online databases
Agenda AVG, wat is er aan de hand? Oefening: register van verwerkingen
In 7 stappen uw organisatie klaar voor AVG
Titelindeling Subtitel.
Mr. I.W. van Osch 360|Advocaten
Privacy en Leerplicht/RMC
Titel Ondertitel.
Titelindeling subtitel.
Titelindeling Subtitel.
Indeling titel met afbeeldingen
Welkom bij de nieuwe versie van PowerPoint
Titelindeling Subtitel.
Indeling titel met afbeeldingen
Gemeente Katwijk. Annerine Blufpand Periklesinstituut
KBO en omgaan met privacy
Taak 6 Hoofdstuk 13 Inleiding in de gezondheidszorg
Titelindeling Subtitel.
Taak 6 Hoofdstuk 13 Inleiding in de gezondheidszorg
StatLine Database van het Centraal Bureau voor de Statistiek
Titelindeling Subtitel.
Taak 6 Hoofdstuk 13 Inleiding in de gezondheidszorg
Transcript van de presentatie:

Kennismiddag Open Data 7 november 2016, Den Haag Privacy bescherming Eric Schulte Nordholt Kennismiddag Open Data 7 november 2016, Den Haag

Inhoud Inleiding Noodzaak van statistische beveiliging Tabellen (Inleiding tabellen, Frequentietabellen, Kwantitatieve tabellen, Beveiligingsmethoden, Software, Conclusies tabellen) Microdata (Soorten microdata, Organisatie toegang tot microdata, Conclusies microdata) Afsluiting

Inleiding (1) Traditionele output van een statistisch bureau: Tabellen Grafieken Echter: Groeiende behoefte aan informatie Groeiende behoefte aan microdata IT-mogelijkheden Mogelijkheden voor analyse Steeds meer samenwerkingsverbanden

Inleiding (2) Eerste stap: Grotere tabellen Beveiligingsrisico’s voor kwantitatieve tabellen (t-ARGUS) Online publicatie van tabellen / geaggregeerde data Eerst beveiligen, dan publiceren (voorbeelden: StatLine, Census hub) Eerst tabellen aanvragen, dan beveiligen (voorbeelden: Factfinder van het U.S. Census Bureau, TableBuilder van het ABS)

Inleiding (3) Tweede stap: PUF (Public Use Files) MUC (Microdata files Under Contract) Derde stap: On-site Remote access Het CBS moet de privacy van individuele bedrijven en personen beschermen (AP)

Noodzaak van statistische beveiliging (1) Wetten Internationaal (EU) Nationaal (in Nederland) Respecteren respondent Huidige respons Toekomstige respons Respecteren eigenaren van registraties

Noodzaak van statistische beveiliging (2) Nederlandse wetten: Wet op de economische statistieken 1936 (→ CBS-wet) Wet Bescherming Persoonsgegevens (WBP) 2001 CBS-wet 2004 Autonome overheidsorganisatie Vrije toegang tot andere overheidsdata Statistische beveiliging is een wettelijke plicht Toegang verlenen tot microdata voor wetenschappelijk onderzoek Wet Openbaarheid van Bestuur (WOB)

Noodzaak van statistische beveiliging (3) Linken Registraties Surveys Datamining technieken Gemakkelijker zoeken (https://www.cbs.nl/opendata)

Noodzaak van statistische beveiliging (4) Pas beveiligingstechnieken zodanig toe dat De resulterende data veilig zijn Het informatieverlies minimaal is Problemen Definitie veilige data Definitie informatieverlies Disclosure risk Maximum tolerable risk No data Released data Original data Data utility

Tabeldata = geaggregeerde data Inleiding tabellen (1) Tabeldata = geaggregeerde data Typen tabellen: Frequentietabellen Kwantitatieve tabellen Losse tabellen Gekoppelde tabellen Hiërarchische tabellen …

Inleiding tabellen (2) Voorbeeld van differencing (niet-hiërarchische indelingen: zorgkantoorregio versus provincie) Eemnes

Inleiding tabellen (3) Het beveiligingsprobleem bij publiceren van zowel vierkanten als bestaande regionale indelingen heeft Europese aandacht LAU 2 Grid squares Unit(s) at risk

Frequentietabellen (1) Celwaarde = aantal Opspanvariabelen identificerend en gevoelig Celwaarde zelf is niet gevoelig, gevoeligheid zit in verdeling over opspanvariabelen

Frequentietabellen (2) Beoordeling naar leeftijd Lage celwaarde hoeft geen probleem te zijn Slechte spreiding over gevoelige categorieën wel A B C D E < 45 1 2 3 45+ 5

Kwantitatieve tabellen (1) Celwaarde = som van doelvariabele over alle bijdragers Opspanvariabelen identificerend (en soms gevoelig) Celwaarde zelf is gevoelige informatie over bijdragers

Kwantitatieve tabellen (2) Minimaal aantal bijdragers per cel Een bijdrager mag niet domineren Dominantieregel of wel (n, k)-regel: Grootste n bijdragers niet meer dan k% van celtotaal Betere regel is de p%-regel: Geen enkele bijdrage mag nauwkeuriger dan met een relatieve fout van p% teruggerekend kunnen worden

Beveiligingsmethoden Redesign van tabel Hergroeperen Hercoderen Afronden Simpel Gecontroleerd Onderdrukken

Software Gebruik t-ARGUS voor: Bepalen primair onveilige cellen (gevoeligheidsmaten) Effect van redesign Bepalen secundaire onderdrukkingen Tot 4-dimensionale tabellen Gekoppelde tabellen Andere technieken (afronden, CTA)

Conclusies tabellen Conclusies: Tabellen vormen een groot deel van onze output Risico’s op onthulling beperken Frequentietabellen versus kwantitatieve tabellen Beveiligingsmethoden Vele methoden in t-ARGUS beschikbaar

Soorten microdata Vier voorbeelden van microdata: Public use microdata files (PUFs ‘voor iedereen’) Microdata under contract (MUCs ‘voor onderzoekers’) Microdata voor on-site (‘onderzoekers werken in CBS-gebouwen’) Microdata voor remote access (‘onderzoekers werken op eigen instituut’)

Organisatie toegang tot microdata (1) PUFs (1994-) Strenge beveiliging, kan met m-ARGUS Niet geschikt voor onderzoekers, wel voor educatieve doeleinden Voorbeeld 1: Volkstellingsbestanden 1960, 1971, 2001 en 2011 (http://www.dans.knaw.nl/nl en https://international.ipums.org/international/) Voorbeeld 2: CBS in de klas (http://www.cbs.nl/nl-NL/menu/informatie/onderwijs/home/default.htm)

Organisatie toegang tot microdata (2) MUCs (1994-) Beperkte beveiliging, kan ook met m-ARGUS Alleen voor onderzoekers werkzaam bij instellingen genoemd in de wet (b.v. universiteiten, planbureaus) of op de CCS-lijst (niet voor administratief gebruik, onderzoeksdoel, resultaten worden openbaar) Via WSA / DANS Op cd-roms, één versie per jaar, geen onderhandelingen Voornamelijk persoons- en huishoudensenquêtes Nu nog als overblijfsel in contracten (‘DANS-bestand’)

Organisatie toegang tot microdata (3) On-site (1998-) On-site betekent: een beveiligde omgeving (safe setting) Contract met onderzoeker en universiteit of onderzoeksinstelling Naast de standaard statistische software pakketten kan speciale (b.v. eigen) software worden geïnstalleerd Check op ‘wat naar buiten gaat’ Sinds 2005 bij het Centrum voor Beleidsstatistiek Ook voor bedrijfsgegevens (vroeger: CEREM) Nuttig voor incidenteel onderzoek en als ‘overloopfaciliteit’ Verschuiving naar remote access

Organisatie toegang tot microdata (4) Remote access (2006-) Remote access is als on-site, maar loopt via een citrixverbinding (naast username en paswoord ook biometrische identificatie) Pilot met de Universiteit van Tilburg in 2005 Groot succes (‘performance als op eigen desktop PC’) Alle(en) data nodig voor betreffende onderzoek (doelbinding) Groeiende hoeveelheid outputchecks op mogelijkheid onthulling Nu algemeen beschikbaar voor universiteiten en onderzoeksinstellingen (ook in het buitenland)

Organisatie toegang tot microdata (5) Samenwerkingscontracten Voor geselecteerde partners komen microdata buiten het CBS beschikbaar Er moet daadwerkelijk sprake zijn van samenwerking (‘wat heeft het CBS er aan’) Vaak bij gezamenlijk onderzoek / publicatie Alle(en) data nodig voor betreffende onderzoek worden beschikbaar gesteld (doelbinding) Risico op precedentwerking beperken via het contract

Conclusies microdata Conclusies: Microdata voorzien in een grote behoefte Risico’s op onthulling beperken Verschillende gebruikers → verschillende microdata Regels voor verschillende soorten microdata Vele methoden in m-ARGUS beschikbaar

Afsluiting Meer informatie is te vinden op: http://neon.vb.cbs.nl/casc/index.htm Zijn er vragen of opmerkingen? Is verdere communicatie gewenst (b.v. lezingen op locatie)? Is er behoefte aan opleidingen?