Download de presentatie
De presentatie wordt gedownload. Even geduld aub
GepubliceerdJoke Brabander Laatst gewijzigd meer dan 5 jaar geleden
1
Big data-advies WRR Bart van der Sloot
2
Overzicht (1) Adviesaanvraag (2) Overzicht van output
(3) Definitie en afbakening (4) Praktijk en gebruik (5) Sociale, ethische en juridische vragen (6) Aanbevelingen
3
(1) Adviesaanvraag Ziet op Big Data, privacy en veiligheid
Vier vragen: (1) Moet er een sterker onderscheid worden gemaakt tussen toegang tot en gebruik van gegevens? Gegevensbescherming ziet vooral op toegang, terwijl dit bij Big Data lastig kan zijn Denk daarbij ook aan transnationale gegevensstromen Moet niet liever gebruik worden gereguleerd? Hoe kunnen doelbinding en dataminimalisatie worden behouden?
4
(1) Adviesaanvraag (2) Hoe moet worden aangekeken tegen profiling, datamining en Big Data door de overheid? Denk daarbij aan het gebruik van patronen en profielen > gebruik van open source software Hoe kunnen deze processen transparant worden gemaakt? Hoe effectief zijn dergelijke processen?
5
(1) Adviesaanvraag (3) Hoe moet worden aangekeken tegen quantum computing? Hoe staat het met deze ontwikkeling Is encryptie nog mogelijk in de toekomst? Is een adequaat gegevensbeschermingsniveau nog mogelijk in de toekomst?
6
(1) Adviesaanvraag (4) Hoe kunnen de rechten van individuen worden gewaarborgd? Kwaliteit van informatie Informed consent Effectieve controle Verantwoordelijkheidsverdeling
7
(2) Overzicht van output
(1) Rapport (2) Boek (3) Internetpublicaties
8
(2) Overzicht van output
(1) Rapport/Advies (1) Inleiding: Big Data in een vrije samenleving (2) De ontwikkeling van Big Data (3) Big Data in het veiligheidsdomein (4) Belofte, voorwaarden en risico’s van het gebruik van Big Data in het veiligheidsdomein (5) Big Data en de bestaande juridische kaders (6) Conclusie: Een kader voor Big Data in het veiligheidsdomein
9
(2) Overzicht van output
(2) Boek (1) Introduction Part I – Technological perspectives on Big Data (2) Sand Klous: Sustainable havesting of the Big Data potential (3) Seda Gürses & Bart Preneel: Cryptology and Privacy in the context of Big Data
10
(2) Overzicht van output
Part II – Empirical perspectives on Big Data (4) Gemma Galdon Clavell: Policing, Big Data and the commodification of security (5) Rosamunde van Brakel: The ambiguous power of Big Data Part III – Juridical perspectives on Big Data (6) Paul de Hert and Hans Lammerant: Predictive profiling and its legal limits: effectiveness gone forever?
11
(2) Overzicht van output
Part IV – Regulatory perspectives on Big Data (7) Bart van der Sloot: The individual in the Big Data era: Moving towards an agent-based privacy paradigm (8) Colin Bennett and Robin Bayley: Privacy Protection in the Era of Big Data: Regulatory Challenges and Social Assessments Part V – International perspectives on Big Data (9) Joris van Hoboken: From Collection to Use in Privacy Regulation? A forward Looking Comparison of European and U.S. Frameworks for Personal Data Processing (10) Alexander Rossnagel & Phillip Richter: Big Data and Informational Self-Determination: Regulative Approaches in Germany using the example of police and intelligence agencies
12
(2) Overzicht van output
(3) Internetpublicaties Sascha van Schendel: Analyse van het gebruik van Big Data door de MIVD en AIVD 2015 Rosamunde van Brakel: Case Study gebruik Big Data door de politie in Nederland Peter Olsthorn: Big Data bij de belastingdienst Leo Ottes: Big Data in de zorg Bart van der Sloot & Sascha van Schendel: International and comparative legal study on Big Data
13
(3) Definitie en afbakening
Wat is Big Data? Bekendste defintie is de drie V’s: Volume, het gebruik van grote hoeveelheden data. Variety, het gebruik van verschillende databronnen die in verschillende structuren of zelfs ongestructureerd (zoals beeld en geluid of grote tekstbestanden) zijn opgeslagen. Velocity, de snelheid, er worden continu in real-time gegevensstromen geanalyseerd. Door een aantal auteurs zijn er nog V’s aan toegevoegd zoals Value (Dijcks, 2012; Dumbill, 2013), Variability (Hopkins & Evelson, 2011; Tech America Foundation, 2012), Veracity (IBM, 2015) en Virtual (Zikopoulos et al 11; Akerkar et al 2015).
14
(3) Definitie en afbakening
De Artikel 29 Werkgroep (Werkgroep 29) heeft een beschrijving gegeven in een rapport uit ‘Big Data is a term which refers to the enormous increase in access to and automated use of information. It refers to the gigantic amounts of digital data controlled by companies, authorities and other large organizations which are subjected to extensive analysis based on the use of algorithms. Big Data may be used to identify general trends and correlations, but it can also be used such that it affects individuals directly.’ De European Data Protection Supervisor (EDPS) stelt op zijn website: ‘Big data means large amounts of different types of data produced at high speed from multiple sources, whose handling and analysis require new and more powerful processors and algorithms. Not all of these data are personal, but many players in the digital economy increasingly rely on the large scale collection of and trade in personal information. As well as benefits, these growing markets pose specific risks to individual's rights to privacy and to data protection.’
15
(3) Definitie en afbakening
De Estse DPA beschrijft Big Data als ‘collected and processed open datasets, which are defined by quantity, plurality of data formats and data origination and processing speed.’ De Luxemburgse DPA geeft de volgende definitie: ‘Big Data stems from the collection of large structured or unstructured datasets, the possible merger of such datasets as well as the analysis of these data through computer algorithms. It usually refers to datasets which cannot be stored, managed and analysed with average technical means due to their size. Personal data can also be a part of Big Data but Big Data usually extends beyond that, containing aggregated and anonymous data.’ Het CBP uit Nederland stelt: ‘Big Data is all about collecting as much information as possible ; storing it in ever larger databases ; combining data that is collected for different purposes ; and applying algorithms to find correlations and unexpected new information.’ De DPA uit Slovenië: ‘Big Data is a broad term for processing of large amounts of different types of data, including personal data, acquired from multiple sources in various formats. Big Data revolves around predictive analytics – acquiring new knowledge from large data sets which requires new and more powerful processing applications.’ De DPA uit het Verenigd Koninkrijk bouwt voor op de 3 vs en stelt dat daarnaast essentieel is: ‘ repurposing data; using algorithms to find correlations in datasets rather than constructing traditional queries; and bringing together data from a variety of sources, including structured and unstructured data.’ Tot slot stelt de DPA van Sweden over Big Data dat ‘the concept is used for situations where large amounts of data are gathered in order to be made available for different purposes, not always precisely determined in advance.’
16
(3) Definitie en afbakening
Het gaat bij Big Data dus om het om het verzamelen, het analyseren en het gebruik van data. Bij het verzamelen gaat het om grote hoeveelheden data (volume), uit gevarieerde (variaty) en vaak ongestructureerde databronnen. Bij het analyseren van de verzamelde data gaat het om de snelheid (velocity) van de analyses, die gebruik maken van algortimes, machine learning en statische correlaties. De uitkomsten zijn vaak voorspellend van aard (predictive analytics) en worden op algemeen of groepsniveau geformuleerd. Het gebruik van de uitkomsten geschiedt meestal door profiling.
17
(3) Definitie en afbakening
Een overkoepelend begrip Open Data: Veel Big Data initiatieven zijn gekoppeld aan Open Data. Open Data is het idee, zoals de naam reeds doet vermoeden, dat (overheids)data openbaar moeten zijn. Traditioneel is dit gekoppeld aan het idee van transparantie in de overheidssector en het faciliteren van de controle op de macht. Met name de Estse DPA is zeer expliciet over de relatie tussen Open Data en Big Data. Big Data wordt gedefinieerd als ‘collected and processed open datasets, which are defined by quantity, plurality of data formats and data origination and processing speed’. Ook uit het deskresearch blijk dat in een aantal landen een duidelijk koppeling wordt gemaakt tussen de twee begrippen, zoals in Australië, Frankrijk, Japan en het Verenigd Koninkrijk.
18
(3) Definitie en afbakening
Internet of things: De term the Internet of things refereert aan het idee dat steeds meer dingen verbonden zijn aan het internet. Dit kunnen auto’s zijn, lantaarnpalen, koelkasten, broeken, of welk object dan ook. Hierdoor kunnen smart-devices ontstaan – bijvoorbeeld een koelkast die registreert dat de melk op is en automatisch nieuwe bestelt. Door alle objecten van een sensor te voorzien kunnen grote hoeveelheden data worden verzameld. Daarom worden Big Data en the Intenet of Things dan ook vaak in één adem genoemd. Als voorbeeld kan dienen de DPA van het Verenigd Konkrijk: ‘we note that big data may involve not only data that has been consciously provided by data subjects, but also personal data that has been observed (eg from Internet of Things devices), derived from other data or inferred through analytics and profiling.’
19
(3) Definitie en afbakening
Smart: Door de toepassingen van the internet of things en het constant in verbinding staan van apparaten en computers is er steeds meer sprake van ontwikkeling van smart producten en diensten. Daarbij kan gedacht worden aan smart cities, smart devices en smart robots. Uit het deskresearch blijkt dat in een aantal landen de link tussen smart systemen en Big Data wordt gemaakt, zoals de Verenigde Staten en het Verenigd Koninkrijk. Ook de Luxemburgse DPA benadrukt ook de relatie tot smart-systems, zoals smart metering. ‘At a national level, a system of smart metering for electricity and gas has been launched. The project is however still in a testing phase. - The CNPD has not issued any decisions, reports or opinions that are directly dealing with Big Data. The Commission has however issued an opinion in a related matter, namely with regard to the problematic raised by smart metering. In 2013, the CNPD issued an opinion on smart metering. The main argument of the opinion highlights the necessity to clearly define the purposes of the data processing as well as the retention periods of the data related to smart metering.’
20
(3) Definitie en afbakening
Profiling: Een term die vaak in verband met Big Data wordt gebracht en soms zelfs als onderdeel van de definitie van Big Data wordt gezien is profiling. Doordat er met steeds grotere datasets wordt gewerkt zijn de conclusies en lessen die kunnen worden getrokken uit de grote datasets voornamelijk op algemeen of groepsniveau geformuleerd. Daarbij gaat het voornamelijk om statistische correlaties, waaraan een voorspellende waarde wordt toegedicht. In Duitsland komt er dan ook nieuwe regelgeving over profiling en ook een aantal DPA’s benadrukt de relatie van Big Dat met profiling, zoals die van Nederland, Slovenië, het Verenigd Koninkrijk en België. Die laatste stelt: ‘The general data protection law applies, and we expect that de new data protection regulation will be able to provide a partial answer (profiling) to big data issues (legal interpretation of the EU legal framework).’
21
(3) Definitie en afbakening
Algoritmes: Een term die in zeer veel definities van Big Data terugkomt is algoritme. Dit geldt zowel voor de definitie van de Werkgroep 29, de EDPS, als die van een aantal DPAs zoals Luxemburg, Nederland en het VK. Een aantal landen heeft dan ook speciale aandacht voor algoritmes. Zo kent de Australische context voor enkele gevallen een ‘Program Protocol’ en kan er een rapport worden uitgebracht waarin de volgende elementen beschreven staan: een omschrijving van de data, een specificatie van ieder matchings algortime, de verwachte risico’s en hoe deze aangepakt zullen worden, de middelen ter controle van de integriteit en de te gebruiken beveiligingsmaatregelen.
22
(3) Definitie en afbakening
Cloud Computing: Cloud computing wordt ook vaak gelieerd aan Big Data processen. Met name in China en Israël blijken de twee termen vaak aan elkaar te worden verbonden. Zo benadrukte de Chinese vicepremier dat de regering beter gebruik wil maken van technologieën als big data en cloud computing, ter ondersteuning van innovatie; volgens de premier worden mobiel internet, cloud computing, big data en het Internet der Dingen geïntegreerd met productieprocessen, en zullen daarmee een belangrijke motor vormenen voor economische groei. In Israel is het de bedoeling dat het leger in 2015 een cloud heeft waar alle data is opgeslagen - er wordt zelfs gesproken over een “combat computing cloud”, een data centrum dat verschillende tools beschikbaar zal maken voor strijdkrachten in het veld. Ook sommige DPA’s leggen het verband tussen cloud computing en Big Data; de Sloveeense DPA stelt bijvoorbeeld dat ‘new concepts and paradigms, such as cloud computing or big data should not lower or undermine the current levels of data protection as a fundamental human right.’
23
(3) Definitie en afbakening
De WRR kiest voor een driedeling: (1) Verzamelen: omvang van de data, structuur van de data en variëteit aan data (2) Verwerken: data driven, nowcasting, forecasting/predicitve analyses (3) Gebruik: ontschotting van domeinen en actionable knowledge
24
(4) Praktijk en gebruik In de Verenigde Staten werd meer dan $200 miljoen voor een onderzoeks- en ontwikkelingsinitiatief voor big data uitgetrokken, te spenderen door 6 federale overheidsafdelingen, defensie investeert daar het meest in Big Data, jaarlijks zou dit $250 miljoen zijn, en $160 miljoen aan investeringen worden gedaan binnen een initiatief voor smart cities, te investeren in 25 samenwerkingen gericht op data. In het Verenigd Koninkrijk gaat £159 miljoen naar hoogwaardige computer- en netwerkinfrastructuur, worden er £189 miljoen aan investeringen gedaan om Big Data te ondersteunen en de data infrastructuur van het Verenigd Koninkrijk verder te ontwikkelen, £10.7 miljoen wordt besteed aan een centrum voor Big Data en ruimte technologieën. Daarnaast is £42 miljoen uitgetrokken voor een Alan Turing Institute, voor analyse en toepassing van big data, £50 miljoen voor ‘The Digital Catapult’, waar onderzoekers en het bedrijfsleven worden samenbracht om met innovatieve producten te komen en tot slot kondigde de Minister van Universiteiten en Wetenschap in februari 2014 een nieuwe investering van £73 miljoen in big data aan. Deze wordt ingezet voor bio informatica, open data projecten, onderzoekscentra en het gebruik van milieu data. In Zuid-Afrika investeerde de overheid 2 biljoen Zuid-Afrikaanse Rand, ongeveer €126,8 miljoen, in het Square Kilometre Array (SKA) project. In Frankrijk, krijgen zeven onderzoeksprojecten met betrekking tot Big Data gezamenlijk €11,5 miljoen. In Duitsland investeert het Ministerie van Onderwijs en Onderzoek €10 miljoen in Big Data onderzoekscentra en €20 miljoen in Big Data onderzoeksprojecten en het Ministerie van Onderwijs en Onderzoek investeert ongeveer €6,4 miljoen in het ABIDA project, een vier jaar durend interdisciplinair onderzoek naar sociale en economische gevolgen van grote datasets.
25
(4) Praktijk en gebruik Wat zijn gebieden waar Big Data (waarschijnlijk) worden gebruikt? Internetbedrijven: advertentiemarkt Gezondheidszorg: total genome analysis Belastingdienst: risicoanalyses Politie: predictive policing Inlichtingendiensten: terreurpreventie
26
(5) Sociale, ethische en juridische vragen
Discriminatie Chilling effect Filter Bubble Mattheus Effect Transparantieparadox
27
(5) Sociale, ethische en juridische vragen
Dataminimalisatie Doel en doelbinding Technische en organisatorische beveiliging Data kwaliteit Transparantie Individuele rechten Nadruk op juridische regulering
28
(5) Sociale, ethische en juridische vragen
Personal data > data? Verschil tussen verschillende type data Verschil tussen verschillende type actoren/doeleinden Verschil tussen verschillende jurisdicties
29
(6) Aanbevelingen Verzamelen van gegevens: komt onder druk te staan, maar voorlopig zo laten > politie en inlichtingendiensten moeten wel een extra zorgplicht in acht nemen Analyse van gegevens: plicht om gegevens te toetsen op kwaliteit, te zorgen dat datasets niet gebiased zijn, dat onderzoeksmethodes deugdelijk zijn, dat algoritmes deugdelijk zijn, dat categorisering helder en transparant is, etc. Externe review + horizonbepaling van 3 tot 5 jaar voor grote overheidsprojecten Gebruik van gegevens: Nadere regels ten aanzien van profiling en geautomatiseerde besluitvorming + verantwoordelijkheid ligt bij
Verwante presentaties
© 2024 SlidePlayer.nl Inc.
All rights reserved.