Anonimisering van testgegevens Privacy Paleis 28 januari 2015 ITCG Friesestraatweg 215 9743 AD Groningen I T C G Hilbrand Kikkers Anonimisering van testgegevens Privacy Paleis 28 januari 2015
Even voorstellen…
VEEL ORGANISATIES GEBRUIKEN KOPIEËN VAN PRODUCTIE DATABASES
ORGANISATIES PRODUCTIE DATABASES TESTEN ONTWIKKELING OUTSOURCING DOELEINDEN: TESTEN ONTWIKKELING OUTSOURCING MARKETING OPLEIDING VEEL ORGANISATIES GEBRUIKEN KOPIEËN VAN PRODUCTIE DATABASES
Hoe beheer je al deze omgevingen? Subsetten Hoe ga je om met persoonsgegevens? Anonimiseren
Productie Test/Ontwikkel Source Database Target Database
Subsetten Anonimiseren Minimaliseer datagebruik Voordelen van het subsetten van data Voordelen van het anonimiseren en maskeren Minimaliseer datagebruik Bespaar op hardware Verkort doorlooptijden Efficiënter data beheer Beschermen van relaties Voldoen aan wetgeving Voorkom imagoschade Behoud concurrentie positie
Anonimiseren van gevoelige gegevens
Persoonsgegevens Identificerende Kenmerkende “Elk gegeven over een geïdentificeerde of identificeerbare natuurlijke persoon” Bron: Wet Bescherming Persoonsgegevens Naam Geboortedatum Email Bankrekening nummer BSN nummer Adres Polisnummer Telefoonnummer Etc… Banksaldo Schulden Medicijn gebruik Ziekte Geloofsovertuiging Politieke voorkeur Salaris Telefoonhistorie Etc… Identificerende Kenmerkende
Risico Imagoschade Identiteitsdiefstal Chantage Creditcard fraude Spam Welke risico’s lopen betrokkenen Identiteitsdiefstal Chantage Creditcard fraude Spam Imagoschade
Technieken
Shuffle Conditioneel + Voornaam Naam Soort Frans Jansen Klant Jan Verwissel waarden binnen een kolom Conditioneel + Maskeer gespecificeerde delen van tabellen Voornaam Naam Soort Frans Jansen Klant Jan de Boer Klant Dirk Huisman Klant DATPROF Leverancier
Scramble Blank Voornaam Naam Soort Opmerking E-Mail 321 Frans de Boer Verwijder waarden uit kolom Scramble Vervang bestaande karakters Voornaam Naam Soort Opmerking E-Mail 321 Frans de Boer Klant “Zwager van D.Jansen” xxxxxxx@xxxx.xx fjansen@live.nl Jan Huisman Klant Xxxxxxx@xxxx.xx jdeboer@live.nl Dirk Jansen Klant “Heeft schulden” ikben@dirkhuisman.nl xxxxx@xxxxxxxxxx.xx DATPROF Leverancier
Key-Shuffle Nr. Voornaam Naam Soort Opmerking E-mail 321 789 123 Frans Verwissel primary keys en foreign keys consistent. “Uniek klantnummer dat op pasjes en polissen wordt gedrukt” Nr. Voornaam Naam Soort Opmerking E-mail 321 789 123 Frans de Boer Klant xxxxxxx@xxxx.xx 456 Jan Huisman Klant Xxxxxxx@xxxx.xx 789 Dirk Jansen Klant xxxxx@xxxxxxxxxx.xx 321 DATPROF Leverancier Nr. Polis 123 Basis + AV Standaard 456 Basis
87% 3.7% 0.04% First day Postcode Geslacht Geboortedatum Geboortemaand Verander datum velden naar de 1e van dezelfde maand of jaar Nr. Voornaam Naam Soort Opm.. E-mail Geboortedatum 321 Frans de Boer Klant xxxxxxx@xxxx.xx 01-02-1954 16-02-1954 789 Jan Huisman Klant Xxxxxxx@xxxx.xx 25-11-1984 01-11-1984 123 Dirk Jansen Klant xxxxx@xxxxxxxxxx.xx 27-03-1974 01-03-1974 456 DATPROF Leverancier Postcode Geslacht Geboortedatum Geboortemaand Geboortejaar 87% 3.7% 0.04% Bron: onderzoek anonimiteit door Prof. Dr. Latanya Sweeney (Harvard University)
Look-up Voornamen Nr. Voornaam Naam Soort Opm.. E-mail Geb-datum Frans Vervang waarden met waarden uit een andere tabel Voornamen Daan Thomas Thomas Nr. Voornaam Naam Soort Opm.. E-mail Geb-datum Tim Tim 321 Frans de Boer Klant xxxxxxx@xxxx.xx 01-02-1954 Lars 789 Jan Huisman Klant Xxxxxxx@xxxx.xx 01-11-1984 Ruben Ruben 123 Dirk Jansen Klant xxxxx@xxxxxxxxxx.xx 01-03-1974 Levi DATPROF Leverancier Luuk Referentiedata
Expression Nr. Voornaam Naam Soort Opm.. E-mail Geboortedatum 321 Maak gebruik van standaard of eigen functies Nr. Voornaam Naam Soort Opm.. E-mail Geboortedatum 321 Thomas de Boer Klant Fictief T.deBoer@testdata.nl xxxxxxx@xxxx.xx 01-02-1954 789 Tim Huisman Klant Fictief T.Huisman@testdata.nl Xxxxxxx@xxxx.xx 01-11-1984 123 Ruben Jansen Klant Fictief xxxxx@xxxxxxxxxx.xx R.Jansen@testdata.nl 01-03-1974 456 DATPROF Leverancier
3. Deployment Definiëren regels Importeren Meta data
Keten geheugen Methodes om over de keten heen te anonimiseren Stap 1 Anonimiseer database A geheugen Stap 2 Anonimiseer database B
Berichtenverkeer geheugen Methodes om met ketenpartners te communiceren xml xml geheugen xml xml
“Blauwdruk” Productie Master Testset Testsets
Concrete tips veilig bruikbaar Imagoschade Identiteitsdiefstal Inventariseer de risico’s (privacy-scan, impact assessment, ...) Leer van collega-bedrijven (referentiegesprek, kennis-sessies) Zoek een kennis-partner (oplossingen, wetgeving, etc) Doe ervaring op (proefproject) Kijk naar de (extra) voordelen Maak fictieve data herkenbaar Begin eenvoudig Identiteitsdiefstal Chantage Creditcard fraude Spam Imagoschade veilig bruikbaar
Vragen?