Subsetten & Anonimiseren Volg ons op twitter: @DATPROF
Opgericht in 1998, gespecialiseerd in data integratie ITCG en DATPROF Opgericht in 1998, gespecialiseerd in data integratie Diensten Producten - Data Warehousing - Data Migratie - Data Kwaliteit - Test Data Management
Klanten
TESTEN ONTWIKKELEN OUTSOURCING MARKETING OPLEIDING DOELEINDEN: Problemen: Werken met volledige kopieën: Werken met volledige kopieën: Werken met persoonsgegevens:
Waarom subsetten? Minimaliseren gebruik van persoonsgegevens Besparen op hardware & infrastructuur Terugbrengen doorlooptijden Efficiënter beheren testdata
Waarom anonimiseren? Beschermen relaties Voldoen aan wetgeving Voorkomen imagoschade Beveiligen concurrentie-gevoelige data
Creëren representatieve subsets van productie databases
Wat is subsetten? Voorbeeld 2: “alle klanten uit Amsterdam” Voorbeeld 1: “willekeurig 5%” Test database Productie database
% Zelfde structuur Classificatie Productie data Test Classificatie Relatief: t.o.v startpunt Volledig: stamtabellen Leeg: log tabellen Overslaan: temp tabellen Start punt Selectie criterium
Relevant voor subsetten Representatief Consistent Onderhoudbaar Herhaalbaar Keten-ondersteuning Bruikbaar!
Hoe werkt DATPROF Subset? 1. Create application 2. Import Data model 3. Configure subset 4. Deployment Deploy subset Subset
Anonimiseren vertrouwelijke en privacy gevoelige data
Hoe zit het met beveiliging? Productie Test Ontwikkel Extern Firewall? Autorisatie? Beveiliging-updates? Outsourcing?
Persoonsgegevens
“Elk gegeven over een geïdentificeerde of identificeerbare natuurlijke persoon” Bron: Wet Bescherming Persoonsgegevens Adressen Telefoonnummers Namen E-Mail
Anonimiseren van Persoonsgegevens “Elk gegeven over een geïdentificeerde of identificeerbare natuurlijke persoon” Bron: Wet Bescherming Persoonsgegevens Religie Gezondheid Video Beelden Politieke voorkeur Kentekens Anonimiseren van Persoonsgegevens
Regulering in het kort Viertal risicoklassen : Risicoklasse 0 - Publiek niveau; telefoonboeken Risicoklasse 1 - Basis niveau: krantabonnement Risicoklasse 2 - Verhoogd risico: bank & verzekering gegevens Risicoklasse 3 - Hoog risico: DNA & opsporingsgegevens Artikel 9: Doelbinding “Persoonsgegevens worden niet verder verwerkt op een wijze die onverenigbaar is met de doeleinden waarvoor ze zijn verkregen” Artikel 13: Organisatorische & technische maatregelen “De verantwoordelijke legt passende technische en organisatorische maatregelen ten uitvoer om persoonsgegevens te beveiligen tegen verlies of tegen enige vorm van onrechtmatige verwerking. “ CBP- AV23 - Beveiliging van persoonsgegevens “Voor het testen van informatiesystemen met persoonsgegevens mogen uitsluitend gegevens van fictieve personen gebruikt worden”
Wat is anonimiseren? Test database Voorbeeld: Verwissel bestaande namen Genereer nieuwe 11-proef banknummers Laat geboortedata enigszins afwijken Genereer nieuwe bedragen en aantallen Test database
Key-Shuffle, Shuffle & Expressie Voorbeeld Key-Shuffle, Shuffle & Expressie Production ID Firstname Lastname Bankaccount Totaal 1 John Ed˚wards 418582971 € 110,00 2 Chris Evans 389719722 € 140,00 Test ID Firstname Lastname Bankaccount Totaal 2 John Evans 233248316 € 110,00 1 Chris Ed˚wards 240806153 € 140,00 Production PK ID Product Totaal 1 Basic € 90,00 2 Advanced € 20,00 3 4 Pro € 50,00 Test PK ID Product Totaal 1 2 Basic € 90,00 Advanced € 20,00 3 4 Pro € 50,00 Key-Shuffle: ID Shuffle: Lastname Expressie: Bankaccount
Keten-ondersteuning Geheugen functie Geheugen functie
Keten met berichtenverkeer Interne Organisatie Externe Organisatie Productie Systeem Productie Systeem Geheugen Enterprise Service Bus
Relevant voor anonimiseren Anoniem, maar herkenbaar Representatief Identieke datakwaliteit Referentiële integriteit Ketenondersteuning Bruikbaar!
Hoe werkt DATPROF Privacy? 1. Create application 2. Import Data model 3. Configure anonymization 4. Deployment Deploy anonymization
Demo? Neem contact op via www.datprof.com info@datprof.com