Data Mining without Discrimination Valorisatiepanel 4 december 2009 10.00 – 12.00 Faculty Club – Universiteit Leiden.

Slides:



Advertisements
Verwante presentaties
RECLAME OP INTERNET ASCC Clubmiddag 15 april 2014.
Advertisements

Module 7 – Hoofdstuk 5 (1) SQL – een begin.
Keuzehulp pijn; wat valt er te kiezen?
Geografisch InformatieSysteem (GIS)
EDC ervaringen op de werkvloer – fase I/IIa
Gegevensbeheer Karin Diederiks KOAC•NPC.
Accreditatierichtlijn beveiliging van bestanden
SVEB Plezier en Respect in Voetbal Sport als belangrijke drager van de leefbaarheid van een dorp/gemeenschap Ouderavond SVEB 28 oktober 2013.
© 2005 natuurlijke partner voor jongerenmarkten Products, services & marketing for sustainable [youth]markets ¤
A RBO - WETGEVING VOOR DUIKEND N EDERLAND Presentatie: Manfred van Deelen 9 april 2011.
Jan Talmon Medische Informatica Universiteit Maastricht
Activiteit 1.6 Bepalen niet-functionele eisen
Standaards in Samenwerking Alex Stroom – 06/04/2004.
Het verbeteren van een modulaire verificatie techniek voor aspect georiënteerd programmeren Alfons Laarman.
Databases I (H. 1) Wiebren de Jonge Vrije Universiteit, Amsterdam Voorlopige versie 2003.
Dataverzamelingsmethoden
Waarom nieuwe privacy richtlijnen?
Een sportraad voor Sport-be-raad Bart Vanreusel September 2006 Zilveren jubileum sportraad provincie Antwerpen.
Risicoanalyse voor het waterbeheer:
14 oktober 2003 (Safety Assessement of Foreign Aircraft) Steekproef methodiek SAFA Ernst van Duffelen SAFA Nationaal Coördinator CAA-NL.
PADS4 maakt het eenvoudig om informatie te verspreiden naar een specifiek publiek op de juiste plaats en het juiste moment PADS4 is een professionele oplossing.
Total Practice Solutions Information Management LexisNexis Media Coverage Analyser 26 November 2009 Marco van Gennip Business Development Manager T: +31.
Improving health by sharing science 11/09/2014 ICT en datakwaliteit: een goede relatie? Ariaan Siezen - Nijmegen ICT coördinator Radboud Biobank/Parelsnoer.
Stellingen en Panel Testpanel (n=122) Vraag 1 Mijn organisatie leert voldoende van ervaringen van andere organisaties in binnen en buitenland 1 maart 2012.
Het recht om vergeten te worden Marens Engelhard Charles Jeurgens.
O Zo! Onderzoeken doe je zo. creatie PowerPoint : Jan Gilté
2 Onderzoeksluik 2: Grounded theory study ervaringen van bio-psycho-sociaal redeneren Presentatie: Ank Eijkelkamp.
Inleiding Adaptieve Systemen, Opleiding CKI, Utrecht. Auteur: Gerard Vreeswijk Inleiding adaptieve systemen Lerende classificatie systemen.
Rogier van der Linde & Davy De Winne, 2014
Leydi Johana Breuls “In hoeverre speelt de sociale samenstelling van een sportclub een rol in de beslissing van leden om te stoppen?“ 01 Waarom?
Master in de Meertalige Professionele Communicatie Visualization of agreement and discussion processes during computer-supported collaborative learning.
Klik op een vlag. Click on a flag Language: Ongewenste Cookies verwijderen Start Wat doen Cookies eigenlijk ? Cookies kunnen gebruikt worden voor het.
Universiteit Utrecht Nieuwe Media & Digitale Cultuur Syntens workshop, 30 november 2004 Imar de Vries, JDO NMDC Instituut Media.
Karel Vlieghe - Utrecht 29 januari 2005 Veranderscenario’s voor e-Learning systemen Evolutie van e-Learning systemen door de jaren heen.
Information Ethics DE TREND IN TESTEN IS NIET IN TESTEN.
Minor Project- en Programmamanagement
PIA vs Big Data Bob Hulsebosch.
KWALITEIT EN ORGANISATIE WEEK 2 Schpa 2.57.
LIGTHARTadvies/Nimöller Branche Support KOMO® RISICOMODEL
Facebook. Opgericht in 2004 Gebruik van persoonlijke gegevens door bedrijven Zonder toestemming gebruikers Profielpagina Persoonlijke gegevens openbaar.
CONCEPT CHECKS & FAST FEEDBACK
KOP/MINOR Thema klassenmanagement/ orde in de klas
Zwijgen of waarschuwen? HIV disclosure: een ethische analyse.
Politie Zeeland West Brabant. District Zeeland. Komt een agent bij de dokter Beroepsgeheim en politie/justitie.
1 RFID en Veiligheid Platform voor Informatiebeveiliging 18 maart 2008 mr. dr. Bart W. Schermer.
PRIVACY ENHANCING TECHNOLOGIES Sergej Katus Bussum, 22 april 2008 Strategische informatiebeveiliging.
Crobeco & Eulis 2 Cross Border Electronic Conveyancing -Project van ELRA: Europese bewaarders (registratieautoriteiten) -24 lidstaten.
Brainstorming Rogier van der Linde, WAT & WAAROM BRAINSTORMEN 2 Genereren van ideeën of oplossingen voor één of meerdere problemen waar je normaal.
EMGO Institute for Health and Care Research Quality of Care Martina Cornel, Hoogleraar community genetics & public health genomics Genetische testen: Direct.
Cliëntervaringsonderzoek Wonen 2011 Tragel Zorg Kwaliteitsdag VGN Jos van Hooijdonk senior adviseur kwaliteit en Veiligheid.
Gij zult openbaren: privacy en de open overheid
Standaarden en spelregels voor de Slimme Stad
KRITISCH DENKEN 11 Co-premissen II © Kritisch Denken.
Vertrouw je testautomatisering!?
Spelregels Digitale stad
Autoriteit Persoonsgegevens Toezicht onder de AVG
Het Sociale Consumenten Brein
HR in tijden van GDPR/AVG – 6 februari 2018 – VAC Gent
Vergadering Personeelsdienst
Internet & privacy (1) Privacy (2) Internet (3) Verklaring
Text and data mining – Meer ruimte in het bestaande systeem?
Modderdorp UNPLUGGED Bron: csunplugged.org.
Introductie computerveiligheid
Assignment: calling for a meeting about internet use at work
Voorspelling van criminele carrières door 2-dimensionale extrapolatie
Workshop videobegeleiding
– Software development fundamentals
The many faces of Application Programmes Interfaces
Onbevredigd door Testautomatisering? Reduceer je False Negatives!
Transcript van de presentatie:

Data Mining without Discrimination Valorisatiepanel 4 december – Faculty Club – Universiteit Leiden

2  Voorstelronde  Presentatie Bart Custers: onderzoeksvoorstel  Presentatie Toon Calders: building classifiers  Presentatie Bart Schermer: legal requirements  Terugkoppeling en discussie  Vragen over presentaties  Rol van het valorisatiepanel  Discussie  Afsluiting en gezamenlijke lunch

3 Information overflow

4 Regressie Classificatie Clusteren

5 De weg vinden in bergen data (2) 2 gebruikelijke oplossingen: Vooraf niet alles verzamelen…  Administratieve lasten  Overzicht raakt verloren  Beveiligingsproblemen  Privacyproblemen … en achteraf analyseren  Niet alleen controle op bekende verdachten (zwarte lijsten, second offenders)  Maar ook controle op nieuwe verdachten (risicoprofielen, first offenders) 5 Verzamel antecedenten data Bouw risicoprofielen op basis van historische data Probleem 2: Historische data kunnen echter discriminerende patronen bevatten Probleem 1: Database kan discriminerende gegevens bevatten

6  Informatietheorie stelt dat de disseminatie van informatie onomkeerbaar is:  Informatie is eenvoudig te vermenigvuldigen  Informatie is eenvoudig te verspreiden  Klassieke (a priori) focus op toegang tot informatie beperken werkt dus niet  Beter: (a posteriori) focus op transparantie en verantwoording 1 Probleem 3: Toegangsbeperkingen zijn geen geweldige oplossing

7  Ongewenste/verboden selectie  Stigmatisering bepaalde groepen  Confrontatie met ongewenste info  Eenzijdige info-voorziening  Doelbinding voorbijgaan  Onbetrouwbaarheid (false positives/false negatives) Stelling: “Als je niets te verbergen hebt, heb je niets te vrezen” is onjuist Discriminatie

8 Mogelijke toepassingen  Terreurfondsen opsporen  Opsporen fraude/criminaliteit  Direct marketing/customisation  Verzekeringen ▪ In VS nu veel mensen onverzekerd vanwege hoge premies door risico  Medische toepassingen ▪ In IJsland grote DNA database aangelegd  Beleid/strategie bepalen

9 Car breakdown Pizza delivery

10 Probleem:  We willen wel positieve aspecten  Overzicht/inzicht grote hoeveelheden data  Maar geen negatieve aspecten  Discriminatie, privacy, onbetrouwbaarheden, etc. Oplossing:  Bouw reeds vooraf in analysemethode ethische en juridische regels in

11  In hoeverre kunnen we juridische en ethische regels integreren in data mining algoritmen om discriminerende effecten te voorkomen?  Input kan discriminerende data bevatten  Output kan discriminerende patronen opleveren  Simpelweg verwijderen gevoelige data is geen oplossing

12  Analyzing the possibilities to translate laws and rules into a format understandable for computers that may be verified  Integrating this formalization in the current state- of-the-art algorithms for discovering models  Providing feedback of the technological possibilities for concrete recommendations for formalizing legislation.

13 Bart CustersUniversiteit Leiden Toon CaldersTU Eindhoven Bart SchermerUniversiteit Leiden Sicco VerwerTU Eindhoven VacatureUniversiteit Leiden Duur: 1 oktober 2009 – 1 oktober 2010

14

15  Voorstelronde  Presentatie Bart Custers: onderzoeksvoorstel  Presentatie Toon Calders: building classifiers  Presentatie Bart Schermer: legal requirements  Terugkoppeling en discussie  Vragen over presentaties  Rol van het valorisatiepanel  Discussie  Afsluiting en gezamenlijke lunch