Vertrouwen en verbinden R Huizinga en J Ciocoiu KPN Consulting
Data: driver voor digitale transformatie Digitalisering aanjager van data management. Data management is aanjager van digitalisering. Van data silo’s naar een single source of truth 80% van relevante business informatie is ongestructureerde data. < 1% daarvan wordt geanalyseerd Kennis is macht. Data de bron. (data driven: +6 % en +9% resultaatverbetering) Snelheid is de nieuwe differentiator: Informatie=relevantie/ consumptietijd Factor vertrouwen speelt grote rol in datamanagement
Denk platformen i.p.v. applicaties Data sources Application Silo’s Historic Dark data Analytics Impact Can X help me sell more? Better service for my clients CONTROL AND OPTIMIZATION Enterprise Descriptive Partner Capture condition Report results Data lake (RTDP) Diagnostic Examine causes of performance, faults and problems Faster service. Better service Happier customers Connected assets Location Condition Use Customer / Consumer Predictive Ingest Store Compute Detect patterns that signal impending events External Business Prescriptive Identify measures to improve outcomes Lower cost Happier employees More innovation Supplier data Traffic Social BASIC INSIGHTS 3
Prorail: IoT, DataLake en analytics
Geldservice NL: Datalake, IOT en analytics Periodiek worden geldautomaten onderhouden, waarbij de onderhoudscyclus nu nog voor alle automaten gelijk is. Dit kan efficiënter omdat de automaten niet allemaal even frequent worden gebruikt en onder verschillende omstandigheden opereren. KPN consulting maakt een systeem voor efficiënter onderhoud op basis van de historische gebruiksgegevens, recente storingen en gegevens over het apparaat.
Achtergrond: Ymere en onderhoud Woningcorporatie Ymere beheert in Nederland ca. 1430 wooncomplexen met in totaal meer dan 5600 daken Deze daken kennen ca. 7000 lekkages per jaar Het voorkomen van lekkages kan o.a. door: Planmatig en preventief onderhoud Maatregelen op basis van historische analyse Predictive modeling (machine learning) Plaatsen van sensoren Lekkages worden opgelost door het dakteam Klomp, Patina en Consolidated (mede-opdrachtgever)
Aanpak: machine learning Idee: eerste concept/voorproef van de mogelijkheden van predictive modeling Doel: Niet: op dinsdag 12 januari om 21:50 ontstaat een lekkage op dak X Maar: in januari is het zeer waarschijnlijk dat op dak X, Y, Z een lekkage ontstaat Gebruikte techniek: Machine learning classificatie logistische regressie RandomForest Implementatie m.b.v. Python en Spark Data: Daken, complexen en activiteiten uit Dakota (Consolidated) Bouwjaar en locatie uit BAG Temperatuur, neerslag en luchtvochtigheid uit KNMI
Predictive modeling 2015 Q1 2016 Features Features Labels Predictions Training dataset Validatie dataset Dakota Features Maand Daktype Dakpartner Gebouwsoort Garantie Conditie Bladval Valbeveiliging Afschot Vandalisme Oppervlakte Bouwjaar Lengte goot Levensduur Aantal lekkages cum. Temperatuur Neerslagduur Neerslagsom Luchtvochtigheid Features Labels BAG Validatie Model Predictions KNMI (Logistische Regressie) IoT Labels Wel/niet lekkage Management Letter <Segment>
(On)mogelijkheden Mogelijkheden Achterhalen van andere features Meer data: meerdere Jaren maar ook van daken die niet op gebouwen van Ymere zitten Externe databronnen Obstakels Privacy van personen, ook externe data Onvolledige data
Resultaten theoretisch optimum model Overall accuracy model: 93% Logistische regressie kent een trade-off tussen True Positive en False Positive voorspellingen Bijv: 40% van de lekkages kan correct worden voorspeld met minder dan 5% false positives random voorspelling (ROC curve)
Vragen? Redmer Huizinga (redmer.huizinga@kpn.com) John Ciocoiu (john.ciocoiu@kpn.com)
Aanpak en fasering Ontwikkeling ‘Machine Learning’ model en visualisatie Orientation Proof of Concept (ontwikkeling MVP) Strategy Interviews variabelen Data organiseren en cleanen Features selecteren, valideren & combineren Uitwerking beschrijvende data Assess & Define Verbetering model, alternatieve algoritmen Combinatie model met IoT sensoren Visualisatie, presentatie, advies praktijk
Dashboard