DaMa producten inzetten in architectuur trajecten Bert Dingemans Interactory
Agenda Achtergrondinformatie DaMa processtappen en datakwaliteiten Inventarisatie relevante processen Inventarisatie relevante kwaliteiten Relevantie voor werkveld Vervolgacties
Integratie/ transport Data levensloop Processen? Processen? Processen? Productie Opslag Integratie/ transport Gebruik Kwaliteiten? Kwaliteiten? Kwaliteiten? Processen? Kwaliteiten? 1-1-2019
Data Management processen
Proces toelichting Meta-data Management Planning, implementation and control activities to enable easy access to high quality, integrated meta data. Data Architecture Management The development and maintenance of enterprise data architecture, within the context of all enterprise architecture, and its connection with the application system solutions and projects that implement enterprise architecture. Data Development The data-focused activities within the system development lifecycle (SDLC), including data modeling and data requirements analysis, design, implementation and maintenance of databases data-related solution components. Data Governance The exercise of authority, control and shared decision-making (planning, monitoring and enforcement) over the management of data assets. Data Governance is high-level planning and control over data management. Data Operations Management Planning, control and support for structured data assets across the data lifecycle, from creation and acquisition through archival and purge.
Processen toelichting 2 Data Quality Management Planning, implementation and control activities that apply quality management techniques to measure, assess, improve and ensure the fitness of data for use. Data Security Management Planning, implementation and control activities to ensure privacy and confidentiality and to prevent unauthorized and inappropriate data access, creation or change. Data Warehousing and Business Intelligence Planning, implementation and control processes to provide decision support data and support knowledge workers engaged in reporting, query and analysis. Document and Content Management Planning, implementation and control activities to store, protect and access data found within electronic files and physical records (including text, graphics, image, audio, video) Reference and Master Data Management Planning, implementation and control activities to ensure consistency of contextual data values with a “golden version” of these data values.
Data kwaliteiten Accuraatheid Accuraatheid heeft betrekking op de mate waarin een data entiteit de werkelijkheid weergeeft. Accuraatheid kan bepaald worden door een data entiteit te vergelijken met de entiteit in de werkelijkheid. Voorbeeld uit het verleden waarbij een baby een stemkaart ontving op basis van een lage accuraatheid binnen de GBA.
Data kwaliteiten Compleetheid Dit heeft betrekking op de mate waarin bepaalde attributen binnen een data entiteit aanwezig zijn. Daarnaast geldt de compleetheid ook voor het altijd voorkomen van een bepaalde set van entiteiten (rijen) in een data set. Bijvoorbeeld een persoon kan enkel de eigenschap naam hebben, maar ook bestaan uit roepnaam, voornamen, tussenvoegsel, achternaam en meisjesnaam. In het laatste geval is er sprake van een hogere compleetheid
Data kwaliteiten Consistentie Dit heeft betrekking op het feit dat de ene data set van een bepaalde entiteit gelijk is aan een andere dataset. Met andere woorden is een data entiteit onafhankelijk van de bron altijd dezelfde. Een voorbeeld van een lage consistentie is als er verschillen zitten tussen datasets van dezelfde entiteiten afkomstig uit verschillende bronnen. Replicatie van gegevens is vaak een oorzaak van lage consistentie.
Data kwaliteiten Actualiteit Mate waarin een data entiteit de actuele situatie van de werkelijkheid weergeeft. Veelzeggende voorbeelden zijn overleden mensen die een brief krijgen op basis van een verouderde dataset. Replicatie van gegevens is vaak een oorzaak van lage actualiteit.
Data kwaliteiten Precisie Mate van detail waarin een data entiteit de werkelijkheid weergeeft. Dit heeft bijvoorbeeld betrekking op de precisie van getallen e.d. Opslag van getallen en datums kunnen onvoldoende nauwkeurig zijn omdat afronding bij opslag nodig is. Ook domeinen op eigenschappen kunnen onvoldoende precisie hebben (denk aan een Nederlandse postcode in een internationale data-opslag
Data kwaliteiten Privacy Voor sommige data entiteiten is toegangscontrole (autorisatie en authenticatie) of monitoring van gebruik nodig. Denk hierbij aan eisen die gesteld worden aan de ontsluiting van vertrouwelijke gegevens. In het GBA kent men bijvoorbeeld meerdere niveaus van vertrouwelijkheid. Zo worden bevragingen van ambtenaren wel gelogd en weergegeven aan de burger maar voor opsporingsambtenaren worden wel gelogd maar niet getoond.
Data kwaliteiten Redelijkheid Heeft vooral betrekking op verwachtingen binnen een bepaalde operationele context. Denk bijvoorbeeld aan het accepteren van een lagere performance bij piekbelasting of aan het langer moeten wachten op een resultaat-set van gearchiveerde data-entiteiten
Data kwaliteiten Referentiele integriteit Dit is de situatie waarbij verwijzingen vanuit de ene data entiteit altijd correct verwijzen naar de gerelateerde data entiteiten. Voorbeelden zijn dubbele sleutels in een dataset waardoor de gekoppelde entiteiten niet kunnen bepalen wat de ouder entiteit is. Ook dangling references of zwevende referenties waarbij de ouder niet meer bestaat hoort hiertoe
Data kwaliteiten Tijdigheid Is een dataset tijdig beschikbaar binnen de gestelde verwachtingen. Het is het verschil tussen het moment van behoefte en beschikbaarheid. Bijvoorbeeld het opvragen van gegevens in een KCC stelt hoge eisen. Vijf minuten wachten op een response van de gegevensopslag is dan niet acceptabel.
Data kwaliteiten Uniekheid Uniekheid van een data entiteit is gericht op het feit dat er geen andere entiteiten zijn met dezelfde gegevens. Voorbeeld uit de praktijk was een tweeling met dezelfde voorletters, achternaam en geboortedatum. Het onderscheid was daardoor niet te maken door een te lage uniekheid. Toevoeging van de roepnaam bewerkstelligde dit wel.
Data kwaliteiten Validiteit Dit is de mate waarin een data entiteit bij opslag en uitwisseling voldoet aan het gewenste formaat. Denk hierbij bijvoorbeeld aan het domein maar ook het datatype van de attributen van een data entiteit. Binnen ketenuitwisseling is dit bijvoorbeeld van het grootste belang. Men wil niet dat aan het einde van de keten blijkt dat de gegevens niet valide zijn. Dit dient in een vroeg stadium geconstateerd te worden. Iedereen kent de voorbeelden uit het verleden waarbij bij webapplicaties na verzenden een melding van invalide data terugkwam zonder verdere toelichting
Voor en nadelen van kwaliteiten Voordelen Nadelen Kwantificeerbaar Grote mate van genericiteit Goed inzetbaar naast functioneel beschrijven bij aanbesteden Consistente- en gekwantificeerde kwaliteiten opstellen is moeilijk Beheer Hoe sturen met kwaliteiten 1-1-2019
Workshop inventarisatie Welke data kwaliteiten zijn relevant voor je huidige werkveld? Wat is de score van deze kwaliteiten in de huidige situatie Wat is de gewenste score voor deze kwaliteiten Wat zijn maatregelen als er verschillen zijn tussen de voorgaande vragen
Dama kwaliteiten en relevantie Omschrijving As Is ToBe Accuraatheid Compleetheid Consistentie Actualiteit Precisie Privacy Redelijkheid Referentiele integriteit Tijdigheid Uniekheid Validiteit
Dama kwaliteiten scoreverschil Omschrijving Totaal Accuraatheid Compleetheid Consistentie Actualiteit Precisie Privacy Redelijkheid Referentiele integriteit Tijdigheid Uniekheid Validiteit
Inventarisatie architectuur maatregelen Voor voorbeelden zie: http://assistent.interactory.nl/upload/Datakwaliteite n.pdf Zijn er specifieke maatregelen te benoemen binnen het TenneT domein of binnen een specifiek TenneT werkveld
Vervolgacties? Bepalen van de grenzen (brons/zilver/goud)? Uitwerken van architectuur maatregelen relevant voor project Evalueren met de business (architecten)? Beschrijven van de (technische en governance) maatregelen (in de architectuur)? Omzetten naar ABB?