De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

Catalogus Centrale Biobank 31 mei 2013 Robert Veen

Verwante presentaties


Presentatie over: "Catalogus Centrale Biobank 31 mei 2013 Robert Veen"— Transcript van de presentatie:

1 Catalogus Centrale Biobank 31 mei 2013 Robert Veen
Ik licht toe dat de titel voor mijn praatje is aangedragen en begin met een definitie van de twee begrippen In 2012 worden limieten aan het kunnen verwerken van data uitgedrukt in exabytes (= terabytes) Stelling: (Gegeven de titel) Big data gaat dus -vanmiddag- eigenlijk over het analyseren van gegevens zonder exacte definitie of vastomlijnde hypothese > dit is een bottom-up proces Hebben we eigenlijk wel big data in het UMCU? Genomics is ‘erkend’ Big Data Maar combineren van EPD, lab, medicatie, beeld (MRI, echo etc.) en meetapparatuur (eigenlijk nano-data zoals ECG, EEG etc.) = zeker BIG DATA Welke geheimen herbergt EZIS? Er zit wrs allerlei informatie in die niemand er bewust in heeft gestopt

2 Biobank en Programma Research ICT Wat is een catalogus? De uitdaging
Catalogus Biobank Biobank en Programma Research ICT Wat is een catalogus? De uitdaging Uitwerking Next steps Ik licht toe dat de titel voor mijn praatje is aangedragen en begin met een definitie van de twee begrippen In 2012 worden limieten aan het kunnen verwerken van data uitgedrukt in exabytes (= terabytes) Stelling: (Gegeven de titel) Big data gaat dus -vanmiddag- eigenlijk over het analyseren van gegevens zonder exacte definitie of vastomlijnde hypothese > dit is een bottom-up proces Hebben we eigenlijk wel big data in het UMCU? Genomics is ‘erkend’ Big Data Maar combineren van EPD, lab, medicatie, beeld (MRI, echo etc.) en meetapparatuur (eigenlijk nano-data zoals ECG, EEG etc.) = zeker BIG DATA Welke geheimen herbergt EZIS? Er zit wrs allerlei informatie in die niemand er bewust in heeft gestopt

3 Biobank en Programma Research ICT
Domein Data Ontwikkeling best-practices voor het verzamelen van data Verbeteren beschikbaarheid van (zorg)data t.b.v. research Een team dat deze processen ondersteunt Ontwikkeling van een Biobankcatalogus valt binnen de scope van Research ICT Ik licht toe dat de titel voor mijn praatje is aangedragen en begin met een definitie van de twee begrippen In 2012 worden limieten aan het kunnen verwerken van data uitgedrukt in exabytes (= terabytes) Stelling: (Gegeven de titel) Big data gaat dus -vanmiddag- eigenlijk over het analyseren van gegevens zonder exacte definitie of vastomlijnde hypothese > dit is een bottom-up proces Hebben we eigenlijk wel big data in het UMCU? Genomics is ‘erkend’ Big Data Maar combineren van EPD, lab, medicatie, beeld (MRI, echo etc.) en meetapparatuur (eigenlijk nano-data zoals ECG, EEG etc.) = zeker BIG DATA Welke geheimen herbergt EZIS? Er zit wrs allerlei informatie in die niemand er bewust in heeft gestopt

4 Biobank en Programma Research ICT
Het Research Data Platform 4. Genereer en presenteer informatie producten UITGIFTE 3. Modelleer de data (klinische) bouwstenen TRANSFORMATIE 2. Registreer en veranker de data (traceability) INTEGRATIE 1. Verkrijg de (ruwe, onversneden) data STAGING De architectuurplaat: er volgt een toelichting van het vierlagenmodel: staging > historische verankering > modellering en standaardisering > uitgifte. Hier verwijzen naar de rol/tooling van SAS

5 Biobank en Programma Research ICT
Showcases Vraaggestuurd vanuit wetenschappelijke speerpunten UBORBIO/Ischemische hartziekten (Folkert Asselbergs) Integraal Reumacentrum (Anne Karien Marijnissen) (Biobank) Eczeem (Edward Knol) CVA (Gabriel Rinkel) Ik licht toe dat de titel voor mijn praatje is aangedragen en begin met een definitie van de twee begrippen In 2012 worden limieten aan het kunnen verwerken van data uitgedrukt in exabytes (= terabytes) Stelling: (Gegeven de titel) Big data gaat dus -vanmiddag- eigenlijk over het analyseren van gegevens zonder exacte definitie of vastomlijnde hypothese > dit is een bottom-up proces Hebben we eigenlijk wel big data in het UMCU? Genomics is ‘erkend’ Big Data Maar combineren van EPD, lab, medicatie, beeld (MRI, echo etc.) en meetapparatuur (eigenlijk nano-data zoals ECG, EEG etc.) = zeker BIG DATA Welke geheimen herbergt EZIS? Er zit wrs allerlei informatie in die niemand er bewust in heeft gestopt

6 Wat is een catalogus? Biobank en Programma Research ICT De uitdaging
Uitwerking Next steps Ik licht toe dat de titel voor mijn praatje is aangedragen en begin met een definitie van de twee begrippen In 2012 worden limieten aan het kunnen verwerken van data uitgedrukt in exabytes (= terabytes) Stelling: (Gegeven de titel) Big data gaat dus -vanmiddag- eigenlijk over het analyseren van gegevens zonder exacte definitie of vastomlijnde hypothese > dit is een bottom-up proces Hebben we eigenlijk wel big data in het UMCU? Genomics is ‘erkend’ Big Data Maar combineren van EPD, lab, medicatie, beeld (MRI, echo etc.) en meetapparatuur (eigenlijk nano-data zoals ECG, EEG etc.) = zeker BIG DATA Welke geheimen herbergt EZIS? Er zit wrs allerlei informatie in die niemand er bewust in heeft gestopt

7 Level 1: List of Biobanks (“Catalogue”)
Wat is een catalogus? Level 1: List of Biobanks (“Catalogue”) Only name + minimal details such as ‘size’ and ‘materials’ Level 2: Biobank list + Variables (“Data Dictionary”) Add info on data items, e.g. questionnaires, lab, SOPs, GWAS > PIM Level 3: Biobanks + Variables + Aggregate Data (“Cohort profiles”) Add aggregate, e.g. ‘number of samples per data item/class’ Level 4: Individual Data (“Biobank database”) Add individual observation data (anonymized). Level 5: Linked Data per Individual (“Registry linkage”) Add “pseudonymous” links, e.g. to national cancer registry. > Mondriaan Ik licht toe dat de titel voor mijn praatje is aangedragen en begin met een definitie van de twee begrippen In 2012 worden limieten aan het kunnen verwerken van data uitgedrukt in exabytes (= terabytes) Stelling: (Gegeven de titel) Big data gaat dus -vanmiddag- eigenlijk over het analyseren van gegevens zonder exacte definitie of vastomlijnde hypothese > dit is een bottom-up proces Hebben we eigenlijk wel big data in het UMCU? Genomics is ‘erkend’ Big Data Maar combineren van EPD, lab, medicatie, beeld (MRI, echo etc.) en meetapparatuur (eigenlijk nano-data zoals ECG, EEG etc.) = zeker BIG DATA Welke geheimen herbergt EZIS? Er zit wrs allerlei informatie in die niemand er bewust in heeft gestopt

8 ? Biobank en Programma Research ICT Wat is een catalogus? De uitdaging
Catalogus Biobank Biobank en Programma Research ICT Wat is een catalogus? De uitdaging Uitwerking Next steps ? Ik licht toe dat de titel voor mijn praatje is aangedragen en begin met een definitie van de twee begrippen In 2012 worden limieten aan het kunnen verwerken van data uitgedrukt in exabytes (= terabytes) Stelling: (Gegeven de titel) Big data gaat dus -vanmiddag- eigenlijk over het analyseren van gegevens zonder exacte definitie of vastomlijnde hypothese > dit is een bottom-up proces Hebben we eigenlijk wel big data in het UMCU? Genomics is ‘erkend’ Big Data Maar combineren van EPD, lab, medicatie, beeld (MRI, echo etc.) en meetapparatuur (eigenlijk nano-data zoals ECG, EEG etc.) = zeker BIG DATA Welke geheimen herbergt EZIS? Er zit wrs allerlei informatie in die niemand er bewust in heeft gestopt

9 Welke bevragingen wil men doen op een biobankcatalogus?
De uitdaging Welke bevragingen wil men doen op een biobankcatalogus? Zijn de vragen realistisch? Waar komen de gegevens vandaan? Wat betekenen de gegevens? Zijn de gegevens gestandaardiseerd? Moet er geconverteerd worden? Wie is de eigenaar? Hoe krijgen we de gegevens uit het systeem? Hoe komen de gegevens bij de gebruiker? Eenmalig extraheren. Geen herhalende ad-hoc extracties. Gestandaardiseerd verzamelen Inzicht in wat er is: Aanleggen catalogus met gedocumenteerde bouwstenen Voorkomen dubbele invoer (maar: Afstemming tussen dossiervastlegging en informatiebehoefte onderzoeker nodig) Interne toepassingen: indicatoren, KPI, ….

10 De uitdaging – EPD modellen zijn ingewikkeld

11 Biobank en Programma Research ICT Wat is een catalogus? De uitdaging
Catalogus Biobank Biobank en Programma Research ICT Wat is een catalogus? De uitdaging Uitwerking Next steps Ik licht toe dat de titel voor mijn praatje is aangedragen en begin met een definitie van de twee begrippen In 2012 worden limieten aan het kunnen verwerken van data uitgedrukt in exabytes (= terabytes) Stelling: (Gegeven de titel) Big data gaat dus -vanmiddag- eigenlijk over het analyseren van gegevens zonder exacte definitie of vastomlijnde hypothese > dit is een bottom-up proces Hebben we eigenlijk wel big data in het UMCU? Genomics is ‘erkend’ Big Data Maar combineren van EPD, lab, medicatie, beeld (MRI, echo etc.) en meetapparatuur (eigenlijk nano-data zoals ECG, EEG etc.) = zeker BIG DATA Welke geheimen herbergt EZIS? Er zit wrs allerlei informatie in die niemand er bewust in heeft gestopt

12 Uitwerking – eerste verkenning
Postcode Leeftijd Geslacht EZIS Patient Diagnose Medicatie IC De architectuurplaat: er volgt een toelichting van het vierlagenmodel: staging > historische verankering > modellering en standaardisering > uitgifte. Hier verwijzen naar de rol/tooling van SAS LMS Patient Cohort Sample

13 Uitwerking – eerste verkenning
Postcode Leeftijd 2 Geslacht Diabetes Mellitus EZIS Patient Diagnose Medicatie 1 IC De architectuurplaat: er volgt een toelichting van het vierlagenmodel: staging > historische verankering > modellering en standaardisering > uitgifte. Hier verwijzen naar de rol/tooling van SAS 3 4 5 LMS Patient Cohort Sample

14 Uitwerking – eerste verkenning

15 Uitwerking – eerste verkenning

16 Uitwerking – eerste verkenning

17 Uitwerking – eerste verkenning

18 Uitwerking – eerste verkenning

19 Uitwerking – eerste verkenning

20 Uitwerking – eerste relativering

21 ? ? Uitwerking – eerste verkenning EZIS LMS Etc. Research
STAGING INTEGRATIE BOUWSTEEN KLINISCHE UITGIFTE ? ? EZIS LMS Etc. Research Data Platform

22 Uitwerking – eerste verkenning
Conclusies Doorsnedes door EZIS en LMS leveren zinvolle resultaten op …maar zijn een schot met hagel Kwaliteit doorsnede is sterk afhankelijk van kwaliteit van onderliggende registratie (en standaardisatie) Denkrichting Definieer een kernset met een beperkt aantal (maar relevante) variabelen Start met grovere selectie via ‘Level 3’ en verfijn eventueel via (niet openbare) ‘Level 4’ (i.e. Research Data Platform)

23 Biobank en Programma Research ICT Wat is een catalogus? De uitdaging
Catalogus Biobank Biobank en Programma Research ICT Wat is een catalogus? De uitdaging Uitwerking Next steps Ik licht toe dat de titel voor mijn praatje is aangedragen en begin met een definitie van de twee begrippen In 2012 worden limieten aan het kunnen verwerken van data uitgedrukt in exabytes (= terabytes) Stelling: (Gegeven de titel) Big data gaat dus -vanmiddag- eigenlijk over het analyseren van gegevens zonder exacte definitie of vastomlijnde hypothese > dit is een bottom-up proces Hebben we eigenlijk wel big data in het UMCU? Genomics is ‘erkend’ Big Data Maar combineren van EPD, lab, medicatie, beeld (MRI, echo etc.) en meetapparatuur (eigenlijk nano-data zoals ECG, EEG etc.) = zeker BIG DATA Welke geheimen herbergt EZIS? Er zit wrs allerlei informatie in die niemand er bewust in heeft gestopt

24 Uitwerking Proof of Concept in show case Eczeem
Next Steps Uitwerking Proof of Concept in show case Eczeem Betrokkenen: Fokke Terpstra en Edward Knol Inclusief processtappen om vraag en aanbod met elkaar in contact te brengen Ontwikkeling Catalogus Projectplan in ontwikkeling: trekker Fokke Terpstra Projectgroep samenstellen Interesse? Fokke Terpstra (Biobank): Robert Veen (Research IT):

25

26 Level 2: Biobank list + Variables (“Data Dictionary”)
Add info on data items, e.g. questionnaires, lab, SOPs, GWAS. Example: PIM

27 Level 5: Linked Data per Individual (“Registry linkage”)
Add “pseudonymous” links, e.g. to national cancer registry. Example: Mondriaan catalogue of linked GP records.

28 De uitdaging - voorbeeld
Inclusion 1. Males & females of non childbearing potential (mostly postmenopausal) 2. Age >18 3. Documented history of myocardial infarction at least 30 days ago Exclusion 1. Planned PCI or CABG 2. Multivessel CABG in past 3 years 3. Major surgical or endoscopic procedure in past 6 months 4. Prior malignancy 5. History of TBC 6. History of chronic infectious disease 7. Immunocompromised patients (HIV, high dose immune modulatory agents) 8. Biologic drugs targeting immune system (TNF blockers, -mab, -cept) 9. Life expectancy <5 yrs by other than cardiovascular cause Terug


Download ppt "Catalogus Centrale Biobank 31 mei 2013 Robert Veen"

Verwante presentaties


Ads door Google