INTEGRATIE EN SEMANTISCHE CONVERSIE VAN AUTISME GERELATEERDE GENDATA IN EEN LINKED DATA OMGEVING Sven Buyse Stagementor: Ir. Filip Pattyn (ONTOFORCE) Stagegever:

Slides:



Advertisements
Verwante presentaties
Autisme en Mindmap Thuis en op School
Advertisements

EBSCO DISCOVERY Els Schaerlaekens Tom De Mey.
Samenwerking met MOSS 2007! Chris Hoppenbrouwers.
Fedora Content Model en XSLT Fedora op Klompen, Amsterdam, Egbert Gramsbergen TU Delft Library / Digital Product Development
Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?
Semantic wiki’s voor Semantic web onderwijs NIOC 2011, 8 april 2011 Lloyd Rutledge en Harold Pootjes Open Universiteit.
Inleiding en Ontwerpen voor het semantische web : 2 cursussen
Het Semantic Web: voor een gezonder Web Lloyd Rutledge, Universitair Docent, INF Opening Academisch Jaar, 18 juni 2008.
Sanne van der Palen – Yoshi Denis – Aïcha Cardoen
Context & Contextualisering* SIOB mini-symposium 27 maart 2013 Stichting Bibliotheek.nl Diederik van Leeuwen, Directeur *) Presentatie bevat schokkende.
THESISSEMINARIE 2 VAKGROEP EXPERIMENTEEL-KLINISCHE EN GEZONDHEIDSPSYCHOLOGIE Probleemstelling, methode LES 1; Klinische Psychologie; Universiteit Gent;
De zoektocht naar functionaliteit in het post-genoom tijdperk
Welkom bij Bioinformatica!
EndNote Titels opslaan in EndNote Verder = klikken.
Verrijkte Publicaties maken met de ESCAPE-editor.
Sneeuwschuivers en leren sneeuwschuiven myResearch Portal en het belang van workflow data analyse Richard L. Zijdeman DAI: info:eu-repo/dai/nl/
Elektronische bronnen (referentiepakketten) ontsluiten op titelniveau 8 april 2009.
Homcom Ledenvergadering 27/01/ Onze beste wensen Voor 2014 Vanwege het bestuur.
De online gids voor studiekeuze en loopbaanoriëntatie
Evaluatieonderzoek hulpmiddelen in het hoger onderwijs
Challenge the future Delft University of Technology Augustus 2010 Korte handleiding Metis Plus Augustus 2010.
InternettechnologieRik Van de WalleGent, mei Semantic Web Internettechnologie (ITech) Rik Van de Walle academiejaar
Databank Beheer Practica Databanken. Vakgroep Telecommunicatie en Informatieverwerking2 Twee practica Schema ontwerp & implementatie –conceptueel ontwerp:
SCORM en Pierre Gorissen ELO-Team 27 januari 2004.
Integratie Eduarte 22 januari 2013
Situering studies luchtkwaliteit MIRA -infodag studies luchtkwaliteit 5 april 2011.
ONLINE VERBONDEN EN INTELLIGENTE COMPUTERS Semantisch web Tom Schurmans Gunter Fransen Nand Truyen Nele Lieben.
OPZOEKENEVALUERENOPSLAAN van informatie van op INTERNET door Bart Coene.
Informatievaardigheden. Niveau 3. Verder Gevorderd. Academiejaar 2010 – 2011 Els Martens & Carl Demeyere.
Qompas StudieKeuze De online gids voor studiekeuze en loopbaanoriëntatie Informatieavond voor ouders.
EhBIB Search Eenvoudig en geavanceerd zoeken Zoekresultaten weergeven.
Eisenbheer module CROW
Werkstukken en rapporten
Ordenen van gegevens Inleiding informatiesystemen © Sander Cox.
Les 24 november 1999 Lesbijdrage: Geschiedenis en multimedia Lesbijdrage: MS Access Overleg Bibliografisch zoeken: aanbod aan de K.U.Leuven Bibliografisch.
Introductie in Linked Data
Intro/Context Niemand weet exact hoe het Google algoritme werkt Echter, de belangrijkste factor zit hem voornamelijk in de kracht van andere websites die.
Mediamonitoring Oplossingen. Duizenden klanten in meer dan 100 Landen.
Buy Your Pin | Why do it yourself? |. Koop de DIYs die je nooit zou maken Bij Buy your Pin kan je eindelijk al die leuke pins die je opgeslagen hebt maar.
Nieuwe cursus: Semantic web TouW-Informatica Symposium, 13 november 2010, Amsterdam Lloyd Rutledge.
“IT’S THE DATA STUPID..!” WAGENINGEN UNIVERSITEIT EN RESEARCH CENTRE.
12.30 – 13.00Inloop en lunch – 13.15Welkom en toelichting Open Toegang/Semantiek – 14.30Korte presentaties ( minuten per stuk)
Op weg naar een design for all? UNIVERSEEL ONTWERP IN DE KLAS 1.
Erfgeo.nl Historische geocoder Niene Boeijen Erfgoed en Locatie Waag society.
COINS 2.0 Hoofdlijnen Hans Schevers
GBIF NODES Committee Meeting Copenhagen, Denmark 4 th October 2009 De GBIF Integrated Publishing Toolkit Alberto GONZÁLEZ-TALAVÁN Programme Officer for.
Modificatie van Galaxy voor Next-Generation Sequencing Bataillie Michiel 2010 – 2011 Bachelorproef Hoge School West-Vlaanderen Dept. Simon Stevin.
Door Ben Cokelaere, student Howest Galaxy pipelines voor de analyse van omics data.
Moeten we onze content door laten indexeren? Kluwerlab.nl.
Het uitbreiden van BOINQ met data upload en conversie mogelijkheden Timothy Vieren Genohm, Technologiepark Zwijnaarde.
Forum Standaardisatie Het belang van open standaarden Presentatie voor FOBID RDA bijeenkomst 29 september 2016 Marijke Abrahamse.
Voor bibliotheken. Training AquaBrowser Zoetermeer, 20 mei 2010.
Smart Logistics Theo Stevens Expeditiemiddag
Linked Open Data Statistics Belgium Kennismiddag – 20/03/2017
Smart Cities ICT en IoT Groep 1: Roy, Mario en René.
Hoe werkt bibliografische software?
Korte Handleiding Slim
Hoe maken wij het onderwijs aantrekkelijker voor doubleurs in havo 4?
Wat zijn de effecten van (intersectorale) samenwerking?
Qompas StudieKeuze De online gids voor studiekeuze en loopbaanoriëntatie Informatieavond voor ouders.
“Orkaan Irma bereikt Florida” Joey Pleunis & Christian Makkinga
Zoek de humane hemoglobine subunit beta op in de UniprotKB/Swiss-Prot databank. Wat is het accessienummer van dit eiwit? P68871.
Break-outsessie Digitale Bronnen
AmsterdaMaps Delen is beter dan vermenigvuldigen
Wat is al mogelijk en wat mogen we verwachten
Procesondersteuning binnen de sociale zekerheid
Ronde 1: Conversie Wie zorgt er voor onze data?
Railinspectie op (de) kaart
Transcript van de presentatie:

INTEGRATIE EN SEMANTISCHE CONVERSIE VAN AUTISME GERELATEERDE GENDATA IN EEN LINKED DATA OMGEVING Sven Buyse Stagementor: Ir. Filip Pattyn (ONTOFORCE) Stagegever: Dhr. Hans Constandt Promotor: Dhr. Jasper Decuyper (HOWEST)

OVERZICHT - ONTOFORCE - DISQOVER - ONDERZOEKSVRAAG - BRONNEN - SCRAPING - CSV naar RDF-conversie - RESULTATEN - CONCLUSIE 2

ONTOFORCE Situering bedrijfs(contact): - Vergevorderde start-up - Gent(/Hasselt) - Innovatief binnen bio-informatica sector - DISQOVER - Linken van biologische data - Bedrijfscontact: back-end 3

DISQOVER Semantische webomgeving: - Linked Open Data - Oplossing problemen relationele databank - Data in triples - Triples worden gelinkt aan elkaar bij object1=subject2 4

Mogelijkheid tot: - Integratie autisme gerelateerde gendata in DISQOVER ? - Sortering zoekresultaten volgens relevantie? ONDERZOEKSVRAAG 5

AUTISME GERELATEERDE GENDATA BRONNEN AutDB: - Meest up-to-date - Bevat autisme gen informatie over: Human Genes (HG) Animal Model (AM Eiwit interacties (PIN) CNV’s SfariGene: - Bevat alle info van AutDB - Genen krijgen autisme relevantiescore  Data niet downloadbaar 6

Datafiltering  Xpath-functie - Python script - Lxml bibliotheek - HTML-pad herkenning - Verkrijgen data via opgegeven pad - Datacorrecties met reguliere expressie  Data opslaan: CSV-formaat SCRAPING 7

RESOURCE DESCRIPTION FRAMEWORK (RDF) - Formaat voor semantisch web integratie - RDF-formaat bevat triples - Unique Resource Identifier (URI) - TURTLE-bestand 8

CONVERSIE CSV-RDF Python: RDFLib - CSV inlezen met csv-bibliotheek - Gendata  Genklasse - Genklasse data  Graph = creatie triples - Blank Node  meerdere gegevens koppelen aan gen 9

RESULTATEN 1.Hoofdgendata 10 2.Extra geninformatie (met nesting)

RESULTATEN 11

CONCLUSIE 12 -Data werd verkregen van AutDB en SfariGene via scraping -Geconverteerd naar CSV-formaat -Hierna werd data omgezet in RDF-formaat -Triples werden verkregen -DISQOVER bied sorteringsmogelijkheid  ONDERZOEKSVRAAG positief beantwoord

TOEKOMSTVISIE Integratie in DISQOVER -Optimalisatie efficiëntie scraping scripts -Integratie in DISQOVER: -Zorgt voor mogelijkheid relevantiesortering bij autisme genen zoektocht -Zorgt voor creatie nieuwe “Links for Lives” -Slimmer zoeken met relevanties  nieuwe inzichten  autisme onderzoek wordt efficiënter gevoerd 13

Bedankt voor uw aandacht! 14