Download de presentatie
De presentatie wordt gedownload. Even geduld aub
GepubliceerdEsmée van den Velde Laatst gewijzigd meer dan 8 jaar geleden
1
INTEGRATIE EN SEMANTISCHE CONVERSIE VAN AUTISME GERELATEERDE GENDATA IN EEN LINKED DATA OMGEVING Sven Buyse Stagementor: Ir. Filip Pattyn (ONTOFORCE) Stagegever: Dhr. Hans Constandt Promotor: Dhr. Jasper Decuyper (HOWEST)
2
OVERZICHT - ONTOFORCE - DISQOVER - ONDERZOEKSVRAAG - BRONNEN - SCRAPING - CSV naar RDF-conversie - RESULTATEN - CONCLUSIE 2
3
ONTOFORCE Situering bedrijfs(contact): - Vergevorderde start-up - Gent(/Hasselt) - Innovatief binnen bio-informatica sector - DISQOVER - Linken van biologische data - Bedrijfscontact: back-end 3
4
DISQOVER Semantische webomgeving: - Linked Open Data - Oplossing problemen relationele databank - Data in triples - Triples worden gelinkt aan elkaar bij object1=subject2 4
5
Mogelijkheid tot: - Integratie autisme gerelateerde gendata in DISQOVER ? - Sortering zoekresultaten volgens relevantie? ONDERZOEKSVRAAG 5
6
AUTISME GERELATEERDE GENDATA BRONNEN AutDB: - Meest up-to-date - Bevat autisme gen informatie over: Human Genes (HG) Animal Model (AM Eiwit interacties (PIN) CNV’s SfariGene: - Bevat alle info van AutDB - Genen krijgen autisme relevantiescore Data niet downloadbaar 6
7
Datafiltering Xpath-functie - Python script - Lxml bibliotheek - HTML-pad herkenning - Verkrijgen data via opgegeven pad - Datacorrecties met reguliere expressie Data opslaan: CSV-formaat SCRAPING 7
8
RESOURCE DESCRIPTION FRAMEWORK (RDF) - Formaat voor semantisch web integratie - RDF-formaat bevat triples - Unique Resource Identifier (URI) - TURTLE-bestand 8
9
CONVERSIE CSV-RDF Python: RDFLib - CSV inlezen met csv-bibliotheek - Gendata Genklasse - Genklasse data Graph = creatie triples - Blank Node meerdere gegevens koppelen aan gen 9
10
RESULTATEN 1.Hoofdgendata 10 2.Extra geninformatie (met nesting)
11
RESULTATEN 11
12
CONCLUSIE 12 -Data werd verkregen van AutDB en SfariGene via scraping -Geconverteerd naar CSV-formaat -Hierna werd data omgezet in RDF-formaat -Triples werden verkregen -DISQOVER bied sorteringsmogelijkheid ONDERZOEKSVRAAG positief beantwoord
13
TOEKOMSTVISIE Integratie in DISQOVER -Optimalisatie efficiëntie scraping scripts -Integratie in DISQOVER: -Zorgt voor mogelijkheid relevantiesortering bij autisme genen zoektocht -Zorgt voor creatie nieuwe “Links for Lives” -Slimmer zoeken met relevanties nieuwe inzichten autisme onderzoek wordt efficiënter gevoerd 13
14
Bedankt voor uw aandacht! 14
Verwante presentaties
© 2024 SlidePlayer.nl Inc.
All rights reserved.