De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

INTEGRATIE EN SEMANTISCHE CONVERSIE VAN AUTISME GERELATEERDE GENDATA IN EEN LINKED DATA OMGEVING Sven Buyse Stagementor: Ir. Filip Pattyn (ONTOFORCE) Stagegever:

Verwante presentaties


Presentatie over: "INTEGRATIE EN SEMANTISCHE CONVERSIE VAN AUTISME GERELATEERDE GENDATA IN EEN LINKED DATA OMGEVING Sven Buyse Stagementor: Ir. Filip Pattyn (ONTOFORCE) Stagegever:"— Transcript van de presentatie:

1 INTEGRATIE EN SEMANTISCHE CONVERSIE VAN AUTISME GERELATEERDE GENDATA IN EEN LINKED DATA OMGEVING Sven Buyse Stagementor: Ir. Filip Pattyn (ONTOFORCE) Stagegever: Dhr. Hans Constandt Promotor: Dhr. Jasper Decuyper (HOWEST)

2 OVERZICHT - ONTOFORCE - DISQOVER - ONDERZOEKSVRAAG - BRONNEN - SCRAPING - CSV naar RDF-conversie - RESULTATEN - CONCLUSIE 2

3 ONTOFORCE Situering bedrijfs(contact): - Vergevorderde start-up - Gent(/Hasselt) - Innovatief binnen bio-informatica sector - DISQOVER - Linken van biologische data - Bedrijfscontact: back-end 3

4 DISQOVER Semantische webomgeving: - Linked Open Data - Oplossing problemen relationele databank - Data in triples - Triples worden gelinkt aan elkaar bij object1=subject2 4

5 Mogelijkheid tot: - Integratie autisme gerelateerde gendata in DISQOVER ? - Sortering zoekresultaten volgens relevantie? ONDERZOEKSVRAAG 5

6 AUTISME GERELATEERDE GENDATA BRONNEN AutDB: - Meest up-to-date - Bevat autisme gen informatie over: Human Genes (HG) Animal Model (AM Eiwit interacties (PIN) CNV’s SfariGene: - Bevat alle info van AutDB - Genen krijgen autisme relevantiescore  Data niet downloadbaar 6

7 Datafiltering  Xpath-functie - Python script - Lxml bibliotheek - HTML-pad herkenning - Verkrijgen data via opgegeven pad - Datacorrecties met reguliere expressie  Data opslaan: CSV-formaat SCRAPING 7

8 RESOURCE DESCRIPTION FRAMEWORK (RDF) - Formaat voor semantisch web integratie - RDF-formaat bevat triples - Unique Resource Identifier (URI) - TURTLE-bestand 8

9 CONVERSIE CSV-RDF Python: RDFLib - CSV inlezen met csv-bibliotheek - Gendata  Genklasse - Genklasse data  Graph = creatie triples - Blank Node  meerdere gegevens koppelen aan gen 9

10 RESULTATEN 1.Hoofdgendata 10 2.Extra geninformatie (met nesting)

11 RESULTATEN 11

12 CONCLUSIE 12 -Data werd verkregen van AutDB en SfariGene via scraping -Geconverteerd naar CSV-formaat -Hierna werd data omgezet in RDF-formaat -Triples werden verkregen -DISQOVER bied sorteringsmogelijkheid  ONDERZOEKSVRAAG positief beantwoord

13 TOEKOMSTVISIE Integratie in DISQOVER -Optimalisatie efficiëntie scraping scripts -Integratie in DISQOVER: -Zorgt voor mogelijkheid relevantiesortering bij autisme genen zoektocht -Zorgt voor creatie nieuwe “Links for Lives” -Slimmer zoeken met relevanties  nieuwe inzichten  autisme onderzoek wordt efficiënter gevoerd 13

14 Bedankt voor uw aandacht! 14


Download ppt "INTEGRATIE EN SEMANTISCHE CONVERSIE VAN AUTISME GERELATEERDE GENDATA IN EEN LINKED DATA OMGEVING Sven Buyse Stagementor: Ir. Filip Pattyn (ONTOFORCE) Stagegever:"

Verwante presentaties


Ads door Google