De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

Door Ben Cokelaere, student Howest Galaxy pipelines voor de analyse van omics data.

Verwante presentaties


Presentatie over: "Door Ben Cokelaere, student Howest Galaxy pipelines voor de analyse van omics data."— Transcript van de presentatie:

1 door Ben Cokelaere, student Howest Galaxy pipelines voor de analyse van omics data

2 Inhoudstafel 1. Doel 2. Galaxy 3. Tijdspad / Methodologie 4. Resultaten  Toolintegratie  Tools Bioinformatics Laboratory 5. Discussie 6. Conclusie

3 Doel van het project 1. Toolintegratie in Galaxy bestuderen 2. Tools Bioinformatics Laboratory terug functioneel krijgen

4 Galaxy Galaxy:  Gratis software framework  Tools voor gebruikers zonder programmeerervaring

5 Galaxy (https://usegalaxy.org/)

6 Tijdspad / Methodologie In chronologische volgorde: Aanleren van R en Python Eigen Galaxy omgeving opzetten Onderzoek naar het opladen van tools Tools terug werkend krijgen

7 Resultaten: Tool integratie Galaxy Toolshed

8 Resultaten: Tool integratie Installeren van eigen tool Benodigdheden: Dezelfde bestandsmap ! Script (R, Perl, Python …) Tool definition file (XML)

9 Resultaten: Tool integratie for each sequence in a file toolExample2.pl $input $output This tool computes GC content from a FASTA file.

10 Tool Integration: Eigen tool GC-teller van een willekeurige sequentie in FASTA formaat

11 Tool Integratie: Eigen tool Sequentie: >gi|612408096|gb|KF801065.1| Crocidura paradoxura voucher FMNH212885 breast cancer susceptibility 1 (BRCA) gene, partial GAACCCCTTTATGGAAGAAGAAAACTGAATAAACAGAAATTGTCATGCTCTGACAGCCCTGAG GATCCCCAAGAGATGACTTGGATGACTTCGAAGAGTAGCCTACAGAAAGTTAATGATTGGTTT TCTAGAAGTGATGATGTATTAACTTCTGATGATTTCCATGATGCAGGGTCTAATTCAAATACAA AAGCTGAGACAGAAGAAATCCCAAGTGCAGCAGATGGGTTTTTTGTTTCTTCAGAGAAAGAA GATTTAATGGCCAGTGATCAGTGTGATGCTTTAATGTATGAAAGTAGCAGAGTCCTCTCCAAA CCAGTAGAGAGTAGCATTGAAGATAAAATATTTGGGAAAACTTATCGGAGGAAAGCAAGCTTC CCTAACTTGAACTGCACAACTGAAGATGTAACTCTAGAATCATCTCTACTAGAACCGCATATGG CACACAAACACCCCTTCACAAATAAATTAAAACGTAAAAGAAGAATTGCATCAAGCCTTGGTC CTGAGGATTTTATAAAGAAAGTAGATTTGACAGTTGTTCAAAAGTCTCCTGAAAATAAAATCGA GAGGCTCGACCAAATGGAT Output:

12 Resultaten: Bioinformatics Tools Galaxy workflow

13 Resultaten: Bioinformatics Tools Galaxy workflow

14 Aanmaak van de ExpressionSet Opgelet: Door het toevoegen van het datatype Rdata is het ook mogelijk om rechtstreeks een ExpressionSet op te laden zonder gebruik te maken van bovenstaande tools Soort toolFunctieBenodigdhedenOutput APMLtoExpressionSetAPML bestand ExpressionSet 1)APMLfile 2)Experimentaldesign file ExpressionSet (Rdatabestand) TabletoExpressionSetTab-gescheiden data ExpressionSet 1)Data in tab- gescheiden formaat 2)Experimentaldesign file ExpressionSet (Rdatabestand)

15 Resultaten: Bioinformatics Tools Galaxy workflow

16 Analyse van de ExpressionSets Soort toolFunctieBenodigdhedenOutput ClassificationAnalysisClassificatiemethodes voor dataineen ExpressionSet 1)ExpressionSetResultfile (Rdata bestand) Differential ExpressionAnalysis Test opdifferentiële expressie kenmerken in een ExpressionSet 1)ExpressionSetTekstbestandmet resultaten in tab- gescheidenkolommen QualityMetricsAanmaken van HTML kwaliteitsrapport van data inExpressionSet 1)ExpressionSetHTML bestand dat het kwaliteitsrapport weergeeft QualityControlUitvoeren van kwaliteitscontroleop de data van eenExpressionSet 1)ExpressionSetZip file met afbeeldingen (clusterdendrogramme n,correlatiematicres, …)

17 Resultaten: Bioinformatics Tools Galaxy workflow

18 Rapportage Soort toolFunctieBenodigdhedenOutput Classification Report Deze tool zet de output van de Classification Analysis tool om in een HTML bestand. 1)Resultfile van de Classification Analysis tool HTML bestand waarin afbeeldingen (histogrammen, boxplots, …)van de gekozen classificatiemethode in voorgesteld worden

19 Discussie Alle tools terug operationeel in Galaxy Workflow werkt terug Classification Analysis tool werkt niet voor alle classificatiemethodes: → verschillende errors per opgeladen dataset per classificatiemethode waardoor precieze fout in de code moeilijk te bepalen was

20 Conclusie Wetenschappers zonder programmeerervaring die computationele data analyse willen uitvoeren? → Galaxy Maar wat als men persoonlijke aanpassingen wil aanbrengen aan de uitgevoerde analyse? → Programmeertaal nodig ! ↓ In de toekomst: programmeertaal zoals R aanleren is geen overbodige luxe; tools kunnen zelf geschreven of aangepast worden

21 door Ben Cokelaere, student Howest Galaxy pipelines voor de analyse van omics data


Download ppt "Door Ben Cokelaere, student Howest Galaxy pipelines voor de analyse van omics data."

Verwante presentaties


Ads door Google