Download de presentatie
De presentatie wordt gedownload. Even geduld aub
GepubliceerdAnna Aerts Laatst gewijzigd meer dan 8 jaar geleden
1
door Ben Cokelaere, student Howest Galaxy pipelines voor de analyse van omics data
2
Inhoudstafel 1. Doel 2. Galaxy 3. Tijdspad / Methodologie 4. Resultaten Toolintegratie Tools Bioinformatics Laboratory 5. Discussie 6. Conclusie
3
Doel van het project 1. Toolintegratie in Galaxy bestuderen 2. Tools Bioinformatics Laboratory terug functioneel krijgen
4
Galaxy Galaxy: Gratis software framework Tools voor gebruikers zonder programmeerervaring
5
Galaxy (https://usegalaxy.org/)
6
Tijdspad / Methodologie In chronologische volgorde: Aanleren van R en Python Eigen Galaxy omgeving opzetten Onderzoek naar het opladen van tools Tools terug werkend krijgen
7
Resultaten: Tool integratie Galaxy Toolshed
8
Resultaten: Tool integratie Installeren van eigen tool Benodigdheden: Dezelfde bestandsmap ! Script (R, Perl, Python …) Tool definition file (XML)
9
Resultaten: Tool integratie for each sequence in a file toolExample2.pl $input $output This tool computes GC content from a FASTA file.
10
Tool Integration: Eigen tool GC-teller van een willekeurige sequentie in FASTA formaat
11
Tool Integratie: Eigen tool Sequentie: >gi|612408096|gb|KF801065.1| Crocidura paradoxura voucher FMNH212885 breast cancer susceptibility 1 (BRCA) gene, partial GAACCCCTTTATGGAAGAAGAAAACTGAATAAACAGAAATTGTCATGCTCTGACAGCCCTGAG GATCCCCAAGAGATGACTTGGATGACTTCGAAGAGTAGCCTACAGAAAGTTAATGATTGGTTT TCTAGAAGTGATGATGTATTAACTTCTGATGATTTCCATGATGCAGGGTCTAATTCAAATACAA AAGCTGAGACAGAAGAAATCCCAAGTGCAGCAGATGGGTTTTTTGTTTCTTCAGAGAAAGAA GATTTAATGGCCAGTGATCAGTGTGATGCTTTAATGTATGAAAGTAGCAGAGTCCTCTCCAAA CCAGTAGAGAGTAGCATTGAAGATAAAATATTTGGGAAAACTTATCGGAGGAAAGCAAGCTTC CCTAACTTGAACTGCACAACTGAAGATGTAACTCTAGAATCATCTCTACTAGAACCGCATATGG CACACAAACACCCCTTCACAAATAAATTAAAACGTAAAAGAAGAATTGCATCAAGCCTTGGTC CTGAGGATTTTATAAAGAAAGTAGATTTGACAGTTGTTCAAAAGTCTCCTGAAAATAAAATCGA GAGGCTCGACCAAATGGAT Output:
12
Resultaten: Bioinformatics Tools Galaxy workflow
13
Resultaten: Bioinformatics Tools Galaxy workflow
14
Aanmaak van de ExpressionSet Opgelet: Door het toevoegen van het datatype Rdata is het ook mogelijk om rechtstreeks een ExpressionSet op te laden zonder gebruik te maken van bovenstaande tools Soort toolFunctieBenodigdhedenOutput APMLtoExpressionSetAPML bestand ExpressionSet 1)APMLfile 2)Experimentaldesign file ExpressionSet (Rdatabestand) TabletoExpressionSetTab-gescheiden data ExpressionSet 1)Data in tab- gescheiden formaat 2)Experimentaldesign file ExpressionSet (Rdatabestand)
15
Resultaten: Bioinformatics Tools Galaxy workflow
16
Analyse van de ExpressionSets Soort toolFunctieBenodigdhedenOutput ClassificationAnalysisClassificatiemethodes voor dataineen ExpressionSet 1)ExpressionSetResultfile (Rdata bestand) Differential ExpressionAnalysis Test opdifferentiële expressie kenmerken in een ExpressionSet 1)ExpressionSetTekstbestandmet resultaten in tab- gescheidenkolommen QualityMetricsAanmaken van HTML kwaliteitsrapport van data inExpressionSet 1)ExpressionSetHTML bestand dat het kwaliteitsrapport weergeeft QualityControlUitvoeren van kwaliteitscontroleop de data van eenExpressionSet 1)ExpressionSetZip file met afbeeldingen (clusterdendrogramme n,correlatiematicres, …)
17
Resultaten: Bioinformatics Tools Galaxy workflow
18
Rapportage Soort toolFunctieBenodigdhedenOutput Classification Report Deze tool zet de output van de Classification Analysis tool om in een HTML bestand. 1)Resultfile van de Classification Analysis tool HTML bestand waarin afbeeldingen (histogrammen, boxplots, …)van de gekozen classificatiemethode in voorgesteld worden
19
Discussie Alle tools terug operationeel in Galaxy Workflow werkt terug Classification Analysis tool werkt niet voor alle classificatiemethodes: → verschillende errors per opgeladen dataset per classificatiemethode waardoor precieze fout in de code moeilijk te bepalen was
20
Conclusie Wetenschappers zonder programmeerervaring die computationele data analyse willen uitvoeren? → Galaxy Maar wat als men persoonlijke aanpassingen wil aanbrengen aan de uitgevoerde analyse? → Programmeertaal nodig ! ↓ In de toekomst: programmeertaal zoals R aanleren is geen overbodige luxe; tools kunnen zelf geschreven of aangepast worden
21
door Ben Cokelaere, student Howest Galaxy pipelines voor de analyse van omics data
Verwante presentaties
© 2024 SlidePlayer.nl Inc.
All rights reserved.