Door Ben Cokelaere, student Howest Galaxy pipelines voor de analyse van omics data.

Slides:



Advertisements
Verwante presentaties
RECLAME OP INTERNET ASCC Clubmiddag 15 april 2014.
Advertisements

Wat Voorstellen Beperkte inleiding toetsen in Wat maakt oefentoetsen leuker dan Facebook Toetsen maken Mijn fouten.
Nieuws en anders in Blackboard 9.1. In grote lijnen  Achterliggend: grote veranderingen  Voor meeste gebruikers transparant  Focus op cursusinhoud.
Symbaloo is de leukste en makkelijkste start op internet
Handboek verzenden van Nieuwsbrief Caribbean.nl 12 september 2012 •Ga naar CMS •Kies Nieuwsbrief Caribbean.nl.
Embedded systemen Embedded software.
Module: Delicious • Verzameling ‘favorieten of bookmarks’ • Eenvoudig om eigen bookmarks bij te houden • Je kan er overal aan (waar internet is) • Gebruikt.
Stijn Hoppenbrouwers Software Engineering les 1 Algemene inleiding en Requirements Engineering.
Portfolio Website Tim Klijn Klas: MBI m1 Datum: 21 november 2007
Installatie & beheer Jonathan Mohnen Martijn Wolfs.
Databases via internet
Metadata proces april 2009 train de trainers. Waar in het werkproces metadata Binnen de organisatie zal afgesproken moeten worden van welke data er metadata.
Hoofdstuk 10 Onderzoeken met SPSS en MS Excel
DokPlan.
WELKOM! Les 1 Vandaag 1.Voorstellen 2.Inhoud en doel cursus 3.Inleiding website 4.Benodigde software 5.Inleiding HTML 6.Huiswerk 7.Afwas ☺
Afdeling/Naam Meervoudige installatie van Futurion op een netwerk Z:\Futurion.
Practica Computerlinguistiek Tekst en uitleg:
Sneeuwschuivers en leren sneeuwschuiven myResearch Portal en het belang van workflow data analyse Richard L. Zijdeman DAI: info:eu-repo/dai/nl/
Nieuw in LIPS VLUG 2 26 juni 2006 Kristof Brams. Overzicht Vernieuwde editor Printervriendelijke pagina Statistieken Variabele fontgrootte Grootte van.
SIP File Recovery Tool. Agenda 18/10/2006Maken agenda + onderzoeken van verschillende filetypes 25/10/2006Uitzoeken hoe er effecient gelezen en geschreven.
Testen Blackboard Marjana Rhebergen.
Statistieknetwerk – introductie Jan Verkade 3 maart 2009.
First ID project Samen werken aan een veilige omgeving Introductiepresentatie.
Your GateWay to the Finest Academic Research papers in the Netherlands Technische aspecten: de ARNO archive server Thomas Place KUB.
Deel XXI 1 Internetapplicaties Internetprogrammeren Capita Selecta.
Een introductie. Stap-voor-stap Eerste keer kan je verdwaald raken: Uitleg via presentatie – Uitvoeren Uitleg via presentatie – Uitvoeren Uitleg via presentatie.
Client-side scripting. 1.Scripting in webpagina’s 1. Verschillende talen VB: toepassingen in Windowsomgeving VBA: toepassingen in MS-Office VBScript internet.
Project Text To Speech Wat houdt het text-to-speech project in
Page 1 HiSPARC FPGA & software aanpassingen Rais Mense.
Wat is WordPress en hoe installeer je het?. Wat is WordPress? WordPress is een CMS (Content Management Systeem) net als Joomla; Met een CMS kan een gebruiker.
Starten met PHP Dynamischer bouwen. PHP is een een scripttaal waarmee de server pagina’s in elkaar kunt laten zetten. Het verschil met HTML: Een php pagina.
TOOLS FOR STRUGGLING WRITERS ASSISTIVE TECHNOLOGY FOR WRITING Evy Jansen.
Starten met PHP Dynamischer bouwen.
Modelleren van XML element content of Hoe doe je dat? Harrie Passier & Bastiaan Heeren TouW-dag 13 november 2010.
De bibliotheek je keert tevreden terug Bart vercruyssen (VCOB) Maja Coltura (VCOB) Dieter Vandenbroeck (TOR)
Experimentele kans javascript.
Fase 2 – Functioneel ontwerp
Leervragen in een PLG PLG bijeenkomst 17 november 2014
Spreadsheets. Testen. Met spreadsheets.. |  Spreadsheet, het meest gebruikte (test) tool in de wereld …  Aan de slag: Spreadsheet PRA  Risico’s en.
Geowebservices Cijfers zonder grenzen Pieter Bresters 26 mei 2011.
Reclaiming academic output. De beschikbaarheid van de Nederlandse wetenschappelijke productie Conclusies.
Datum Task Force Architectuur development in 2008.
Empirical librarianship ceci n’est pas un texte De bibliotheek als onderzoeker Workshop: presentatie en handleiding Jeroen Bosman & Bianca Kramer Universiteitsbibliotheek.
Automatische builds vanuit ClearCase UCM 1 Visual & Integrated Build Engine Automatische builds vanuit ClearCase en UCM Download ClearVibe Light Download.
Inloggen >> Gegevensaanlevering en controle in Peridos In Release 3.3 van Peridos is er een nieuwe module gebouwd voor het aanleveren en bekijken van gegevens.
1 cijfer uit 8 miljoen records Resultaten uit het 1-cijfer-traject Arjan Biemans (HBO-raad) Dair-seminar 6 november 2003.
C++ Les 1: introductie. Programmeren Programma’s scripts Websites libraries (Sound, GUI, netwerking…)
INTEGRATIE EN SEMANTISCHE CONVERSIE VAN AUTISME GERELATEERDE GENDATA IN EEN LINKED DATA OMGEVING Sven Buyse Stagementor: Ir. Filip Pattyn (ONTOFORCE) Stagegever:
Modificatie van Galaxy voor Next-Generation Sequencing Bataillie Michiel 2010 – 2011 Bachelorproef Hoge School West-Vlaanderen Dept. Simon Stevin.
Art-Kadia Door: Boy, Sebastiaan, Benjamin en Thomas.
RNA-Seq data-analyse pipeline integratie in GALAXY Van Middelem Robin.
TICKETMANAGEMENTPLAT FORM NEWCO BVBA GENERAAL DE WITTELAAN MECHELEN
Programmeren met Reeksen
Hoe werkt bibliografische software?
Student: Christof Dolphens Mentor: Dr. Jomjai Peerapattana
= Data management Voor uitvoering en communicatie Informatie tijdens het ontwerp- en het bouwproces Werken met het InfraModel Het begin van de verandering!
Programmeren woensdag 4 oktober 2017.
Tool II-2: Het plannen van OL, leerlingen stellen hun eigen vragen
Lectora als ontwikkeltool voor interactieve multimedia programma’s
Syntactische Annotatie CHILDES
Aan de slag met Moodle Les 1. Kennismaking Schermonderdelen en navigatie Voorkeuren aanpassen: profiel, wachtwoord Cursusbeheer: cursusinstellingen en.
Embedded systemen Programmeren op de Arduino Les 1
Blackboard Testproces
Is testen een project op zich?
Wandelen en fietsen met gps
Hoofdstuk 8 Taakcluster Strategisch support
Continuous Integration and Continuous Deployment
Hoofdstuk 10 Onderzoeken met SPSS en MS Excel
Onderzoekend leren Werkt onderzoekend leren (OL)?
Transcript van de presentatie:

door Ben Cokelaere, student Howest Galaxy pipelines voor de analyse van omics data

Inhoudstafel 1. Doel 2. Galaxy 3. Tijdspad / Methodologie 4. Resultaten  Toolintegratie  Tools Bioinformatics Laboratory 5. Discussie 6. Conclusie

Doel van het project 1. Toolintegratie in Galaxy bestuderen 2. Tools Bioinformatics Laboratory terug functioneel krijgen

Galaxy Galaxy:  Gratis software framework  Tools voor gebruikers zonder programmeerervaring

Galaxy (

Tijdspad / Methodologie In chronologische volgorde: Aanleren van R en Python Eigen Galaxy omgeving opzetten Onderzoek naar het opladen van tools Tools terug werkend krijgen

Resultaten: Tool integratie Galaxy Toolshed

Resultaten: Tool integratie Installeren van eigen tool Benodigdheden: Dezelfde bestandsmap ! Script (R, Perl, Python …) Tool definition file (XML)

Resultaten: Tool integratie for each sequence in a file toolExample2.pl $input $output This tool computes GC content from a FASTA file.

Tool Integration: Eigen tool GC-teller van een willekeurige sequentie in FASTA formaat

Tool Integratie: Eigen tool Sequentie: >gi| |gb|KF | Crocidura paradoxura voucher FMNH breast cancer susceptibility 1 (BRCA) gene, partial GAACCCCTTTATGGAAGAAGAAAACTGAATAAACAGAAATTGTCATGCTCTGACAGCCCTGAG GATCCCCAAGAGATGACTTGGATGACTTCGAAGAGTAGCCTACAGAAAGTTAATGATTGGTTT TCTAGAAGTGATGATGTATTAACTTCTGATGATTTCCATGATGCAGGGTCTAATTCAAATACAA AAGCTGAGACAGAAGAAATCCCAAGTGCAGCAGATGGGTTTTTTGTTTCTTCAGAGAAAGAA GATTTAATGGCCAGTGATCAGTGTGATGCTTTAATGTATGAAAGTAGCAGAGTCCTCTCCAAA CCAGTAGAGAGTAGCATTGAAGATAAAATATTTGGGAAAACTTATCGGAGGAAAGCAAGCTTC CCTAACTTGAACTGCACAACTGAAGATGTAACTCTAGAATCATCTCTACTAGAACCGCATATGG CACACAAACACCCCTTCACAAATAAATTAAAACGTAAAAGAAGAATTGCATCAAGCCTTGGTC CTGAGGATTTTATAAAGAAAGTAGATTTGACAGTTGTTCAAAAGTCTCCTGAAAATAAAATCGA GAGGCTCGACCAAATGGAT Output:

Resultaten: Bioinformatics Tools Galaxy workflow

Resultaten: Bioinformatics Tools Galaxy workflow

Aanmaak van de ExpressionSet Opgelet: Door het toevoegen van het datatype Rdata is het ook mogelijk om rechtstreeks een ExpressionSet op te laden zonder gebruik te maken van bovenstaande tools Soort toolFunctieBenodigdhedenOutput APMLtoExpressionSetAPML bestand ExpressionSet 1)APMLfile 2)Experimentaldesign file ExpressionSet (Rdatabestand) TabletoExpressionSetTab-gescheiden data ExpressionSet 1)Data in tab- gescheiden formaat 2)Experimentaldesign file ExpressionSet (Rdatabestand)

Resultaten: Bioinformatics Tools Galaxy workflow

Analyse van de ExpressionSets Soort toolFunctieBenodigdhedenOutput ClassificationAnalysisClassificatiemethodes voor dataineen ExpressionSet 1)ExpressionSetResultfile (Rdata bestand) Differential ExpressionAnalysis Test opdifferentiële expressie kenmerken in een ExpressionSet 1)ExpressionSetTekstbestandmet resultaten in tab- gescheidenkolommen QualityMetricsAanmaken van HTML kwaliteitsrapport van data inExpressionSet 1)ExpressionSetHTML bestand dat het kwaliteitsrapport weergeeft QualityControlUitvoeren van kwaliteitscontroleop de data van eenExpressionSet 1)ExpressionSetZip file met afbeeldingen (clusterdendrogramme n,correlatiematicres, …)

Resultaten: Bioinformatics Tools Galaxy workflow

Rapportage Soort toolFunctieBenodigdhedenOutput Classification Report Deze tool zet de output van de Classification Analysis tool om in een HTML bestand. 1)Resultfile van de Classification Analysis tool HTML bestand waarin afbeeldingen (histogrammen, boxplots, …)van de gekozen classificatiemethode in voorgesteld worden

Discussie Alle tools terug operationeel in Galaxy Workflow werkt terug Classification Analysis tool werkt niet voor alle classificatiemethodes: → verschillende errors per opgeladen dataset per classificatiemethode waardoor precieze fout in de code moeilijk te bepalen was

Conclusie Wetenschappers zonder programmeerervaring die computationele data analyse willen uitvoeren? → Galaxy Maar wat als men persoonlijke aanpassingen wil aanbrengen aan de uitgevoerde analyse? → Programmeertaal nodig ! ↓ In de toekomst: programmeertaal zoals R aanleren is geen overbodige luxe; tools kunnen zelf geschreven of aangepast worden

door Ben Cokelaere, student Howest Galaxy pipelines voor de analyse van omics data