Modificatie van Galaxy voor Next-Generation Sequencing Bataillie Michiel 2010 – 2011 Bachelorproef Hoge School West-Vlaanderen Dept. Simon Stevin.

Slides:



Advertisements
Verwante presentaties
Dimitri Brosens & Bart Goossens Informatie & Datacentrum INBO OMGAAN MET ONDERZOEKSDATA: INBO.
Advertisements

Wideband Delphi methode
Overzicht Sessie 1 Inleiding
Document Management Silicon.
SSD gebruik in “WMC“ Nico Oosterwijk.
Virtualisatie in de praktijk met Hyper-V
Bepalen van een productstrategie ten aanzien van 64-bits computing ISV Community Day Schiphol-Rijk, Andreas de Ruiter Developer & Platform Group.
E-RADEN Roadmap. AGENDA • Overzicht van nieuwe ontwikkelingen 2009 • Interfaces • Document Types : Meta-data • E-raden gratis ? • Perspectieven.
EDC ervaringen op de werkvloer – fase I/IIa
Windows Server 2012 Optimaliseer uw IT. Ready for the Future.
Dr. ir. Kurt Lust VSC-coördinator.
Easy Bis Bestuursdienst Informatie Systeem Van agendapunt tot besluit Met automatische internet publicatie.
DokPlan.
17 april 2008 WAB*info De digitale bron van de Nederlandse waterbodems Gaston Lamaitre Data-ICT-Dienst, Delft Uitvoerders: Atlis (hoofdaannemer), CSO (functioneel.
Practica Computerlinguistiek Tekst en uitleg:
Steven Van Acker. Transmeta Crusoe - Steven Van Acker - Mei Overzicht  Inleiding  Het Idee  De Technologie  CodeMorphing  LongRun  NorthBridge.
Dries Harnie 3 e bach Computerwetenschappen Workshop 2: Integratie van Polyglot en smalltalk.
Statistiek ?! … Ronald Buyl - BISI.
Centrum voor proces- en productontwikkeling Samenhang taxonomie XBRL-NL met Auditfile en Winstaangifte.
Praktijk case: “Geautomatiseerd scannen én verwerken van ingekomen facturen” ICT Platform.
Subversion Version control
College Beslissingsondersteuning Marakas H6,7 en 11 Robert de Hoog Programmagroep SWI Universiteit van Amsterdam.
Power PC Assembler. Assembler toolkit bevat Assembler zelf Linkerlibrarian.
Strategische managementinformatie met Project, Visio en Excel 2007
Your GateWay to the Finest Academic Research papers in the Netherlands Technische aspecten: de ARNO archive server Thomas Place KUB.
Centrum voor proces- en productontwikkeling Het XML platform Samenwerking rond AUDITFILE Theo Klarenbeek 8 maart 2006 XML platform.
Tool voor maandelijkse risico rapportage
M A K E Y O U R N E T W O R K S M A R T E R July, Middag programma.
Backup scripting met robocopy
De kracht van OES2 op Linux!. Agenda Sterke punten van OES2 Beheer OES2, hoe ziet dit er uit? Producten in OES2 Nieuw in OES2 SP1 (nov/dec 2008) Migratie.
Samenhang taxonomie XBRL-NL met Auditfile en Winstaangifte
Elobase Kerntaak 2, Hoog Omgevingsanalyse
Indoor navigation Presentatie Increment 3 EII6RTa Ingmar te Raa
Hoofdstuk 7 ERP-systemen: human resources Enterprise Resource Planning © Pearson Education, 2007; Enterprise Resource Planning door Mary Sumner.
Geïntegreerde praktijkanalyse: de Bandon Group Enterprise Resource Planning © Pearson Education, 2007; Enterprise Resource Planning door Mary Sumner.
Les 1: Zaterdag 10 mei 2014 Wim Peeters
APP Platform Rivium, 5 maart 2013 Rik Vietsch.
Virtualisatie systemen
WapliX Webdatabases New generations of applications.
Datum Task Force Architectuur development in 2008.
Facet offline installatie
RFLPs SNPs Micro-array
Project Architectuur en Beheer BI2-DT en Inf2-DT Module CMIPRJ25DT George Pluimakers en Jacques Wetzels Studiejaar 2010/2011 Opdracht 3.
123 Belangrijke voordelenWat is het? End-to-end mogelijkheden Creëer en versterk autonome flexibele teams Plaats kwaliteit centraal in alles wat u doet.
Automatische builds vanuit ClearCase UCM 1 Visual & Integrated Build Engine Automatische builds vanuit ClearCase en UCM Download ClearVibe Light Download.
Adapter voor industriële wireless sensor netwerken Student: Glen Vanroelen Interne promotor: Tim Dams Externe promotor: Kevin Heylen (Intation)
+ Praktijkscasus Business Intelligence Dashboard in de thuiszorg.
DS WebUren presentatie. DS WebUren Sumatra DS WebUren is een Webbased urenregistratie oplossing, waarmee (externe) medewerkers op een snelle en gebruiksvriendelijke.
1 VMWare. 2 Introductie VMware Fysieke server ESX-server Virtuele machines Ongewijzigde toepassing Ongewijzigd besturingssysteem Virtuele hardware.
DS WebShop presentatie. DS WebShop beheer stamgegevens, artikelen en prijzen vanuit Exact beheer stamgegevens, artikelen en prijzen vanuit Exact real-time.
Bra1 STUDENTMOBILITEIT Eindrapport Andre Brands – 4 augustus 2015.
Print & Scan Wat kan ik leren uit print & scan analyses over mijn meerkeuzeexamen? Lisa De Jonghe O 2 : dienst Onderwijs Ondersteuning.
Integrated Software for Real Estate, Facility & Workplace Management 1 myMCS Energy Energiebeheer van de toekomst.
INTEGRATIE EN SEMANTISCHE CONVERSIE VAN AUTISME GERELATEERDE GENDATA IN EEN LINKED DATA OMGEVING Sven Buyse Stagementor: Ir. Filip Pattyn (ONTOFORCE) Stagegever:
PRESENT.ME PRESENTATIE ALS VERVANGING VAN DE LEERKRACHT?
De Ruimtemonitor Vlaanderen SADL Thérèse Steenberghen Diederik Tirry 25 januari 2012.
April 20, 2015 FEWS Lunchlezing Delft-FEWS Database Analyse Marc van Dijk.
Adrem Software.  Key Features  Monitoring  Visualisatie  Alerting  Reporting  Console  Praktisch  Server requirements  Databases  Licensing.
Door Ben Cokelaere, student Howest Galaxy pipelines voor de analyse van omics data.
RNA-Seq data-analyse pipeline integratie in GALAXY Van Middelem Robin.
Het uitbreiden van BOINQ met data upload en conversie mogelijkheden Timothy Vieren Genohm, Technologiepark Zwijnaarde.
Virtualisatie 29 sept 2012 Een wegwerpcomputer met VirtualBox
Software Development fundamentals
Energiemangement industrie
= Data management Voor uitvoering en communicatie Informatie tijdens het ontwerp- en het bouwproces Werken met het InfraModel Het begin van de verandering!
STO 2006 Hogeschool Utrecht Kick-off presentatie 23 februari 2006.
Aura Software: meer dan 25 jaar thuis in schoolmediatheken
Procesondersteuning binnen de sociale zekerheid
Azure Data Factory Henry
Transcript van de presentatie:

Modificatie van Galaxy voor Next-Generation Sequencing Bataillie Michiel 2010 – 2011 Bachelorproef Hoge School West-Vlaanderen Dept. Simon Stevin

 Stageplaats  Project  Galaxy  High-Throughput Sequencing  Resultaten  Besluit Overzicht

 VIB – BITS Bioinformatics Training and Service Facility  support aan alle onderzoeksdepartementen binnen het VIB Stageplaats

Project  Nieuwe server  Klaarzetten van server voor gebruik binnen het VIB voor analyse van biologische data  BITS Galaxy server

 Specificaties 12 CPU – 24 cores 96 GB RAM  Hoofdbesturingssysteem: Red Hat Enterprise Linux 6  KVM  OS werkt virtueel op server  Virtuele machines  CentOS = guest OS  Iedere virtuele machine heeft eigen specifiek doel Default Galaxy  ongewijzigd Development Galaxy  ontwikkelen … Server

 Webplatform voor managen van: Bio-informatica tools Datasets Analyses  Voordelen: Applicaties verzameld op één plaats  gebruiksvriendelijk Workflows/pijplijn Reproduceerbaarheid Galaxy

Lijst van tools Framework Galaxy

Werkpaneel

Framework Galaxy Geschiedenis Output bekijken in werkpaneel

High-Throughput sequencing  BITS Galaxy server  tools gericht op High-Throughput Sequencing (HTS)  Next-Generation Sequencing (NGS)  tweede generatie sequentieplatformen  Genereert miljoenen kleine sequentiefragmenten (= reads) in korte tijdspanne Illumina (HiSeq)  korte fragmenten: 50 – 150 bp  gigabasen / run AB (SOLiD)  korte fragmenten: 60 – 90 bp  gigabasen / run Roche (454)  lange fragmenten: 300 – 800 bp  megabasen / run

Mapping  Mapping = alignering korte nucleotide sequenties (reads) tegen een referentie sequentie (bv.: humaan genoom)  Mapping in Galaxy  duurt uren tot dagen  Mappers = Applicatie om reads te aligneren Bowtie BWA BFAST LastZ MAQ …  Elke mapper is efficiënter in mappen van reads met specifieke lengte  Input: FASTQ  Output: SAM file

Mapping  FASTQ  Iedere read = 4 lijnen 1 ste lijn: begint steeds met dan omschrijving + naam van fragment 2 de lijn: ruwe sequentie in lettertekens 3 de lijn: begint altijd met ‘+’ 4 de lijn: kwaliteitswaarden voor sequentie op lijn 2  lengte lijn 4 = lengte lijn 2  ieder symbool (ASCII) representeert numerieke waarde = kwaliteitsscore

Mapping  SAM = Sequence Alignment Map  Algemeen formaat voor het opslaan van de resultaten van mappers Alignment informatie van sequenties tegen referentiegenomen Hoofdsectie en aligneringssectie Formaat ondersteunt short & long reads

Resultaten  BITS Galaxy server  zelf tools ontwikkelen  implementeren Histogram tool  “oefening” CG Graph Reports tool  rapport met grafieken Script Install tool  installeert tools vanuit interface IGV tool  integratie van IGV in Galaxy Monitor tool  benchmarking mappers

 Ontwikkeling van tools: script + xml Perl Python Bash (Linux) Implementeren van tools in Galaxy

IGV tool  Input: BAM file = Binary Alignment Map  Binaire representatie van SAM file  exact dezelfde informatie  maar omvang kleiner  schijfruimte besparen  Output: IGV (= genoombrowser) met BAM file en vooringestelde parameters

IGV tool  Galaxy conferentie: 25 – 26 mei  IGV integratie onlangs aanwezig  Toegevoegd in release van 8 april 2011

Monitor tool  Benchmarking mappers  Monitor CPU verbruik RAM verbruik Tijd SAM analyse

Monitor tool  Twee outputs: SAM file = normale output Mapping report = extra output

NBIC Benchmark tool  Netherlands Bioinformatics Centre (NBIC)  Andere aanpak: Aparte tool Geïntegreerd in mappers

NBIC Benchmark tool  Perl  Wrapper script  herschreven  Mappers: BWA MAQ  SAM analyse: uitvoeriger aantal juist gemapped aantal verkeerd gemapped aantal niet gemapped  Python  Wrapper script  behouden  Mappers: Bowtie BWA BFAST LastZ …  SAM analyse: eenvoudig unique + multiple hits Eigen Monitor tool

Besluit  Galaxy  flexibel platform met veel mogelijkheden  Analyses gemakkelijk door gebruik van workflows  Reproduceerbaarheid  Default Galaxy & Development Galaxy operationeel  Production Galaxy  Benchmarking mappers

Modificatie van Galaxy voor Next-Generation Sequencing Bataillie Michiel 2010 – 2011 Bachelorproef Hoge School West-Vlaanderen Dept. Simon Stevin