Download de presentatie
De presentatie wordt gedownload. Even geduld aub
GepubliceerdHanne Pauwels Laatst gewijzigd meer dan 8 jaar geleden
1
Modificatie van Galaxy voor Next-Generation Sequencing Bataillie Michiel 2010 – 2011 Bachelorproef Hoge School West-Vlaanderen Dept. Simon Stevin
2
Stageplaats Project Galaxy High-Throughput Sequencing Resultaten Besluit Overzicht
3
VIB – BITS Bioinformatics Training and Service Facility support aan alle onderzoeksdepartementen binnen het VIB Stageplaats
4
Project Nieuwe server Klaarzetten van server voor gebruik binnen het VIB voor analyse van biologische data BITS Galaxy server
5
Specificaties 12 CPU – 24 cores 96 GB RAM Hoofdbesturingssysteem: Red Hat Enterprise Linux 6 KVM OS werkt virtueel op server Virtuele machines CentOS = guest OS Iedere virtuele machine heeft eigen specifiek doel Default Galaxy ongewijzigd Development Galaxy ontwikkelen … Server
6
Webplatform voor managen van: Bio-informatica tools Datasets Analyses Voordelen: Applicaties verzameld op één plaats gebruiksvriendelijk Workflows/pijplijn Reproduceerbaarheid Galaxy
7
Lijst van tools Framework Galaxy
8
Werkpaneel
9
Framework Galaxy Geschiedenis Output bekijken in werkpaneel
10
High-Throughput sequencing BITS Galaxy server tools gericht op High-Throughput Sequencing (HTS) Next-Generation Sequencing (NGS) tweede generatie sequentieplatformen Genereert miljoenen kleine sequentiefragmenten (= reads) in korte tijdspanne Illumina (HiSeq) korte fragmenten: 50 – 150 bp gigabasen / run AB (SOLiD) korte fragmenten: 60 – 90 bp gigabasen / run Roche (454) lange fragmenten: 300 – 800 bp megabasen / run
11
Mapping Mapping = alignering korte nucleotide sequenties (reads) tegen een referentie sequentie (bv.: humaan genoom) Mapping in Galaxy duurt uren tot dagen Mappers = Applicatie om reads te aligneren Bowtie BWA BFAST LastZ MAQ … Elke mapper is efficiënter in mappen van reads met specifieke lengte Input: FASTQ Output: SAM file
12
Mapping FASTQ Iedere read = 4 lijnen 1 ste lijn: begint steeds met ‘@’ dan omschrijving + naam van fragment 2 de lijn: ruwe sequentie in lettertekens 3 de lijn: begint altijd met ‘+’ 4 de lijn: kwaliteitswaarden voor sequentie op lijn 2 lengte lijn 4 = lengte lijn 2 ieder symbool (ASCII) representeert numerieke waarde = kwaliteitsscore
13
Mapping SAM = Sequence Alignment Map Algemeen formaat voor het opslaan van de resultaten van mappers Alignment informatie van sequenties tegen referentiegenomen Hoofdsectie en aligneringssectie Formaat ondersteunt short & long reads
14
Resultaten BITS Galaxy server zelf tools ontwikkelen implementeren Histogram tool “oefening” CG Graph Reports tool rapport met grafieken Script Install tool installeert tools vanuit interface IGV tool integratie van IGV in Galaxy Monitor tool benchmarking mappers
15
Ontwikkeling van tools: script + xml Perl Python Bash (Linux) Implementeren van tools in Galaxy
16
IGV tool Input: BAM file = Binary Alignment Map Binaire representatie van SAM file exact dezelfde informatie maar omvang kleiner schijfruimte besparen Output: IGV (= genoombrowser) met BAM file en vooringestelde parameters
17
IGV tool Galaxy conferentie: 25 – 26 mei IGV integratie onlangs aanwezig Toegevoegd in release van 8 april 2011
18
Monitor tool Benchmarking mappers Monitor CPU verbruik RAM verbruik Tijd SAM analyse
19
Monitor tool Twee outputs: SAM file = normale output Mapping report = extra output
20
NBIC Benchmark tool Netherlands Bioinformatics Centre (NBIC) Andere aanpak: Aparte tool Geïntegreerd in mappers
21
NBIC Benchmark tool Perl Wrapper script herschreven Mappers: BWA MAQ SAM analyse: uitvoeriger aantal juist gemapped aantal verkeerd gemapped aantal niet gemapped Python Wrapper script behouden Mappers: Bowtie BWA BFAST LastZ … SAM analyse: eenvoudig unique + multiple hits Eigen Monitor tool
22
Besluit Galaxy flexibel platform met veel mogelijkheden Analyses gemakkelijk door gebruik van workflows Reproduceerbaarheid Default Galaxy & Development Galaxy operationeel Production Galaxy Benchmarking mappers
23
Modificatie van Galaxy voor Next-Generation Sequencing Bataillie Michiel 2010 – 2011 Bachelorproef Hoge School West-Vlaanderen Dept. Simon Stevin
Verwante presentaties
© 2024 SlidePlayer.nl Inc.
All rights reserved.