PROTEOMICA PROTEOOM = alle proteïnen die tot expressie worden gebracht door het genoom, in een bepaald organel, cel, organisme, of lichaamsvloeistof op een bepaald ogenblik Technieken Tweedimensionele electroforese (Tweedimensionele chromatografie) Massaspectrometrie Eerstgebruik van term “proteome” door Wilkins, 1994 In 2003 zal het precies 50 jaren geleden zijn dat Watson en Crick het structuurmodel van DNA voorgesteld hebben.
2-D gel electrophoresis Protein separation according to : (1) charge (2) size Protein mixture
HART “mastergel” German Heart Institute Berlin (2002) Humaan hart Ca. 3000 spots German Heart Institute Berlin (2002)
Controle Rat serum Acute ontsteking (turpentine) E. Gianazza (2002)
Massaspectrometer Electrospray (ESI) vacuüm ionen bron massa analyzer detector Iontrap
iontrap
electrospray ionenbron 1- 4 kV iontrap + helium
m z
Verdere scheiding van peptidenmengsel dmv chromatografie Onze strategie Scheiding van eiwitmengsel dmv 2DE gelspot optimaal slechts 1 eiwit eiwit in gel trypsine-behandeling specifieke knipplaatsen [het maximaal aantal eiwitstukjes (= peptiden) is voorspelbaar] [hoe groter het eiwit, des te meer peptiden ] complex mengsel Verdere scheiding van peptidenmengsel dmv chromatografie eiwit trypsine peptiden A B C D E F G Chromatografie massa- spectrometer peptiden- mengsel A E B F G C ruwe data Stroomrichting over chromatografiekolom
“gewicht” van peptide C Fictief massaspectrum op ogenblik dat peptide C uit de kolom stroomt intensiteit (full scan spectrum) m/z massaspectrum van de kolomuitstroom is weliswaar minder complex maar blijft toch nog te complex voor de massaspectrometer: Kan wel alle ionen die op een bepaald ogenblik uit de kolom stromen “wegen”, maar kan er geen verdere “sequentieinformatie” uithalen, behalve uit de drie meest intense ionen (instrumentele beperking er gaat mogelijks veel informatie verloren) Sequentieinformatie wordt bekomen dmv fragmentatie van het peptide C ion het bekomen massaspectrum noemt men een fragmentatiespectrum Per full scan spectrum krijgen we maximaal 3 fragmentatiespectra (volledige cycle time: ca 1.5 sec)
b-ionen y-ionen Peptide sequentiebepaling met MS/MS NH2 C-R-I-S-T-A-L COOH MS/MS b-ionen y-ionen m/z 763.67 104.01 660.67 260.11 504.57 373.20 391.49 460.23 304.45 561.27 202.98 632.31 131.94 C-R-I-S-T-A-L R-I-S-T-A-L C I-S-T-A-L C-R S-T-A-L C-R-I T-A-L C-R-I-S A-L C-R-I-S-T L C-R-I-S-T-A
Sequentie-ionen P. Roepstorff & J. Fohlman, Biomed. Mass Spectrom. 11, 601 (1984)
massa neutraal peptide chromatogram een parent-ion (één van de vele) m/z = 806.8 z = 2+ (806.8 * 2)-2=1611.2 Da massa neutraal peptide
Parent m/z = 806.8 y9 MS/MS spectrum y6 y8 y12 y5 y7 y3 y10 y11 y4
m/z 1386.4 1271.5 1157.4 971.4 856.2 769.4 670.2 569.1 482.3 381.0 m/z 114.9 115.03 114.1 114.04 186.0 186.08 115.2 86.8 87.03 99.2 99.07 101.1 101.05 101.3 sequentie D N W S V T Asp Asn Trp Asp Ser Val Thr Ser Thr RHFWQQDEPP QSPWDRVKDL ATVYVDVLKD SGRDYVSQFE GSALGKQLNL KLLDNWDSVT STFSKLREQL GPVTQEFWDN LEKETEGLRQ EMSKDLEEVK AKVQPYLDDF QKKWQEEMEL YRQKVEPLRA ELQEGARQKL HELQEKLSPL GEEMRDRARA HVDALRTHLA PYSDELRQRL AARLEALKEN GGARLAEYHA KATEHLSTLS EKAKPALEDL RQGLLPVLES FKVSFLSALE EYTKKLNTQ Apolipoproteïne A1
a) Data-acquisitie (software: Xcalibur versie 3.1) 1 ruwe datafile per analyse (per gel spot) b) Dataverwerking Raw datafile-format (bestaande uit full scan spectra en fragmentaitiespectra) dta-file format (alleen fragmentatiespectra) search Mascot Sequest Rapport 1 Rapport 2 (. dat file) (.out file)
Van ruwe data tot identificatie van eiwit
Welke ruwe datafile moet er verwerkt worden ?
Ruwe datafile (verzameling van full scan spectra en fragmentatiespectra) omvormen naar een set bestaande uit enkel fragmentatiefiles = dta-format ( 1 fragmentatiespectrum = 1 dta.file)
search-engine Mascot “publiek”: zonder licentie enkel te bevragen met maximaal 300 dta.files
Na kopieren van merge programma (afkomstig van Mascot-website) in de juiste folder (hier peptide2975 met 299 dta files) wordt 1 grote tekst-file aangemaakt
Text-file aanbieden in Mascot
Welke databank ? Hoe specifiek kan/moet de search zijn? invoeren van text-file
... en na een 1-2 minuten...
Opnieuw dta-fles aanmaken :omdat a) minimizer had enkel de 300 meest intense fragmentatiespectra weerhouden en b) voor slechts een beperkt gebied van het chromatogram nu verder werken met alle dta-files van het volledige chromatogram
Alles wat hier ingevuld wordt, wordt weggeschreven in een parameter-file in de folder waar ook de dta-files zich bevinden (vhpeptide2975)
Automatiseren a) Data-acquisitie (software: Xcalibur versie 3.1) 1 ruwe datafile per analyse (per gel spot) b) Dataverwerking Raw datafile-format (bestaande uit full scan spectra en fragmentatiespectra) (Sequest) Vraagstelling: dta-file format (alleen fragmentatiespectra) Automatiseren Mogelijk ? In welke mate ? Op welke manier ? Transparantie ? search Mascot Sequest Rapport 1 Rapport 2 (. dat file) (.out file)
.dat file en .out file: twee rapporten-> 1 rapport Nauw hierbij aansluitend: .dat file en .out file: twee rapporten-> 1 rapport DTAselect software bruikbaar om één rapport te maken (HTML file en een text file als output) ? Kunnen we DTAselect rapport makkelijker manipuleerbaar maken (bv. verwijderen van items en de counter aanpassen,... ) ? Kunnen we DTAselect rapport publicatie-vriendelijk maken Andere vraagstellingen: ? Automatiseren van download van databanken en extractie van subdatabanken met automatische logboekregistratie (download datum, versie, aantal items per databank) ? Kan Sequest-search vlotter verlopen (geïndexeerde databanken?) [Validatie van identificaties (dmv Lutefisk de novo sequentie-software): belangrijk voor identificaties gebaseerd op slechts één peptide] [Info vervat in full scan spectra]