Expressievectoren en proteïneproductiesystemen

Slides:



Advertisements
Verwante presentaties
Medicijnen tegen zeldzame erfelijke ziekten:
Advertisements

* Vectoren : planten Moleculaire klonering in planten
“It is not enough to succeed.
Genregulatie en Epigenetica.
DNA Korte herhaling.
Voorkennistoets Bio-informatica week 3.1.
Enzymen I Eiwitten maken voor meer dan 50% uit van het gewicht aan drooggewicht van de meeste cellen. Meest belangrijke eiwitten zijn enzymen Enzymen.
Toetskwaliteit LAW onderwijsmiddag Leendert van Gastel, Amstel Instituut 24 mei 2005.
21.3 PCR-techniek Dubbelstrengs DNA verhitten, resultaat: enkelstrengs DNA Afkoelen Binding complementaire DNA-primers op specifieke plekken los DNA.
Natuurlijke Werkloosheid en de Phillipscurve
Randstad Werkmonitor state of mind arbeidsmarkt (werknemer perspectief) juli – augustus 2007 B
basistechnieken van de recombinant-DNA-technologie
B1 Stoffen worden omgezet
EIWITSYNTHESE.
Expressievectoren en proteïneproductiesystemen
Bijzondere integratie-manipulatiemogelijkheden
Zoeken naar Rho's Jullie hebben met BLAST gezocht naar Rho in planten...  En die hebben jullie gevonden, maar... Lijken ze meer op Rac, Rho of Cdc42?
De zoektocht naar functionaliteit in het post-genoom tijdperk
LENGTE METEN VAN EEN GENOOM
Transcriptie DNA overschrijven.
Hoofdstuk 10 : Van DNA tot eiwit
eiwitten: voorbeelden van eiwitten
enzymen: katalysator Enzymen
EIWITSYNTHESE.
Restrictie Enzymen Bacteriele verdediging tegen virale infecties door restrictie- (knip) enzymen.
Transcriptie en translatie van het DNA
Genspecifieke therapie bij patienten met Cystic Fibrosis
SDS-PAGE met IPTG en insert in juiste orientatie : A-c en B-b
De Cel, DNA.
KULeuven: fermentatie van hydrolysaat
Werkzitting II Prof. F. Claessens.
Centrale vraag Hoe kunnen inzichten in de moleculaire biologie helpen om ziektes te begrijpen, te voorkomen en te genezen?
Genexpressie = de mate waarmee het DNA van een gen gekopieerd wordt naar mRNA en mRNA vertaald wordt naar een aminozuursequentie.
DNA Erfelijke materiaal. Twee nucleotiden ketens
Keuze-opdracht 3-1.
DNA en eiwitten.
Paragraaf 3.3 DNA vertaald.
HIV replicatie.
Genexpressie = de mate waarmee het DNA van een gen gekopieerd wordt naar mRNA en mRNA vertaald wordt naar een aminozuurvolgorde.
Auxine en Vruchtzetting De rol van twee Auxine Respons Factoren in het aanschakelen van vruchtontwikkeling Maaike de Jong.
Thema 8 Moleculaire genetica
BIO 42 Transcriptie.
BIO 42 Replicatie “hoe het DNA in een cel wordt verdubbeld”
RFLPs SNPs Micro-array
BIO 42 Het centrale dogma.
BIO 42 Replicatie en PCR “hoe het DNA in een cel wordt verdubbeld”
of de synthese van eiwitten
Transcriptie (bij pro- en eukaryoten) Splicing, gewoon en alternatief
De PCR reactie.
From Gene to Protein (CHMBCM21) College 2, CHMBCM21
Expressie van het DNA De translatie vindt plaats in het cytoplasma.
DNA, RNA en Eiwitsynthese
B5 translatie en eiwitsynthese
Biologische Labcourse Nanobiologie NB1061 deel 2   Basistechnieken Microscopie, Microbiologie en Moleculaire Biologie Week 9  
Genexpressie B6.
Presentatie titel Rotterdam, 00 januari 2007 GKL11 Cursus genklonering Rotterdam, september 2008.
Genklonering Presentatie titel Cursus GKL11 Les2: kloneervectoren
College 6: Regulatie van gen expressie
13.4. t/m De ruimtelijke vorm van eiwitten Nadat een eiwit in de cel is aangemaakt, vouwt het zich spontaan in een kluwen, die kenmerkend is voor.
6A1-Stofwisseling. B4 Eiwitsynthese (les3). Hoe haal je de INFO van het DNA? Volgorde van de ‘letters’ A-T-G-C = info. Één gen bevat de info voor één.
Thema 4 DNA. Genotype - Fenotype genotype: de erfelijke eigenschappen die vastliggen in het DNA (in de genen). fenotype: alle uiterlijk waarneembare kenmerken.
LOCALISATIE VAN HSPB8 NAAR STRESS GRANULES: IMPLICATIES VAN TRANSLATIE CONTROLE IN PROTEOTOXISCHE STRESS CONDITIES? Arvid Verfaillie Prof. Dr. Harm H.
Genregulatie eukaryoten
Daphne Seys Buitenlandse stage gevolgt aan Dublin city university
6A1-Stofwisseling. B4 Eiwitsynthese (les3).
Biotechnologie. Veredeling : kruisingen en selectie planten gunstige eigenschappen combineren Weefselkweken: voor produceren van medicijnen, insecticiden.
6A1 Stofwisseling B5 Regulatie van de genexpressie. B6 Mutaties.
Eiwit synthese.
The Wonderful World of RNA
DNA, RNA en Eiwitsynthese
Transcript van de presentatie:

Expressievectoren en proteïneproductiesystemen o.a. Primrose & Twyman, 7e editie, pp.81-93 Primrose, Twyman & Old, 6e editie, pp.70-83 Expressievectoren en proteïneproductiesystemen Expressie verwijst naar het gen, productie verwijst naar het proteïne, hoewel in het jargon 'expressie' ook vaak verkeerdelijk voor proteïnen wordt misbruikt. Aangezien productie van een gekloneerd proteïne in hoge hoeveelheden gebeurt, is detectie en analyse van het rendement meestal relatief eenvoudig, en kan dit makkelijk door rechtstreekse visualisering (door kleuring) op een SDS-PAGE. Hierbij kan expressie "voor" en "na" inductie in de cel vergeleken worden, evenals het celcompartiment of de toestand waarin het eiwitproduct zich bevindt : cytoplasmatisch versus periplasmatisch versus extracellulair, en oplosbaar of onoplosbaar. (Bijgaande figuur op volgende slide vergelijkt “met of zonder” inductie.)

* Expressie van de constructen achter een lac promoter, controle door LacI en inductie met IPTG.) IPTG-geïnduceerde productie van RP4 proteïnen : (A) DNA primase (118 en 80 kDa proteinen) ; (B) 16.5 en 8.6 kDA proteinen. Waardcelstam : E. coli HB101. Analyse door SDS-polyacrylamidegel electroforese. (A) insert in directe (c, d) of omgekeerde (e,f) orientatie ; geïnduceerd (c, e) of niet-geïnduceerd (d,f) met IPTG. (a) referentie proteïnen ; (b) gezuiverd RP4 DNA primase (118 en 80 kDa). (Lange electroforesetijd) (B) insert in directe (b, c) or of omgekeerde (d,e) orientatie ; geïnduceerd (b, d) of niet-geïnduceerd (c,e) met IPTG. (f) referentie proteïnen ; (a) gezuiverd 16.5 kDa proteïne. (Korte electroforesetijd)

* uit : J. Sambrook & D.W. Russell : Molecular cloning, a laboratory manual. 3rd edition, 2001 1. Basisaspecten 2. Belangrijke expressievectoren (3 vb.) 3. Productiestrategieën 4. Zuivering en verwerking (6 vb.) 5. Optimalisatiestrategieën Addendum : genoomstrategie Hoe coderende gebieden (ORF’s) opsporen?

- hoge expressiewaarden kunnen 1. Basisaspecten regulatie - hoge expressiewaarden kunnen - toxisch zijn (door het eiwitproduct) voor de cel - "metabolic drain" veroorzaken : dus verstoring van het metabolisme => iedere verandering die het expressieniveau verlaagt (bvb. door mutaties, verlies van plasmide, ...) zal de betrokken cel een selectief groeivoordeel geven - vermijden van toxiciteit : groei de celpopulatie tot het geschikte niveau (d.w.z. aantal cellen) vooraleer de synthese van het gekloneerde eiwit aanvangt, m.a.w. induceer de expressie (en tot dan, hou het gen onder repressie) - induceer expressie in de laat-logaritmische fase (terwijl de cellen nog voldoende metabolisch actief zijn) maar nog niet in de stationaire fase - regulatie is in hoofdzaak een zaak van transcriptiecontrole - andere factoren: translatie, stabiliteit (van vector, transcript en product)

- E.coli RNA polymerase : a2, b, b' transcriptie : - E.coli RNA polymerase : a2, b, b' algemene promotorstructuur (‘consensus’ sequenties) s70 promotor : TTGACA (16-19 nt) TATAAT (5-8 nt) start (+1) (zones / optimale afstanden) -35 (17) -10 (7) UP-elementen (upstream) kunnen een extra invloed op efficientie hebben - initiatie : vaak gebruikte efficiente promotoren en hun regulatie - lacUV5 : IPTG, LacI (lacI en lacIq), uittitratie, 'leakiness' - trp : tryptofaan + aporepressor (TrpR), IAA inductie - Ptac : upstream -20 Plac + downstream -20 Ptrp (ook PtacI, PtacII, Ptrc, en andere varianten) inductie door IPTG mogelijk - PL, PR : repressor CIts857 : inductie door temperatuurshift of : CIwt + inductie door mitomycine C (nb. CIts857 is minder efficient als regulator (repressor) dan wild-type CI) - araBAD : arabinose + AraC : positieve en negatieve regulatie lacUV5 is een mutant die veel minder gevoelig is aan de concentratie cAMP in de cel. Het niveau van cAMP neemt toe met de celdensiteit (concentratie glucose daalt). Met toevoeging van 1% glucose aan het medium wordt de afhankelijkheid aan CAP-cAMP nog extra onderdrukt. . vervolgt

E. coli Pribnow box (-10) T89 A99 T50 A65 A65 T100 s70 bindingsplaats (-35) T85 T83 G81 A61 C69 A52 (in feite de lacUV5 promoter ; wild-type lac promoter heeft TATGTT als -10 gebied) E. coli promoters, en hybride promoters tacI en II E. coli transcriptieterminatie (r-onafhankelijk)

T7 als expressiepromoter : vereist toelevering van T7 RNA polymerase vervolg T7 als expressiepromoter : vereist toelevering van T7 RNA polymerase - gekodeerd op een ander (compatibel) plasmide - gekodeerd door een l profaag (cIts) (bvb. in een E.coli lysogen) - door infectie met een M13mp-recombinant kloon van het polymerasegen (het T7 gen1) (zie verder) => PL en PBAD worden zeer efficient geblokkeerd, Plac (en zijn derivaten) zijn ‘leaky’; met de faag T7 promotor (en andere specifieke faagpromotoren), wordt alle interferentie met het E.coli polymerase vermeden. - terminatie kan zijn : - factor-afhankelijk (Rho (r), Tau (t), NusA (van faag l)) - factor-onafhankelijk (GC-rijke stam-lusstructuur + oligoT-reeks) => meest gebruikt in expressievectoren zijn : - de fd terminator (in Ff fagen tussen gIII en gVIII, zie figuur in deel 6) - de rrnB operon terminatoren T1 en T2 - faag T7 terminator Tf

- sequentie motief : Shine-Dalgarno sequentie translatie - initiatie: RBS (ribosome binding site), AUG (of GUG, 91 vs 8% in E.coli) - sequentie motief : Shine-Dalgarno sequentie RBS > < Shine-Dalgarno (SD) motief RBS = ongeveer 55 nt tussen posities –35 en + 22 (versus AUG) SD : 16S rRNA 5'….GUACACCUCCUAOH 3' (E.coli) basispatroon : 5'….AGGA… +/- 7nt … AUG(start)… 3' efficientie is vrij onvoorspelbaar variaties : GAGG, GGAG, GGAGG - secundaire structuur - het AUG (GUG) initiatietriplet moet goed toegankelijk zijn, bvb. gelegen op de top van een stam-lusstructuur (en dus niet in baseparing betrokken) - triplets die volgen achter AUG beïnvloeden de efficientie (zoals ook de nucleotiden die het AUG voorafgaan, en uiteraard ook de secundaire structuur van dit gebied) vervolgt

* - codongebruik - het effect van codongebruik is zeer complex vervolg - codongebruik - het effect van codongebruik is zeer complex - zelfde aminozuur => multipele codons - zelfde codons => multipele tRNA's - verschillende codons => zelfde tRNA - codon-anticodon bindingssterkte - vergelijking van frequentie (in E. coli) van codongebruik tussen genen met hoog expressieniveau en deze met laag expressieniveau, toont het effect van sommige triplets (ongeacht of deze vaak gebruikt worden of niet) (zie Tabel) - met synthetische genen : kan men bewust systematisch kiezen voor telkens het 'optimale' triplet : dit garandeert (meestal) een goed productierendement (hetgeen echter daarom niet het hoogst mogelijke is) - gendosiseffect - toename van aantal kopijen van de vector heeft - geen effect - een positief effect - een negatief effect (vb. expressie van het trypsinegen ) => niet voorspelbaar, geen algemene regel, kan alleen empirisch bepaald worden *

Kodewoordgebruik in E. coli van sterk en zwak tot expressie komende genen * "sterk" : 24 genen (5253 triplets), o.a. 12 voor ribosomale proteïnen, 7 voor "outer membrane" proteïnen, en voor sommige RNA polymerase subeenheden en translatie-initiatie- en terminatiefactoren. "weak" : 18 genen (5231 triplets), o.a. voor verschillende repressorproteïnen, lac-permease, enz. kleine kadertjes : een enkel tRNA voor synonieme codons ; dus voor deze is interactiesterkte anticodon-codon bepalend

stabiliteit van het plasmide - een transcriptieterminatiesignaal achter het doelwitgen is nodig voor stabiliteit van het plasmide - par locus (of loci) helpt voor plasmidestabiliteit (belangrijk op moment van inductie) - transcript stabiliteit : mRNA degradatie is een complex proces - zowel 5' als 3' UTR spelen een rol (bvb. een stam-lusstructuur in het 5' UTR geeft stabilisatie) - er is geen omgekeerde correlatie tussen grootte en halfwaardetijd van een mRNA bijgevolg: degradatie is niet afhankelijk van a-specifieke endonucleolytische splitsing - proteïne stabiliteit : degradatie is sterk gereguleerd in E.coli : er is een groot aantal proteasen in het cytoplasma, periplasma en aan de binnenste en buitenste membranen. => degron : is een element van degradatie : o.a. N-regel van Varshavsky vervolgt

N-regel van Varshavsky : Kenmerken die oorzaak zijn van instabiliteit van eiwitten in het metabolisme, noemt men “degradatiesignalen” of ‘degrons’. De essentiële component van het eerst-ontdekte degron is een destabiliserend N-terminaal aminozuur van het eiwit (N-degron). De set van N-degrons geeft een “regel”, de “N-end rule” genoemd (A. Varshavsky, 1997), die de relatie geeft tussen N-degron en de halfwaardetijd (“half-life”) van een eiwit in de cel. Dergelijke N-end regel komt voor bij alle organismen (waaronder E.coli, gist en zoogdiercellen). Bij eukaryoten is fusie met ubiquitine hierbij essentieel, maar niet bij prokaryoten (hoe het daar juist verloopt is nog niet gans duidelijk). N-regel van Varshavsky : maakte een reeks recombinante b-galactosidasen met als N-terminaal aminozuur telkens een ander achter het Metf : - varianten met R, K, L, F, Y, W => halfwaardetijd (T1/2) van 2 min - varianten van andere aminozuren (behalve P) => T1/2 = 10 uur

* De E. coli N-end rule pathway. Primair destabiliserende N-terminale residus L, F, W en Y staan in rood aangeduid, secundaire R en K in blauw. De gele geven de rest van het proteinesubstraat weer. Conjugatie van het primair destabiliserende residu L aan de secundair destabiliserende residus R en K wordt gemediëerd door Leu, Phe-tRNA- proteine-transferase (L/F-transferase), gecodeerd door aat. In vivo blijkt L/F-transferase vooral (of zelfs exclusief) aan L te conjugeren. De degradatie van een substraat dat een primair destabiliserend N-terminaal residu heeft, gebeurt door het ATP-afhankelijke protease ClpAP, gecodeerd door clpA en clpP. Het vraagteken geeft de onduidelijkheid weer omtrent de natuur van het N-recognine in E. coli. Open cirkels : stabiliserend N-end aminozuur Andere : destabiliserend ; verschillende types Voor proline speelt blijkbaar ook het tweede aminozuur een rol.

Wat met het initiërende methionine ? : - meestal wordt het Metformyl (als eerste aminozuur van een celeigen eiwit) afgesplitst - hoe makkelijk kan dit met 'cel-vreemde' eiwitten ? => niet meteen voorspelbaar - gebeurt blijkbaar makkelijkst als het 2de aminozuur een korte zijketen heeft (vergemakkelijkt de splitsing door het methionine aminopeptidase) Stresscondities veroorzaken inductie van genen voor bepaalde proteasen, o.a. het protease La (lon gen) deze staan onder controle van s32 promotoren : - het gen voor de s32 subeenheid van dit RNA polymerase is rpoH - mutanten in rpoH kunnen een dramatische toename van expressierendement geven (en van productstabiliteit) (E.coli heeft 7 s-factoren. De “house-keeping” factor is s70 (gen rpoD). Er zijn ook anti-sigma factoren, die de functie van een sigma-factor inhiberen, en anti-anti-sigma factoren die de activiteit weer herstellen. s32 is de factor bij heat-shock stress.) Er zijn nog heel wat meer specifieke observaties gemaakt waarmee kan of moet rekening gehouden worden.

Het pET vectorsysteem voor proteïneproductie 2. Belangrijke expressiesystemen (inductie en regulatorische circuits) enkele voorbeelden Het pET vectorsysteem voor proteïneproductie - met T7 RNA polymerase - extra regulatie (repressie) door LacI (inductie door IPTG) - toelevering van T7 RNA polymerase vanuit een aparte expressieëenheid op een l (DE3) profaag met PlacUV5 als promoter (ook onder LacI controle : lacO) - additionele controle door lysozyme van T7 LysS (of E) (gekodeerd op een (pACYC184-afgeleid) compatibel plasmide) => het lysozyme bindt aan en inhibeert (residueel) T7 RNA polymerase E. coli waardcel pLysS of E wijst op de orientatie in de BamHI van pACYC184 : E is in de expressie-orientatie van het tet gen ; S (silent) in de omgekeerde orientatie. Met pLysE worden grotere hoeveelheden T7 lysozyme aangemaakt, hetgeen niet steeds een voordeel is. lac verwijst naar de lacUV5 promoter

...vervolg... 2. Belangrijke expressiesystemen (inductie en regulatorische circuits) Het binaire trp-cI systeem : expressiecontrole op de Ptrp promoter door de l CI repressor - dubbel systeem met compatibele plasmiden - doelwitgen stroomafwaarts van de PL promotor - synthese van CI (gekodeerd door cI repressorgen) wordt gereguleerd door Ptrp - toevoeging van tryptofaan activateert expressie van het doelwitgen door afsluiten van de CI synthese : vroeger reeds gezien : regulatie door CIts857 kan ook op basis van temperatuur, maar : die regulatie is minder strict (wt-CI bindt efficienter) én toevoeging van een inductor in grote fermentoren is eenvoudiger dan het verhogen van de temperatuur ; bovendien kan een temperatuurshift stressmechanismen (heat-shock) induceren. (Po) O = operator van de overeenkomstige promoter

* ara operon : araC : araO : araI : araB : araA : araD lac operon : inductief systeem : activatie door (allo)lactose (en analogen) “negative inducible operon” trp operon ; repressief systeem : inhibitie door tryptofaan (met aporepressor) ”negative repressible operon” (co-repressor model) in aanwezigheid van tryptofaan wordt actieve repressor gevormd, door binding van tryptofaan aan zijn (inactieve) aporepressor. In afwezigheid van tryptofaan in het cultuurmedium is er dus constitutieve expressie van het operon (trpE : trpD : trpC : trpB : trpA). (er is dus geen expliciete “activator”, zoals in het ara operon) * ara operon : araC : araO : araI : araB : araA : araD Afbraak van L-arabinose tot D-xylulose-5-fosfaat, dat verder gemetaboliseerd wordt via de pentosefosfaatweg. Operon voor synthese van de AraA, AraB en AraD enzymen. AraC is een activator eiwit. araI promoter (induceerplaats). AraA : L-arabinose : isomerase => L-ribulose (reversibel) AraB : L-ribulose : ribuloskinase => L-ribulose-fosfaat (niet-reversibel) AraD : L-ribulose-fosfaat : epimerase => D-xylulose-fosfaat (reversibel) Negatieve en positieve regulatie : AraC is activator of repressor naargelang zijn bindingplaats, in aanwezigheid of afwezigheid van arabinose.

1) repressie : het dimeer AraC bindt aan I1 en O2 operatorplaatsen ...vervolg... 2. Belangrijke expressiesystemen (inductie en regulatorische circuits) Het pBAD systeem : vooral goed voor expressie van zeer toxische eiwitten (op basis van keuze van expressieniveau) Regulatie van de PBAD promoter en expressie in pBAD vectoren 1) repressie : het dimeer AraC bindt aan I1 en O2 operatorplaatsen (de DNA lus blokkeert transcriptie) 2) activatie : het dimeer AraC + arabinose : bindt aan de I1 en I2 plaatsen 3) de activatie is bovendien gevoelig aan catabolietrepressie : CAP + cAMP (cAMP = is laag als glucose concentratie hoog is) => het samenspel van arabinose- en glucose-concentraties kan gebruikt worden als fijnregeling van het expressieniveau (nb. CAP-regulatie is ook aanwezig in het lac operon, maar tac promotoren zijn niet CAP-afhankelijk)

Goed controleerbaar met % arabinose (dosis-afhankelijke regulatie) Lusvorming (210 bp) door interactie van een AraC dimeer tussen I1 en O2 : negatieve regulatie. Positieve regulatie : arabinose bindt op AraC waardoor het O2 verlaat en maakt een complex met AraC op I1 en I2 en transcriptie start. Glucose verlaagt cAMP, en aldus de efficïentie van binding aan I1-I2 en dus transcriptie (extra regulatie). Autoregulatie van AraC op zijn eigen promoter (pC, waarvoor O1) N en C wijzen op de N- en C- uiteinden van AraC (dus C is dus niet het ganse AraC). O1 Detectie met antilichamen

Regulation of the ara-operon * The three structural genes are arranged in an operon that is regulated by the araC gene product. There are four important regulatory sites as shown in the following survey (figures on next slides) : araO1 is an operator site. AraC binds to this site and represses its own transcription from the PC promoter. In the presence of arabinose, however, AraC bound at this site helps to activate expression of the PBAD promoter. araO2 is also an operator site. AraC bound at this site can simultaneously bind to the araI site to repress transcription from the PBAD promoter araI is also the inducer site. AraC bound at this site can simultaneously bind to the araO2 site to repress transcription from the PBAD promoter. In the presence of arabinose, however, AraC bound at this site helps to activate expression of the PBAD promoter. CRP binds to the CRP binding site. It does not directly assist RNA polymerase to bind to the promoter in this case. Instead, in the presence of arabinose, it promotes the rearrangement of AraC when arabinose is present from a state in which it represses transcription of the PBAD promoter to one in which it activates transcription of the PBAD promoter. Regulation of the arabinose operon is, clearly, much more complex than the lactose operon. When arabinose is absent, there is no need to express the structural genes. AraC does this by binding simultaneously to araI and araO2. As a result the intervening DNA is looped. These two events block access to the PBAD promoter which is, in any case, a very weak promoter (unlike the lac promoter): AraC also prevents its own expression. Thus, it is an autoregulator of its own expression. This makes sense; there is no need to over-express AraC. If the concentration falls too low then transcription of araC resumes until the amount of AraC is sufficient to prevent more transcription again. When arabinose is present, it binds to AraC and allosterically induces it to bind to araI instead of araO2. If glucose is also absent, then the presence of CRP bound to its site between araO1 and araI helps to break the DNA loop and also helps AraC to bind to araI:              The ara operon demonstrates both negative and positive control. It shows a different function for CRP. It also shows how a protein can act as a switch with its activity being radically altered upon binding of a small molecule.

*

* Light switch mechanism of AraC protein action. In the absence of arabinose, the N-terminal arm interacts with the DNA-binding domains and holds the latter such that the protein loops between araO2 and araI1. This represses both pC and pBAD. In the presence of arabinose, interactions between arabinose and the N-terminal arms hold the latter over the arabinose, thus freeing the DNA-binding domains. These domains are then free to bind to I1 and I2, which then leads to induction of the pBAD promoter. The binding of AraC to O1L and O1R, left and right, directly represses the pC. *

3. Productiestrategieën E. coli : is het majeure "eerstelijns" organisme voor expressie => nadelen (beperkingen) - geen (of zeer weinig) post-translationele modificaties - nagenoeg geen efficiënte secretiewegen naar het medium (secretie brengt het proteïne in de periplasmatische ruimte) - extensieve S-S bruggen zijn moeilijk te vormen Waarom dan recombinante expressie/productie ? => opdrijven van het productierendement => zuivering vergemakkelijken => nieuwe eiwitvarianten creëren (mutaties, inserties, fusies, enz.) Het expressieproduct is : - oplosbaar of onoplosbaar - als matuur proteïne of als fusieproduct - accumuleert in cytoplasma of wordt gesecreteerd naar periplasma (type II secretie) (met E. coli is mogelijke extracellulaire secretie (excretie) zeer beperkt ; één voorbeeld : type I secretie van haemolysine) vervolgt

- kan aggregeren en precipiteren als 'inclusion bodies' vervolg Expressieproduct : - als matuur proteïne - kan aggregeren en precipiteren als 'inclusion bodies' - dit maakt zuivering gemakkelijk - het beschermt tegen afbraak - maar het vereist achteraf solubilisatie en hervouwing => denatureer (in bvb. guanidinium hydrochloride) en (tracht te) renatureren - vertraging van synthesesnelheid kan dit aggregatieproces (deels) inperken (bvb. door verlaging van de incubatietemperatuur) - het expressieconstruct vereist kritische manipulatie van het RBS gebied om efficiente (op hoog niveau) translatie-initiatie te verzekeren - het MET-probleem : wordt de initiator (formyl-)methionine verwijderd ? vervolgt

"Inclusion bodies" in E. coli (Scanning electronmicrograph) (Thin section through the cells) Hoe de vorming van inclusion bodies vermijden (of verminderen) ? (verbetering van de kans op eiwitvouwing) - cellen groeien bij lagere temperatuur (vertraagt het expressieproces) (of gebruik andere groeivertragende condities, bvb. samenstelling van media & pH waarden) - co-expressie van chaperonen : DnaK, GroES, GroEL - verwijdering van kritische aminozuurposities (bvb. in interferon-b) - fusie aan thioredoxine, of sommige andere eiwitten (zoals MalE)

- als fusieproteïne (bvb. random inserties in ScaI van cat : AGT'ACT) vervolg - als fusieproteïne (bvb. random inserties in ScaI van cat : AGT'ACT) - N-terminale en C-terminale fusies zijn mogelijk (of multipele partners) - voordeel van C-terminale fusies : (d.i. aan C-terminus van fusiepartner) translatie-initiatieëfficiëntie wordt grotendeels behouden - fusiepartner kan doelwit zijn voor zuivering (etiket) - fusiepartner kan een activiteit hebben waarmee het productieniveau gevolgd kan worden - fusiepartner kan verankering in de membraan bewerkstellingen - een epitoop herkend door aan specifiek antilichaam kan voorzien worden (voor detectie of kwantificering of zuivering) - fusie aan een signaalpeptidesequentie kan secretie geven => secretie laat vorming van (minstens sommige) S-S bruggen toe - secretie = keuze tussen cytoplasmatische of periplasmische productie vervolgt

Verschillende mogelijkheden van translatiefusieconstructen S : signaalsequentie ; I : membraanintegratiedomein ; A, B : fusiepeptiden, o.a. affiniteitsetiketten Het gebruik van membraanintegratiedomeinen laat toe het proteïne te verankeren in één van de membraansystemen of in de celwand.

Constitutieve expressie van het cat gen (baan 2), en (peptide)fusies door random klonering in de ScaI plaats (die dicht bij het C-terminus coderend gebied ligt) (banen 1, 6, 7, 9-15). Banen 4 en 5 zijn plasmide-vrije cellen ; banen 3 en 8 zijn proteïne-lengtemerkers. *

Secretie : is een bijzondere vorm van fusie vervolg Secretie : is een bijzondere vorm van fusie - de fusiepartner (signaalpeptide) wordt verwijderd tijdens secretie - er is dus geen (extra) methionine aan de N-terminus - (de voorspelde) positie van splitsing is niet altijd gegarandeerd => meestal moet men verschillende secretiesignalen testen : van OmpA, OmpT, PelB, b-lactamase, alkalische fosfatase, enz. Sommige hiervan geven bij voldoende overexpressie ook lekkage naar het groeimedium. - !!! maar : niet alle proteinen zijn ‘secreteerbaar’ (zelfs al is er een signaalpeptide) Over het algemeen : 1) kleine peptiden : vaak stabiliteitsprobleem (afbraak van het peptide) => fusiebenadering te verkiezen : bvb. LacZ fusies 2) intermediaire grootte: weinig S-S : intracellulaire aanmaak meer S-S : periplasmische aanmaak (secretie) 3) grote proteïnen : problematischer

4. Zuivering en verwerking Fusies die makkelijke zuivering mogelijk maken: o.a. aan glutathion-S-transferase, MalE (MBP : maltose bindingsproteïne), oligo-His (hexa-His), enz. : partners of etiketten. Zuivering door affiniteitschromatografie of door immobilisatie gevolgd door elutie. Vrijzetting van het etiket/de partner door splitsing met specifieke proteasen zoals factor Xa, enterokinase, enz., of gebruik van ‘intein processing’. Voorbeelden van affiniteitsetiketten ("tags")

Voorbeelden van expressie-fusie systemen : 1. C-terminale fusie in pBAD/His vectoren - zes Histidine triplets - insertie in het juiste leesraam : BglII knipplaats - binding aan een kolom met geïmmobilizeerd Ni2+ - splitsingsplaats voor enterokinase (D-D-D-D-K* ) (* = splitsingsplaats) (nb. enkele resterende aminozuren blijven aan de N-terminus na verwerking) 2. C-terminale fusie aan een biotine-afhankelijke carboxylase (biotine is een essentiële cofactor voor een aantal carboxylasen) - biotine covalent aangehecht aan een lysine door biotine ligase (BirA) (E. coli heeft één gebiotinyleerd eiwit maar dit bindt in zijn natieve vorm niet aan streptavidine) het “doelwit” (voor biotine ligase) is aan de N-zijde als “tag” voorzien - immobilisatie aan streptavidine (batchgewijs of door affiniteitschromatografie) - factor Xa splitsingsplaats : I-E-G-R* of I-D-G-R* (niet gevolgd door P of R) (* = splitsingsplaats) (secundaire plaatsen meestal op G-R*)

Proteïneproductie en verwerking met pBAD/His vectoren C-terminale fusie 6 His-resten voor affiniteits- zuivering splitsing door enterokinase (D-D-D-D-K-*) na verwerking blijven nog een paar extra aminozuren aan de N-terminus

C-terminale fusie aan biotine carboxylase Binding op streptavidinekolommen voor zuivering. Verwerking met factor Xa protease (I-E-G-R-* of I-D-G-R-* (niet gevolgd door P of R)) Zie ook verder “pinpoint vectoren” De tag hier is een biotine-afhankelijk carboxylasegen. Na splitsing met factor Xa protease blijven ook hier meestal een aantal extra aminozuren aan het N-uiteinde over.

(vermijdt het toevoegen van een protease bij de verwerkingsstappen) 3. N-terminale fusie aan en verwerking door inteïne (i.t.t. meeste andere systemen die C-terminaal zijn) (vermijdt het toevoegen van een protease bij de verwerkingsstappen) - N-terminale fusie aan (aangepast) inteïne + chitine bindingsdomein (CBD) => zelf-splitsing aan de N-terminus van het inteïne door een thiol - expressie vanaf de T7 promotor, in fusie met lacO => inductie door IPTG - bind het fusieproduct aan de chitinekolom - was de kolom, en equilibreer de kolom met een DTT-oplossing => in situ splitsing bij 4°C gedurende een nacht - elueer het doelwitproteïne - verwijder de fusiepartner (inteïne-CBD) van de kolom met SDS ~100 aminozuren ~50 aminozuren Splicing van het inteïne Inteine : - universeel voorkomend - 200-800 lang diverse types met of zonder homing endonuclease splitst autokatalytisch, geen cofactoren, ATP of andere elementen vereist

Verwerking van een N-terminale fusies aan inteïne, met immobilisatie op een chitinekolom

4. MalE-fusies : vectoren pMAL-c2 en pMAL-p2 (met (c) of zonder (p) de signaalpeptidesequentie van het malE gen: cytoplasmische of periplasmatische expressie) - expressie-eenheid tussen de Ptac promotor en rrnB terminatoren, met lacIq op de vector om voldoende Lac-repressor te voorzien. - fusie tussen de malE partner en lacZa, gescheiden door 10xD en een MCS voor insertie van het doelwitgen. De in-frame constructie produceert blauwe kolonies op BCIG-media. Het polaire 10xD peptide scheidt de twee proteïnedelen (eigen vouwing). Klonering in de MCS geeft witte (kleurloze) kolonies. - affiniteitszuivering op een amylosekolom : na elutie met maltose en splitsing door factor Xa, wordt fusiepartner MalE verwijderd door een 2e chromatografie op amylose. - MCS bevat (aan de linkerzijde) een XmnI, die overlapt met de factor Xa knipplaats en een exacte fusie aan het doelwitgen mogelijk maakt : andere insertieplaatsen laten enkele extra aminozuren aan het N-terminale uiteinde na factor Xa splitsing. - de EcoRI kloneerplaats ligt in hetzelfde leesraam als de EcoRI plaats in lacZ : dit vergemakkelijkt de uitwisseling van een gen dat als een expressiefusie gekloneerd is in (ondermeer) de vector lgt11.

pMAL expressievectoren malE : kodeert voor maltosebindend proteïne (MBP) lacZa

Karakteristieken van pMAL vectoren : ColE1 ori ; M13 ori ; Ptac ; rrnB terminators ; lacIq ; bla Fusieconstruct : malE - DDDDDDDDDD - IEGR - MCS(polylinker) - lacZa (bij doorlezing in het leesraam : blauwkleuring met IPTG + BCIG) pMAL-c2 : malE signaalpeptidesequentie is gedeleteerd pMAL-p2 : met malE signaalpeptidesequentie : secretie naar het periplasma fusie in XmnI : exacte koppeling van het doelwitproteïne aan de factor Xa sequentie 10 Asp eenheden (D) scheiden de twee fusiegedeelten insertie in EcoRI is identisch (qua leesraam) als in lgt11 (lacZ) de vector is een fasmide : snelle enkelstreng bereiding mogelijk Splitsingsplaats van factor Xa I - E - G - R * XmnI nnn nnn nGA Ann nnT TCn nnn ATC-GAG-GGA-AGG-ATT-TCA-GAA-TTC- EcoRI

"Multiple cloning site" in (één van) de pMAL vectoren Perfecte fusie met XmnI. Met EcoRI blijft alleen Ile-Ser- over (+ Glu-Phe vanop de EcoRI plaats) Andere mogelijkheid (in sommige vectoren) Pro-Gly-Ala-Ala-His-Tyr : splitsing door Genenase I (een geëngineerde vorm van subtilisine) splitst achter His-Tyr (afhankelijke van het volgende aminozuur) (splitst His-Tyr-Glu en His-Tyr-Asp traag, en His-Tyr-Pro en His-Tyr-Ile niet)

Verwerking van expressieproducten uit fusieconstructen in pMAL vectoren

- gelijkaardige elementen als in vorige voorbeelden (o.a. vb.2): 5. Pinpoint vectoren - gelijkaardige elementen als in vorige voorbeelden (o.a. vb.2): tac (en T7) promoter, insertieplaatsen, etiket, factor Xa doelwit, enz. hier tevens SP6 (naast T7 vanop andere streng) promoter voor synthese van RNA - N-terminaal is een etiket waarin een lysine gebiotinyleerd wordt door het E. coli biotin ligase holoenzyme Het lysine is toegankelijk voor (strept)avidine : => etiket voor detectie en zuivering E. coli produceert slechts één enkel endogeen gebiotinyleerd proteïne dat, in zijn natieve conformatie, niet bindt aan (strept)avidine : => zeer specifiek zuiveringssysteem voor het recombinante fusieproteïne. Ook, detectie van het fusieproteïne mogelijk met streptavidine-alkalische fosfatase. - het fusieproteïne bindt aan (strept)avidine, en kan geëlueerd worden door toevoeging van 5mM biotine : => geen denaturerende condities vereist.

twee promoters : T7 en tac factor Xa knipplaats (Commerciële) Pinpoint vectoren twee promoters : T7 en tac factor Xa knipplaats N-terminale biotinylering (tag) polylinker (MCS) in vitro RNA sondes met de SP6 (of T7) promoter secretiesignaal (sommige vectoren) Detectie door streptavidine-alkalische fosfatase Elutie van fusieproteïne met 5 mM biotine (dus : geen denaturatie vereist)

6. Een recentere pET vector (zie hoger) voor LIC klonering en eiwitverwerking 22 aminozuren N-terminale fusie, waarin hexa-His en protease TEV knipplaats M-H-H-H-H-H-H-S-S-G-V-D-L-G-T-E-N-L-Y-F-Q*S-M- (* is de TEV knipplaats) LIC klonering (LIC-5 en LIC-3 plaatsen) sacB als (negatieve) selectiemerker (nl. als stuffer) op 5% sucrose De waardcel moet T7 RNA polymerase tot expressie brengen (zie pET systeem) Fasmide vector. TEV (van Tobacco etch virus) protease : herkent E-X-X-Y-X-Q-G/S en splitst tussen Q en G of S. Tolereert dus heel wat aminozuursequentievariatie maar de splitsingsefficientie varieert sterk. Meestal wordt E-N-L-Y-F-Q-S gebruikt dat het meest efficiënte substraat lijkt. Zijn structuur is similair aan serineproteasen maar met C i.p.v. S in de katalytische triade Ser-Asp-His, hetgeen allicht zijn resistentie tegen veel protease-inhibitoren verklaart. N

* N Ander, analoog aan het vorige, voorbeeld. Hier op basis van een vector voor TOPO-klonering, zie practicum, maar in deze vector ook alle elementen voorzien voor expressie en verdere verwerking van het eiwitproduct.

* 5. Optimalisatiestrategieën bvb. C-terminale fusie aan een reportergen om expressierendement te testen in functie van (kleine) wijzigingen. Ondermeer door regio-specifieke willekeurige mutaties (o.a. in het gebied van ribosoombinding en initiatie) kan de beste producer geïdentificeerd worden. Op analoge wijze kan een N-terminale fusie aan een reportergen voorzien worden, en dusdanig dat na optimalisatie (regio-mutagenese) kan het reportergen geëxciseerd kan worden. Er wordt dan op gespeculeerd dat het C-terminale deel van de fusie geen invloed heeft op de expressieëfficientie. * GFP (green fluorescent protein) is een efficiënte, meer recente, reporter ; het oorspronkelijk geïsoleerde was een eiwit van 238 aminozuren (26,9 kDa) dat een groene fluorescentie (emissie bij 509 nm) geeft bij belichting met blauw licht (excitatie bij 395 nm en ook, in mindere mate, bij 475 nm). Het vereist Ca2+ ionen. Het werd geïsoleerd uit Aequorea victoria, maar heel wat andere mariene organismen bleken similaire eiwitten te bevatten. Er werden tevens tal van mutanten gemaakt (van het eerste en van latere) waarmee de eerste nadelen (2 excitatiegolflengtes en afhankelijkheid van cofactoren) konden uitgeschakeld worden. Expressies in nagenoeg alle organismen voor genmanipulatie werden bekomen.

Addendum : Genoomstrategie : lokaliseren van coderende gebieden (ORFs) in een genoomsequentie * N

Toegepast op een genomische DNA-sequentie met hoog G+C gehalte (75%) * N posities in codon Toegepast op een genomische DNA-sequentie met hoog G+C gehalte (75%) (in de DNA sequentie)