Student: Dekeyser Jonas Mentor: Prof. Matti Nykter

Integrated analysis of miRNA and mRNA microarray data in prostate cancer cells
Student: Dekeyser Jonas Mentor: Prof. Matti Nykter Promotor: Jasper Decuyper University of Tampere, BioMediTech

Inhoudsopgave Introductie Prostaatkanker
Differentiële miRNA/mRNA expressie analyse Resultaten Conclusie

Introductie Probleemstelling: Analyse gebaseerd op ERG en AR subtypes
Verschillen tussen prostaatkanker Analyse gebaseerd op ERG en AR subtypes Xenograft samples Doelstelling Validatie Niet alle prostaatkankers zijn hetzelfde en voor deze reden moet elk van deze kankers op een andere manier behandeld worden. Bijvoorbeeld een veelvoorkomend voorval in prostaatkanker is dat hormoon afhankelijke prostaatkanker behandeling resistent wordt na een bepaalde periode of in andere woorden castratie resistent wordt. Dit maakt het behandelen van dit soort kankers moeilijker. In dit project worden prostaatkanker samples gesubtyped gebaseerd op de expressie van bepaalde genen, daarna wordt er een differentiële expressie analyse uitgevoerd op de gesubtypeerde data. Deze analyse zou een beter inzicht moeten geven op deze subtypes wat uiteindelijk zou kunnen leiden tot het produceren van een gepersonaliseerde behandeling tegen deze prostaatkanker subtypes. De prostaat kanker samples worden gesubtyped of de expressie van 2 genen ERG en AR, de positieve samples vertonen een overexpressie van 1 van deze genen de negatieve samples vertonen een onder expressie van 1 van deze genen. Een xenograft is een stukje weefsel die wordt getransporteerd van een bepaald organisme naar een andere species. Bij deze samples is dat van de mens naar de muis (mannelijke muis). De uiteindelijke doelstelling van dit project is het vinden van microRNA en messengerRNA interacties die anders reageren in ERG positive en ERG negative samples. Dit wordt gedaan aan de hand van het uivoeren van een differentiële expressie analyse op gen expressie data en op miRNA expressie data. Na het uivoeren van deze 2 analyses wordt adhv van een linear model bepaald of er een negatieve correlatie is te vinden tussen het target gen en de miRNA. Deze interacties worden gezocht in xenograft samples en worden daarna gevalideerd in een databank die gen expressie data en miRNA expressie data bevat van echte prostaatkanker patiënten van zowel CRPC sample als van PC samples. Er wordt gezocht naar gelijke expressie motieven van de miRNA’s als van de target genen die gevonden zijn in de xenograft samples.

Prostaatkanker Algemene informatie kanker Adenocarcinoma
Oudere mannen (>65 jaar oud) Castratie Chirurgisch Chemisch Kanker is het resultaat van een ongecontroleerde groei en devisie van cellen. Het verschil tussen kanker cellen en normale cellen is dat normale cellen meer gespecialiseerd zijn, ze profileren in cellen met een specifieke functie. Normale cellen kunnen worden gecontroleerd. Kanker cellen negeren regulatie signalen en blijven groeien. Kanker cellen ontstaan wanneer een cel abnormaal begint te profileren. De abnormale groei van deze cellen leiden tot de creatie van een tumor. Kankers kunnen zich dan nog eens verdelen in types afhankelijk van in welke weefsels de tumor is ontstaan, zo is bijvoorbeeld prostaatkanker een adenocarcinoma. Een adenocarcinoma is een carcinoom dat is ontstaan in klierweefsel. De prostaat is een klier die bij de man vlak onder de blaas om de urinebuis heen zit. De prostaat produceert een aantal hulpstoffen die aan het sperma worden toegevoegd. Een veel voorkomende behandeling bij prostaatkanker is castratie, castratie is de behandeling waarbij de testikels worden verwijderd. Dit verminderd de groei van androgen onafhankelijke prostaatkankers doordat testikels de plaats is waar androgens zoals testosteron worden aangemaakt. Dit kan op 2 manieren chirurgish waarbij de teelballen via een operatie worden verwijderd. Een andere manier is aan de hand van medicatie. Deze medicatie verminderd de hoeveelheid testosteron in de testikels. Het grote verschil bij deze 2 technieken is dat de chemische manier reversibel is, de teelballen worden niet definitief verwijderd. Al zullen de teelballen krimpen bij het gebruik van deze medicatie

Prostaatkanker Androgen Receptor (AR) ETS-related gene (ERG)
DNA-bindend domein Androgen-bindend domein ETS-related gene (ERG) Transcriptiefactor Het androgen receptor gen is 90 kb lang en codeert voor een proteïne die een belangrijke rol speelt in gen expressie regulatie. Het gen bevat een DNA bindend domein en een androgen bindend domein. Wanneer een androgen zich bindt met de receptor dan zal de receptor zich transporteren naar de nuclues van de cel waar het op een specifieke plaats op het DNA zal binden en aan die hand de expressie van bepaalde genen zal regelen. ERG is een oncogen wat betekent, dat dit gen vaak wordt gemuteerd terug wordt gevonden in kanker. ERG is een transcriptiefactor, wat betekent dat het proteïne van het gen zich bind op specifieke plaatsen in het DNA om zo de transcriptie van specifieke genen worden gereguleerd.

Differentiële expressie analyse
microRNA (miRNA) Degradatie Imperfecte binding miRNA targets (miRWalk) MicroRNA’s zijn niet-coderende RNA’s die nucleotiden lang zijn. Ze spelen een grote rol in de regulatie van de translatie van bepaalde messengerRNA’s. MessengerRNA’s zijn afkomstig van de transcriptie van bepaalde genen in het DNA. Deze RNA’s worden na translatie omgezet in proteïnes. De regulatie van mRNA’s kan op 2 manieren gebeuren: Degradatie: Hier bij bindt het microRNA perfect met het stukje messenger RNA, waardoor het stukje mRNA door argonaute eiwiten wordt gedegradeert of geknipt. Wat translatie van het messengerRNA onmogelijk maakt. Wanneer het miRNA imperfect bindt met het stukje mRNA. Zal de miRNA de translatie van het mesenger RNA inhiberen doordat het niet perfect complementair is met het stukje mRNA. Om de target genen van bepaalde miRNA’s te bepalen kan er gebruik gemaakt worden van de site miRWalk. Mirwalk is een site waarmee je via verschillende algoritmen de target genen van bepaalde miRNA’s kan bepalen aan de hand van acgh structuur van deze miRNA’s. Enkele voorbeelden van de algoritmen zijn miRand,a PICTAR5 en TargetScan. In dit project werd er gebruik gemaakt van 5 algoritmes, wanneer een target gen werd voorspeld door meer dan 3 algoritmes, dan werd deze als waar gezien.

Hiërarchische clustering miRNA/mRNA data Agglomererend Scheidend Een eerste stap bij de differentiële expressie analyse is het clusteren van de samples om zo de samples via relevantie te kunnen groeperen en zo deze groepering of clustering te kunnen toewijzen aan bepaalde subtypes. De clustering van data kan via vele manieren of clustering algoritmes worden gedaan. Een eerste clusterings algoritme die werd gebruikt in dit project was het hiërarchische clusterings algoritme. Bij hiërarchische clustering is de output te zien als een dendrogram of een boom. Waarbij de takken de relevanties en de verschillen tussen de samples/clusters weergeeft. Een groot verschil dan bij andere clustering algoritmes is dat bij dit algoritme het aantal clusters niet hoeft gekend te zijn voor dat het algoritme wordt uitgevoerd. Dit algoritme kan op 2 manieren de data verdelen in clusters. Een eerste manier is een agglomererende manier. Hierbij wordt iedere data punt gezien als een cluster, en bij iedere run van dit algoritme wordt de twee dichtstbijzijnde clusters bij elkaar gevoegd. Tot er 1 enkele cluster wordt overgehouden. Een andere manier is scheidend manier. Hierbij werkt het algoritme in de omgekeerde zin. Het algoritme start met 1 cluster die alle data punten/ samples bezit en splits zich op naargelang hoever de clusters van elkaar bevinden. Dit gebeurt tot ieder data punt zich in 1 enkele cluster bevindt.

K-means Clustering miRNA/mRNA data Bepaal aantal clusters Hoofdcomponentenanalyse (PCA) Het K-means algoritme is snel en simpel. Het moet ook niet vele keren worden herhaald, voor het tot zijn eind verdeling komt. Nadelen van dit clusterings algoritme is dat het aantal clusters waarin de data samples moeten worden verdeeld voordien moeten gekend zijn. Dit kan worden bepaald door een grafiek op te stellen, waarbij we de variantie wordt bepaald van de output van het k-means algoritme in functie van het aantal clusters. Het streefdoel is om een zo klein mogelijk aantal clusters te hebben en een zo laag mogelijke variantie. In dit voorbeeld zou dit ongeveer 4 zijn. Hoofdcomponentenanalyse, of principale-componentenanalyse is een analysemethode in de statistiek om een grote hoeveelheid gegevens te beschrijven met een kleiner aantal relevante grootheden, de hoofdcomponenten of principale componenten. Ieder sample wordt hier dus voorgesteld als een simpel puntje in 3 dimensionele omgeving.

Two sample T-test Fold change P-waarde False discovery rate (FDR) Een T-test is een statische test, waarmee kan na gegaan worden of 2 populaties significant verschillend zijn of significant gelijk zijn ten opzichte van elkaar. Er zijn 3 variabelen die belangrijk zijn bij de output van deze test namelijk Fold change, P-value en False discovery rate (FDR) Fold change is een maat voor hoeveel een bepaalde hoeveelheid veranderd, gaan van de initiële waarde naar de finale waarde. Bijvoorbeeld we hebben een gen met een expressie level van 30 in het ERG positieve subtype en in het ERG negatieve subtypes is het expressielevel van dit gen 60. Doordat het expressielevel dubbel zo groot is spreken we van een fold change van 2 of -2. De p-waarde of overschrijdingskans is de kans dat de uitkomst van een nulhypothese behaald of overschreden wordt. De nulhypothese is bijvoorbeeld een fold change van 2 van een bepaald gen tussen 2 subtypes, is de p-value lager dan een bepaalde threshold zoals 5 of 1 procent dan kunnen we spreken dat de uitkomst significant is en de hypothese kan worden geaccepteerd. Maar is de p-waarde groter dan een bepaald significantie level spreken we van een niet significante uitkomst. De p-value is dus de kans die bepaalt of de fold change geen 2 i. FDR false discovery rate is een methode om valse afgewezen nulhyptheses op te sporen. Als er wordt gewerkt met grootte hoeveelheden data zoal in de analyse van genexpressie die de expressielevels bevat van meer dan gene bevat dan duid een significantie level van 5 procent op zeer veel vals positieven. De FDR methode bied hier een oplossing voor deze methode berekent een nieuwe p-value die zich niet baseerd op de gehele dataset maar alleen op de significante resultaten.

Resultaten Kwaliteitscontrole Boxplots
Normalisatie wordt gedaan om een standaardisatie van de variantie te bekomen tussen de verscheidene samples. Om zo vergelijkingsanalyses te kunnen uitvoeren tussen de verscheidene samples. De controle van de kwaliteit van een dataset of de controle van de variantie tussen de verschillende samples kan gedaan worden door de data te visualiseren via boxplots. Een boxplot is een grafische weergave van de vijf-getallensamenvatting, we kunnen vijf getallen aflezen van een boxplot de minimum waarde, de maximum waarde en 3 kwartielen waaronder meer de mediaan. Iedere boxplot is als het ware een samenvatting van ieder sample. Door de vorm en de positie van boxplots met elkaar te vergelijken. Kunnen we de kwaliteit van de dataset bespreken en kunnen we zien of de variantie tussen de verscheidene samples gelijk is.

Resultaten Hiërarchische clustering & K-means clustering
Na de kwaliteitscontrole en normalisatie wordt de data geclusterd aan de hand van 2 clustering algoritmes. Zowel de gen expressie als de miRNA expressie data werd geclusterd, alleen bij de clustering van de miRNA expressie data werd een gelijk resultaat gevonden tussen beide clusteringsalgoritmes. Clusters 1 en 2 hadden veel gemeen met de ERG pos en neg subtypes. Aan de hand van deze 2 subtypes werden dan 2 differentiële expressie analyses uitgevoerd op zowel miRNA expressie data als op gen expressie data.

Resultaten Two-sample T-test op miRNA expressie data
Parameters: Q value < 0,15 en Fold change: logFC > 2 of < -2 Het resultaat van de T-test op de miRNA expressie data gaf als resultaat 8 differentieel geëxpresseerde miRNA’s. 4 miRNA’s hiervan waren opgereguleerd in ERG neg samples en down gereguleerd in ERG pos samples. En de 4 andere juist omgekeerd, de output werd gefilterd op een significantie level van 0,15 en een fold change van hoger dan 2 of kleiner dan -2.

Resultaten Two-sample T-test op gen expressie data
Parameters: Q value<0,05 en Fold change: logFC >2 of <-2 Het resultaat van T-test op de gen expressie data gaf als resultaat 5 differentieel geëxpresseerde genen. 4 gene hiervan waren down gereguleerd in ERG neg samples en up gereguleerd in ERG pos samples. En 1 andere juist omgekeerd. De output werd gefilterd op een significantie level van 0,05 en een fold change van hoger dan 2 of kleiner dan -2

Resultaten miRNA-mRNA interacties Target genen microRNA’s Interacties
Door een lineair model te fitten op de miRNA’s en hun target genen, werden er 4 interacties gevonden die een negatieve correlatie ten opzichte van elkaar hadden. Met een negatieve correlatie wordt er bedoeld dat er een up regulatie is van het miRNA en een down regulatie is van het target gen of omgekeerd. Interacties

Validatie miRNA-mRNA interacties
CRPC (castration-resitant prostate cancer) PC (prostate cancer) PC Deze gevonden interacties zijn afkomstig van xenograft samples, deze moeten hierna worden gevalideerd in een dataset die miRNA en gen expressie data bevatten van echte prostaat kanker patiënten. De validatie gebeurd in PC sample als in CRPC samples. De validatie gaat als volgt er word op nieuw een T-test uitgevoerd op de gesubtypeerde samples van de patiënten dataset. En er wordt gezocht naar gelijke expressie patronen die gevonden zijn in de xenograft dataset. In de PC samples werden 2 gelijke miRNA-mRNA interacties terug gevonden. In de CRPC samples werden 3 gelijke miRNA-mRNA interacties terug gevonden. CRPC

Conclusie 4 miRNA-mRNA interacties 2 interacties gevalideerd in CRPC
hsa-miR-135a − RNF24 hsa-miR-125b − ELMO2 hsa-miR-200b − FECH hsa-miR-200a – FECH 2 interacties gevalideerd in CRPC 3 interacties gevalideerd in PC Toekomst perspectief Toekomst perspectief: Er is nog altijd geen zekerheid dat deze miRNA-mRNA interactions echt in praktijk voorkomen. Hiervoor moet een experimentele validatie in het lab worden. Een andere stap zou zijn het uivoeren ven een pathway analyse van deze interacties. Om nu daad werkleijk te weten in welke pathways deze interacties een rol spelen en wat hun invloed is op de expressie van ERG

Student: Dekeyser Jonas Mentor: Prof. Matti Nykter

Verwante presentaties

Presentatie over: "Student: Dekeyser Jonas Mentor: Prof. Matti Nykter"— Transcript van de presentatie:

Verwante presentaties

Over het project

Feedback

Inloggen

Inloggen via een sociaal netwerk:

Student: Dekeyser Jonas Mentor: Prof. Matti Nykter

Verwante presentaties

Presentatie over: "Student: Dekeyser Jonas Mentor: Prof. Matti Nykter"— Transcript van de presentatie:

Verwante presentaties

Over het project

Feedback