formele analyse van taxonomische gegevens NUMERIEKE TAXONOMIE

Slides:



Advertisements
Verwante presentaties
Voltooid tegenwoordige tijd
Advertisements

Een dag uit het leven van Plotseling Waar je als Lord al niet druk mee kunt zijn …
REBELS: Race and Ethnicity Based Education; Local Solutions
Effect I-Pod op radio luisteren. Effect I-Pod op radio I-POD’s en Podcasting hot topic MP3 spelers zijn populair en worden steeds vaker geintegreerd in.
BEKERING IN EEN POSTMODERNE CONTEXT EZA RAADSVERGADERING 10 OKTOBER 2011 MIRANDA KLAVER I once was lost?
donderdag 17 juli 2014 Thursday, 17 July 2014 Those who smoke, will die !!!! Those who don’t smoke……….. RIGHT !! Zij die roken, zullen sterven !!!! Zij.
IMAGINE John Lennon Muziek en tekst zijn gesynchroniseerd.
RWW unit 6 Passive-de lijdende vorm Vergelijk deze zinnen:
Vrije Universiteit amsterdamPostacademische Cursus Informatie Technologie Universal Modeling Language … why you need models? Models are necessary to communicate,
serologische systematiek moleculaire systematiek
Past Simple Onvoltooid verleden tijd Regelmatige werkwoorden:
Herhaling hoofdstuk 3 A. Wat is de Past Simple?
past simple en present perfect
Rational Unified Process RUP Jef Bergsma. Iterations –Inception –Elaboration –Construction –Transition De kernbegrippen (Phases)
Reflections on life Sound on Reflecties op het leven. Geluid aan.
English and IPC How to teach content through English.
Paragraph  People wanted to avoid war in the future.  League of Nations (1919) had failed.  In 1945: 2 nd try: United Nations.
‘WAIT FOR ME’ Lees met elkaar de songtekst Klik door naar volgende scherm.
EUROCITIES-NLAO is supported under the European Community Programme for Employment and Social Solidarity (PROGRESS ). The information contained.
Deltion College Engels B2 Schrijven [Edu/006] thema: Euromail can-do : kan in persoonlijke s nieuws en standpunten van een ander becommentariëren.
MAN IN BLACK JOHNNY CASH. Well, you wonder why I always dress in black, Why you never see bright colors on my back, Dus, je vraagt je af waarom ik altijd.
Gatenteksten: tactiek Skimmen Line of thought vinden Om het gat heen lezen mbv 3-zinnentruc 1 zin vooraf, 1 erna + zin waarin het gat zit Gat invullen.
Informatievaardigheden Feedback BPE Marja Maclaine Pont Bibliotheek Wageningen UR 30 september 2010.
Deltion College Engels B2 Lezen [Edu/003] thema: Topical News Lessons: The Onestop Magazine can-do: kan artikelen en rapporten begrijpen die gaan over.
Informatievaardigheden Feedback BPE Marja Maclaine Pont Bibliotheek Wageningen UR 29 september 2011.
2G 16 November Today’s lesson  Last class  Mull  Puffins  Check homework (ex )  Thursday 9 December: TEST UNIT 2.
Deltion College Engels B2 Gesprekken voeren [Edu/009] thema: ‘We’d better go to…’ can-do : kan in vertrouwde situaties actief meedoen aan discussies over.
Lesson 5. Today’s lesson Check homework Grammar: present perfect Presentations Spelling basics.
Monday, 20 April 2015 maandag 20 april 2015 Click Klik.
Deltion College Engels B2 Gesprekken voeren [Edu/007] thema: ‘With this mobile you can…’ can-do : kan op betrouwbare wijze gedetailleerde informatie doorgeven.
Behind Interactive Media. Agenda 1.Intro Content Mangement Systemen 2.Open Source 3.CMS vergelijking 4.Wordpress installeren 5.Huiswerk.
Nederlandse Organisatie voor Wetenschappelijk Onderzoek Semantic Web and Library Applications Workshop Presented by Luit Gazendam.
Deltion College Engels B2 (telefoon)gesprekken voeren[Edu/002] /subvaardigheid lezen/schrijven thema: I am so sorry for you… can-do : kan medeleven betuigen.
6de jaar ASO Lindsay Borremans
Kom, ga met ons mee Come, go with us. ‘Wij vertrekken nu naar het land dat de Heer ons beloofd heeft. Ga met ons mee! Je zult het goed hebben bij ons.
Financial Intelligence Unit of Aruba MOT Subjectief melden, een sprookje?
Creating local Europeana related networks Europeana taskforce Hans van der Linden 17/4/15.
GegevensAnalyse Les 2: Bouwstenen en bouwen. CUSTOMER: The Entity Class and Two Entity Instances.
Vrijwilliger voor de S.I.R.O Woonzorgcentrum Sinnehiem in Haulerwijk Sinnehiem Radio omroep is met spoed op zoek naar een vrijwilliger. Een vrijwilliger.
Boek en bibliotheek: de toekomst Bas Savenije, algemeen directeur KB KVB Symposium, 27 april 2011.
The Research Process: the first steps to start your reseach project. Graduation Preparation
Present perfect Voltooid tegenwoordige tijd. Bevestigende zinnen De present perfect bestaat uit have / has + voltooid deelwoord. I, you, we, they have.
Key Process Indicator Sonja de Bruin
Welkom in de Top-2000 kerkdienst
PILOT TOETSING PERIODE 2 LES 1: BEOORDELEN VAN GROEPSWERK
Innovatie met IBM Cloud Orchestrator.
Inhoudsopgave Fasering Product Clearing & Settlement
Directe en indirecte oorzaken van gewelddadig extremisme
Presentatie titel Measurement education in the junior primary –
Past Simple vs Present Perfect
Werkwijze Hoe zullen we als groep docenten te werk gaan?
De taaltaak
Innovate-IT Enkele toepassingen
Today: Chapter 2 Discuss SO 2 What to study for your test?
Present Perfect allesvoorengels.nl.
<Typ titel via Beeld, Koptekst en voettekst, Koptekst>
Participatory Action Research
Unit 2: LESSON 2 practicing the grammar: betrekkelijke voornaamwoorden
Vreugde Joy.
Who knows something about scenarioplanning?
2 Corinthians 4:5-7 “For what we proclaim is not ourselves, but Jesus Christ as Lord, with ourselves as your servants for Jesus' sake. For God, who said,
DE ADVIEZEN VAN BEURSMAKELAAR BERNARD BUSSCHAERT
Dynamic Architecture What about you?
Empty handed here I come,
Matthew 16 “But who do you say that I am?”  Simon Peter replied, “You are the Christ, the Son of the living God.”  And Jesus answered him, “Blessed are.
ERD maken.
Voltooid tegenwoordige tijd
Leerlingen zeiden: “Je MOET hem loslaten
Past simple vs present perfect
Moving Minds DNA.
Transcript van de presentatie:

formele analyse van taxonomische gegevens NUMERIEKE TAXONOMIE Van artificieel klasseren naar fylogenetische reconstructie Historische ontwikkeling van de systematiek 5. Ontwikkelingen in de twintigste eeuw formele analyse van taxonomische gegevens NUMERIEKE TAXONOMIE

vorm-systematiek: heuristiek Alfa-taxonomie en vorm-systematiek vaak het resultaat van heuristische analyse. Maar het gebruik van geïsoleerde kenmerken leidt tot artificiële systemen. Conventionele systematiek is vooral gebaseerd op morfologische en anatomische gegevens over de bestudeerde organismen. De menselijke geest is inderdaad zeer geschikt om grote hoeveelheden informatie van die aard te verwerken en op zicht te inter­preteren. Een getrainde herbariumtaxonoom herkent een gedroogd specimen behorend tot een hem vertrouwde groep meteen, zich baserend op het globale morfologische patroon van het exemplaar. De geoefende veldbioloog werkt eveneens op “Gestalt” wanneer hij organismen in hun biotoop snel en met zekerheid determineert.

1. analyse kenmerken 2. synthese → taxa

Hoe meer niet-morfologische gegevens, hoe moeilijker de heuristische interpretatie.

Bacteriologie: zeer beperkt set aan morfologische gegevens (vorm van de cellen; vorm en kleur van kolonies, gram kleuring …) Coccen, bacillen en spirillen. Gram positieve kleuring van Bacillus anthracis (paars); gram negatief = rose. + fysiologische eigenschappen + biochemische tests

analyse kenmerken synthese taxa vorm van de cellen vorm en kleur van kolonies gram kleuring fysiologische eigenschappen biochemische tests synthese taxa

For most major biological groups [including the bacteria], R.Y. Stainier, M. Doudoroff & A.E. Adelberg (1970) The microbial world, ed. 3, p. 529. Prentice-Hall For most major biological groups [including the bacteria], the general course of evolution will probably never be known, and there is simply not enough evidence to base their classification on phylogenetic grounds. For these and other reasons, most modern taxonomists have explicitly abandoned the phylogenetic approach … i.e. de tijdsgeest waarin Sokal en Sneath de denkwijzen van de numerieke taxonomie ontwikkelden

Robert R. Sokal (1925 - ) & Peter H.A. Sneath ( ? - ) Robert Sokal (born January 13, 1926, in Vienna, Austria) is an Austrian-American biostatistician and anthropologist. Distinguished Professor Emeritus at the State University of Stony Brook, New York, Sokal is a member of the National Academy of Sciences and the American Academy of Arts and Sciences. He has pioneered the use of statistics in biology and co-founded the field of numerical taxonomy, together with P. H. A. Sneath. Peter HA Sneath 1969 eredoctoraat UGent; emeritus professor University of Leicester; microbioloog Naarmate de systematiek de veronderstelde verwantschappen met gegevens uit andere domeinen (cytologie, fytochemie ...) wil bevestigen, wordt de heuristische interpretatie steeds moeilijker. Niet alleen zijn deze eigenschappen door hun aard moeilijker voor menselijke perceptie vatbaar, bovendien wordt de beschikbare set van gegevens steeds groter (veelkenmerken­systematiek!), en dus niet zo gemakkelijk meer te overzien. Het wordt dan vanzelfsprekend dat de taxonoom grijpt naar een wiskundige verwerkingsmethode.

Principles of Numerical Taxonomy Sokal & Sneath 1963 Principles of Numerical Taxonomy Sneath & Sokal 1973 ed. 2 “One reason the book has been so widely cited is that it was very comprehensive, covering all aspects of classification including nonbiological applications. It contained numerous formulae and descriptions of algorithms but was not too heavily mathematical. It also reviewed critically the voluminous literature of the preceding 10 years. PHA Sneath, Current Contents 1987 Mathematische verwerking van de gegevens bleef echter om rekentechnische mogelijkheden lang beperkt tot enkele kenmerken. Door de opkomst van de computer kwam de zogenaamde numerieke taxonomie vanaf de jaren 1950 echter tot snelle ontwikkeling en bloei. Het standaardwerk Principles of Numerical Taxonomy werd in het begin van de jaren zestig gepubliceerd (Sokal & Sneath 1963; tweede editie: Sneath & Sokal 1973).

Caminalcules: 29 recent / 48 fossiel Cf bouwplan! Later gebruikte Sokal een ingebeelde groep organismen, de Caminalcules, voor het ontwikkelen van de theorie van de numerieke taxonomie. Sokal, R. R.; K. L. Fiala; G. Hart (December 1984). "OTU Stability and Factors Determining Taxonomic Stability: Examples from the Caminalcules and the Leptopodomorpha". Systematic Zoology 33 (4): 387-407. Hij werd later theoreticus van de cladistiek, en ging verder met theoretische bijdragen over de Caminalcules Sokal, R. R. (June 1983). "A phylogenetic analysis of the Caminalcules. I. The data base". Systematic Zoology 32 (2): 159-184. Sokal, R. R. (June 1983). "A phylogenetic analysis of the Caminalcules. II. Estimating the true cladogram". Systematic Zoology 32 (2): 185-201. Sokal, R. R. (September 1983). "A phylogenetic analysis of the Caminalcules. III. Fossils and Classification". Systematic Zoology 32 (3): 248-258. Sokal, R. R. (September 1983). "A phylogenetic analysis of the Caminalcules. IV. Congruence and Character Stability". Systematic Zoology 32 (3): 259-275. Caminalcules: 29 recent / 48 fossiel Sokal, R. R.; K. L. Fiala; G. Hart (December 1984). "OTU Stability and Factors Determining Taxonomic Stability: Examples from the Caminalcules and the Leptopodomorpha". Systematic Zoology 33 (4): 387-407.

Numerieke taxonomie - beginselen kenmerken 1. alleen homoloog 2. consistente analyse 3. ongewogen 4. zoveel mogelijk synthese 1. fenetisch standpunt 2. wiskundig model * * meestal geometrisch model (multivariate analyse met bijvoorbeeld Euclidische afstand)

kenmerken 1. alleen homoloog 2. consistente analyse 3. ongewogen 4. zoveel mogelijk synthese 1. fenetisch standpunt 2. wiskundig model *

Kenmerk: huidschubben Homoloog??

Beukenootjes en kastanjes zijn homoloog

Quercus acutissima (USA)

Evolutie van de onderkaak bij reptielen: ontstaan van een secundair onderkaakgewricht

kenmerken 1. alleen homoloog 2. consistente analyse 3. ongewogen 4. zoveel mogelijk synthese 1. fenetisch standpunt 2. wiskundig model *

alfa-taxonomie diairesis als oorzaak van inconsistente analyse

kenmerken 1. alleen homoloog 2. consistente analyse 3. ongewogen 4. zoveel mogelijk synthese 1. fenetisch standpunt 2. wiskundig model *

alfa-taxonomie gewogen kenmerken aantal poten > kleur van de beharing aantal cotylen > bladconsistentie

kenmerken 1. alleen homoloog 2. consistente analyse 3. ongewogen 4. zoveel mogelijk synthese 1. fenetisch standpunt 2. wiskundig model

kenmerken 1. alleen homoloog 2. consistente analyse 3. ongewogen 4. zoveel mogelijk synthese 1. fenetisch standpunt 2. wiskundig model De meeste numerieke taxonomen passen een geometrisch model toe op het feitenmateriaal. Dit wiskundig model kunnen wij ons het best voorstellen in een twee- of driedimensionale ruimte. Taxa waarvoor twee of drie kenmerken zijn onderzocht kunnen worden voorgesteld als punten in de twee- of driedimensionale ruimte. De taxonoom werkt echter met meer variabelen: het geometrisch model wordt daardoor multidimensionaal. Wiskundige analyse volgens dit model gaat uit van het axioma dat twee taxonomische objecten met dezelfde waarden voor alle variabelen zich op hetzelfde punt in de hyperruimte bevinden, en dat objecten met verschillende waarden een ander punt innemen. De geobserveerde fenetische verschillen tussen de taxa waarin de studiegroep wordt ingedeeld (de gekozen “opera­tional taxonomic units” of OTU's [1]) resulteren dus in een verschillende positie: dissimilariteit tussen taxonomische objecten wordt voorgesteld door afstanden tussen punten in de hyperruimte, en verwantschap komt overeen met clusters van OTU’s waartussen slechts kleine afstanden bestaan. Door opeenvolgende groepering van clusters kan uiteindelijk een hiërarchisch systeem van taxonomische groepen opgebouwd worden. [1] Het taxon van laagste rang in een bepaald numeriek taxonomisch onderzoek is de “operational taxonomic unit” (OTU) : het kan een familie zijn, een soort, een individu of om het even welke formele of informele eenheid.

Werkwijze van de numerieke taxonomie keuze studiegroep en OTU’s (operational taxonomic units) analyse van zoveel mogelijk homologe kenmerken codering kenmerken en hun toestanden - aan /afwezig - kwantitatieve meertoestandenkenmerken: standaardiseren - kwalitatieve meertoestandenkenmerken - probleem binnen-OTU variatie - probleem ontbrekende gegevens rekenblad met ruwe gegevens multivariate analyse: Systat, Statistica, NTSYSpc 6. taxonomische conclusies De eerste stap van een numerieke analyse behelst een mathematische codering van de bestudeerde kenmerken; het + of - coderen van een aan- of afwezigheid is de eenvoudigst mogelijke codering. Kwantitatieve meertoestandenkenmerken zijn ook op eenvoudige manier mathematisch uit te drukken, maar dienen achteraf gestandaardiseerd te worden (hun gemiddelde waarden = 0 en hun standaard­deviaties = 1). De codering van kwalitatieve meertoestanden­kenmerken schept de grootste problemen. Een tweede moeilijkheid betreft de inconsistentie van de OTU’s: het onvolledig bekend zijn van sommige ervan, of het voorkomen van een kenmerk dat in de meeste OTU’s verschillende toestanden heeft, maar in enkele OTU’s afwezig is. Sneath & Sokal (op. cit.) gaan dan ook uitgebreid in op het coderen van kenmerken.

Werkwijze van de numerieke taxonomie keuze studiegroep en OTU’s (operational taxonomic units) analyse van zoveel mogelijk homologe kenmerken codering kenmerken en hun toestanden rekenblad met ruwe gegevens multivariate analyse: Systat, Statistica, NTSYSpc - euclidische afstand, Pearson … - clusteranalyse → dendrogram (fenogram) - PCA & aanverwante methoden 6. taxonomische conclusies Eenmaal de kenmerkenwaarden in een gegevensmatrix zijn samengebracht, kan men de verdeling van de punten die in de hyperrruimte met de taxonomische objecten overeenkomen niet zomaar interpreteren. In de praktijk zijn er dus algoritmen nodig voor de berekening van de afstanden en het detecteren van de clusters. De eenvoudigste manier om de afstanden tussen objecten in de geometrische hyperruimte te bepalen is de berekening van de zogenaamde Euclidische afstand. Het is een directe afstandsberekening, die gebaseerd is op de uitbreiding van twee naar meer dimensies van de formule voor de schuine zijde van een rechthoekige driehoek. In de Sokal & Sneath-school maakt men daarentegen vaker gebruik van indirecte afstandsbepalingen of hoek­metingen. Deze zijn een uitdrukking van de hoek tussen de assen getrokken vanuit de oorsprong naar het object in de hyperruimte. Het meest frequent gebruikt is Pearsons product-moment correlatie-coëfficiënt r, die varieert tussen +1 en -1. De afstanden of correlaties tussen taxonomische objecten worden in de numerieke analyse vooral toegepast voor de uitvoering van clusteranalyses. Deze resulteren in dendrogrammen (in de numerieke taxonomie vaker fenogrammen genoemd), waarop de lengte van de takken van het diagram een maat is voor de similariteit of dissimilariteit tussen de OTU’s. Een tweede veelgebruikte analysetechniek is hoofdcomponentenanalyse (P.C.A., principal component analysis) gevolgd door ordinatie.