Download de presentatie
GepubliceerdJasper Eilander Laatst gewijzigd meer dan 10 jaar geleden
1
formele analyse van taxonomische gegevens NUMERIEKE TAXONOMIE
Van artificieel klasseren naar fylogenetische reconstructie Historische ontwikkeling van de systematiek 5. Ontwikkelingen in de twintigste eeuw formele analyse van taxonomische gegevens NUMERIEKE TAXONOMIE
2
vorm-systematiek: heuristiek
Alfa-taxonomie en vorm-systematiek vaak het resultaat van heuristische analyse. Maar het gebruik van geïsoleerde kenmerken leidt tot artificiële systemen. Conventionele systematiek is vooral gebaseerd op morfologische en anatomische gegevens over de bestudeerde organismen. De menselijke geest is inderdaad zeer geschikt om grote hoeveelheden informatie van die aard te verwerken en op zicht te interpreteren. Een getrainde herbariumtaxonoom herkent een gedroogd specimen behorend tot een hem vertrouwde groep meteen, zich baserend op het globale morfologische patroon van het exemplaar. De geoefende veldbioloog werkt eveneens op “Gestalt” wanneer hij organismen in hun biotoop snel en met zekerheid determineert.
3
1. analyse kenmerken 2. synthese → taxa
4
Hoe meer niet-morfologische gegevens, hoe moeilijker de heuristische interpretatie.
5
Bacteriologie: zeer beperkt set aan morfologische gegevens (vorm van de cellen; vorm en kleur van kolonies, gram kleuring …) Coccen, bacillen en spirillen. Gram positieve kleuring van Bacillus anthracis (paars); gram negatief = rose. + fysiologische eigenschappen + biochemische tests
6
analyse kenmerken synthese taxa vorm van de cellen
vorm en kleur van kolonies gram kleuring fysiologische eigenschappen biochemische tests synthese taxa
7
For most major biological groups [including the bacteria],
R.Y. Stainier, M. Doudoroff & A.E. Adelberg (1970) The microbial world, ed. 3, p Prentice-Hall For most major biological groups [including the bacteria], the general course of evolution will probably never be known, and there is simply not enough evidence to base their classification on phylogenetic grounds. For these and other reasons, most modern taxonomists have explicitly abandoned the phylogenetic approach … i.e. de tijdsgeest waarin Sokal en Sneath de denkwijzen van de numerieke taxonomie ontwikkelden
8
Robert R. Sokal (1925 - ) & Peter H.A. Sneath ( ? - )
Robert Sokal (born January 13, 1926, in Vienna, Austria) is an Austrian-American biostatistician and anthropologist. Distinguished Professor Emeritus at the State University of Stony Brook, New York, Sokal is a member of the National Academy of Sciences and the American Academy of Arts and Sciences. He has pioneered the use of statistics in biology and co-founded the field of numerical taxonomy, together with P. H. A. Sneath. Peter HA Sneath 1969 eredoctoraat UGent; emeritus professor University of Leicester; microbioloog Naarmate de systematiek de veronderstelde verwantschappen met gegevens uit andere domeinen (cytologie, fytochemie ...) wil bevestigen, wordt de heuristische interpretatie steeds moeilijker. Niet alleen zijn deze eigenschappen door hun aard moeilijker voor menselijke perceptie vatbaar, bovendien wordt de beschikbare set van gegevens steeds groter (veelkenmerkensystematiek!), en dus niet zo gemakkelijk meer te overzien. Het wordt dan vanzelfsprekend dat de taxonoom grijpt naar een wiskundige verwerkingsmethode.
9
Principles of Numerical Taxonomy
Sokal & Sneath 1963 Principles of Numerical Taxonomy Sneath & Sokal 1973 ed. 2 “One reason the book has been so widely cited is that it was very comprehensive, covering all aspects of classification including nonbiological applications. It contained numerous formulae and descriptions of algorithms but was not too heavily mathematical. It also reviewed critically the voluminous literature of the preceding 10 years. PHA Sneath, Current Contents 1987 Mathematische verwerking van de gegevens bleef echter om rekentechnische mogelijkheden lang beperkt tot enkele kenmerken. Door de opkomst van de computer kwam de zogenaamde numerieke taxonomie vanaf de jaren 1950 echter tot snelle ontwikkeling en bloei. Het standaardwerk Principles of Numerical Taxonomy werd in het begin van de jaren zestig gepubliceerd (Sokal & Sneath 1963; tweede editie: Sneath & Sokal 1973).
10
Caminalcules: 29 recent / 48 fossiel
Cf bouwplan! Later gebruikte Sokal een ingebeelde groep organismen, de Caminalcules, voor het ontwikkelen van de theorie van de numerieke taxonomie. Sokal, R. R.; K. L. Fiala; G. Hart (December 1984). "OTU Stability and Factors Determining Taxonomic Stability: Examples from the Caminalcules and the Leptopodomorpha". Systematic Zoology 33 (4): Hij werd later theoreticus van de cladistiek, en ging verder met theoretische bijdragen over de Caminalcules Sokal, R. R. (June 1983). "A phylogenetic analysis of the Caminalcules. I. The data base". Systematic Zoology 32 (2): Sokal, R. R. (June 1983). "A phylogenetic analysis of the Caminalcules. II. Estimating the true cladogram". Systematic Zoology 32 (2): Sokal, R. R. (September 1983). "A phylogenetic analysis of the Caminalcules. III. Fossils and Classification". Systematic Zoology 32 (3): Sokal, R. R. (September 1983). "A phylogenetic analysis of the Caminalcules. IV. Congruence and Character Stability". Systematic Zoology 32 (3): Caminalcules: 29 recent / 48 fossiel Sokal, R. R.; K. L. Fiala; G. Hart (December 1984). "OTU Stability and Factors Determining Taxonomic Stability: Examples from the Caminalcules and the Leptopodomorpha". Systematic Zoology 33 (4):
11
Numerieke taxonomie - beginselen
kenmerken 1. alleen homoloog 2. consistente analyse 3. ongewogen 4. zoveel mogelijk synthese 1. fenetisch standpunt 2. wiskundig model * * meestal geometrisch model (multivariate analyse met bijvoorbeeld Euclidische afstand)
12
kenmerken 1. alleen homoloog 2. consistente analyse 3. ongewogen 4. zoveel mogelijk synthese 1. fenetisch standpunt 2. wiskundig model *
13
Kenmerk: huidschubben
Homoloog??
14
Beukenootjes en kastanjes zijn homoloog
15
Quercus acutissima (USA)
16
Evolutie van de onderkaak bij reptielen: ontstaan van een secundair onderkaakgewricht
17
kenmerken 1. alleen homoloog 2. consistente analyse 3. ongewogen 4. zoveel mogelijk synthese 1. fenetisch standpunt 2. wiskundig model *
18
alfa-taxonomie diairesis als oorzaak van inconsistente analyse
19
kenmerken 1. alleen homoloog 2. consistente analyse 3. ongewogen 4. zoveel mogelijk synthese 1. fenetisch standpunt 2. wiskundig model *
20
alfa-taxonomie gewogen kenmerken aantal poten > kleur van de beharing aantal cotylen > bladconsistentie
21
kenmerken 1. alleen homoloog 2. consistente analyse 3. ongewogen 4. zoveel mogelijk synthese 1. fenetisch standpunt 2. wiskundig model
22
kenmerken 1. alleen homoloog 2. consistente analyse 3. ongewogen
4. zoveel mogelijk synthese 1. fenetisch standpunt 2. wiskundig model De meeste numerieke taxonomen passen een geometrisch model toe op het feitenmateriaal. Dit wiskundig model kunnen wij ons het best voorstellen in een twee- of driedimensionale ruimte. Taxa waarvoor twee of drie kenmerken zijn onderzocht kunnen worden voorgesteld als punten in de twee- of driedimensionale ruimte. De taxonoom werkt echter met meer variabelen: het geometrisch model wordt daardoor multidimensionaal. Wiskundige analyse volgens dit model gaat uit van het axioma dat twee taxonomische objecten met dezelfde waarden voor alle variabelen zich op hetzelfde punt in de hyperruimte bevinden, en dat objecten met verschillende waarden een ander punt innemen. De geobserveerde fenetische verschillen tussen de taxa waarin de studiegroep wordt ingedeeld (de gekozen “operational taxonomic units” of OTU's [1]) resulteren dus in een verschillende positie: dissimilariteit tussen taxonomische objecten wordt voorgesteld door afstanden tussen punten in de hyperruimte, en verwantschap komt overeen met clusters van OTU’s waartussen slechts kleine afstanden bestaan. Door opeenvolgende groepering van clusters kan uiteindelijk een hiërarchisch systeem van taxonomische groepen opgebouwd worden. [1] Het taxon van laagste rang in een bepaald numeriek taxonomisch onderzoek is de “operational taxonomic unit” (OTU) : het kan een familie zijn, een soort, een individu of om het even welke formele of informele eenheid.
23
Werkwijze van de numerieke taxonomie keuze studiegroep en OTU’s
(operational taxonomic units) analyse van zoveel mogelijk homologe kenmerken codering kenmerken en hun toestanden - aan /afwezig - kwantitatieve meertoestandenkenmerken: standaardiseren - kwalitatieve meertoestandenkenmerken - probleem binnen-OTU variatie - probleem ontbrekende gegevens rekenblad met ruwe gegevens multivariate analyse: Systat, Statistica, NTSYSpc 6. taxonomische conclusies De eerste stap van een numerieke analyse behelst een mathematische codering van de bestudeerde kenmerken; het + of - coderen van een aan- of afwezigheid is de eenvoudigst mogelijke codering. Kwantitatieve meertoestandenkenmerken zijn ook op eenvoudige manier mathematisch uit te drukken, maar dienen achteraf gestandaardiseerd te worden (hun gemiddelde waarden = 0 en hun standaarddeviaties = 1). De codering van kwalitatieve meertoestandenkenmerken schept de grootste problemen. Een tweede moeilijkheid betreft de inconsistentie van de OTU’s: het onvolledig bekend zijn van sommige ervan, of het voorkomen van een kenmerk dat in de meeste OTU’s verschillende toestanden heeft, maar in enkele OTU’s afwezig is. Sneath & Sokal (op. cit.) gaan dan ook uitgebreid in op het coderen van kenmerken.
24
Werkwijze van de numerieke taxonomie
keuze studiegroep en OTU’s (operational taxonomic units) analyse van zoveel mogelijk homologe kenmerken codering kenmerken en hun toestanden rekenblad met ruwe gegevens multivariate analyse: Systat, Statistica, NTSYSpc - euclidische afstand, Pearson … - clusteranalyse → dendrogram (fenogram) - PCA & aanverwante methoden 6. taxonomische conclusies Eenmaal de kenmerkenwaarden in een gegevensmatrix zijn samengebracht, kan men de verdeling van de punten die in de hyperrruimte met de taxonomische objecten overeenkomen niet zomaar interpreteren. In de praktijk zijn er dus algoritmen nodig voor de berekening van de afstanden en het detecteren van de clusters. De eenvoudigste manier om de afstanden tussen objecten in de geometrische hyperruimte te bepalen is de berekening van de zogenaamde Euclidische afstand. Het is een directe afstandsberekening, die gebaseerd is op de uitbreiding van twee naar meer dimensies van de formule voor de schuine zijde van een rechthoekige driehoek. In de Sokal & Sneath-school maakt men daarentegen vaker gebruik van indirecte afstandsbepalingen of hoekmetingen. Deze zijn een uitdrukking van de hoek tussen de assen getrokken vanuit de oorsprong naar het object in de hyperruimte. Het meest frequent gebruikt is Pearsons product-moment correlatie-coëfficiënt r, die varieert tussen +1 en -1. De afstanden of correlaties tussen taxonomische objecten worden in de numerieke analyse vooral toegepast voor de uitvoering van clusteranalyses. Deze resulteren in dendrogrammen (in de numerieke taxonomie vaker fenogrammen genoemd), waarop de lengte van de takken van het diagram een maat is voor de similariteit of dissimilariteit tussen de OTU’s. Een tweede veelgebruikte analysetechniek is hoofdcomponentenanalyse (P.C.A., principal component analysis) gevolgd door ordinatie.
Verwante presentaties
© 2024 SlidePlayer.nl Inc.
All rights reserved.