A forest of trees even with modest numbers of tip species, the number of possible trees is frightening. De meest voor de hand liggende methode om de meest spaarzame boom te vinden, is door alle mogelijke bomen te genereren, en dan na te gaan welke het minst aantal veranderingen vergt (bijvoorbeeld met de algoritmen van Fitch of Sankoff). Helaas, zoals hier zal blijken, is dit onbegonnen werk. Fitch W.M. 1971. Syst. Zool. 20: 406-416.
= Types of trees trees that seem different – may be not. Orang Oetan Chimpansee Chimpansee Orang Oetan Macaque Gorilla Human Gibbon Colobus Macaque Gibbon Gorilla Human Colobus Sommige voorstellingen van bomen lijken verschillend, maar zijn het niet echt. De links-rechts volgorde van de aftakkingen speelt immers geen rol. Bovenstaande bomen lijken visueel verschillend, maar hebben eigenlijk dezelfde ‘topologie’. In al wat volgt worden dergelijke bomen als identiek beschouwd – als we het aantal mogelijke bomen tellen, geldt dit slechts als één boom. Hoeveel bomen zijn er? Het antwoord hangt op die vraag hangt af van wat voor type bomen we bekijken. =
Types of trees there are always fewer unrooted trees than rooted trees. Alpha Delta Gamma Beta Epsilon Gamma Alpha Beta > Er zijn steeds minder ongewortelde bomen (unrooted trees) dan gewortelde bomen (rooted trees). Delta Epsilon Fitch W.M. 1971. Syst. Zool. 20: 406-416.
> Types of trees there are more labeled than unlabeled trees. Alpha Delta Gamma Beta Epsilon > Er zijn steeds minder ongewortelde bomen (unrooted trees) dan gewortelde bomen (rooted trees). Fitch W.M. 1971. Syst. Zool. 20: 406-416.
Forests of labeled, rooted, bifurcating trees 2 tip species a b We gaan nu na hoeveel gelabelde, bifurcate, gewortelde bomen er zijn bij 2, 3 en 4 tipsoorten. Met twee tipsoorten is uiteraard slechts één topologie mogelijk.
Forests of labeled, rooted, bifurcating trees 3 tip species a b c a c b b c a Met drie tipsoorten zijn dat er 3.
Forests of labeled, rooted, bifurcating trees 4 tip species a b c d a c b d b c a d a b d c a d b c b d a c a c d b a d c b d c a b b c d a Met vier tipsoorten zijn dat er al 15. b d c a c d b a a b c d a c b d a d b c
Forests of labeled, rooted, bifurcating trees n tip species (2n -3)! # possible trees = 2n-2(n - 2)! = 1 x 3 x 5 x 7 x 9 x 11 x … x (2n-3) Het kan aangetoond worden dat het totaal aantal mogelijke bifurcate, gewortelde, gelabelde bomen gegeven wordt door bovenstaande formule.,
Forests of labeled, rooted, bifurcating trees #tips #trees 2 1 3 4 15 5 105 6 945 7 10395 8 135135 9 2027025 10 34459425 11 6.55E+08 12 1.37E+10 13 3.16E+11 14 7.91E+12 2.13E+14 20 8.2E+21 30 4.95E+38 40 1.01E+57 50 2.75E+76 n tip species Hieruit blijkt dat het aantal mogelijke bomen angstaanjagend snel oploopt met het aantal tipsoorten. Alle mogelijke bomen daadwerkelijk opstellen en evalueren is slechts praktisch haalbaar tot maximum 10 tipsoorten. Dit maximum zal wel nog wat oplopen met de stijgende kracht van computers, maar slechts heel traag. Voorbij de 20 soorten krijgt men te maken met aantallen die groter zijn dan het getal van Avogadro. Voor 50 soorten komt het aantal mogelijke bomen in de buurt van het getal van Eddington, het aantal electronen in het zichtbare deel van het heelal. Het bepalen van het aantal mogelijke bomen is niet zo belangrijk. Het doel van dit hoofdstuk was aan te tonen dat er al snel té veel bomen kunnen bedacht worden om individueel evalueren van elke boom in de praktijk toe te laten. Dit heeft ernstige gevolgen voor de manier waarop we op zoek moeten gaan naar de beste boom. Avogadro Eddington