Discrete keuze theorie H01I6A Verkeerskunde basis cursus 2011 Francesco Viti & Willem Himpe Author: Jim Stada Traffic and Infrastructure Faculty of Engineering Katholieke Universiteit Leuven
H01I6A Verkeerskunde Cursus 2011 Overzicht college Keuze Utiliteit Logitmodel Voorbeelden Specificatie Aggregatie Beperkingen Nested logitmodel H01I6A Verkeerskunde Cursus 2011
Voorbeelden van keuze in de verkeerskunde Gebieds- gegevens Ritproductie/ ritattractie Vervoersstromen Trip-ends Verplaatsings- weerstanden H-B tabellen Distributie/ vervoerwijzekeuze Toedeling Transport netwerken Keuze voor: Wel of niet maken van verplaatsing Bestemming Vervoerwijze Route H01I6A Verkeerskunde Cursus 2011
Discrete keuze theorie Algemene theorie over keuze tussen discrete (elkaar uitsluitende) alternatieven Afkomstig uit de psychologie en economie Belangrijke referenties: Daniel Mc Fadden M. Ben Akiva en S. Lerman (1985) Discrete choice analysis: Theory and application to Travel Demand (The MIT Press) Kenneth Train H01I6A Verkeerskunde Cursus 2011
H01I6A Verkeerskunde Cursus 2011 Werkwijze dataset met gegevens over de keuzes die mensen gemaakt hebben in bepaalde situaties Opsporen regelmatigheden in die keuzes Gieten in mathematische vorm Afgeleide formules gebruiken om de keuzes in nieuwe situaties te voorspellen. H01I6A Verkeerskunde Cursus 2011
Kenmerken van alternatieven en keuzemaker + een keuzeregel Kenmerken alternatieven Reistijd Reiskosten Comfort Auto t1 k1 c1 Bus t2 k2 c2 Lopen t3 k3 c3 Kenmerken van de alternatieven Ook van invloed: kenmerken van de keuzemaker (bijv. inkomen) Tenslotte nodig: een keuzeregel H01I6A Verkeerskunde Cursus 2011
Utiliteit Keuzeregel: De aantrekkelijkheid van een alternatief a voor persoon n kan worden uitgedrukt in één getal, de utiliteit: Uan Persoon kiest alternatief met hoogste utiliteit Utiliteiten : niet direct waarneembaar Kenmerken alternatieven en personen: wel waarneembaar Daarom: Uan = functie (kenmerken alternatief a, kenmerken persoon n) H01I6A Verkeerskunde Cursus 2011
Stochastische utiliteit Personen in (voor de waarnemer) exact dezelfde situatie (zelfde kenmerken a en n) maken toch verschillende keuzen! Waarom? Er zijn een (mogelijk groot) aantal kenmerken die de analist niet waarneemt! Daarom: Definieer Uan als een stochastische variabele: met Van deterministisch = f(kenmerken a,n) en een kansvariabele De kans dat alternatief a wordt gekozen (door persoon n) wordt nu: (We laten in het vervolg n weg als dat niet tot onduidelijkheid leidt) H01I6A Verkeerskunde Cursus 2011
Eigenschappen utiliteit U Optellen (of aftrekken) constante bij alle U maakt geen verschil voor kansen: Vermenigvuldigen van alle U met positieve constante c maakt geen verschil voor kansen: H01I6A Verkeerskunde Cursus 2011
H01I6A Verkeerskunde Cursus 2011 Voorbeeld Pr(1) = Pr(U1 > U2) = Pr(5 + 1 > 7 + 2) U1 = 5 + 1 U2 = 7 + 2 1 Uniform verdeeld tussen –2 en +2 2 Uniform verdeeld tussen –1 en +1 En kansverdelingen Onafhankelijk ! Alt 1 wordt gekozen Kans = 1/16 (alleen bij uniforme en onafhankelijke kansverdelingen!) 3 7 6 8 Alt 1 Alt 2 H01I6A Verkeerskunde Cursus 2011
Kansverdeling stoortermen Probit model Logit model Kansfunctie? Normale Verdeling Gumbel Varianties? Verschillend Identiek Onderling afhankelijk? Ja Nee H01I6A Verkeerskunde Cursus 2011
Normale verdeling vs Gumbel-verdeling Gumbel verdeling ook wel Extreme Value of EV-verdeling genoemd H01I6A Verkeerskunde Cursus 2011
H01I6A Verkeerskunde Cursus 2011 Logitmodel Als we voor de kansverdelingen van de stoortermen aannemen: Aanname 1: Gumbel-verdelingen Aanname 2: identiek (zelfde variantie :: 1/2 ) Aanname 3: onafhankelijk Dan kan worden aangetoond: H01I6A Verkeerskunde Cursus 2011
H01I6A Verkeerskunde Cursus 2011 Binaire logitmodel Keuze tussen twee alternatieven: Deel teller en noemer door H01I6A Verkeerskunde Cursus 2011
H01I6A Verkeerskunde Cursus 2011 Voorbeeld binaire logit Gebruik logitmodel voor berekening productie Keuzeverzameling voor een persoon: Alternatief 1: maakt wel woon-werk verplaatsing Alternatief 2: maakt niet woon-werk verplaatsing Persoonskenmerken: L = Leeftijd (in jaren 16-90) OPL = Opleiding (schaal van 1-17) G = Geslacht (0 = vrouw, 1 = man) GM = Gehuwde man (0 = nee, 1 = ja) GV = Gehuwde vrouw (0 = nee, 1 = ja) VK = Vrouw met jong kind (0 = nee, 1 = ja) Geschatte functies voor V (uit waarnemingen): Opmerkingen: Alleen verschil V1 en V2 is van belang ! Aggregeren over zone ! Check de plausibiliteit van de coefficienten ! H01I6A Verkeerskunde Cursus 2011
H01I6A Verkeerskunde Cursus 2011 Multinomiale logit Voorbeeld vervoerwijzekeuze Pr(a) de kans dat vervoerwijze a wordt gekozen Vk de (waarneembare) utiliteit van vervoerwijze k K het aantal alternatieve vervoerwijzen Als K = 2 binaire logit Als K > 2 multinomiale logit H01I6A Verkeerskunde Cursus 2011
H01I6A Verkeerskunde Cursus 2011 Voorbeeld multinomiale logit Gebruik logitmodel voor berekening vervoerwijzekeuze Geschatte functies voor V (uit waarnemingen): Vauto = 1,00 - 0,15*KOSTauto - 0,10*TIJDauto Vbus = - 0,15*KOSTbus - 0,10*TIJDbus Vfiets = -0,50 - 0,10*TIJDfiets Auto Bus Fiets TIJD (min) 5 15 20 KOST (Euro) 0,20 0,17 - Stel gegeven: Dan: Vauto = +0,47, Vbus = -1,53, Vfiets = -2,50 Modal split Pr(auto) = e0,47 / (e0,47 + e-1,53 + e -2,50) = 85% Pr(bus) = = 11% Pr(fiets) = = 4% Opmerkingen: V kan negatief zijn ! V + constante verandert uitkomsten niet ! H01I6A Verkeerskunde Cursus 2011
Specificatie logitmodel Functionele vorm utiliteitsfuncties Meestal lineaire functies maar niet verplicht Variabelen in de utiliteitsfunctie Onderscheid 1 Kenmerken alternatieven (tijd, kost, ….) Kenmerken personen (inkomen, leeftijd, …) Gecombineerde kenmerken (kost/inkomen, ….) Onderscheid 2 Generieke variabelen Alternatief-specifieke variabelen Vauto = 1,00 - 0,15*KOSTauto - 0,10*TIJDauto Vbus = - 0,15*KOSTbus - 0,10*TIJDbus Vfiets = -0,50 - 0,10*TIJDfiets H01I6A Verkeerskunde Cursus 2011
Geaggregeerde en gedisaggregeerde modellen Stel 2 personen A en B: Correct is eerst Pr(A) en Pr(B) bepalen, daarna middelen. Foutief is eerst VA en VB middelen, daarna Pr(C) bepalen. Voor een zone betekent dit eerst kansen voor homogene groepen bepalen, daarna aggregeren. H01I6A Verkeerskunde Cursus 2011
Schatting logitmodel Maximum Likelihood Methode Neem aan: Waarnemingen: persoon tijd auto tijd bus keuze 1 12 23 auto 2 31 27 3 19 9 bus Kans op individuele waarnemingen: Likelihood = Gezamenlijke kans op alle waarnemingen: Bepaal a en b zodat L maximaal is H01I6A Verkeerskunde Cursus 2011
H01I6A Verkeerskunde Cursus 2011 Havenkeuzemodel H01I6A Verkeerskunde Cursus 2011
Resultaten schatting (op basis van gegevens 1992 Statisches Bundesamt) H01I6A Verkeerskunde Cursus 2011
Toepassing model Effect aanleg IJzeren Rijn H01I6A Verkeerskunde Cursus 2011
Beperkingen logitmodel (1) Voor de kansverdeling van de stoortermen: Aanname 1: Gumbel-verdelingen Aanname 2: identiek (zelfde variantie :: 1/2 ) Aanname 3: onafhankelijk Logit routekeuze Geeft verkeerd resultaat Want variantie stoortermen niet identiek H01I6A Verkeerskunde Cursus 2011
Beperkingen logitmodel (2) Rode/Blauwe bussen probleem 1e situatie: Vervoerwijze verdeling auto/blauwe bus 50%/50% Dan geldt dus Vauto = Vblauwe bus want: 2e situatie: Introductie rode bussen. Kleur bussen geen invloed op utiliteit: Dus Vauto = Vrode bus = Vblauwe bus Nu keuze uit 3 alternatieven: Logit geeft verkeerd resultaat want: kansverdeling stoortermen niet onafhankelijk H01I6A Verkeerskunde Cursus 2011
H01I6A Verkeerskunde Cursus 2011 Gevolg aanname onafhankelijke stoortermen: Independence of irrelevant alternatives (i.i.a.) (i.a.a. eigenschap) i.a.a. leidt tot: Proportionele substitutie Nieuwe verdeling als ov B van markt verdwijnt H01I6A Verkeerskunde Cursus 2011
Aanpak i.a.a. 1. Toch logit, maar met heterogene bevolkingsgroepen Oorspronkelijke verdeling over vervoerwijzen (%) auto ov-bedrijf A ov-bedrijf B Totaal Groep 1 95 2,5 100 % Groep 2 25 37,5 Groep 1 + 2 60 20 Met logitmodel berekende verdeling na verdwijning van bedrijf B (%) 97,44 2,56 40,00 60,00 68,72 31,28 H01I6A Verkeerskunde Cursus 2011
Betere aanpak i.a.a. 2. Nested logit Alle verplaatsingen Auto Openbaar Vervoer Trein (of OV bedrijf A) Bus (of OV bedrijf B) H01I6A Verkeerskunde Cursus 2011
Nested logit - Berekeningsmethode (1) alle verplaatsingen prive vervoer openbaar vervoer ov-bedrijf A auto ov-bedrijf B Neem aan: (Generalised Extreme Value verdeling) Dan kan worden afgeleid: Zet gecorrelleerde alternatieven bij elkaar in een “nest” k is maat voor correlatie: 0 = perfecte corr 1 = onafhankelijk H01I6A Verkeerskunde Cursus 2011
Nested logit - Berekeningsmethode (2) Complexe formule op vorige slide is equivalent aan sequentie van ‘gewone’ logits ! alle verplaatsingen LS = ‘logsom’ H01I6A Verkeerskunde Cursus 2011
Nested logit – nest met 1 alternatief alle verplaatsingen Vereenvoudiging als nest slechts één alternatief bevat H01I6A Verkeerskunde Cursus 2011
Nested logit – voorbeeld berekening OV = 1 geen correlatie A en B normale logit OV = 0,5 enige correlatie A en B OV 0 perfecte correlatie A en B ov-A en ov-B aanwezig enkel ov-A Pr(A/ov) 0,50 1,00 Pr(B/ov) 0,00 Pr(auto) 0,60 0,75 0,68 Pr(OV) 0,40 0,25 0,32 Pr(A) 0,20 Pr(B) H01I6A Verkeerskunde Cursus 2011
H01I6A Verkeerskunde Cursus 2011 Samenvatting Keuze is een centraal thema in de verkeerskunde Het logitmodel is een zeer geschikt instrument voor het analyseren van keuzes Gebaseerd op toekenning van utiliteiten aan de diverse keuze-alternatieven Utiliteiten zijn een functie van de kenmerken van alternatieven (en van kenmerken van personen) Omdat we niet alle kenmerken weten, voegen we een stochastische component toe aan de utiliteit. Dit heet een stoorterm. De keuzeverdeling wordt gegeven in termen van kansen, die later over een gebied of bevolkingsgroep worden geaggregeerd Het logitmodel kent beperkingen. Correlaties in stoortermen kunnen worden verwerkt door toepassing van een nested logitmodel. H01I6A Verkeerskunde Cursus 2011