De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

Telecommunicatie en Informatieverwerking UNIVERSITEIT GENT Didactisch materiaal bij de cursus Academiejaar 2011-2012

Verwante presentaties


Presentatie over: "Telecommunicatie en Informatieverwerking UNIVERSITEIT GENT Didactisch materiaal bij de cursus Academiejaar 2011-2012"— Transcript van de presentatie:

1 Telecommunicatie en Informatieverwerking UNIVERSITEIT GENT Didactisch materiaal bij de cursus Academiejaar Tel: 09/ Fax: 09/ Prof. dr. ir. W. Philips Optimalisatietechnieken

2 © W. Philips, Universiteit Gent, versie: 23/4/ b. 2 Copyright notice This powerpoint presentation was developed as an educational aid to the renewed course “Optimisation Techniques” (Optimalisatietechnieken), taught at the University of Gent, Belgium as of This presentation may be used, modified and copied free of charge for non-commercial purposes by individuals and non-for-profit organisations and distributed free of charge by individuals and non-for-profit organisations to individuals and non-for-profit organisations, either in electronic form on a physical storage medium such as a CD-rom, provided that the following conditions are observed: 1.If you use this presentation as a whole or in part either in original or modified form, you should include the copyright notice “© W. Philips, Universiteit Gent, 1998” in a font size of at least 10 point on each slide; 2.You should include this slide (with the copyright conditions) once in each document (by which is meant either a computer file or a reproduction derived from such a file); 3. If you modify the presentation, you should clearly state so in the presentation; 4.You may not charge a fee for presenting or distributing the presentation, except to cover your costs pertaining to distribution. In other words, you or your organisation should not intend to make or make a profit from the activity for which you use or distribute the presentation; 5. You may not distribute the presentations electronically through a network (e.g., an HTTP or FTP server) without express permission by the author. In case the presentation is modified these requirements apply to the modified work as a whole. If identifiable sections of that work are not derived from the presentation, and can be reasonably considered independent and separate works in themselves, then these requirements do not apply to those sections when you distribute them as separate works. But when you distribute the same sections as part of a whole which is a work based on the presentation, the distribution of the whole must be on the terms of this License, whose permissions for other licensees extend to the entire whole, and thus to each and every part regardless of who wrote it. In particular note that condition 4 also applies to the modified work (i.e., you may not charge for it). “Using and distributing the presentation” means using it for any purpose, including but not limited to viewing it, presenting it to an audience in a lecture, distributing it to students or employees for self-teaching purposes,... Use, modification, copying and distribution for commercial purposes or by commercial organisations is not covered by this licence and is not permitted without the author’s consent. A fee may be charged for such use. Disclaimer: Note that no warrantee is offered, neither for the correctness of the contents of this presentation, nor to the safety of its use. Electronic documents such as this one are inherently unsafe because they may become infected by macro viruses. The programs used to view and modify this software are also inherently unsafe and may contain bugs that might corrupt the data or the operating system on your computer. If you use this presentation, I would appreciate being notified of this by . I would also like to be informed of any errors or omissions that you discover. Finally, if you have developed similar presentations I would be grateful if you allow me to use these in my course lectures. Prof. dr. ir. W. Philips Department of Telecommunications and Information ProcessingFax: University of GentTel: St.-Pietersnieuwstraat 41, B9000 Gent, Belgium

3 Niet-lineaire programma’s Vervolg

4 © W. Philips, Universiteit Gent, versie: 23/4/ b. 4 Vlak-optimalisatie... We leggen deze richting p k a priori niet volledig vast maar zoeken de optimale richting in het vlak bepaald door de gradiënt g k =  f ( x k ) in x k (de lokaal beste richting) x k- 1 x k Principe: we proberen het zigzaggen te verminderen door een betere richting te kiezen p k- 1 p k x k+ 1 en de richting p k- 1 van waaruit we in x k kwamen  we optimaliseren f ( x k +  g k +  p k- 1 ) naar  en   x k+ 1 =x k +  * g k +  * p k- 1 en k p k =  * g k +  * p k- 1 met  * en  * de optimale waarden van  en  Merk op dat p k niet langer loodrecht staat op p k- 1 g k Opmerking: in het geval van een kwa- dratische functie van 2 veranderlijken vinden we onmiddellijk het optimum; in het algemeen is dat niet zo, omdat we de zoektocht beperken tot een 2D-vlak

5 © W. Philips, Universiteit Gent, versie: 23/4/ b. 5...De toegevoegde-gradiëntmethode... Dit is altijd een goede benadering dicht bij het optimum! Voor elk kwadratisch oppervlak kan men A symmetrisch kiezen x k- 1 x k p k- 1 p k x k+ 1 g k We veronderstellen nu dat we minimaliseren en dat f ( x ) een kwadratische vorm is: Optimalisatie van g ( ,  ) =f ( x k +  g k +  p k- 1 ) naar  en  : met  *,  * 

6 © W. Philips, Universiteit Gent, versie: 23/4/ b. 6...De toegevoegde-gradiëntmethode... Als f ( x ) exact een kwadratische vorm is, dan geldt: g k  p k- 1 (dit geldt bij gelijk welke lijnoptimalisatie!) g k  p l voor l < k x k- 1 x k p k- 1 p k x k+ 1 g k Gebruik makend van deze eigenschappen kunnen we p k uitdrukken als functie van enkel g k en p k- 1 : We elimineren A uit de formules (waarom: zie verder) We gebruiken hiervoor speciale eigenschappen van g k en p k g k  g l voor k  l p t k Ap l =0 voor k  l : p k en p l zijn toegevoegde richtingen details van deze slide niet kennen met 1   kkkk pgp  geen A meer!   k k k g g 

7 © W. Philips, Universiteit Gent, versie: 23/4/ b. 7...De toegevoegde-gradiëntmethode Algoritme: 1. Initialisatie: eerste stap volgens de gradiënt: p 0 =g 0 =  f ( x 0 ) We willen A niet berekenen met In de praktijk is f ( x ) geen kwadratische vorm en zouden we A en b moeten berekenen via Taylorreeksbenadering  we willen dit echter vermijden en enkel gradiënten berekenen 2. Verbetering: voor k= 0, 1,…: bereken optimale staplengte k : door f ( x k +  p k ) te optimaliseren naar  optimum bij  k bereken x k+ 1 = x k + k x k en vervolgens g k+ 1 =  f ( x k+ 1 ) stop als | f ( x k+1 ) -f ( x k )|<  bereken de volgende richting p k+ 1 : geen A meer!

8 © W. Philips, Universiteit Gent, versie: 23/4/ b. 8 Voor een exacte kwadratische vorm Als f ( x ) exact een kwadratische vorm is met n variabelen dan bereikt men in theorie het optimum in n stappen x 0x 0 x 1x 1 p 0p 0 p 1p 1 x 2x 2 g 1g 1 g 2 =0 f ( x ) kwadratisch  g 2  p 1 g 2  p 0 g 2  g l g 2  g 0 in de praktijk duurt het langer wegens afrondingsfouten De richting p k is een betere richting dan de gradiëntrichting g k want we optimaliseren f ( x k +  g k +  p k- 1 ) naar  en  en laten dus meer mogelijke oplossingen toe dan de gradiëntmethode die f ( x k +  g k ) naar  optimaliseert g 1  p 0 g 1  g 0 p t 1 Ap 0 = 0 Reden: g n, g n- 1, …, g 0 staan loodrecht op elkaar en er kunnen maar n zulke vectoren zijn  g n, g n-1, … of g 0 = 0

9 © W. Philips, Universiteit Gent, versie: 23/4/ b. 9 Stel f ( x ) niet-kwadratisch g 2  p 1 g 2  p 0 g 2  g l g 2  g 0 g 1  g 0 p t 1 Ap 0 = 0 Voor een willekeurige functie x 0x 0 x 1x 1 p 0p 0 p 1p 1 x 2x 2 g 1g 1 g 2 =0 Als f ( x ) geen kwadratische vorm is f ( x ) is dan nog steeds bij benadering kwadratisch lokaal rond x k  p k is lokaal nog een betere richting dan g k maar niet globaal Dicht bij het optimum is de kwadratische benadering relatief beter  het algoritme convergeert daar sneller dan de gradiëntmethode dan gelden de orthogonaliteitsbetrekkingen niet en het optimum wordt niet bereikt in n stappen

10 © W. Philips, Universiteit Gent, versie: 23/4/ b. 10 Te onthouden over deze methode Als f ( x ) exact een kwadratische vorm is met n variabelen dan bereikt men in theorie het optimum in n stappen in de praktijk duurt het langer wegens afrondingsfouten De richting p k is een betere richting dan de gradiëntrichting g k want we optimaliseren f ( x k +  g k +  p k- 1 ) naar  en  en laten dus meer mogelijke oplossingen toe dan de gradiëntmethode die f ( x k +  g k ) naar  optimaliseert Als f ( x ) geen kwadratische vorm is dan wordt het optimum niet bereikt in n stappen het gaat nog altijd sneller dan bij de gradiëntmethode

11 © W. Philips, Universiteit Gent, versie: 23/4/ b. 11 Opmerking Slides die in de les worden overgeslagen moeten toch worden gekend, tenzij expliciet anders vermeld

12 © W. Philips, Universiteit Gent, versie: 23/4/ b. 12 Literatuur Rardin, hfdst. 13: blzn Rardin, hfdst. 14: blzn , (geselecteerde onderwerpen)

13 Appendix

14 © W. Philips, Universiteit Gent, versie: 23/4/ b. 14 Het nieuw trippelpunt wordt dan ( a, x, y ) of ( x, y, b ) maar we noemen het ( a’, x’, b’ )...De methode van de gulden snede... We veronderstellen nu dat er 1 minimum is in [ a, b ]  elke x  ] a, b [ levert een trippelpunt We kiezen symmetrisch gelegen x en y in [ a, b ] x=b-  ( b-a ) y=a+  ( b-a ) ab xy a’ x’ b’ y’ axb y a’b’ x’ y’ We kiezen nog een tweede punt in ] a, b [ en noemen dit y’ We doen dat zo dat x’ en y’ symmetrisch liggen in [ a’, b’ ] Zelf-similariteit: We wensen dat ( a’, x’, y’, b’ ) of ( a’, y’, x’, b’ ) een geschaalde (en verschoven) versie is van ( a, x, y, b ): x’=b’-  ’ ( b’-a’ ) y’=a’+  ’ ( b’-a’ ) met  ’=  of  ’= 1 -   ’=   ’= 1 - 

15 © W. Philips, Universiteit Gent, versie: 23/4/ b De methode van de gulden snede... We hebben: x=b-   ( b-a ) y=a+   ( b-a ) x’=b’-  ’ ( b’-a’ ) y’=a’+  ’ ( b’-a’ ) (1  ’ )  ( b-a ) ( 1 -  )  ( b-a )  ’  ( b-a ) We moeten twee gevallen onderscheiden: axb y a’b’ x’ y’ B: ( a’, x’, b’ ) = ( x, y, b ) axby a’ x’ b’ y’ A: ( a’, x’, b’ ) = ( a, x, y ) (1  ’ )  ( b-a ) = (1-  )  ( b-a )  (1  ’ )  = 1-  voor  ’=    = 1 voor  ’= 1 -    2 +  1 = 0  ’  ( b-a ) = (1 -  )( b-a )  ’ =1- ’ =1- voor  ’=    2 +  1 = 0 voor  ’= 1 -    = 1  ( b-a )

16 © W. Philips, Universiteit Gent, versie: 23/4/ b De methode van de gulden snede Besluit: mogelijke oplossingen:  = 1 en de wortels van  2 +  1 = 0 gaat niet want y  [ a, b ] Gaat zowel in geval A als B Besluit: gulden snede: we kiezen als nieuwe ( x ’, y ’): 1. x ’ is ofwel x ofwel y, naargelang geval A of B 2. y ’ is het punt dat symmetrisch ligt t.o.v. x ’ in [ a’, b ‘ ] We krijgen zelf-similariteit als we  = kiezen  x en y liggen op ongeveer 1/3 van de rand van [ a, b ] en x’ en y’ liggen op ongeveer 1/3 van de rand van [ a’, b’ ] en … gaat niet want x=a  = is de zogenaamde “gulden snede” d.w.z.:  = 1,  = 0.618,  = -1.61

17 © W. Philips, Universiteit Gent, versie: 23/4/ b. 17 Als f ( x ) een kwadratische vorm is dan zijn beide formules equivalent omdat g k +1  g k ; voor een willekeurige f ( x ) leidt de tweede formule tot een snellere convergentie Toeg. gradiëntmethode: Opmerkingen De toegevoegde-gradiëntmethode convergeert sneller dan de gradiëntmethode omdat we kunnen bewegen volgens 2 richtingen, n.l. de gradiënt g k en de vorige richting p k-1 Kan men nog beter door nog meer richtingen te gebruiken? b.v. optimaliseer f ( x k +  g k +  1 p k- 1 +  2 p k- 2 +… +  m p k-m ) naar  en  i Antwoord: neen (althans voor een kwadratische vorm) want na berekening blijkt dat  2 =  3 =… =  n =0 Er bestaat nog een tweede formule om  k+ 1 te berekenen:


Download ppt "Telecommunicatie en Informatieverwerking UNIVERSITEIT GENT Didactisch materiaal bij de cursus Academiejaar 2011-2012"

Verwante presentaties


Ads door Google