De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

Herconfigureerbare optische interconnectie-netwerken voor multiprocessor-architecturen met gedeeld geheugen Wim Heirman Promotoren: prof. Jan Van Campenhout.

Verwante presentaties


Presentatie over: "Herconfigureerbare optische interconnectie-netwerken voor multiprocessor-architecturen met gedeeld geheugen Wim Heirman Promotoren: prof. Jan Van Campenhout."— Transcript van de presentatie:

1 Herconfigureerbare optische interconnectie-netwerken voor multiprocessor-architecturen met gedeeld geheugen Wim Heirman Promotoren: prof. Jan Van Campenhout en prof. Dirk Stroobandt Publieke doctoraatsverdediging – 9 juli 2008

2 ‘computer’: iemand die berekeningen uitvoert
Enkele jaren terug… ‘computer’: iemand die berekeningen uitvoert

3 Sneller resultaten: parallellisme
Meerdere mensen werken tegelijk (in parallel) samen aan één taak 3

4 Communicatie: dichtste buur
Communicatie van invoergegevens, tussenresultaten, … 4

5 Communicatie: lange afstand
Lange-afstandscommunicatie: via tussenstappen ? 5

6 Communicatie: directe verbindingen
Met meer technologie: (beperkt aantal) directe verbindingen 6

7 Communicatie beperkt prestaties
Meerdere rekenaars nodig voor voldoende prestaties Communicatie beperkt prestaties Trage communicatie = lange wachttijd voordat het resultaat beschikbaar is Deelname in communicatie van anderen Meer rekenaars = kleinere deelproblemen = meer communicatie = meer vertraging… prestaties parallellisme 7

8 Computers worden steeds sneller
Gebruiker wil meer details in games, betere weersvoorspellingen Processor (rekeneenheid) wordt sneller:  meer bewerkingen (+, -, ×, ÷, …) per seconde

9 Nood aan parallelle verwerking
Sinds 1960: één enkele processor niet genoeg voor sommige toepassingen Supercomputers: Cray, SGI, IBM (weersvoorspelling, fysische simulaties) Servers: IBM, Sun (Internet servers, databanken)

10 Nood aan parallelle verwerking
2005: mogelijke verbeteringen per processor raken uitgeput, hogere prestatie enkel nog mogelijk met meerdere processors Multicore: meerdere processors op één chip (Intel Core2 Duo) Multiprocessing nu: desktops, laptops straks: PDA’s, GSM’s, …

11 Het communicatienetwerk
Processoren en geheugenelementen, verbonden via een communicatienetwerk CPU MEM NetIF CPU MEM NetIF CPU MEM NetIF CPU MEM NetIF CPU MEM NetIF Communicatienetwerk

12 Netwerktopologie All-to-all technologisch niet mogelijk
Beperkt aantal ‘buren’ per processor Vorm van het netwerk (‘topologie’): vaste, regelmatige structuur boom rooster

13 Gedeeld geheugen: de ‘netwerkkloof’
Netwerk maakt deel uit van de geheugenhiërarchie instructie: 0.5 ns cache: 5 ns DDR: 50 ns netwerk: 500 ns CPU MEM NetIF CPU MEM NetIF CPU MEM cache NetIF CPU MEM NetIF CPU MEM NetIF CPU MEM NetIF CPU MEM NetIF CPU MEM NetIF CPU MEM NetIF Enorme prestatie-invloed van niet-uniforme toegangstijd Moeilijk door de programmeur in te schatten!

14 Communicatiepatronen kunnen sterk verschillen
Tussen programma’s onderling weersvoorspelling: dichtse buur galactische simulatie: all-to-all

15 Communicatiepatronen kunnen sterk verschillen
Tijdens één programma Fast Fourrier Transform: variabel

16 Netwerkvereisten Niet-uniforme belasting in tijd en ruimte
time load Link #6 Niet-uniforme belasting in tijd en ruimte CPU MEM NetIF time load Link #10 time load Link #28 Kunnen we het netwerk op elk moment aanpassen aan het huidige verkeerspatroon?

17 Onderzoeksvraag De optimale topologie hangt af van het communicatiepatroon Communicatiepatroon verandert (tussen applicaties, tijdens één applicatie) Hoe kunnen we een herconfigureerbaar netwerk maken, en welke prestaties kunnen we hiervan verwachten? Binnen de context van herconfigureerbare optische verbindingen met bestaande en verwachte componenten

18 Optische verbindingen
Nu: elektrische verbindingen over koper Nieuwe toepassingen vereisen steeds meer bandbreedte Elektrische verbinding: meer vermogen nodig voor hoge bandbreedte / lange afstand Alternatief: overdracht van gegevens via licht

19 Optische verbindingen in elektronische systemen
Verliezen nagenoeg onafhankelijk van de lengte en de bandbreedte Nodige conversiestappen: Een alternatief voor elektrische verbindingen zijn optische verbindingen. Het verliesmechanisme van optische verbindingen is totaal anders. Verliezen zijn nagenoeg onafhankelijk van de lengte en het datadebiet. Men heeft bijvoorbeeld gedemonstreerd dat het mogelijk is om over 1 optische vezel 1000en GBbps te versturen met een signaal waarvan de het vermogen pas halveert na 15 km. Er is een conversie nodig is om elektronische componenten optisch met elkaar te laten spreken. Aan de zenderkant is een conversie vereist van spanningen en stromen naar licht, bijvoorbeeld door een laser. Aan de ontvangerkant is de omgekeerde conversie nodig, bijvoorbeeld met een fotodiode. <klik> Bovendien zijn er speciale elektronische schakelingen nodig om deze conversie in goede banen te sturen. Voor de laser noemen we dit een aanstuurschakeling; de schakeling na de fotodiode noemen we een ontvangerschakeling. Over het algemeen is het de snelheid van deze twee schakelingen die het datadebiet over 1 optische verbinding beperkt. elektrisch optisch elektrisch laser fotodiode

20 Optisch of elektrisch? Op deze grafiek ziet u een vergelijking (van in 2004) tussen het vermogenverbruik van elektrische en optische verbindingen van een vergelijkbaar datadebiet per eenheid van doorsnede. De horizontale as stelt de lengte van de verbinding voor en de verticale as geeft het vermogenverbruik aan. De verschillende lijnen staan voor verschillende realisaties en datadebieten van elektrische verbindingen (in stippellijn) en optische verbindingen (in volle lijn). De elektrische verbindingen zijn zeer zuinig op korte afstand maar beginnen veel te verbruiken als de afstand toeneemt. De optische verbindingen hebben een hoge vaste kost door de signaalconversies, maar zijn veel zuiniger op de lange afstand. In dit onderzoek bleken de optische verbindingen beter vanaf 75 cm. Nu drie jaar verder ligt deze overgang alweer een stuk dichter. Cho, H., Kapur, P., and Saraswat, K. C. (2004). Power comparison between high-speed electrical and optical interconnects for interchip communication. IEEE/OSA Journal of Lightwave Technology, 22(9):2021–2033.

21 Optische communicatie: over steeds kortere afstanden
©2005 IBM

22 Optische herconfiguratie
WDM (golflengtemultiplexering) tunable lasers / selective detectors passive broadcast element A B  A C  B A  C A C  A B x B A  B C C B  C

23 Optische herconfigureerbare componenten
MEMS switches optische crossbar (photonic crystal) afstembare VCSEL laser

24 Mogelijke implementatie met goedkope componenten
CPU 1 CPU 2 ... CPU n Broadcast element Fiber Links Processor nodes Tunable lasers Photodetectors ‘Selectief’ broadcast element (VUB/TONA) I. Artundo, L. Desmet, W. Heirman, C. Debaes, J. Dambre, J. Van Campenhout, H. Thienpont. Selective Optical Broadcast Component for Reconfigurable Multiprocessor Interconnects. IEEE Journal on Selected Topics in Quantum Electronics: Special Issue on Optical Communication. Vol. 12 (4) 1-naar-9 broadcast: elke knoop maakt 1 extra verbinding, keuze uit 9 bestemmingen

25 Bijdragen van dit werk Een herconfigureerbare netwerkarchitectuur
Methoden voor snellere evaluatie Prestatie-evaluatie 25

26 Herconfigureerbare optische netwerken
Herconfigureerbaar optisch netwerk past zich aan doorheen de tijd Aan de verkeerspatronen van verschillende applicaties Aan de verschillende patronen binnen één programma Vrije parameters: Mogelijke topologieën Herconfiguratiesnelheid

27 Extra verbindingen: de ‘mobiele brigade’
Vast basisnetwerk, + extra verbindingen Basisconnectiviteit, gegarandeerde prestatie Extra bandbreedte waar/wanneer nodig, ‘kortere’ verbindingen (minder tussenknopen) Eenvoudige routering, configuratie Verminderen van aantal tussenknopen: Netwerken met hogere dimensie (meer buurknopen) => niet mogelijk door beperkingen op o.m. # pinnen / IC, routeringtijd Herconfigureerbaar netwerk => beperkt aantal buren, maar wel op elk moment wel de meest belangrijke

28 Tijdsschaal van herconfiguratie
(goedkope) componenten 1 ns 1 μs 1 ms 1 s 1 vraag+antwoord patronen binnen programma’s verschillende programma’s

29 Transparante herconfiguratie
herconfiguratie-interval Opmeten netwerkverkeer Topologie bepalen Selectietijd (algoritme, rekenkracht) Herconfiguratietijd (componenten) Opmeten netwerkverkeer Herconfiguratie Nuttig gebruik van de nieuwe configuratie herconfiguratie- interval lokaliteit in netwerkverkeer selectie- en herconfiguratietijden Topologie bepalen Herconfiguratie Nuttig gebruik van de nieuwe configuratie tijd

30 Evaluatiemethodiek Onderzoek op systeemniveau:
Specifieke eigenschappen hardware nog niet gekend Wel: nuttige eigenschappen voor onze toepassing bepalen, resultaten terugkoppelen naar onderzoek naar de componenten + 1 implementatie (selectieve broadcast)

31 Nood aan snelle evaluatie
Wat is de prestatie van elk netwerk? Gedetailleerde simulatie: uren/dagen De ontwerpruimte: combinatie van technologieën, componenten, parameterwaarden ‘Exploratie van de ontwerpruimte’: snel evalueren welke combinaties voordelig zijn, gegeven de prestatievereisten en de te verwachten werklast Zéér veel mogelijke combinaties…

32 Parameters dir_alloc net_flitdelay dir_latency reconf_interval
cpu_speed l2_assoc cpu_ooo l1i_assoc reconf_fanout net_topology l2_size l1d_size l1i_hit_latency l1i_size net_flitsize reconf_n_elinks l1d_hit_latency net_routerdelay dir_linesize l1d_assoc dir_interleave cpu_count l1_wb l2_hit_latency

33 Methodes voor snelle evaluatie
Bestaande methodes voor snelle netwerkevaluatie: sterke vereenvoudiging van het netwerkverkeer ‘trage dynamica’ wordt meestal weggelaten maar dat is juist waarop herconfiguratie steunt Nood aan nieuwe methodes!

34 Bijdragen van dit werk Een herconfigureerbare netwerkarchitectuur
Methoden voor snellere evaluatie Prestatie-evaluatie 34

35 Prestatieschatter één gedetailleerde simulatie
(uren) Bepaal posities extra verbindingen Schat geheugen- toegangstijden Voorspel prestatie voor elke parameter- combinatie Bepaal posities extra verbindingen Schat geheugen- toegangstijden Voorspel prestatie communicatiepatroon (minuten) Prestatieschatter W. Heirman, J. Dambre, I. Artundo, C. Debaes, H. Thienpont, D. Stroobandt, J. Van Campenhout. Predicting the performance of reconfigurable optical interconnects in distributed shared-memory systems. Photonic Network Communications. Vol. 15 (1)

36 Prestatieschatter Bepaal posities van extra verbindingen
Δt = 1 n = 2 Δt = 2 n = 3 tijd Parameters: herconfiguratie-interval (Δt), aantal extra verbindingen (n), plaatsingsalgoritme

37 Verminderde toegangstijd
Prestatieschatter Schat de nieuwe geheugentoegangstijden Geen verandering Verminderde toegangstijd

38 Prestatieschatter Voornamelijk relatieve nauwkeurigheid,
voor het vergelijken van netwerken 100 μs 1 ms 10 ms

39 Congestiemodel Congestie: wachttijden wanneer meerdere processors één verbinding tegelijk willen gebruiken Toevoegen van verbindingen beïnvloedt congestie! 2e prestatiemodel brengt dit effect in rekening W. Heirman, J. Dambre, J. Van Campenhout. Congestion Modeling for Reconfigurable Inter-Processor Networks. Proceedings of the International Workshop on System Level Interconnect Prediction (SLIP)

40 Model van het netwerk: wachtrijen en servicestations
Netwerkknopen bevatten buffers (wachttijen) Verbindingen verzorgen de ‘service’: verzending over een traag kanaal Wachtlijntheorie voorspelt de wachttijden Netwerkknoop Σ totale transmissietijd Link X Link Link

41 Congestiemodel

42 Synthetisch netwerkverkeer
Laat toe alle netwerkeigenschappen te evalueren Evenaart het gedrag van echt netwerkverkeer Zonder de complexiteit van het simuleren van de applicatie, OS, processors, caches, … Synthetic traffic generator Reconfigurable network simulator simulatietijd ÷10 Application OS CPU Caches netwerkverkeer Reconfigurable network W. Heirman, J. Dambre, J. Van Campenhout. Synthetic Traffic Generation as a Tool for Dynamic Interconnect Evaluation. Proceedings of the 2007 International Workshop on System Level Interconnect Prediction (SLIP) simulator

43 Generatie van realistisch synthetisch netwerkverkeer
Eén volledige simulatie Verkeersprofiel wordt vele keren herbruikt Statistisch profiel Application Parameter extractie OS CPU Synthetic traffic generator Caches netwerkverkeer Reconfigurable network ×1 ×n

44 Synthetisch netwerkverkeer: resultaten

45 Synthetisch netwerkverkeer: variabiliteit bij kortere simulaties
synthetisch verkeer volledige simulatie trace-driven +profiling* exec-driven * assuming traffic profile is re-used 100 times

46 Evaluatiemethodes Scala aan methodes met verschillende afweging in snelheid vs. nauwkeurigheid snelheid nauwkeurigheid prestatieschatter synthetisch netwerkverkeer congestiemodel simulatie

47 Bijdragen van dit werk Een herconfigureerbare netwerkarchitectuur
Methoden voor snellere evaluatie Prestatie-evaluatie 47

48 Case-study: selectieve broadcast
Prestatie van de implementatie met selectieve broadcast (i.s.m. VUB) Invloed van de technologische beperkingen? Evaluatie met eigen technieken W. Heirman, I. Artundo, L. Desmet, J. Dambre, C. Debaes, H. Thienpont, J. Van Campenhout. Speeding up multiprocessor machines with reconfigurable optical interconnects. Proceedings of SPIE, Optoelectronic Integrated Circuits VIII, Photonics West. Vol

49 Case-study: selectieve broadcast
16 processors, 16 extra verbindingen Technologische beperkingen: Slechts 1 extra verbinding per processor Volledige vs. selectieve broadcast Lengte van het herconfiguratie-interval 49

50 Exploratie van de ontwerpruimte met synthetisch netwerkverkeer
W. Heirman, I. Artundo, J. Dambre, C. Debaes, T. Pham Doan, K. Bui Viet, H. Thienpont, J. Van Campenhout. Performance Evaluation of Large Reconfigurable Interconnects for Multiprocessor Systems. Proceedings of the International Symposium on Electrical - Electronics Engineering (ISEE)

51 Herconfigureerbare netwerken: toekomst
Optische verbindingen worden verwacht binnen enkele jaren Mogelijks reeds aanwezige herconfiguratie (bv. foutrobuustheid) nuttig te gebruiken ‘Trage’ herconfiguratie, met reeds aanwezige componenten, geeft goedkope prestatiewinst

52 Herconfigureerbare netwerken: verder onderzoek
Nu toegepast op ‘gedeeld geheugen’ (impliciete communicatie) en ‘transparante’ herconfiguratie Wat als de programmeur/compiler controle krijgt over herconfiguratie? ‘Snelle’ herconfiguratie met nieuwe componenten Toepassingsmogelijkheden in andere architecturen (videokaarten, spelconsoles, …)

53 Herconfigureerbare optische interconnectie-netwerken voor multiprocessor-architecturen met gedeeld geheugen Wim Heirman Promotoren: prof. Jan Van Campenhout en prof. Dirk Stroobandt Publieke doctoraatsverdediging – 9 juli 2008 53


Download ppt "Herconfigureerbare optische interconnectie-netwerken voor multiprocessor-architecturen met gedeeld geheugen Wim Heirman Promotoren: prof. Jan Van Campenhout."

Verwante presentaties


Ads door Google