IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 1 Onderwijsenquête Resultaten en gevolgen.

Slides:



Advertisements
Verwante presentaties
KWALITEITSZORG november 2012
Advertisements

Stilstaan bij parkeren Dat houdt ons in beweging
BRIDGE Vervolgcursus Vervolg op starterscursus Bridgeclub Schiedam ‘59 info: Maandagavond: 19: – of
De elektronische verzamelaanvraag Ruben Fontaine Markt- en Inkomensbeheer – dienst Aangiftes.
‘SMS’ Studeren met Succes deel 1
Paulus' eerste brief aan Korinthe (20) 23 januari 2013 Bodegraven.
NEDERLANDS WOORD BEELD IN & IN Klik met de muis
BRIDGE Vervolgcursus Vervolg op starterscursus Bridgeclub Schiedam ‘59 info: Maandagavond: 19: – of
1 Resultaten marktonderzoek RPM Zeist, 16 januari 2002 Door: Olga van Veenendaal, medew. Rothkrans Projectmanagement.
November 2013 Opinieonderzoek Vlaanderen – oktober 2013 Opiniepeiling Vlaanderen uitgevoerd op het iVOXpanel.
Uitgaven aan zorg per financieringsbron / /Hoofdstuk 2 Zorg in perspectief /pagina 1.
Personalisatie van de Archis website Naam: Sing Hsu Student nr: Datum: 24 Juni 2004.
1 COVER: Selecteer het grijze vlak hiernaast met rechtsklik & kies ‘change picture’ voor een ander beeld of verwijder deze slide & kies in de menubalk.
Global e-Society Complex België - Regio Vlaanderen e-Regio Provincie Limburg Stad Hasselt Percelen.
 Deel 1: Introductie / presentatie  DVD  Presentatie enquête  Ervaringen gemeente  Pauze  Deel 2 Discussie in kleinere groepen  Discussies in lokalen.
Stijgen en dalen constante stijging toenemende stijging
STAPPENPLAN GRAMMATICUS.
Ronde (Sport & Spel) Quiz Night !
Een Concert van het Nederlands Philharmonisch Orkest LES 4 1.
Een optimale benutting van vierkante meters Breda, 6 juni 2007.
Kb.1 Ik leer op een goede manier optellen en aftrekken
Tevredenheids- enquête 2012 P. Grouwels Inleiding Mogelijke antwoorden: Zeer goed: 4 sterren ****: volledig tevreden; Goed: 3 sterren ***:
© BeSite B.V www.besite.nl Feit: In 2007 is 58% van de organisaties goed vindbaar op internet, terwijl in 2006 slechts 32% goed vindbaar.
Leiden University. The university to discover. ICLON, Interfacultair Centrum voor Lerarenopleiding, Onderwijsontwikkeling en Nascholing Denkgereedschap.
9 januari 2013 Bodegraven 1. 1Korinthe 11 1 Wordt mijn navolgers, gelijk ook ik Christus navolg. 2.
Nooit meer onnodig groen? Luuk Misdom, IT&T
Als de som en het verschil gegeven zijn.
Hoofdstuk 6: Controle structuren
FOD VOLKSGEZONDHEID, VEILIGHEID VAN DE VOEDSELKETEN EN LEEFMILIEU 1 Kwaliteit en Patiëntveiligheid in de Belgische ziekenhuizen anno 2008 Rapportage over.
Meisjes en wiskunde (Waarom) is wiskunde moeilijk?
Elke 7 seconden een nieuw getal
1 Datastructuren Sorteren: alleen of niet alleen vergelijkingen College 5.
Visibility-based Probabilistic Roadmaps for Motion Planning Tim Schlechter 13 februari 2003.
Softwarepakket voor het catalogeren en determineren van fruitsoorten
Lineaire functies Lineaire functie
Differentieer regels De afgeleide van een functie f is volgens de limietdefinitie: Meestal bepaal je de afgeleide niet met deze limietdefinitie, maar.
Differentieer regels De afgeleide van een functie f is volgens de limietdefinitie: Meestal bepaal je de afgeleide niet met deze limietdefinitie, maar.
1 het type x² = getal 2 ontbinden in factoren 3 de abc-formule
1 introductie 3'46” …………… normaal hart hond 1'41” ……..
Oefeningen F-toetsen ANOVA.
Wat levert de tweede pensioenpijler op voor het personeelslid? 1 Enkele simulaties op basis van de weddeschaal B1-B3.
Wie het kleine niet eert ... (quarks, leptonen,….)
1 WIJZIGINGEN UNIEK VERSLAG. 2 Agenda Verbeteringen Veranderingen formulieren Praktische herinneringen Nieuwe formulieren Sociale en culturele participatie.
In dit vakje zie je hoeveel je moet betalen. Uit de volgende drie vakjes kan je dan kiezen. Er is er telkens maar eentje juist. Ken je het juiste antwoord,
13 maart 2014 Bodegraven 1. 1Korinthe Want gelijk het lichaam één is en vele leden heeft, en al de leden van het lichaam, hoe vele ook, een lichaam.
1. 33 GERECHTIGHEID GODS 21 Thans is echter buiten de wet om GERECHTIGHEID GODS openbaar geworden, waarvan de wet en de profeten getuigen, 34.
Seminarie 1: Pythagoreïsche drietallen
Ben Bruidegom 1 Sequentiële schakelingen Toestand uitgang bepaald door:  ingangen;  vorige toestand uitgang.
Construeren van een Tennishal Vergeet-mij-nietjes. Week 13
ribwis1 Toegepaste wiskunde Lesweek 01 – Deel B
ribwis1 Toegepaste wiskunde – Differentieren Lesweek 7
Statistiekbegrippen en hoe je ze berekent!!
Hoe gaat dit spel te werk?! Klik op het antwoord dat juist is. Klik op de pijl om door te gaan!
Eerst even wat uitleg. Klik op het juiste antwoord als je het weet.
ECHT ONGELOOFLIJK. Lees alle getallen. langzaam en rij voor rij
17/08/2014 | pag. 1 Fractale en Wavelet Beeldcompressie Les 5.
17/08/2014 | pag. 1 Fractale en Wavelet Beeldcompressie Les 3.
Fractale en Wavelet Beeldcompressie
Fractale en Wavelet Beeldcompressie
STIMULANS KWALITEITSZORG juni 2014.
Samen-bouwen … over paneelbouw en de rest!
Centrummaten en Boxplot
Waar gaat het nou toch om?!
JOUW WERELD MIJN WERELD
1 Zie ook identiteit.pdf willen denkenvoelen 5 Zie ook identiteit.pdf.
12 sept 2013 Bodegraven 1. 2  vooraf lezen: 1Kor.7:12 t/m 24  indeling 1Korinthe 7  1 t/m 9: over het huwelijk  10 t/m 16: over echtscheiding  16.
1 Week /03/ is gestart in mineur De voorspellingen van alle groten der aarden dat de beurzen zouden stijgen is omgekeerd uitgedraaid.
23 mei 2013 Bodegraven vanaf hoofdstuk 6: hoofdst.1: de wijsheid van de wereld hoofdst.2: de wijsheid van God hoofdst.3: Gods akker en Gods bouwwerk.
Transcript van de presentatie:

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 1 Onderwijsenquête Resultaten en gevolgen

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 2 Dus… informele transparanten + simplistische uitleg –Vandaag: formules! te grote opdrachten –Kleinere opdrachten 2 en 3 ipv grote opdracht 2 duidelijkere beschrijving –hopelijk ;-) “Vlugge vragen” –Studenten aanwijzen

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 3 Opdracht 1 Ter herinnering: 22 mei 2007 –een week van vandaag! De bedoeling: –de redeneerder(s) kunnen met jullie stellingen omgaan! Hebben jullie vragen?

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 4 Het verwerven van kennis

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 5 Kennissysteem Softwaresysteem, die kennis verwerft, op een expliciete manier voorstelt, over deze kennis redeneert en gebruikt om een opdracht uit te voeren.

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 6 Waar zijn we beland? machinaal leren niet gesuperviseerd leren scheidend clustering

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 7 Huiswerk 14 Een belangrijk probleem is het clusteren van XML documenten. Welke technieken zou je ervoor gebruiken? Aanbevolen: –“Clustering XML documents by structure” van Theodore Dalamagas, Tao Cheng, Klaas-Jan Winkel, and Timos Sellis In te leveren ten laatste op 29 mei 2007

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 8 Onelijkheidsmaat: objecten (1) “Gelijke objecten moeten samen zijn” In welke mate zijn twee objecten gelijk? Soms: expliciet aangegeven: Gelijkenisgraad: Bepaald door studenten van politieke wetenschappen 1 – gelijk, 10 – verschillend symmetrisch

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 9 Maar soms is de ongelijkheidsmaat niet expliciet… ElementMassaSmelt. Kook Aantal iso- topenOntdekkerJaar Zink Marggraf1746 Aluminium Wöhler1827 Argon ,73Ramsey1895 Helium4-272,2-268,92Ramsey1895

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 10 Als de ongelijkheidsmaat niet expliciet is Moeten we ons op de eigenschappen van de objecten baseren: –welke eigenschappen van deze twee objecten zijn voor ons van belang? –in welke mate zijn de eigenschappen gelijk? –hoe combineer je de (on)gelijkenissen van de eigenschappen tot een maat?

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 11 Voorbeeld: eigenschappen Eleme ntMassa Smelt. °K Kook °K Aantal isotopenOntdekkerJaar Zink Marggraf1746 Alumini um Wöhler1827 Argon ,73Ramsey1895 Helium4-272,2-268,92Ramsey1895

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 12 Ongelijkheidsmaten: getallen Absolute afstand –d(x,y) = |x – y| Euclidische afstand –d(x,y) = (x – y) 2 we schrijven ook ||x - y|| Correlatie –zie les Statistiek Aantal isotopen Smeltpunten

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 13 Ongelijkheidsmaat: namen Fout –d(x,x) = 0 –d(x,y) > 0 vaak: d(x,y) = 1 zodra x  y Ontdekkers

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 14 Ongelijkenismaat: objecten (2) Objecten x en y –waarden van de gekozen eigenschappen: x 1, …, x n en y 1, …, y n :

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 15 Element Smelt. °K Aantal isotopenOntdekker Zink4205Marggraf Aluminium Wöhler Argon-1893Ramsey Helium-272,22Ramsey ongelijkheidsmaat |x – y| (x – y) 2 0, als x = y 1, anders Voor welke elementen x, y is D(x,y) het kleinst?

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 16 Als dan hebben alle eigenschappen even veel invloed op D A.Ik ben met de stelling eens. B.Ik ben met de stelling niet eens.

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 17 Scheidend clustering met minimaal opspannende boom 1) Voorbeelden vormen een kliek met ongelijkheidsmaten als gewichten van kanten 2) Bereken de minimaal opspannende boom 3) Verwijder k-1 langste kanten Hier k = 2 4) Stukjes zijn clusters

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 18 A.A en B B.D en E A B C D E Als we minimaal opspannende boom gebruiken voor 2 clusters… wie zit dan in dezelfde cluster? 5

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 19 Ter herinnering: Maximale snede Gegeven een graaf G = (V,E), een paar (V1,V2) is een maximale snede als –V1  V2 = V en –de som van de gewichten verbonden aan de kanten tussen V1 en V2 zo groot mogelijk is Vinden van een maximale snede is NP- volledig!

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 20 A B C D E A.25 B.26 C.27 D.geen enkele antwoord is juist Wat is het grootste gewicht van de kanten tussen de twee delen van een snede? 5

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 21 Max-Cut 1) Voorbeelden vormen een kliek met ongelijkenismaten als gewichten van kanten 2) Bereken de maximale snede 3) Verwijder de kanten van de snede 4) Als het aantaal delen kleiner is dan k, kies een deel en ga naar stap 2). Anders, stop.

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 22 wie zit dan in dezelfde cluster? A B C D E A.A en B B.D en E Als we maximale snede gebruiken voor k = 2… 5

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 23 Maximale snede Splitsend clustering: –1 cluster  2 clusters  3 clusters… –We kunnen een dendrograam van maken: C1 C2C3 C4 C5

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 24 Hiërarchisch clustering Kan ook top-down! –ook verdelend clustering genoemd Kan bereikt worden door –In 2 clusters verdelen (hoe dan ook) –een van de clusters kiezen –en herhalen…

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 25 Scheidend clustering grafenteoretisch –minimale opspannende boom –maximale snede statistisch –k gemiddelde, –k centroïden, –vage k gemiddelde –hoe bepaal je het aantal clusters? Wij zijn hier

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 26 K gemiddeld Voorbeeld 1) Kies randomaal K clustercentra 2) Bepaal voor ieder voorbeeld het dichtstbijzijnde clustercentrum

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 27 K gemiddeld 3) Herbereken de clustercentra als massamiddelpunten van de bijbehorende voorbeelden 4) Herhaal tot de clustercentra niet meer veranderen

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 28 Welke van de volgende stellingen zijn juist? A.Eindclusters zijn onafhankelijk van de oorspronkelijke keuze van de clustercentra B.Clusters voor een grotere k verfijnen clusters voor een kleinere k C.Nog A nog B is juist

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 29 Toepassing: beeld- en signaalcompressie Sir Ronald A. Fisher ( ) N*N pixels, iedere pixel m-bit grijswaarde, N=1024, m = 8 Splits het beeld op in blokjes 2*2 pixels Ieder blokje is een vector in R 4 Gebruik K-gemiddelde clustering. Vervang ieder blokje bij “zijn” clustercentrum K = 200 K = 4

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 30 Compressie? Oorspronkelijk: N 2 * m Voor ieder blokje – zijn clustercentrum –N 2 /4 blokjes –per clustercentrum: log 2 (K) bits (kan beter…) –dus, N 2 /4 * log 2 (K) Compressie is dus: log 2 (K)/(4m) Gecomprimeerd beeld: –23,9% (K = 200, m = 8) –6,3% (K = 4, m = 8)

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 31 Wanneer 1.minimale opspannende boom of maximale snede wel kunnen gebruikt worden 2.terwijl k gemiddeld niet?

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 32 Antwoord K gemiddeld is niet van toepassing… –op niet numerieke eigenschappen –als de ongelijkheid met de “nieuwe” punten niet te bepalen is bijv. als die expliciet aangegeven is in een tabel –als de ongelijkheidsmaat asymmetrisch is

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 33 Wij willen… Kwaliteit van K gemiddeld maar ook toepasbaar voor –niet numerieke eigenschappen –expliciete ongelijkheidsmaten en minder gevoelig voor de “abnormale” voorbeelden: Centrum ligt buiten het echte cluster

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 34 Oplossing: k centroïden (1) Centroïde (ook wel medoïde genoemd) van een cluster K = voorbeeld x zodanig dat som van de afstanden van andere voorbeelden van K tot x is minimaal

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 35 Gegeven een cluster van België, Frankrijk en Israël, de centroïde is A.België B.Frankrijk C.Israël

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 36 k centroïden (2) 1)Bepaal willekeurig de initiële plaatsing van de centroïden. 2)Verdeel voorbeelden bij de dichtstbijzijnde centroïden. 3)Herbereken de centroïden 4)Herhaal 2) en 3) tot de verdeling niet meer veranderd.

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 37 Beginnende met België en Frankrijk als centroïden, welke clusters produceert het algoritme? In hoeveel stappen?

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 38 k centroïden, k = 2 2 stappen

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 39 Wat gebeurt er als een voorbeeld bij meerdere clusters kan horen? Vaagheid: in welke mate maakt het voorbeeld deel van een cluster? –Ter herinnering: vage predicaat is een functie van een meeting naar een graad [0,1] van het predicaat –Hier: “is element van” is vaag! Vage K (of vage c) gemiddelde!

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 40 K gemiddelde vs. Vage K gemiddelde (1) K gemiddelde minimaliseert Euclidische afstand Vage K gemiddelde minimaliseert

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 41 K gemiddelde vs. Vage K gemiddelde (2) K gemiddelde past aan: Vage K gemiddelde past aan: K gemiddelde stopt: als de centra niet meer veranderen Vage K gemiddelde stopt als de “bijna” niet meer veranderd (tot  ) en

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 42 1.Kies en op een willekeurige manier. 2.Herhaal: en 3. Stop als

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 43 Vage K gemiddelde in actie m  Clustercentra en de u-waardes worden eerst willekeurig gekozen voorbeelden En het resultaat is:

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 44 Parameters voor vage k gemiddelde: vaagheid (m), nauwkeurigheid (  ) Initiële lidmaatschapsfunctie Voor welke waarden van deze parameters wordt “vage k gemiddelde” gewone “k gemiddelde”?

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 45 Wat gebeurt als de voorbeelden on-line komen? Geen enkele techniek werkt! Zelforganiserend netwerk –K gemiddelde –maar voorbeeld per voorbeeld de clustercentra worden in een rooster georganiseerd ook goed als de voorbeelden te veel eigenschappen hebben

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 46 Het idee Kies clustercentra. Klasseer voorbeeld X bij het dichtstbijzijnde clustercentrum Voor alle clustercentra z.d. pas aan

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 47 Parameters Grenswaarde Leertempo Beide parameters dalen naar mate het leerproces vordert.

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 48 Welke clusteringtechniek zal je gebruiken? Waarom? A.minimaal opspannende boom B.maximale snede C.k gemiddelde D.k centroïden E.vage k gemiddelde F.zelforganiserende netwerken Kariboe, Noord- am. rendier. Leven in kuddes. Verplaatsen zich veel tussen kuddes. Vind subpopulaties in een radiogemarkeerde kudde.

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 49 Tot nu toe Alle technieken konden k clusters vinden. Maar hoe bepaal je het aantal clusters? –Soms is het gegeven: verzekeringsmaatschappij met k makelaars ieder makelaar moet zo mogelijk uniforme klanten hebben –Anders: zoveel dat de clusters goed zijn.

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 50 Wanneer is een clusterverdeling goed? Verschilmaat voor een clusterverdeling: Voor k gemiddelde geeft het

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 51 Bepalen van k Bereken clusters voor 1, …, K max. Scenario –Aanname: in de werkelijkheid zijn er K* clusters –Als k < K* (en de clustering met de werkelijkheid overeenkomt) dan W(k) – W(k+1) “vrij groot” –Als k > K* dan is W(k) – W(k+1) “nogal klein” –Dus, kijk naar de helling van de grafiek W(k)

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 52 In de praktijk… J. Debenham, G. Clarke en J. Stillwell 2002

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 53 Problemen Komen de gevonden clusters overeen met de echte? Wat betekent “vrij groot”? W(k) – W(k+1) is niet genormaliseerd –vergelijking met andere datasets is onmogelijk!

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 54 Kunnen we beter doen? Vergelijk met een “referentie data set” –uniforme verdeling binnen de min-max grenzen VoorbeeldenVoorbeelden met grenzen aangeduid Monte Carlo simulatie

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 55 Hoe gaan we vergelijken? Bereken W(k) voor k = 1, …, K Kies B referentie data sets (b = 1, …, B) Cluster ieder van de data sets tov iedere k- waarde. Bereken W(k,b). Bereken de “standaardafwijking” s k (verborgen) Kies de kleinste k z.d.

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 56 Wat betekent het in de praktijk? log(W(k,b)) log(W(k)) standaard afwijkingen

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 57 Berekenen van standaardafwijking (zelfstudie)

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 58 Wat hebben we besproken? Scheidend clustering –grafenteoretisch min. opspannende boom maximale snede –statistisch k gemiddelde k centroïden vage k gemiddelde – hoe bepaal je het aantal clusters?

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 59 Vragen voor de toekomst? Hoe kan ik een aantal dimensies (eigenschappen) verkleinen? –kies de interessante –als je het a priori niet weet? Bewerk het dataset voor de clustering –normaliseer? (gemiddelde = 0, st.afwijking =1) –logaritme?

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 60 Opdracht 2 Doel: relevante groepen objecten te vinden. Middelen: –datasets: staan on-line (kies één) –software: implementeer zelf In te leveren tot 5 juni: –software –verslag

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 61 Opdracht 2: Software Invoer: een willekeurige tab-separated bestand –Het eerste colom: namen, –alle andere – eigenschappen (reële getallen). Omgeving: –mijn laptop –zorg, indien nodig, voor de installatiegids Ik ben wel bereid om een kwartiertje te wachten op een clusteringprogramma maar zeker geen uur!

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 62 Opdracht 2: Verslag Welke dataset hebben jullie gekozen? Voor welke clusteringtechniek(en) hebben jullie gekozen? Waarom? Welke ongelijkheidsmaat hebben jullie gebruikt? NB: ongelijkheidsmaat moet gebaseerd worden op ten minste twee eigenschappen per voorbeeld Hoe wordt het aantal clusters bepaald? Hoe hebben jullie de bovengrens gekozen voor het aantal clusters (K)?

IntroGrafentheorieK gemiddelde en variantenHoe bepaal je k? 63 Opdracht 2: Verslag Wat zijn de resultaten van de clustering? Welke objecten horen samen? Kunnen jullie de clusters omschrijven in termen van de eigenschappen? Wat is de verschilmaat van de clusterverdeling (W)? Kunnen jullie in deze clusters bepaalde bekende groepen herkennen? Bespreek het ontwerp en de implementatie.