Een Booleaanse kijk op Hierarchische Data-Analyse Peter Theuns AROR-VUB Pleinlaan 2 1050 Brussel

Slides:



Advertisements
Verwante presentaties
Klaar? Actie! over ouderen en cultuurparticipatie
Advertisements

Schoolsecretariaten (n=555)
Wat was toen het grootste het grootste probleem van de van de FOD?
Overzicht Sessie 1 Inleiding
FOD VOLKSGEZONDHEID, VEILIGHEID VAN DE VOEDSELKETEN EN LEEFMILIEU 1 Controle en doorsturen van de gegevens voor Finhosta via PORTAHEALTH FOD Volksgezondheid,
Hoofdstuk14 Gegevens verzamelen in het veld, non- responsefouten en screening van vragenlijsten.
1 Motion Planning (simpel) •Gegeven een “robot” A in een ruimte W, een verzameling obstakels B, en een start en doel positie, bepaal een beweging voor.
Welke keuzemogelijkheden zijn er m.b.t. pensionering? Vele medewerkers kiezen er niet voor om met 62 jaar met pensioen te gaan, maar overwegen een eerdere.
November 2013 Opinieonderzoek Vlaanderen – oktober 2013 Opiniepeiling Vlaanderen uitgevoerd op het iVOXpanel.
Uitgaven aan zorg per financieringsbron / /Hoofdstuk 2 Zorg in perspectief /pagina 1.
MMNM 2011 Marketingcommunicatie.
Samen bouwen aan zelfvertrouwen
Vergelijkbaarheid historische studies
Onderwerp Vraagstelling Theorie Methodiek verslaglegging
Gelijkvormige driehoeken
Nooit meer onnodig groen? Luuk Misdom, IT&T
EVEN HELDER KRIJGEN EVEN DE VRAAG HEEL HELDER KRIJGEN VOORDAT JE ZOMAAR AAN DE SLAG GAAT?
Tentoonstelling Scryption Tilburg
Statistiek Verzamelen Voorstellen Beschrijven Interpreteren
Rekenregels voor wortels
Determinants of underemployment of young adults: A multi-country study Ruiz-Quintanilla, S.A., & Claes, R. (1996). Industrial and Labor Relations Review,
THESISSEMINARIE 2 VAKGROEP EXPERIMENTEEL-KLINISCHE EN GEZONDHEIDSPSYCHOLOGIE Probleemstelling, methode LES 1; Klinische Psychologie; Universiteit Gent;
LAATSTE SCRIPTIESEMINARIE
Chapter 9. Understanding Multivariate Techniques
Inhoud (1) De ontwerpruimte en haar terminologie
Oefeningen F-toetsen ANOVA.
Aan de Rijksuniversiteit Groningen Informatica studeren › Michael Wilkinson Onderwijsinstituut voor Informatica en Cognitie.
Aan de Rijksuniversiteit Groningen Informatica studeren › Michael Wilkinson Onderwijsinstituut voor Informatica en Cognitie.
1Ben Bruidegom 1 Sequentiële schakelingen Toestand uitgang bepaald door:  ingangen &  vorige toestand uitgang.
Sequentiële schakelingen
DP PL OP IP BF MP MFAP Figuur 9.1. Beheersen van een fase: Werk autoriseren Informatie verzamelen over de voortgang Aandachtspunten verzamelen Beoordelen.
Finite State Machines.
Ben Bruidegom 1 Sequentiële schakelingen Toestand uitgang bepaald door:  ingangen;  vorige toestand uitgang.
CQI- ziekenhuisopname ontwikkeling en discriminerend vermogen
Oefeningen Akoestische grondslagen en Sonologische analyse Dr
Een Theoretische en Empirische Analyse van Benaderingen in Symbolische Probleem Oplosmethoden.
Aanleiding onderzoek Ondervoeding sinds 2010 prestatie indicator (PI) voor revalidatiecentra Advies in PI: gebruik de SNAQ om te screenen Vragen van de.
BEHEER ENQUÊTES Opvragen en verwerken van gegevens.
Hoe gaat dit spel te werk?! Klik op het antwoord dat juist is. Klik op de pijl om door te gaan!
VEELTERMEN BLADWIJZERS: GETALWAARDE OPTELLEN EN AFTREKKEN
Petra Dewilde Annelies Duerinckx
Survey onderzoek Veldstudie waarin via een interviewmethode een stand van zaken wordt opgemaakt voor een representatieve steekproef enquêtes opiniepeilingen.
Varianties bij replicatie (herhaald testen)
Onderzoeksmethoden en -Technieken
Fractale en Wavelet Beeldcompressie
Kwalitatief onderzoek
Nauwkeurigheid bij Practica
In opdracht van NOC*NSF
Modelleren van XML element content of Hoe doe je dat? Harrie Passier & Bastiaan Heeren TouW-dag 13 november 2010.
 Doel Sociaal-economische Raad: * 2016: arbeidsdeelname jarigen = 20% * Arbeidsparticipatie van 55 tot 65-jarigen.
Module I Informatica Dhr. C. Walters. Het belang van informatie Gegevens  Informatie  Besluitvorming Gegevens = Data, Raw Material Informatie = Gegevens.
Pag. Software Engineering: SCRUM 2 Schedule Generator Zjef Van de Poel, Alexander De Cock, Adam Cooman, Matthias Caenepeel
Business Intelligence
De incidentmethode Een eenvoudige en strak gestructureerde methode
MBR AtT1 College 9 Diagnose met correctmodellen. Verdieping in de formalisatie. In reader: Characterizing diagnoses and Systems J. de Kleer, A.
Hogeschool Rotterdam, Opleiding Vastgoed & Makelaardij drs. ing. M.M.A. Scheepers Collegejaar college.
Plancyclus, les 4  Actualiteit  Vragen naar aanleiding van vorige les  Vragen over hoofdstuk 4 en 5  Observeren met een plan; het verschil tussen observeren.
Managen analyseren 6 adviseren creëren organiseren begeleiden In kaart brengen Organisaties communicatieve r maken Iets doen ontstaan Mensen.
Data Mining without Discrimination Valorisatiepanel 4 december – Faculty Club – Universiteit Leiden.
Datastructuren voor grafen Algoritmiek. 2 Grafen Model van o.a.: –Wegennetwerk –Elektrische schakeling –Structuur van een programma –Computernetwerk –…
Minimum Opspannende Bomen
Tool IE-3: Kenmerken van probleem-oplosopdrachten
HISWA Certified Jachtservice bedrijf
Praktijkgericht onderzoek
Unified Modeling Language
Praktijkgericht onderzoek
Introductie in de filosofie van ACT
Van data naar inzicht Verzamelen Opslag Interpreteren Zoeken & vinden
Onbevredigd door Testautomatisering? Reduceer je False Negatives!
Transcript van de presentatie:

Een Booleaanse kijk op Hierarchische Data-Analyse Peter Theuns AROR-VUB Pleinlaan Brussel

Overzicht Booleaanse analyse : veralgemening van Guttman analyse Benaderende oplossingen: Waarom? 3 klassen van benaderingen 1. Fouten vermijden 2. Eenvoud / Interpreteerbaarheid nastreven 3. Eigenschappen van het model

Booleaanse - en Guttman analyse Guttman is vaak te beperkend, basishypothesen vaak niet –Uni-dimensionaliteit –n+1 model patronen –Asssumptie van Totale Orde Booleaanse analyse veralgemeent de totale orde tot partiële orde

A A = 1  B = 1 B = 0  A = B 4,5,62,3 -1 p11111 p20111 p30101 p40011 p50001 p60000 A A = 1  C = 1 C = 0  A = C 3,5,62,4 -1 A A = 1  D = 1 D= 0  A = D 62,3,4,5 -1 B ? C 5,64 31,2 B B = 1  D = 1 D = 0  B = D 64,5 -1,2,3 C C = 1  D = 1 D = 0  C = D 63,5 -1,2,4

p11111 p20111 p30101 p40011 p50001 p60000 AD B C

A A = 1  B = 1 B = 0  A = B 4,5,62 -1 p11111 p20111 p40011 p50001 p60000 A A = 1  C = 1 C = 0  A = C 5,62,4 -1 A A = 1  D = 1 D= 0  A = D 62, 4,5 -1 B B = 1  C = 1 C = 0  B = C 5,64 -1,2 B B = 1  D = 1 D = 0  B = D 64,5 -1,2 C C = 1  D = 1 D = 0  C = D 65 -1,2,4

ADBC AD B C p11111 p20111 p40011 p50001 p60000 p11111 p20111 p30101 p40011 p50001 p60000

p11111 p20111 p30101 p40011 p60000 AD B C B of C

p11111 p30101 p40011 p60000 B en CB of CAD B C

Benaderingen - Waarom? Fouten in de data Complexiteit van de bekomen implicatie schemas Theoretische eisen gesteld aan de resulterende implicatie schemas

Benaderingen - HOE? DICHOTOMIZATIE METHODEN Fouten vermijden (patroon frequencies) (Flament) Eenvoud nastreven (lengte van PCU) (Degreef & Van Buggenhaut) Voldoen aan theoretische eisen (format van PCU) (Theuns)

Communistisch regime (Flament, 1976) antwpatroonFiFi Niveau %antwpatroonFiFi Niveau % BMPIF , ,0 BMPI ,5F ,7 BMPF ,0I ,2 BMIF ,0P ,0 BPIF ,6M ,0 MPIF ,9B ,1 BMP ,1IF ,9 BMI ,6PF ,2 BMF ,3PI ,9 BPI ,8MF ,0 BPF ,9MI ,2 BIF ,7MP ,5 MPI ,6BF ,2 MPF ,3BI ,3 MIF ,3BP ,7 PIF ,5BM ,2

 B M P I F BMPF BMIFBMPI BPIFMPIF BMPIF BM BP BI BF MP MI PI BMP BMI BMF BPIBPFBIFMPF MF MPI PF MIF IF PIF Communistisch regime (Flament, 1976)

 B M P I F BMPF BMIFBMPI BPIFMPIF BMPIF BM BP BI BF MP MI PI BMP BMI BMF BPIBPFBIFMPF MF MPI PF MIF IF PIF Pad doorheen patronen met hoogste frequentie = (toevallig) scalogram of Guttmanschaal B P F I M Implicatieschema: M  I  F  P  B

 BMPF BMIFBMPI BPIFMPIF BMPIF 8 47 PCU overdekken ALLE niet-model patronen. Men kan ze voorstellen als “kubussen”, transitieve PCU overdekken geen andere patronen. PCU PB’ FP’ IF’ MI’ B M P I F BM BP BI BF MP MI PI MF PFIF BMP BMI BMF BPIBPFBIFMPF MPI MIFPIF = model patroon Implicatieschema: M  I  F  P  B

P M  I  F  B Reduceren van fouten ­ Dichotomie op % van steekproefgrootte  is vastgesteld op 3% van steekproefgrootte (  =35) R*' = {11111,10111,10101,00000,00100,10000,10001,10100} PCU= { MP', MI', MF', P'I, IF', B'M, B'I, B'F }, implicatie schema ( sample fit = 89.7 % )

MIBFMIBF Eenvoud van model – de cohesie drempel (Van Buggenhaut & Degreef)  0 = 8 R*'= {10000, 10100, 10001, 10101, 10111, 11111, 00000, 00100, 10110, 10011, }, PCU = { x10xx, x1x0x, x1xx0, 01xxx, 0xx1x, 0xxx1 } = { MP', MI', MF', B'M, B'I, B'F }, Implicatie schema (sample fit = 94.4 %) P

Dichotomie volgens criteria van theoretisch model (Theuns) Cross sectionele benadering van veranderingsproces Hypothese:verandering vindt plaats in een proces waarin gradueel geordende items worden beheerst Proces vangt aan bij lege status en evolueert tot volledige verzameling door telkens 1 item toe te voegen Flament (1976) R*' is gesloten voor Unie asa er zijn geen PCU die meer dan 1 positieve response omvatten R*' is gesloten voor intersectie asa er zijn geen PCU die meer dan 1 negatieve response omvatten Gevolg:, R*' is gesloten voor intersectie EN unie asa alle PCU bevatten precies 1 negatieve en 1 positieve respons