Een Booleaanse kijk op Hierarchische Data-Analyse Peter Theuns AROR-VUB Pleinlaan Brussel
Overzicht Booleaanse analyse : veralgemening van Guttman analyse Benaderende oplossingen: Waarom? 3 klassen van benaderingen 1. Fouten vermijden 2. Eenvoud / Interpreteerbaarheid nastreven 3. Eigenschappen van het model
Booleaanse - en Guttman analyse Guttman is vaak te beperkend, basishypothesen vaak niet –Uni-dimensionaliteit –n+1 model patronen –Asssumptie van Totale Orde Booleaanse analyse veralgemeent de totale orde tot partiële orde
A A = 1 B = 1 B = 0 A = B 4,5,62,3 -1 p11111 p20111 p30101 p40011 p50001 p60000 A A = 1 C = 1 C = 0 A = C 3,5,62,4 -1 A A = 1 D = 1 D= 0 A = D 62,3,4,5 -1 B ? C 5,64 31,2 B B = 1 D = 1 D = 0 B = D 64,5 -1,2,3 C C = 1 D = 1 D = 0 C = D 63,5 -1,2,4
p11111 p20111 p30101 p40011 p50001 p60000 AD B C
A A = 1 B = 1 B = 0 A = B 4,5,62 -1 p11111 p20111 p40011 p50001 p60000 A A = 1 C = 1 C = 0 A = C 5,62,4 -1 A A = 1 D = 1 D= 0 A = D 62, 4,5 -1 B B = 1 C = 1 C = 0 B = C 5,64 -1,2 B B = 1 D = 1 D = 0 B = D 64,5 -1,2 C C = 1 D = 1 D = 0 C = D 65 -1,2,4
ADBC AD B C p11111 p20111 p40011 p50001 p60000 p11111 p20111 p30101 p40011 p50001 p60000
p11111 p20111 p30101 p40011 p60000 AD B C B of C
p11111 p30101 p40011 p60000 B en CB of CAD B C
Benaderingen - Waarom? Fouten in de data Complexiteit van de bekomen implicatie schemas Theoretische eisen gesteld aan de resulterende implicatie schemas
Benaderingen - HOE? DICHOTOMIZATIE METHODEN Fouten vermijden (patroon frequencies) (Flament) Eenvoud nastreven (lengte van PCU) (Degreef & Van Buggenhaut) Voldoen aan theoretische eisen (format van PCU) (Theuns)
Communistisch regime (Flament, 1976) antwpatroonFiFi Niveau %antwpatroonFiFi Niveau % BMPIF , ,0 BMPI ,5F ,7 BMPF ,0I ,2 BMIF ,0P ,0 BPIF ,6M ,0 MPIF ,9B ,1 BMP ,1IF ,9 BMI ,6PF ,2 BMF ,3PI ,9 BPI ,8MF ,0 BPF ,9MI ,2 BIF ,7MP ,5 MPI ,6BF ,2 MPF ,3BI ,3 MIF ,3BP ,7 PIF ,5BM ,2
B M P I F BMPF BMIFBMPI BPIFMPIF BMPIF BM BP BI BF MP MI PI BMP BMI BMF BPIBPFBIFMPF MF MPI PF MIF IF PIF Communistisch regime (Flament, 1976)
B M P I F BMPF BMIFBMPI BPIFMPIF BMPIF BM BP BI BF MP MI PI BMP BMI BMF BPIBPFBIFMPF MF MPI PF MIF IF PIF Pad doorheen patronen met hoogste frequentie = (toevallig) scalogram of Guttmanschaal B P F I M Implicatieschema: M I F P B
BMPF BMIFBMPI BPIFMPIF BMPIF 8 47 PCU overdekken ALLE niet-model patronen. Men kan ze voorstellen als “kubussen”, transitieve PCU overdekken geen andere patronen. PCU PB’ FP’ IF’ MI’ B M P I F BM BP BI BF MP MI PI MF PFIF BMP BMI BMF BPIBPFBIFMPF MPI MIFPIF = model patroon Implicatieschema: M I F P B
P M I F B Reduceren van fouten Dichotomie op % van steekproefgrootte is vastgesteld op 3% van steekproefgrootte ( =35) R*' = {11111,10111,10101,00000,00100,10000,10001,10100} PCU= { MP', MI', MF', P'I, IF', B'M, B'I, B'F }, implicatie schema ( sample fit = 89.7 % )
MIBFMIBF Eenvoud van model – de cohesie drempel (Van Buggenhaut & Degreef) 0 = 8 R*'= {10000, 10100, 10001, 10101, 10111, 11111, 00000, 00100, 10110, 10011, }, PCU = { x10xx, x1x0x, x1xx0, 01xxx, 0xx1x, 0xxx1 } = { MP', MI', MF', B'M, B'I, B'F }, Implicatie schema (sample fit = 94.4 %) P
Dichotomie volgens criteria van theoretisch model (Theuns) Cross sectionele benadering van veranderingsproces Hypothese:verandering vindt plaats in een proces waarin gradueel geordende items worden beheerst Proces vangt aan bij lege status en evolueert tot volledige verzameling door telkens 1 item toe te voegen Flament (1976) R*' is gesloten voor Unie asa er zijn geen PCU die meer dan 1 positieve response omvatten R*' is gesloten voor intersectie asa er zijn geen PCU die meer dan 1 negatieve response omvatten Gevolg:, R*' is gesloten voor intersectie EN unie asa alle PCU bevatten precies 1 negatieve en 1 positieve respons