D-LUCEA Database of the Longitudinal Utrecht Collection of English Accents Hugo QuenéRosemary Orr UiL OTSUCU Universiteit Utrecht CLARIN-NL Call 3 Kickoff Meeting 6 maart 2012, Hilversum
University College Utrecht zelfstandig onderdeel van UU bachelor college in Angelsaksische stijl –drie jaar –brede academische vorming –ca 3x200 studenten selectief, competitief, intensief Engels als lingua franca intensief campus-leven
UCU English Accent moedertalen studenten: 5% EN, 60% NL, 35% anders English-only policy geen training in EN uitspraak geen invloed van EN omgevingstaal spontaan ontwikkelend, uniek accent: UCU English
LUCEA Longitudinaal onderzoek focus op convergentie van accenten 3 cohorten: 2010 (N=73), 2011 (N=79), opnames longitudinaal over 3 jaar totaal ca 900 opnames, elk ~20m (~2.5GB) plus meta-data (vragenlijst)
LUCEA EN voorgelezen teksten Rainbow, Wolf, prosody sentences, intelligibility test sentences, UN Declaration of Human Rights L1 voorgelezen teksten UN Declaration of Human Rights EN spontane monologen informal, formal L1 spontane monologen EN spontane dialoog
voorbeelden Cohort 2010, Round 1 (sept 2010) S010 S060 S002
studiemarathon 7 Engels als vreemde taal spraak-onderzoek bij University College Utrecht English-only on campus, 24/7, Nederlandstalige omgeving hoe verandert accent? –herhaalde opnames (3 cohorten, 3 jaar) –nu 46 Ned, 8 Eng, 16 anderstalige studenten Orr & Quené (2011)
D-LUCEA Resource Curation Project (12m) curatie en beschrijving van opnames, metadata, en andere materialen i.s.m. Daan Broeder, The Language Archive, MPI, Nijmegen meta-data: CMDI (L2 acquisition) uitbreiding ISOCat waar nodig Persistent IDs voor optimale ontsluiting
privacy informed consent Copies of the recordings may be distributed anonymously to individuals and organizations engaged in linguistic research, education, and technology development. (...) Individuals and organizations that receive session recordings or transcripts will first agree to use these resources only for linguistic education, research and technology development purposes. Personal identifying information will not be distributed to individuals or organizations receiving the data. anonimiteit en privacy naam inhoud van monoloog en dialoog
D-LUCEA verbeterde ontsluiting en bruikbaarheid relevant voor onderzoek naar (convergentie van) accenten –in academia, industrie, militair relevant voor onderwijs en ASR (i.s.m. Helmer Strik c.s., Radboud Un)
vragen ?