Speech Recognition LIACS Media Lab Leiden University Seminar Speech Recognition Group I Recognition Algoritms Michel van Egmond Nico de Groot LIACS Media Lab Leiden University
Speech Recognition LIACS Media Lab Leiden University General Specification
Speech Recognition LIACS Media Lab Leiden University Situatie en Doelen Uitgangssituatie –RES met huidige algoritmes duidelijk te traag voor real-time –RES herkenningskwaliteit op eerste gezicht (te) laag –beide problemen hebben direct verband met de gebruikte algoritmes en zijn in deze combinatie ‘dodelijk’ Implementatie doelen (algoritmes) –Kwaliteitsonderzoek: is RES met andere parameters wél bruikbaar te maken –Indien positief: Opsporen in welk deel van RES de meeste resources worden verbruikt -> tracen, profilen en dan optimaliseren –Indien negatief: Algoritmes vervangen door betere en snellere: Stackdecoding of CFG search + N-gram search (vgl MS Whisper case study)
Speech Recognition LIACS Media Lab Leiden University Planning 9 weken beschikbaar –7: source-code verder doorwerken, boek! –8: kwaliteitsonderzoek –9: profiling -> implementatie-voorstel of literatuur-onderzoek implementatie Whisper (IEEE-document) –10: overleg met andere groepen: interfaces afspreken –11-12: coding/testing –13: integratie - testen –14: oplossen problemen integratie