Spraakverstaanbaarheid (criteria, normalisatie, subjectieve en objectieve verstaanbaarheidsmaten, toepassingen en voorspelkracht) Herman J.M. Steeneken (www.steeneken.com) Reference list (small list) for past and present research. For looking into the future some recent publications are added. Houtgast, T., Steeneken, H.J.M. (1971). Evaluation of speech transmission channels by using artificial signals. Acustica 25(1971) 355‑367. Houtgast, T., Steeneken, H.J.M. (1972). Envelope spectrum and intelligibility of speech in enclosures. Proc. 1972 Conference on Speech Communication and Processing, April 1972: 392‑395. Steeneken, H.J.M., Houtgast, T. (1973). Intelligibility in telecommunication derived from physical measurements. Rapports et Textes Symposium Intelligibilité de la Parole, November 12‑15, Liege 1973: 316‑324. Houtgast, T., Steeneken, H.J.M. (1973). The modulation transfer function in room acoustics as a predictor of speech intelligibility. Acustica 28(1973) 66‑73. Steeneken, H.J.M., Houtgast, T. (1975). MTF as a physical measure of the quality of communication channels. Textes des Conferences de Colloque nr. 1: l'Acoustique dans les Telecommunications", Paris 1975: 351‑359. Houtgast, T., Steeneken, H.J.M. (1977). Speech intelligibility in rooms; reverberation curve or modulation transfer function? Proc. 9th International Congress on Acoustics, July, Madrid 1977: 92. Steeneken, H.J.M., Houtgast, T. (1979). Measuring ISO‑intelligibility contours in auditoria. Proc. 3rd Symp. of F.A.S.E. on Building Acoustics, September, Dubrovnik 1979: 85‑88. (RASTI). Steeneken, H.J.M., Houtgast, T. (1980). A physical method for measuring speech‑transmission quality. J. Acoust. Soc. Am. 67(1980) 318‑326. VPT 2008
Overzicht Kwaliteit van Spraakcommunicatie Spraakverstaanbaarheidmaten Evaluatiemethoden (subjectief-objectief) Voorspellingsmethoden Samenvatting VPT 2008
Het communicatiekanaal In general the reduction of the speech intelligibility is related to a reduction of the signal-to-noise ratio. Hence, speaking louder, increasing the directivity factor of the listener or a well designed public address system might help. VPT 2008
Het communicatiekanaal Spreker (stem, moedertaal, vocale inspanning) Transmissiepad (lawaai, akoestiek, vervorming) Luisteraar (gehoor, moedertaal) VPT 2008
Spraakcommunicatiekwaliteit Spraakwaliteit Spraakverstaanbaarheid Vocale inspanning Objectieve voorspellingsmethoden VPT 2008
Toepassing en criteria (ISO-9921) Toepassing bij: verst. “vocal effort” Gevaar en waarschuwing matig luid Persoon-tot-persoon (kritiek) redelijk luid Persoon-tot-persoon (algemeen) goed ontspannen Omroepinstallaties openbaar goed normaal Persoonlijke comm. systemen goed normaal VPT 2008
Subjectieve evaluatie Evaluatiemethoden Subjectieve evaluatie meerdere sprekers en luisteraars specifieke testmethoden representatief resultaten soms niet reproduceerbaar Objectieve evaluatie voorspelling van verstaanbaarheid diagnostisch reproduceerbaar VPT 2008
Subjectieve evaluatie Mean Opinion Scores (korte zinnen) beoordeling op (vijfpuntsschaal), zeer veel ppn. Speech Reception Threshold slechts voorspelling bij 50% zinsverstaanbaarheid (Nonsens)woorden in (dragerzin) indirect, groot bereik, arbeidsintensief VPT 2008
Objectieve evaluatiemethoden Speech Interference Level (SIL) beperkt tot directe communicatie in lawaai Speech Transmission Index (STI) geschikt voor alle soorten vervorming Speech Intelligibility Index (SII) geen niet-lineaire en temporele vervorming VPT 2008
Relatie tussen subjectieve en objectieve verstaanbaarheidsmaten VPT 2008
Relatie tussen subjectieve en objectieve verstaanbaarheidsmaten Kwalificatie Sent.% CVC % PB % STI LSA – LLN nonsens bestaande dB woorden woorden Uitstekend 100 >81 > 98 >0.75 21 Goed 100 70-81 93-98 0.60-0.75 15 - 21 Redelijk 100 53-70 80-93 0.45-0.60 9 - 15 Matig 70-100 31-53 60-80 0.30-0.45 3 - 9 Slecht <70 <31 <60 < 0.30 <3 VPT 2008
Toegevoegde ruis op basis van het gemiddelde Demonstratie van vier kwalificaties Uitstekend SNR = 11 dB Goed SNR = 5 dB Redelijk SNR = 1 dB Matig SNR = - 4 dB Toegevoegde ruis op basis van het gemiddelde spraakspectrum VPT 2008
Criteria ISO-9921 Toepassing Verst. SIL STI Vocale inspan. Alarm Waarschuwing matig 9 0.45 Luid Persoon-tot-persoon (kritisch) redelijk 9 0.50 Luid Persoon-tot-persoon (ontspan.) goed 15 0.60 Ontspan. Omroepinstallatie openbaar redelijk 11 0.50 Normaal Persoonlijke communicatie redelijk 11 0.50 Normaal VPT 2008
Voorspellingsmethoden SIL, vocale inspanning, omgevingslawaai STI, vocale inspanning, geslacht spreker, omgevingslawaai, bandbreedte-beperking, maskering, nagalm, echo’s, niet-lineairiteit, (IEC 60268-16) SII, vocale inspanning, omgevingslawaai, bandbreedte-beperking, maskering, (ANSI 305.2) VPT 2008
Toegevoegde ruis op basis van het gemiddelde Demonstratie van kwalificatie “Redelijk” Redelijk SNR = 1 dB, (STI = 0,53) geen bandbreedte-beperking Redelijk SNR = 3 dB, (STI = 0,53) bandbreedte 375 - 5600 Hz Toegevoegde ruis op basis van het gemiddelde spraakspectrum VPT 2008
Speech Transmission Index (STI) Gewogen SNR levert voorspelling spraakkwaliteit VPT 2008
Modulatieoverdracht (lijnfrequentie) VPT 2008
Omhullende funktie en spectrum VPT 2008
Omhullende funktie met nagalm en ruis VPT 2008
Modulatieoverdracht (MTF) De MTF wordt verkregen door de omhullende-spectra van het originele en ontvangen spraaksignaal te vergelijken VPT 2008
Matrix voor zeven MTF’s 1 Hz 3 Hz 10 Hz 10 Hz For a full STI measurement the MTF has to be determined for 7 octave bands (125 Hz – 8 kHz) and for 14 modulation frequencies (0.63 Hz – 12.5 Hz). Under the orange buttons a sample of a test signal for 1, 3, and 10 Hz is given. If you listen to this signal in a reverberating environment you will notice a decrease of the fluctuations for the higher modulation frequency. X VPT 2008
Modulatieoverdracht meten met testsignaal VPT 2008
Berekening STI (Spraak Transmissie Index) Voor elke octaafband wordt eerst de effectieve SNR bepaald De gewogen octaaf-bijdrage levert de STI VPT 2008
Optimale frequentieweging De bijdrage per frequentieband hangt af van het type spraak VPT 2008
Redundante informatie is overbodig! VPT 2008
Redundantie in het spraakspectrum VPT 2008
Proefpersonen aan het werk VPT 2008
Proefpersoon responsies CVC woorden, dragerzin: versta des over en nu fijs uit het woord zek einde noteer lal punt “Semi random” combinatie van: 17 beginmedeklinkers 15 klinkers 11 eindmedeklinkers VPT 2008
Relatie tussen woordscores en STI Relatie STI/CVC-score voor mannelijke spraak en condities met ruis en bandbreedte-beperking De verticale spreiding bedraagt s.d. 4.8% VPT 2008
STI voor Cabine-omroepinstallatie VPT 2008
Iso STI-contouren in collegezaal VPT 2008
Effectieve versterking van PA-systeem STI als funktie het omgevings- lawaainiveau Twee condities (met en zonder toespreekinstallatie) Verschil in lawaainiveau bij zelfde STI-waarde levert effectieve versterking van de toespreekinstallatie VPT 2008
STI gemeten met spraaksignalen MTF via verschil van omhullendespectra van verzonden en ontvangen spraaksignalen Toepasbaar bij ruis, nagalm en echo’s maar niet bij niet-lineaire vervorming VPT 2008
RASTI (room acoustical STI, 1980) Screening-apparaat 2 Octaafbanden Continu testsignaal Verouderd (gebruik STIPA)! VPT 2008
STIPA (STI Public Address, 2001) Evaluatie voor Public Address Omvat: akoestische omgeving, bandbreedtebeperking, oversturingsvervorming Zeven octaafbanden (125 Hz en 250 Hz samen) Complex omhullende (2 simultane modulatie- frequenties per band) zie: IEC 60268-16 VPT 2008
Conclusies Criteria voor vele toepassingen volgens ISO-9921 Subjectieve methoden: representatief, niet diagnostisch Objectieve methoden: voorspellen, snel, diagnostisch VPT 2008