De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

Klanken 2. Dit college Fonologie met eindige automaten en transducers.

Verwante presentaties


Presentatie over: "Klanken 2. Dit college Fonologie met eindige automaten en transducers."— Transcript van de presentatie:

1 Klanken 2

2 Dit college Fonologie met eindige automaten en transducers

3 Colleges en hoofdstukken 28 april: Klanken 1 (fonetiek, fonologie) Chapters 2 en 7 3 mei: Klanken 2 (eindige automaten en transducers) Chapters 2, 3 en mei: Woorden (morfologie) Chapter 3

4 Automaten: Talen We kunnen de mogelijke syllaben en woorden in een taal opvatten als een verzameling rijtjes over een alfabet van fonemen (d.w.z. als een formele taal) Een simpel voorbeeld: Alfabet = { p, k, a, i }, Taal = { pa, ka, pi, ki, papa, papi, pipa, pipi, …, paki, …, kipa, …, kikipa, …, pakipapa, … }

5 Formele Talen

6 Eindige Automaten Een taal kan worden gekaraktiseerd door een eindige automaat (finite automaton/state machine) Een automaat herkent een taal door stap voor stap de tekens van een inputrijtje op een tape te lezen en een aantal toestanden te doorlopen. Geslaagde herkenning: einde tape en tevens in een accepterende eindtoestand.

7 Example of a finite automaton There are states off and on, the automaton starts in off and tries to reach the “accept state” on What sequences of f’ s lead to the accept state? Answer: {f, fff, fffff, …} = {f n : n is odd } This is a finite automaton over alphabet {f} off on f f

8

9 Deterministic finite automata deterministische eindige automaten A deterministic finite state automaton (DFA) is a 5-tuple (Q, , , q 0, F) where – Q is a finite set of states –  is an alphabet –  : Q ×  → Q is a transition function – q 0  Q is the initial state – F  Q is a set of accepting states (or final states). In diagrams, the accepting states will be denoted by double loops

10 Example q0q0 q1q1 q2q ,11 alphabet  = {0, 1} states Q = {q 0, q 1, q 2 } initial state q 0 accepting states F = {q 0, q 1 } states inputs 0 1 q0q0 q1q1 q2q2 q0q0 q1q1 q2q2 q2q2 q2q2 q1q1 table of transition function 

11 Language of a DFA The language of a DFA (Q, , , q 0, F) is the set of all strings over  that, starting from q 0 and following the transitions as the string is read left to right, will reach some accepting state. Language of M is {f, fff, fffff, …} = {f n : n is odd } off on f f M:M:

12 q0q0 q1q Wat zijn de talen van deze automaten? Meer Voorbeelden q0q0 q1q1 q2q2 q3q3 q4q4 a a a a a b b b b b q0q0 q1q q2q2 0, 1  = {0, 1}  = {a, b}

13 Reguliere expressies We hebben hier te maken met een reguliere taal – een taal beschreven door een FSA. Een reguliere taal kan ook beschreven worden door een reguliere expressie: ([pk][ai])+

14 Operaties over talen Let L, L 1, L 2 be subsets of Σ * Concatenation:L 1 L 2 = {xy | x is in L 1 and y is in L 2 } Concatenating a language with itself:L 0 = {ε} L i = LL i-1, for all i >= 1 Kleene Closure:L * = L i = L 0 U L 1 U L 2 U… Positive Closure:L + = L i = L 1 U L 2 U…

15 Kleene-sluiting Say, L 1 ={a, abc, ba}, on Σ ={a,b,c} Then, L 2 = {aa, aabc, aba, abca, abcabc, abcba, baa, baabc, baba} L 3 = {a, abc, ba}. L 2 L* = { ε } U L 1 U L 2 U L 3 U..

16 Definitie van een Reguliere Expressie Let Σ be an alphabet. The regular expressions over Σ are: –ØRepresents the empty set { } –ε Represents the set {ε} –aRepresents the set {a}, for any symbol a in Σ Let r and s be regular expressions that represent the sets R and S, respectively. –r|sRepresents the set R U S (precedence 3) –rsRepresents the set RS (precedence 2) –r * Represents the set R* (highest precedence) –(r)Represents the set R(not an op, provides precedence) If r is a regular expression, then L(r) is used to denote the corresponding language.

17 Examples: Let Σ = {0, 1} (0|1)*All strings of 0’s and 1’s 0(0|1)*All strings of 0’s and 1’s, beginning with a 0 (0|1)*1All strings of 0’s and 1’s, ending with a 1 (0|1)*0(0|1)*All strings of 0’s and 1’s containing at least one 0 (0|1)*0(0|1)*0(0|1)*All strings of 0’s and 1’s containing at least two 0’s (0|1)*01*01*All strings of 0’s and 1’s containing at least two 0’s (1|01*0)*All strings of 0’s and 1’s containing an even number of 0’s 1*(01*01*)*All strings of 0’s and 1’s containing an even number of 0’s (1*01*0)*1*All strings of 0’s and 1’s containing an even number of 0’s

18 ‘Flapping’ in Amerikaans Engels foneem /t/ flapping regel na een beklemtoonde klinker ( ) en voor een onbeklemtoonde klinker (V), is [dx] de allofoon voor de foneem /t/

19 Transducers (informeel)

20 Transducers (formeel) deterministische eindige automaten (DFA)  (1) niet-deterministische eindige automaten (NFA)  (2) eindige toestands transducer (finite state transducers FST)

21 Van DFA naar NFA 0 1 … … … … qq qq qq q  q  q  q  q  q  q  q  Construct a DFA over alphabet {0, 1} that accepts those strings that end in 101 Sketch of answer:

22 Would be easier if… Suppose we could guess when the string we are reading has only 3 symbols left Then we could simply look for the sequence 101 and accept if we see it q die symbols left This is not a DFA!

23 Nondeterminism Nondeterminism is the ability to make guesses, which we can later verify Informal nondeterministic algorithm for strings that end in 101 : 1.Guess if you are approaching end of input 2.If guess is yes, look for 101 and accept if you see it 3.If guess is no, read one more symbol and go to step 1

24 Nondeterministic finite automaton This is a kind of automaton that allows you to make guesses Each state can have zero, one, or more transitions out labeled by the same symbol , 1 qq qq qq qq

25 (1) Van DFA naar NFA A deterministic finite state automaton (DFA) is a 5-tuple (Q, , , q 0, F) where – Q is a finite set of states –  is an alphabet –  : Q ×  → Q is a transition function – q 0  Q is the initial state – F  Q is a set of accepting states (or final states).

26 (1) Van DFA naar NFA A nondeterministic finite state automaton (NFA) is a 5-tuple (Q, , , q 0, F) where – Q is a finite set of states –  is an alphabet –  : Q ×  × Q is a transition relation – q 0  Q is the initial state – F  Q is a set of accepting states (or final states).

27 , 1 qq qq qq qq

28 1 0 1 qq qq qq qq (q , 0,q)q) (q , 1,q)q) (q , 1,q)q) (q , 0,q)q) (q , 1,q)q)

29 , 1 qq qq qq qq (2) Van NFA naar FST

30 1:y 0:x 1:y 0:a, 1:b qq qq qq qq (2) Van NFA naar FST

31 1:y 0:x 1:y 0:a, 1:b qq qq qq qq (2) Van NFA naar FST => abbbbayxy niet geaccepteerd

32 (2) Van NFA naar FST A finite state transducer (FST) is a 6-tuple (Q, , Δ, , q 0, F) where – Q is a finite set of states –  is an input alphabet – Δ is an output alphabet –  : Q ×  × Δ × Q is a non-deterministic transition relation –q 0  Q is the initial state – F  Q is a set of accepting states (or final states).

33 Voorbeeld – Meervoud in het Engels [ix z] na de “sibilant” fonen [s], [sh], [z], [zh], [ch] of [jh]- peaches [z] na “voiced” klanken - pigs [s] na “voiceless” klanken - cats faxes in lexicon: f aa k ^ z

34

35

36 Automaten: Voorbeeld 0 1 p|k a|i Begintoestand en eindtoestand Eindig aantal toestanden Toestandsovergangen bij het lezen van bepaalde symbolen 2 a|ip|k p|k|a|i

37 Automaten: Voorbeeld 0 1 p|ka|i Met een ‘jump’ p|k p|k|a|i a|i

38 basi (bus) bwana (mijnheer) duka (winkel) jenga (bouwen) kwanza (eerst) mama (moeder) mbuzi (geit) mvua (regen) ndizi (banaan) ngoma (trommel) ngwena (krokodil) njia (weg) ona (zien) pangwa (gepland) pwani (strand) saa (horloge) simba (leeuw) wingu (wolk) unga (meel) asante (bedankt) desemba (december) kamera (fototoestel) matata (problemen) safari (reis) kampuni (onderneming) mandazi (doughnut) kidogo (klein) ofisi (kantoor) mbalimbali (allerlei) kawaida (gewoonte) kitunguu (ui) maharagwe (bonen) endelea (doorgaan) tofauti (verschil) Ufaransa (Frankrijk) madaraka (verantwoordelijkheid) barabara (weg) kilimanjaro milionea (millionaire) arobaini (veertig)

39 Swahili lettergrepen Taalkundige analyse syllabestructuur: NCwV opeenvolging van 1 of meer syllaben Reguliere expressie in Wingrep ^([mn]?[zsjhrlfvptkbdg]?w?[aeiou])+$


Download ppt "Klanken 2. Dit college Fonologie met eindige automaten en transducers."

Verwante presentaties


Ads door Google