Teoria das Linguagens. Linguagens Formais e Autómatos (Linguagens)

(1)

Teoria das Linguagens

Lic. em Ciˆencias da Computa¸c˜ao

Linguagens Formais e Aut´omatos

(Linguagens)

Carla Mendes

Dep. Matem´atica e Aplica¸c˜oes Universidade do Minho

(2)

“The fundamental aim in linguistic analysis of language L is to

separate the grammatical sequences which are sentences of L from the ungrammatical sentences which are not sentences of L and to study the structure of grammatical sequence.”

Avram Noam Chomsky (1928) O estudo de linguagens formais e da teoria de autómatos emergiu na década de 1950, altura em que Noam Chomsky introduziu a formaliza¸cão matemática da no¸cão de linguagem.

Neste cap´ıtulo estudamos algumas classes importantes de linguagens formais assim como os modelos abstractos de computa¸cão que permitem fazer o reconhecimento sintáctico destas linguagens. Mais precisamente, iremos estudar linguagens regulares e autómatos finitos, linguagens independentes de contexto e autómatos de pilha.

(3)

Nesta seçcão come¸camos por introduzir alguns conceitos básicos sobre linguagens que são fundamentais neste cap´ıtulo.

Nos dicion´arios encontramos o termo “linguagem” definido

informalmente como sendo um sistema adequado para expressar ideias, factos ou conceitos, incluindo um conjunto de s´ımbolos e regras para a sua manipula¸cão. Embora isto nos dê uma ideia intuitiva do que é uma linguagem não é suficiente para o estudo de linguagens formais.

Defini¸c˜ao 1.1

Um alfabeto A é um conjunto finito não vazio cujos elementos são designados por letras. Uma palavra sobre A é uma sequência finita de elementos de A; a sequência vazia de s´ımbolos designa-se por palavra

vazia, e representa-se por ǫ. O comprimento de uma palavra w ,

(4)

Exemplo 1.2

Seja A = {a, b, c}. Ent˜ao w1 = acb, w1 = bbaca e ǫ s˜ao palavras sobre A e tem-se |w1| = 3, |w2| = 5 e |ǫ| = 0.

Defini¸c˜ao 1.3

Duas palavras a1a2. . .a_n e b1b2. . .b_m sobre um alfabeto A dizem-se iguais se n = m e, para cada i ∈ {1, . . . , n}, ai = bi.

O conjunto de todas as palavras sobre A ´e representado por A∗ _{e o}

conjunto de todas as palavras n˜ao vazias de A ´e representado por A+_. Exemplo 1.4

Sendo A = {a, b}, tem-se A∗

= {ǫ, a, b, aa, bb.ab.ba.aaa.bbb, abb, aba, . . .}

(5)

Defini¸c˜ao 1.5

Dado um alfabeto A, seja · : A∗

× A∗

→ A∗

a opera¸c˜ao que a duas palavras u, v de A∗ _{associa a palavra representada por u · v (ou apenas} por uv ) e que ´e definida por

u · v = v , se u = ǫ; u · v = u, se v = ǫ;

u · v = a1a2. . .a_nb₁b₂. . .b_m, se u = a₁a₂. . .a_n e v = b₁b₂. . .b_m

s˜ao palavras n˜ao vazias.

A esta opera¸cão dá-se a designa¸cão de concatena¸cão (produto) de

duas palavras de A∗_.

Se u ´e uma palavra sobre um alfabeto A e n ∈ N0, representa-se por un:

a palavra vazia, caso n = 0;

o produto de n c´opias de u, caso n ∈ N.

A palavra un _{designa-se por potˆ}_{encia-n de u e pode ser definida}

recursivamente por _un₌

ǫ se n = 0,

(6)

A respeito da opera¸cão de concatena¸cão de duas palavras é simples provar as seguintes propriedades.

Proposi¸c˜ao 1.6

Dado um alfabeto A, tem-se, para quaisquer u, v , w ∈ A∗

e m, n ∈ N0: (i) ǫu = u = uǫ (ǫ elemento neutro do produto);

(ii) (uv )w = u(vw ) (propriedade associativa do produto); (iii) uv = uw ⇒ v = w (lei do corte `a esquerda);

(iv) vu = wu ⇒ v = w (lei do corte `a direita); (v) |uv | = |u| + |v |;

(vi) un+m_{= u}n_um_; (vii) (un₎m _{= u}nm_; (viii) |un_{| = n|u|.}

Sejam u, v , w palavras sobre um alfabeto A. Ent˜ao, atendendo a que a opera¸cão de concatena¸cão de palavras é associativa, podemos escrever

(7)

Note-se que a opera¸cão de concatena¸cão não é, em geral, comutativa. Por exemplo, dadas as palavras u = ab, v = ba ∈ {a, b}∗_{, tem-se} uv = abba 6= baab = vu.

Recorrendo à opera¸cão de concatena¸cão, podemos definir indutivamente o conjunto A∗

. Este tipo de defini¸c˜ao pode ser ´util na prova de certas propriedades referentes a este conjunto.

Proposi¸c˜ao 1.7

Dado um alfabeto A, o conjunto A∗ _{´e o conjunto definido indutivamente} pelas regras seguintes:

(i) ǫ∈ A∗;

(ii) Se w ∈ A∗

e a ∈ A, ent˜ao wa ∈ A∗ .

O conjunto A+ também admite uma defini¸cão indutiva. Uma vez que a palavra ǫ n˜ao pertence a A+ basta modificar a defini¸cão anterior da forma que se apresenta a seguir:

(8)

Proposi¸c˜ao 1.8

Dado um alfabeto A, o conjunto A+ ´e o conjunto definido indutivamente pelas regras seguintes:

(i) Se a ∈ A, então a ∈ A+; (ii)Se w ∈ A+ e a ∈ A, então wa ∈ A+. Defini¸cão 1.9

Sejam A um alfabeto e u, v ∈ A∗

. Diz-se que:

u ´e um factor de v se existem x, y ∈ A∗ _{tais que v = xuy ;} u ´e um prefixo de v se existe y ∈ A∗

tal que v = uy ; u ´e um sufixo de v se existe y ∈ A∗ _{tal que v = yu;}

u é um factor próprio (resp., prefixo próprio, sufixo próprio) de v

se u ´e um factor (resp. prefixo, sufixo) de v e u 6= v . Exemplo 1.10

Sejam A = {0, 1} e u = 0101. Ent˜ao

os factores de u s˜ao: ǫ, 0, 1, 01, 10, 010, 101 e u; os prefixos de u s˜ao: ǫ, 0, 01, 010 e u;

(9)

Defini¸c˜ao 1.11

Sejam A um alfabeto e u ∈ A∗_{. Designa-se por palavra inversa de u, e} representa-se por uI_{, a palavra de A}∗

definida por uI = ǫ se u = ǫ, avI _{se u = va com v ∈ A}∗ _{e a ∈ A.} Exemplo 1.12 Sejam A = {0, 1} e u = 01101. Ent˜ao uI _{= 10110.} Proposi¸c˜ao 1.13

Seja A um alfabeto. Ent˜ao, para quaisquer n ∈ N, a1,a₂. . . ,a_n∈ A e

u, v ∈ A∗_{, tem-se}

(i) (a1a2. . .a_n)I = a_n. . .a₂a₁;

(ii) (uv )I _{= v}I_uI_; (iii) (uI₎I _{= u.}

(10)

Defini¸c˜ao 1.14

Dado um alfabeto A, designa-se por linguagem sobre A, qualquer subconjunto de A∗_.

Exemplo 1.15

Seja A = {0, 1}. Ent˜ao s˜ao exemplos de linguagens sobre A os seguintes subconjuntos de A∗

:

∅, {ǫ}, {0}, A, {00, 11, 000, 111}, A∗

, A+, {0n₁n_{: n ∈ N} 0}.

O conjunto P(A∗_{) de todas as linguagens sobre A ´e representado por} L(A).

Uma vez que as linguagens são conjuntos, podemos definir entre linguagens as opera¸cões usuais de união, interseçcão e complementar.

(11)

Defini¸c˜ao 1.16

Sendo L1, L2 s˜ao linguagens sobre um alfabeto A, define-se L1∪ L2= {x ∈ A∗ : x ∈ L1 ou x ∈ L2}; (uni˜ao de L1e L2)

L1∩ L2= {x ∈ A∗: x ∈ L1e x ∈ L2} (intersec¸c˜ao de L1e L2)

L1\ L2= {x ∈ A∗: x ∈ L1e x 6∈ L2} (complementar de L1em L2)

L1= A∗\ L1 (complementar de L1).

Recorrendo à opera¸cão de concatena¸cão de palavras, define-se também a seguinte opera¸cão de linguagens.

Defini¸c˜ao 1.17

Dadas linguagens L1 e L2 sobre um alfabeto A, designa-se por

concatena¸c˜ao (ou produto) de L1 e L2, e representa-se por L1· L2 (ou apenas por L1L2), a linguagem

(12)

Exemplo 1.18

Sejam L1 = {a, ba} e L2 = {b, ab} linguagens sobre o alfabeto {a, b}. Ent˜ao L1L2 = {ab, aab, bab, baab} e L2L1 = {ba, bba, aba, abba}.

Sendo u uma palavra e L uma linguagem sobre um alfabeto A, ´e usual escrever uL e Lu em vez de {u}L e L{u}, respectivamente.

Sejam A um alfabeto e u palavra sobre A. Ent˜ao

uA∗

= {ux : x ∈ A∗_}; A∗_{u = {xu : x ∈ A}∗_}; A∗_uA∗ _{= {xuy : x, y ∈ A}∗_},

representam, respectivamente, o conjunto de palavras de A∗

que tˆem u como prefixo, como sufixo e como factor, respectivamente.

(13)

Exemplo 1.19 Para A = {a, b, c}, (abcA∗ ∩ A∗ cbA∗ ) \ A∗ a

representa a linguagem das palavras sobre A que come¸cam por abc, tˆem cb como factor e n˜ao terminam em a.

Da defini¸cão de concatena¸cão de linguagens e de algumas propriedades relativas à concatena¸cão de palavras, resultam as igualdades seguintes:

Proposi¸c˜ao 1.20

Para quaisquer linguagens L, L1, L2 e L3 sobre um alfabeto A, tem-se: (i) ∅L = ∅ = L∅;

(ii) ǫL = L = Lǫ;

(iii) (L1L2)L3 = L1(L2L3); (iv) L1(L2∪ L3) = L1L2∪ L1L3.

(v) (L2∪ L3)L1 = L2L1∪ L3L1.

Uma vez que a concatena¸c˜ao de linguagens ´e associativa, escrevemos

(14)

Defini¸c˜ao 1.21

Sejam L uma linguagem sobre um alfabeto A e n ∈ N0. Define-se

potˆencia-n de L, e representa-se por Ln_{, a linguagem definida} recursivamente por _Ln₌

{ǫ} se n = 0, Ln−1_{L se n ∈ N.} Defini¸c˜ao 1.22

Seja L uma linguagem sobre um alfabeto A. Designa-se por:

estrela de L ou fecho (de Kleene) de L, e representa-se por L∗ , a uni˜ao de todas as potˆencias de L, i.e.

L∗

= [

n∈N0

Ln.

fecho positivo de L, e representa-se por L+_{, a uni˜}_{ao de todas as} potˆencias positivas de L, i.e.,

L+= [

n∈N Ln.

(15)

Note que as nota¸c˜oes A∗ _{e A}+ _s˜_{ao coerentes com as defini¸c˜}_{oes de fecho}

de Kleene e de fecho positivo. Por exemplo, {0}∗

= {ǫ, 0, 00, 000, 0000, . . .} = {0n : n ∈ N0}

tanto representa o conjunto de todas as palavras sobre o alfabeto

A = {0} como tamb´em representa o fecho de Kleene da linguagem L = {0}.

A respeito dos operadores fecho de Kleene e fecho positivo, s˜ao v´alidas as propriedades seguintes:

Proposi¸c˜ao 1.23

Sejam A um alfabeto e L uma linguagem sobre A. Tem-se: (i) ∅∗ _{= {ǫ}, ∅}+_{= ∅, {ǫ}}∗_{= {ǫ} = {ǫ}}+_;

(ii) L ⊆ L+ _{⊆ L}∗_;

(iii) ǫ∈ L+ se e s´o se ǫ ∈ L;

(16)

Defini¸c˜ao 1.24

Sejam A um alfabeto, L uma linguagem sobre A e u uma palavra sobre A. Chama-se:

res´ıduo esquerdo de L relativamente `a palavra u `a linguagem u−1_{L = {x ∈ A}∗

: ux ∈ L};

res´ıduo direito de L relativamente `a palavra u `a linguagem Lu−1 _{= {x ∈ A}∗

: xu ∈ L}.

Exemplo 1.25

Sejam A = {a, b} e L = {a, aba, ba, bbaa, abba}. Ent˜ao

ǫ−1L = L;

a−1_{L = {ǫ, ba, bba};} b−1_{L = {a, baa};}

(aa)−1_{L = ∅;}

(ab)−1_{L = {a, ba};}

(bba)−1L = {a};

Lǫ−1 _{= L;}

La−1 _{= {ǫ, ab, b, bba, abb};} Lb−1 _{= ∅;}

L(aa)−1 _{= {bb};} L(ab)−1 _{= ∅;} L(bba)−1 = {a}.

(17)

´

E simples verificar as propriedades seguintes:

Proposi¸c˜ao 1.26

Sejam A um alfabeto, a ∈ A, u uma palavra sobre A e L uma linguagem sobre A. Ent˜ao (i) u−1_(L 1∪ L2) = u−1L1∪ u−1L2; (ii) u−1_(L 1∩ L2) = u−1L1∩ u−1L2; (iii) u−1_(L 1\ L2) = u−1L1\ u−1L2; (iv) a−1_(L 1L2) = (a−1_L 1)L2 se ǫ 6∈ L1 (a−1_L 1)L2∪ a−1L2 se ǫ ∈ L1 ; (v) a−1_L∗ = (a−1_L)L∗ ; (vi) (uv )−1L = v−1(u−1L).