Autômatos de Pilha. ( n x 0 +x 1 )+x 2 ) +x n )

(1)

Autˆ

omatos de Pilha

Apesar das inúmeras aplica¸cões dos formalismos associados às linguagens regulares, existem aplica¸cões que requerem linguagens mais sofisticadas e que, portanto, envolvem o uso de formalismos mais sofisticados. Por exemplo, são comuns as aplica¸cões em que se deve escrever expressões aritméticas. As linguagens das expressões aritméticas normalmente contêm todas as palavras da forma:

(n_x₀+_x₁)+_x₂)_{· · · +x}_n)

em que n ≥ 0, cada xié uma subexpressão, e o número de (s é igual ao de )s.

Aplicando-se o lema do bombeamento, vê-Aplicando-se que tais linguagens não são regulares: tomando-Aplicando-se z = (kx0+x1)+x2)· · · +xk), em que k é a constante referida no lema, vê-se que para

quaisquer u, v e w tais que z = uvw, |uv| ≤ k e v 6= λ, uv2w = (k+|v|x0+x1)+x2)· · · +xk),

que tem mais (s do que )s.

Intuitivamente, um AF não pode reconhecer a linguagem descrita porque não tem uma memória poderosa o suficiente para “lembrar” que leu n ocorrências de certo s´ımbolo, para n arbitrário. A única maneira de ler uma quantidade arbitrária de determinado s´ımbolo, em um AF, é por meio de um ciclo. E, nesse caso, não há como contar o número de s´ımbolos lidos.

Neste cap´ıtulo, será apresentada uma extens˜ao dos AFs, os denominados autômatos de pilha,1 de grande importância, visto que constituem uma base para a obten¸cão de reconhecedores para muitas linguagens que ocorrem na prática. Em particular, alguns compiladores de linguagens de programa¸cão utilizam alguma variante de autômato de pilha na fase de análise sintática.

Ao contrário dos AFs, a versão não determin´ıstica desse tipo de autômato tem uma abrangência de reconhecimento maior que a determin´ıstica. No entanto, as linguagens que podem ser reconhecidas por autômatos de pilha determin´ısticos são especialmente

1

Em inglˆes, pushdown automata.

(2)

a1 a2 · · · ai · · · an i fita de leitura apenas, unidirecional

❄

controle

+

δ

e registrador com estado atual

b1 b2 .. . bn topo da pilha pilha

Figura 3.1 Arquitetura de um APD.

importantes, já que admitem reconhecedores eficientes. Algumas constru¸cões que ocor-rem em linguagens que podem ser reconhecidas por autômatos de pilha não deter-min´ısticos, mas que não podem ocorrer em linguagens que possam ser reconhecidas por autômatos de pilha determin´ısticos, alertam para o fato de que se está transitando do campo da eficiência de reconhecimento para o da ineficiência.

Antes de apresentar as versões determin´ıstica e não determin´ıstica de autômatos de pilha nas Se¸cões 3.2 e 3.3, será vista uma introdu¸cão informal de autômato de pilha determin´ıstico na Se¸cão 3.1. Depois, na Se¸cão 3.4, serão estudadas as gramáticas livres do contexto, que são um formalismo de grande utilidade prática para a especifica¸cão de linguagens reconhec´ıveis por autômatos de pilha. Para finalizar, algumas propriedades importantes dessa classe de linguagens serão abordadas na Se¸cão 3.5.

3.1 Uma Introdu¸

c˜

ao Informal

Um autˆomato de pilha determnin´ıstico (APD) pode ser visto como uma m´aquina similar `

aquela ilustrada na Figura 2.47, página 120, que contenha adicionalmente uma pilha, como mostrado na Figura 3.1. Como a fita, a pilha é dividida em células que comportam apenas um s´ımbolo cada uma, mas o cabe¸cote de leitura da pilha só se posiciona na célula do topo da pilha. No in´ıcio, o registrador contém o estado inicial do APD, a fita recebe a palavra de entrada a partir da sua primeira célula, o cabe¸cote da fita é posicionado na primeira célula da fita e a pilha está vazia.

Agora, além do alfabeto da fita haverá o alfabeto da pilha (não necessariamente disjunto do da fita). E embora a ocorrência de uma transi¸cão a partir de um estado possa depender do s´ımbolo de entrada e do s´ımbolo no topo da pilha, será permitido

(3)

ap fp (, λ/X

a, λ/λ

), X/λ

+, λ/λ; ∗, λ/λ

Figura 3.2 Reconhecendo express˜oes aritm´eticas simples.

também que ela dependa apenas do s´ımbolo de entrada (ignorando o que está no topo da pilha) ou apenas do s´ımbolo no topo da pilha (ignorando o s´ımbolo de entrada). A palavra vazia, λ, será usada nestes últimos dois casos para indicar a inten¸cão de ignorar a entrada ou a pilha.

Suponha um APD com conjunto de estados E, alfabeto de entrada (alfabeto da fita) Σ e alfabeto da pilha Γ. Em uma computa¸c˜ao, ao transitar de um estado e para um estado e′, caso o s´ımbolo de entrada seja a ∈ Σλ (se a = λ, nada ´e lido) e o s´ımbolo

do topo da pilha seja b ∈ Γλ (se b = λ, o s´ımbolo do topo da pilha ´e ignorado), o APD

poder´a empilhar zero ou mais s´ımbolos (representados por uma palavra z ∈ Γ∗_{) no lugar}

de b. Tendo isso em mente, cada transi¸cão do APD será da forma δ(e, a, b) = [e′, z], em que e, e′ ∈ E, a ∈ Σλ, b ∈ Γλ e z ∈ Γ∗. Essa transi¸cão será dita uma transi¸cão de

e para e′ _sob _{a desempilhando b e empilhando z, sendo representada em um diagrama}

de estados da seguinte forma:

e a, b/z _e′

significando, no caso em que a 6= λ, b 6= λ e z 6= λ, que “estando no estado e, se o próximo s´ımbolo de entrada for a e o s´ımbolo no topo da pilha for b, há uma transi¸cão para o estado e′, b é desempilhado e z, empilhado (o s´ımbolo mais à esquerda em z, no topo)”. Se a = λ, não é consumido o s´ımbolo de entrada. Se b = λ, a transi¸cão acontece sem consulta à pilha e nada é desempilhado. E se z = λ, nada é empilhado. Se z = a0a1. . . an, então os s´ımbolos são empilhados na ordem an, an−1, . . . , a0.

Um APD simples que reconhece certo tipo de expressão aritmética é apresentado a seguir.

Exemplo 70 Seja o conjunto EA das expressões aritméticas com parênteses e as opera¸cões de soma (+) e multiplica¸cão (*), definido recursivamente por:

a) a∈ EA;

b) se x, y ∈ EA, ent˜ao (x) ∈ EA, x+y ∈ EA e x∗y ∈ EA.

O s´ımbolo a pode ser imaginado como representando expressões mais básicas, como números inteiros e/ou reais, identificadores de variáveis etc. O reconhecimento de tais expressões básicas não oferece nenhum problema, podendo ser feito mediante um AF. A Figura 3.2 apresenta um diagrama de estados para um APD que reconhece EA. Observe que o conjunto de estados é E = {ap, fp}, o alfabeto de entrada é Σ = {a, (, ), +, ∗}, e

(4)

o da pilha, Γ = {X}. O estado inicial ´e ap e o conjunto de estados finais, {fp}. Existem cinco transi¸c˜oes:

1. δ(ap, (, λ) = [ap, X]; 2. δ(ap, a, λ) = [fp, λ]; 3. δ(fp, ), X) = [fp, λ]; 4. δ(fp, +, λ) = [ap, λ]; 5. δ(fp, ∗, λ) = [ap, λ].

As transi¸cões estão numeradas para referência futura. Os detalhes de funcionamento desse APD serão elucidados do decorrer desta se¸cão, à medida que os conceitos ne-cessários forem sendo introduzidos.

Uma pilha de s´ımbolos de um alfabeto Γ ser´a representada por meio de uma palavra de Γ∗_{. A conven¸c˜}_{ao adotada ´e que o s´ımbolo mais a esquerda est´}_{a no topo. Assim, o}

resultado de empilhar o s´ımbolo a na pilha y é a pilha ay. O resultado de desempilhar o elemento do topo da pilha ay é a pilha y. A pilha vazia será representada pela palavra λ.

No Cap´ıtulo 2, mostrou-se que a configura¸cão instantânea de um AF é um par [e, y], em que e é o estado atual do autômato e y, o restante da palavra de entrada. A configura¸cão instantânea consta das informa¸cões necessárias para o autômato prosseguir no reconhecimento da palavra de entrada em certo instante. Em um autômato de pilha, ela será uma tripla [e, y, z], na qual e é o estado atual, y é o restante da palavra de entrada, e z é o conteúdo da pilha. Como explicado na Se¸cão 2.1.1, usa-se a nota¸cão c ⊢ c′ para dizer que a configura¸cão instantânea c′ é o resultado de uma transi¸cão a partir da configura¸cão instantânea c. Com isso, por exemplo, pode-se expressar a seguinte computa¸cão para o APD do Exemplo 70, mostrado na Figura 3.2, quando a palavra de entrada for (a*(a+a)):

[ap, (a ∗ (a + a)), λ] ⊢ [ap, a ∗ (a + a)), X] por 1 ⊢ [fp, ∗(a + a)), X] por 2 ⊢ [ap, (a + a)), X] por 5 ⊢ [ap, a + a)), XX] por 1 ⊢ [fp, +a)), XX] por 2 ⊢ [ap, a)), XX] por 4 ⊢ [fp, )), XX] por 1

⊢ [fp, ), X] por 3

⊢ [fp, λ, λ] por 3. N˜ao h´a transi¸c˜ao que se aplique a ⊢ [fp, λ, λ].

Outro exemplo:

(5)

λ, λ/X

Figura 3.3 Um APD com computa¸c˜oes ilimitadas.

Não há transi¸c˜ao que se aplique a [fp, ), λ]. Esse segundo exemplo mostra que o APD pode não consumir toda a palavra de entrada. Usando a metáfora propiciada pelo esquema da Figura 3.1, em que a cada transi¸cão corresponde uma “instru¸cão” da m´aquina, diz-se que um AP pode parar sem consumir toda a palavra de entrada.

Para uma palavra ser reconhecida é necessário que três condi¸cões sejam satisfeitas simultaneamente : (1) um estado final seja atingido (2) a palavra seja totalmente con-sumida e (3) a pilha esteja vazia. Em outras palavras, uma palavra w é reconhecida se a computa¸cão com in´ıcio na configura¸cão inicial [i, w, λ] atingir a configura¸cão [f, λ, λ] em que f é estado final. Assim, para o APD do Exemplo 70, a palavra (a*(a+a)) é reconhecida, como mostra a primeira computa¸cão descrita. A palavra a) não é reco-nhecida, pois o AP não consome toda a palavra, como mostra a segunda computa¸cão apresentada. E a palavra (a não é reconhecida, pois o APD para com a pilha não vazia:

[ap, (a, λ] ⊢ [ap, a, X] por 1 ⊢ [fp, λ, X] por 2.

N˜ao h´a transi¸c˜ao que se aplique a [fp, λ, X]. ´

E interessante notar que existem APs que n˜ao param para algumas entradas, ou mesmo para todas as entradas, como mostra o pr´oximo exemplo.

Exemplo 71 Um exemplo conciso de um AP com computa¸c˜oes de tamanho ilimitado seria aquele com alfabeto de entrada {1} e com o diagrama de estados exposto na Figura 3.3. Para toda palavra em {1}+_{, pode-se dizer que o APD n˜ao para, visto}

que o primeiro s´ımbolo nunca é lido e a única transi¸cão existente é sempre aplicável. Em particular:

[0, 1, λ] ⊢ [0, 1, X] ⊢ [0, 1, XX] . . .

Para a palavra λ, a transi¸cão também é aplicável e têm-se computa¸cões de todo tama-nho. Pergunta: para a palavra de entrada λ, deve-se considerar que o APD para ou não? A palavra λ é reconhecida ou não?

Na próxima se¸cão, será definido formalmente o conceito de autômato de pilha de-termin´ıstico e apresentados alguns exemplos. O problema levantado no Exemplo 71 pode ser resolvido formalizando-se convenientemente a no¸cão de reconhecimento.

3.2 Autˆ

omatos de Pilha Determin´ısticos

Os autômatos de pilha determin´ısticos (APDs) são especialmente importantes, já que lidam com uma classe de linguagens para as quais há reconhecedores eficientes.

(6)

A defini¸cão de autômato de pilha determin´ıstico, basicamente, acrescenta uma pilha a um AFD. Para que haja determinismo, n˜ao deverá ser poss´ıvel mais de uma transi¸cão ser definida para uma mesma configura¸cão instantânea; em outras palavras, em um es-tado qualquer do APD, qualquer que seja o próximo s´ımbolo de entrada e qualquer que seja a situa¸cão atual da pilha, no máximo uma transi¸cão deverá ser poss´ıvel. A de-fini¸cão a seguir captura exatamente as situa¸cões em que duas transi¸cões podem ocorrer simultaneamente para alguma configura¸cão instantânea.

Defini¸c˜ao 33 Seja uma fun¸cão de transi¸cãoδ : E ×Σλ×Γλ→ E ×Γ∗. Duas transi¸cões

δ(e1, a1, b1) = [e′1, z1] e δ(e2, a2, b2) = [e′2, z2] s˜ao ditas compat´ıveis se e somente se:

e1= e2 e (a1= a2 ou a1= λ ou a2= λ) e (b1 = b2 ou b1 = λ ou b2 = λ).

Note-se, na Defini¸cão 33, que a compatibilidade não depende dos estados destino nem das palavras a empilhar. Para algumas pessoas pode parecer mais intuitivo o complemento da expressão apresentada na defini¸cão: duas transi¸cões δ(e1, a1, b1) =

[e′₁, z1] e δ(e2, a2, b2) = [e′2, z2] s˜ao n˜ao compat´ıveis se e somente se:

e16= e2 ou (a16= a2 e a1 6= λ e a2 6= λ) ou (b16= b2 e b1 6= λ e b26= λ).

Apesar de um APD admitir transi¸cões sob λ, ele não admite transi¸cões compat´ıveis. Logo, qualquer configura¸cão instantânea que seja atingida terá no máximo uma suces-sora.

Defini¸c˜ao 34 Um autômato de pilha determin´ıstico(APD ) é uma sêxtupla (E, Σ, Γ, δ, i, F ),

em que

• E ´e um conjunto finito de um ou mais elementos denominados estados; • Σ ´e o alfabeto de entrada;

• Γ ´e o alfabeto de pilha;

• δ, a fun¸cão de transi¸cão, é uma fun¸cão parcial de E × Σλ× Γλ para E × Γ∗, sem transi¸cões compat´ıveis;

• i, um estado de E, ´e o estado inicial;

• F , subconjunto de E, ´e o conjunto de estados finais.

As seguintes razões fazem que não haja uma fun¸cão ˆδ similar àquela do Cap´ıtulo 2: • Pode haver computa¸cões que não terminam, como ficou claro na Se¸cão 3.1. • Além do(s) estado(s) atingido(s), é importante saber o conteúdo da pilha. Assim, em vez de uma fun¸cão ˆδ, será usada a rela¸cão ⊢ definida a seguir.

(7)

1 2 a_{, λ/X}

b, X/λ

b_{, X/λ}

Figura 3.4 APD para {an_bn_{| n ∈ N}.}

Defini¸c˜ao 35 Seja um APD M = (E, Σ, Γ, δ, i, F ). A rela¸c˜ao⊢⊆ (E × Σ∗_{× Γ}∗₎2_{, para}

M , ´e tal que para todo e, e′ ∈ E, a ∈ Σλ, b ∈ Γλ ex ∈ Γ∗:

[e, ay, bz] ⊢ [e′, y, xz] para todo y ∈ Σ∗ ez ∈ Γ∗ se, e somente se,δ(e, a, b) = [e′, x].

Utilizando a rela¸c˜ao⊢, que corresponde ao fecho reflexivo e transitivo de ⊢, define-se∗ a seguir o que ´e a linguagem reconhecida (aceita) por um APD.

Defini¸c˜ao 36 Seja um APD M = (E, Σ, Γ, δ, i, F ). A linguagem reconhecida por M ´e

L(M ) = {w ∈ Σ∗ | [i, w, λ]⊢ [e, λ, λ] para algum e ∈ F }.∗

Uma palavraw tal que [i, w, λ]⊢ [e, λ, λ], em que e ∈ F , ´e dita ser reconhecida (aceita)∗

porM .

Exemplo 72 No Exemplo 50, p´agina 87, mostrou-se que o conjunto {an_bn_{| n ∈ N}}

não é uma linguagem regular. Ela é reconhecida pelo autômato de pilha determin´ıstico ({1, 2}, {a, b}, {X}, δ, 1, {1, 2}), em que δ é dada por:

δ(1, a, λ) = [1, X]; δ(1, b, X) = [2, λ]; δ(2, b, X) = [2, λ].

O diagrama de estados est´a ilustrado na Figura 3.4.

No exemplo anterior, a pilha foi utilizada para conter o número de as em excesso (com rela¸cão ao número de bs) lido até o momento atual; e os dois estados garantem que o processamento dos as anteceda o dos bs. Veja-se, então, que parte das informa¸cões coletadas (até certo instante do processamento) é armazenada na pilha e parte nos estados. Evidentemente, o número de as só pode ser anotado na pilha, visto que ele pode ser um número natural qualquer. Os dois exemplos a seguir, mostram que às vezes pode-se escolher entre guardar uma informa¸cão em estados ou na pilha. (Na Se¸cão 3.4.4 será visto que, para a versão não determin´ıstica, toda informa¸cão pode ser guardada na pilha, o estado inicial servindo apenas para “dar partida”.)

(8)

ig m0 m1 0, λ/F 1, λ/F 0, λ/X 1, X/λ 1, F/λ 1, λ/X 0, X/λ 0, F/λ

Figura 3.5 APD para n´umero igual de 0s e 1s/vers˜ao 1.

Exemplo 73 A Figura 3.5 apresenta o diagrama de estados de um APD M que reco-nhece a linguagem {w ∈ {0, 1}∗_{| n}

0(w) = n1(w)}. Tem-se que

M = ({ig, m0, m1}, {0, 1}, {Z, U, F}, δ, ig, {ig}) sendo δ dada por:

1. δ(ig, 0, λ) = [m0, F]; 2. δ(ig, 1, λ) = [m1, F]; 3. δ(m0, 0, λ) = [m0, X]; 4. δ(m0, 1, X) = [m0, λ]; 5. δ(m0, 1, F) = [ig, λ]; 6. δ(m1, 1, λ) = [m1, X]; 7. δ(m1, 0, X) = [m1, λ]; 8. δ(m1, 1, F) = [ig, λ].

No estado ig a pilha estará vazia e, além disso, o número de 0s será igual ao de 1s. O estado m0 é atingido se e somente se o número de 0s lido até o momento é maior do que o de 1s; neste caso, a pilha contém o excesso de 0s com rela¸cão ao número de 1s. Analogamente, o estado m1 é atingido se e somente se o número de 1s lido até o momento é maior do que o de 0s; no caso, a pilha contém o excesso de 1s com rela¸cão a 0s. Portanto, a informa¸cão de que o número de 0s é igual ao de uns (estado ig) ou o de 0s é maior que o de 1s (estado m0) ou o de 1s é maior que o de 0s (estado m1) é dada pelos estados. Já a informa¸cão do excesso de um dos s´ımbolos com rela¸cão ao outro é dado pela pilha.

A seguinte computa¸c˜ao mostra que 001110 pertence `a linguagem reconhecida por M : [ig, 001110, λ] ⊢ [m0, 01110, F] por 1 ⊢ [m0, 1110, XF] por 3 ⊢ [m0, 110, F] por 4 ⊢ [ig, 10, λ] por 5 ⊢ [m1, 0, F] por 2 ⊢ [ig, λ, λ] por 7.

(9)

= 6= 1, λ/UF 0, λ/ZF λ, F/λ 0, U/λ 0, Z/ZZ 1, U/UU 1, Z/λ

Figura 3.6 APD para n´umero igual de 0s e 1s/vers˜ao 2.

No exemplo a seguir, a informa¸cão de qual s´ımbolo está em excesso, que no exemplo anterior é dada pelos estados, é colocada na pilha.

Exemplo 742 A Figura 3.6 apresenta o diagrama de estados de um outro APD que reconhece a linguagem {w ∈ {0, 1}∗_{| n}

0(w) = n1(w)}. Observe que, como requerido,

não há transi¸cões compat´ıveis. Após lido um prefixo x da palavra de entrada:

• se n0(x) > n1(x), o estado atual ´e 6= e a pilha cont´em ZnF, sendo n = n0(x) −

n1(x);

• se n1(x) > n0(x), o estado atual ´e 6= e a pilha cont´em UnF, sendo n = n1(x) −

n0(x);

• se n0(x) = n1(x), o estado atual é = e a pilha está vazia ou o estado atual é 6= e

a pilha cont´em F.

No caso em que n0(x) = n1(x) e o estado atual é 6= e a pilha contém F, a única transi¸cão

aplicável é a de 6= para = sob λ substituindo F por λ, mesmo que exista um próximo s´ımbolo a ser lido.

Os Exemplos 73 e 74 utilizam uma técnica que possibilita marcar o fundo da pi-lha: foi introduzido um s´ımbolo de pilha (F) especificamente para isso. Algumas for-maliza¸cões de APDs incluem um s´ımbolo especial para tal propósito. No entanto, a introdu¸cão de um s´ımbolo especial de fundo de pilha não aumenta o poder de reco-nhecimento dos APDs, já que um s´ımbolo de pilha comum pode fazer seu papel, como mostram os exemplos citados. A seguir mais um exemplo de uso de marca¸cão do fundo de pilha.

Exemplo 75 A Figura 3.7 mostra o diagrama de estados de um APD que reconhece {0m1n_{| m ≤ n}.}

Novamente, de forma similar ao que se fez no exemplo da Figura 3.5, o marcador Fé usado para detectar quando o fundo de pilha é atingido, que é quando, ao ler o próximo 1, o número de 1s se torna igual ao de 0s.

2

O APD apresentado nesse exemplo foi desenvolvido por Jonatan Schr¨oeder, na ´epoca (segundo semestre de 2000), aluno da UFPR.

(10)

0, λ/F 1, λ/λ 0, F/XF 0, X/XX 1, X/λ 1, F/λ 1, X/λ 1, F/λ 1, λ/λ

Figura 3.7 Mais um APD com marca¸c˜ao de fundo de pilha.

0s 1s f 0, λ/X 1, X/λ #, λ/λ 1, X/λ #, λ/λ λ, X/λ

Figura 3.8 APD com s´ımbolo de final de palavra.

Existem linguagens que podem ser reconhecidas por autômatos de pilha não deter-min´ısticos, mas que não podem ser reconhecidas por APDs, como será visto na próxima se¸cão. Dentre essas, existem algumas que passam a ser reconhecidas por APDs, caso haja um s´ımbolo espec´ıfico para finalizar a palavra de entrada. Segue um exemplo. Exemplo 76 A Figura 3.8 apresenta o diagrama de estados de um APD que reconhece a linguagem

{0m₁n_{# | m ≥ n}.}

Note que o s´ımbolo # s´o ´e utilizado para finalizar as palavras da linguagem. A lingua-gem similar, sem tal s´ımbolo,

{0m1n_{| m ≥ n},}

n˜ao pode ser reconhecida por APD, como pode ser verificado.3

Observe que, para cada 0, alguma coisa deve ser empilhada para, no futuro, garantir-se que o número de 1s não ultrapasse o de 0s. Mas, após lido o prefixo de 0s, caso possa ser lido mais algum 1 (conforme indicado pela pilha), pode-se também terminar a palavra. Nesse último caso, a pilha deve ser esvaziada sem leitura de mais s´ımbolos. O s´ımbolo para indicar final de palavra propicia, justamente, reconhecer deterministi-camente o momento de parar a leitura e esvaziar a pilha.

3

Na verdade, essa linguagem pode ser reconhecida por APD, mas com outro critério de reconheci-mento, como será visto na Se¸cão 3.3.

(11)

A defini¸cão de reconhecimento dada na Defini¸cão 36, página 139, não faz referência `

a parada da m´aquina. Assim, por exemplo, a linguagem reconhecida pelo APD cujo dia-grama de estados está ilustrado na Figura 3.3, página 137, é {λ}, não sendo importante se o APD para ou não para essa entrada.

Ao contrário dos autômatos finitos, os autômatos de pilha têm o seu poder aumen-tado quando se introduz não determinismo, como será visto na próxima se¸cão. Depois, na Se¸cão 3.4, serão estudadas as gramáticas livres do contexto, que geram exatamente as linguagens reconhec´ıveis por autômatos de pilha. Isso é importante, já que, na maio-ria das situa¸cões que ocorrem na prática, é mais fácil e conveniente obter uma gramática para a linguagem e, a partir da gramática, obter o autômato de pilha (determin´ıstico ou não).

Exerc´ıcios

1. Mostre que duas transi¸cões são compat´ıveis (veja a Defini¸cão 33, página 138) se, e somente se, elas podem ocorrer simultaneamente para alguma configura¸cão instantânea.

2. Construa APDs para as seguintes linguagens: a) {0n₁2n_{| n ≥ 0};} b) {03n₁2n_{| n ≥ 0};} c) {w0wR_{| w ∈ {1, 2}}∗_}; d) {an_bk_cn_{| n, k ≥ 0};} e) {an_bi_cj_{| n = i + j};} f ) {0m₁n_{| m < n};} g) {0n₁n₀₁₂_{| n ∈ N};} h) {0m₁n_{# | m 6= n};} i) {w# | w ∈ {0, 1}∗ _{e n} 0(w) > n1(w)}.

3. Explique por que n˜ao h´a APD para as seguintes linguagens: a) {wwR_{| w ∈ {1, 2}}∗_};

b) {0m₁n_{| m > n};}

c) {0m₁n_{| m 6= n};}

d) {w ∈ {0, 1}∗_{| n}

0(w) > n1(w)}.

4. Construa um APD que reconhe¸ca toda palavra com parênteses balanceados. Exemplos de palavras da linguagem: λ, (), (())(). Exemplos de palavras que não pertencem à linguagem: (, )(, ()).

Generalize para o caso em que existem n tipos de parênteses. Nesse caso, considere que cada ocorrência de abre parênteses, ai, deve ser seguida à direita por uma

(12)

uma palavra com parˆenteses balanceados. Se i = 2, a1 = (, b1 = ), a2 = [,

b2 = ], seriam exemplos de palavras da linguagem: λ, (), [()](), [[()]()]([]).

Exemplos de palavras que não pertencem à linguagem: (, ][, ()], (], ([)]. 5. Construa um APD que reconhe¸ca as expressões aritméticas na forma prefixada,

EAPre, definidas recursivamente como segue: a) a ´e uma EAPre;

b) se x e y são EAPre, então +xy e −xy são EAPre.

Dica: Sempre que ler + ou −, empilhe dois Xs, para “lembrar” de ler duas subexpress˜oes `a frente.

6. Construa um APD que reconhe¸ca as express˜oes aritm´eticas na forma posfixada, EAPos, definidas recursivamente como segue:

(a) a ´e uma EAPos;

(b) se x e y são EAPos, então xy+ e xy− são EAPos.

Dica: Use os seguintes fatos, fáceis de mostrar por indu¸cão: o número de as é um a mais que o de operadores, e qualquer palavra que tenha mais as que operadores é prefixo de EAPos.

3.3 Autˆ

omatos de Pilha N˜

ao Determin´ısticos

A diferen¸ca entre um autômato de pilha determin´ıstico e um não determin´ıstico é que esse último pode conter transi¸cões compat´ıveis, como pode ser visto na defini¸cão a seguir.

Defini¸c˜ao 37 Um autômato de pilha não determin´ıstico (APN ) é uma sêxtupla (E, Σ, Γ, δ, I, F ), em que

• E, Σ, Γ e F s˜ao como em APDs;

• δ, a fun¸cão de transi¸cão, é uma fun¸cão parcial de E × Σλ× Γλ para D, sendo D constitu´ıdo dos subconjuntos finitos de E × Γ∗;

• I, um subconjunto de E, ´e o conjunto de estados iniciais.

A rela¸cão ⊢ da Defini¸cão 35, página 139, será utilizada para definir o reconheci-∗ mento para APNs, de forma similar ao reconhecimento para APDs apresentado na Defini¸cão 36.

Defini¸c˜ao 38 Seja um APN M = (E, Σ, Γ, δ, I, F ). A linguagem reconhecida por M ´e

(13)

= 6= 1, λ/U 0, λ/Z λ, λ/λ 0, U/λ 0, Z/ZZ 1, U/UU 1, Z/λ Figura 3.9 APN para n´umero igual de 0s e 1s.

Uma palavra w tal que [i, w, λ] ⊢ [e, λ, λ], sendo i ∈ I e e ∈ F , ´e dita ser reconhecida∗ (aceita) por M .

Segue um exemplo que mostra a evolu¸c˜ao de um APD para um APN equivalente “mais conciso”.

Exemplo 77 No Exemplo 74, p´agina 141, foi visto um APD para {w ∈ {0, 1}∗| n0(w) =

n1(w). Nele ´e usado o s´ımbolo F para marcar o fundo da pilha, de forma que, quando

os números de 0s e de 1s se tornam idênticos (mesmo que a palavra não tenha sido toda processada ainda), seja ativada a transi¸cão para o estado final =. Ora, um autômato

n˜ao determin´ıstico pode “adivinhar” quando a pilha se torna vazia e fazer a transi¸c˜ao citada. Assim, um APN equivalente ao APD do Exemplo 74 seria:

N = ({=, 6=}, {0, 1}, {Z, U}, δ, {=}, {=}), em que δ ´e dada por:

1. δ(=, 0, λ) = {[6=, Z]}; 2. δ(=, 1, λ) = {[6=, U]}; 3. δ(6=, 0, Z) = {[6=, ZZ]}; 4. δ(6=, 0, U) = {[6=, λ]}; 5. δ(6=, 1, U) = {[6=, UU]}; 6. δ(6=, 1, Z) = {[6=, λ]}; 7. δ(6=, λ, λ) = {[=, λ]}.

O diagrama de estados de N pode ser visto na Figura 3.9. Note que, a única diferen¸ca, com rela¸cão ao APD do Exemplo 74, é que, na figura, o s´ımbolo F foi substitu´ıdo por λ. Observe que a transi¸cão 7 é compat´ıvel com as transi¸cões 3 a 6, mas de uma forma restrita: partindo-se do estado 6=, quando a pilha está vazia, apenas a transi¸cão 7 é aplicável; somente quando a pilha não está vazia, uma das transi¸cões 3 a 6 é aplicável, além da transi¸c˜ao 7. Assim, se for dada prioridade sempre para as transi¸c˜oes 3 a 6, o comportamento do APN é análogo ao do APD do Exemplo 74. Isso evidencia que esse APN reconhece toda palavra que o referido APD reconhece. Contudo, tal APN

(14)

= 6= 1, λ/U 0, λ/Z λ, λ/λ 0_{, U/λ} 1, Z/λ (a) O segundo 0, λ/Z 1_{, λ/U} 0, U/λ 1, Z/λ (b) O terceiro

Figura 3.10 Mais dois APNs para n´umero igual de 0s e 1s.

1 2 λ, λ/λ 0, λ/λ 1, λ/λ 0, λ/0 1, λ/1 0, 0/λ 1, 1/λ

Figura 3.11 APN para pal´ındromos sobre {0, 1}∗.

continua não podendo reconhecer palavras com números diferentes de 0s e 1s, como pode ser notado verificando-se o padrão de empilhamentos e desempilhamentos.

Na realidade, o APN N é menos conciso do que poderia ser. As transi¸cões 3 e 5 são desnecessárias. O mesmo efeito da transi¸cão 3 pode ser conseguido aplicando-se, em sequência, as transi¸cões 7 (compat´ıvel com a 3) e 1, e o mesmo efeito da transi¸cão 5 pode ser obtido aplicando-se, em sequência, as transi¸cões 7 (compat´ıvel com a 5) e 2. Obtém-se, com isso, o APN cujo diagrama de estados está mostrado na Figura 3.10a. Analisando-se esse último diagrama de estados, levando-se em conta que o reconheci-mento se dá quando a pilha fica vazia, chega-se ao APN equivalente cujo diagrama de estados está ilustrado na Figura 3.10b.

A seguir, ´e apresentado um APN para uma linguagem que n˜ao pode ser reconhecida por APDs.

Exemplo 78 Na Figura 3.11 est´a representado o diagrama de estados para um APN que reconhece a linguagem {w ∈ {0, 1}∗| w = wR_}.

Caso uma palavra w seja pal´ındromo, existirá uma computa¸cão para w em que w é consumida e a pilha fica vazia; para tal computa¸cão, uma das três transi¸cões de 1 para 2 é percorrida:

• se |w| for par, ser´a percorrida a transi¸c˜ao de 1 para 2 sob λ;

• se |w| for ´ımpar e o s´ımbolo do meio for 0, ser´a percorrida a transi¸c˜ao de 1 para 2 sob 0;

• se |w| for ´ımpar e o s´ımbolo do meio for 1, ser´a percorrida a transi¸c˜ao de 1 para 2 sob 1.

(15)

Ao processar uma palavra da esquerda para a direita, quando atinge o meio da palavra, não há como o autômato reconhecer tal fato, para, a partir da´ı, comparar a segunda metade com a primeira. Assim sendo, não há como construir um APD para a linguagem dos pal´ındromos.

Pela Defini¸c˜ao 38, a linguagem reconhecida por um APN M = (E, Σ, Γ, δ, I, F ) ´e

L(M ) = {w ∈ Σ∗| [i, w, λ]⊢ [e, λ, λ] para algum i ∈ I e e ∈ F }.∗

Uma defini¸cão alternativa, que levaria a uma concep¸cão diferente de APNs, é aquela em que o reconhecimento de uma palavra se dá ao ser atingido um estado final, após ser consumida a palavra de entrada, esteja a pilha vazia ou não. Usando o ´ındice F em LF(M ) para significar reconhecimento por estado final, segue tal defini¸cão alternativa,

mais formalmente.

Defini¸c˜ao 39 Seja um APN M = (E, Σ, Γ, δ, I, F ). A linguagem reconhecida por M por estado final ´e

LF(M ) = {w ∈ Σ∗| [i, w, λ] ∗

⊢ [e, λ, y] para algum i ∈ I, e ∈ F e y ∈ Γ∗}.

Uma palavra w tal que [i, w, λ] ⊢ [e, λ, y], sendo i ∈ I, e ∈ F e y ∈ Γ∗ ∗_{, ´}_{e dita ser}

reconhecida (aceita) por M por estado final.

O reconhecimento, segundo a Defini¸c˜ao 38, ser´a denominado, a seguir,

reconheci-mento por pilha vazia e estado final.

Pode-se mostrar que uma linguagem pode ser reconhecida por pilha vazia e es-tado final se, e somente se, pode ser reconhecida por eses-tado final, como ser´a visto no Teorema 18 no final desta se¸c˜ao.

O exemplo a seguir apresenta dois autˆomatos de pilha que reconhecem a mesma linguagem, um deles utilizando reconhecimento por pilha vazia e estado final, e o outro usando reconhecimento por estado final.

Exemplo 79 Seja o problema de determinar um APN que reconhe¸ca a linguagem L = {0m₁n_{| m ≥ n}.}

A Figura 3.12a mostra o diagrama de estados de um APN M tal que L(M ) = L, sendo que M reconhece por pilha vazia e estado final, enquanto a Figura 3.12b ilustra o diagrama de estados de um APN M′ tal que LF(M′) = L, sendo que M′ reconhece

por estado final. Veja que, por coincidência, o diagrama de estados da Figura 3.12b é idêntico ao da Figura 3.4, página 139, que reconhece a linguagem {an_bn_{| n ≥ 0}}

por pilha vazia e estado final (substituindo-se 0 por a e 1 por b); assim, L(M′) = {0n₁n_{| n ≥ 0}. Observe tamb´em que L}

F(M ) = L: coincidentemente, o APN cujo

diagrama de estados pode ser observado na Figura 3.12a reconhece a mesma linguagem para os dois m´etodos de reconhecimento.

(16)

0 ₁ 1 , X/λ 0, λ/λ

0_{, λ/X} 1_{, X/λ}

(a) Aceita¸c˜ao por pilha vazia e estado final

0 ₁ 1

, X/λ

0_{, λ/X} 1_{, X/λ}

(b) Aceita¸c˜ao por estado final

Figura 3.12 APNs para {0m₁n_{| m ≥ n}.}

Outra defini¸cão alternativa é aquela em que o reconhecimento de uma palavra se dá quando a pilha fica vazia, após ser consumida a palavra de entrada. Nesse caso, não há o conceito de estado final. Usando o ´ındice V em LV(M ) para significar reconhecimento por pilha vazia, segue tal defini¸cão alternativa, observando a ausência do conjunto de estados finais.

Defini¸c˜ao 40 Seja um APN M = (E, Σ, Γ, δ, I). A linguagem reconhecida por M por pilha vazia ´e

LV(M ) = {w ∈ Σ∗| [i, w, λ] ∗

⊢ [e, λ, λ] para algum i ∈ I e e ∈ E}.

Uma palavra w tal que [i, w, λ] ⊢ [e, λ, λ], sendo que i ∈ I, ´e dita ser reconhecida∗ (aceita) por M por pilha vazia.

Note que, por essa defini¸cão, λ é sempre reconhecida, já que a pilha come¸ca vazia. Será mostrado também, no Teorema 18, que uma linguagem com a palavra λ pode ser reconhecida por pilha vazia e estado final se, e somente se, pode ser reconhecida por pilha vazia.

O APN cujo diagrama de estados está ilustrado na Figura 3.12a reconhece a lin-guagem {0m₁n_{| m ≥ n} também por pilha vazia, visto que todos os seus estados são}

estados finais. Ali´as, se um APN M = (E, Σ, Γ, δ, I) reconhece LV(M ), ent˜ao o APN

M′ _{= (E, Σ, Γ, δ, I, E) (observe que todos os estados s˜ao finais em M}′_{) reconhece}

LV(M ) por pilha vazia e estado final.

Exemplo 80 Seja o APN cujo diagrama de estados est´a representado na Figura 3.13. Tal APN reconhece a linguagem {0m₁n_{| m ≤ n} por pilha vazia. Considerando todos}

os seus estados como estados finais, ele reconhece a mesma linguagem por pilha vazia e estado final.

O teorema a seguir mostra a equivalência dos três métodos de reconhecimento. A equivalência segue do uso de três métodos: (a) um que mostra como obter um AP que reconhece por estado final equivalente a um que reconhe¸ca por pilha vazia e estado final, (b) outro que revela como chegar a um AP que reconhece por pilha vazia equivalente a um que reconhe¸ca por estado final, e (c) finalmente, um método que mostra como

(17)

0 ₁ 1 , X/λ 0, λ/X

λ, λ/X 1_{, X/λ}

Figura 3.13 APN para {0m₁n_{| m ≤ n}.}

M · · · i′ i1 .. . im f1 fn .. . g λ, λ/F λ, λ/F λ, F/λ λ, F/λ I F

Figura 3.14 Obten¸c˜ao de AP pelo M´etodo 12.

obter um AP que reconhece por estado final e pilha vazia equivalente a um outro que reconhe¸ca por pilha vazia. Antes do teorema, seguem os trˆes m´etodos.

M´etodo 12 De reconhecimento padr˜ao ao por estado final

Seja um APN M = (E, Σ, Γ, δ, I, F ). ´E poss´ıvel obter, a partir de M , um APN M′ _de

modo que LF(M′) = L(M ). A id´eia central ´e utilizar um s´ımbolo de pilha novo para

marcar o fundo da pilha, de forma que M′ possa reconhecer quando M estaria com a pilha vazia.

Serão usados, além dos estados em E, mais dois estados i′, g 6∈ E, e, além dos s´ımbolos de Γ, mais um s´ımbolo de pilha F 6∈ Γ. Basta fazer M′ = (E ∪ {i′, g}, Σ, Γ ∪ {F}, δ′, {i′}, {g}) (veja a Figura 3.14 para uma representa¸cão esquemática de M′), tal que δ′ _{inclui δ mais as seguintes transi¸c˜}_oes:

• para cada ik ∈ I, δ′(i′, λ, λ) = {[ik, F]};

• para cada fj ∈ F , δ′(fj, λ, F) = {[g, λ]}.

M´etodo 13 De reconhecimento por estado final ao por pilha vazia

Seja um APN M = (E, Σ, Γ, δ, I, F ). Um APN M′ tal que LV(M′) = LF(M ) ∪ {λ}

seria M′ _{= (E ∪{i}′_{, g, h}, Σ, Γ∪{F}, δ}′_{, {i}′_{}) (veja a Figura 3.15 para uma representa¸c˜ao}

esquem´atica de M′_{), tal que i}′_{, g, h 6∈ E, F 6∈ Γ e δ}′ _{inclui δ mais as seguintes transi¸c˜oes:}

• para cada ik ∈ I, δ′(i′, λ, λ) = {[ik, F]};

(18)

M · · · i′ i1 .. . im f1 fn .. . g h λ, λ/F λ, λ/F λ, λ/λ λ, λ/λ λ, X/λ ∀X ∈ Γ λ, F/λ I F

Figura 3.15 Obten¸c˜ao de APN pelo M´etodo 13.

• para cada X ∈ Γ, δ(g, λ, X) = {[g, λ]}; • δ(g, λ, F) = {[h, λ]}.

O s´ımbolo de pilha F ´e utilizado aqui para evitar que a pilha fique vazia, exceto quando a palavra deva ser reconhecida. A pilha fica vazia se, e somente se, for atingido o estado h.

Teorema 18 Seja L uma linguagem. As seguintes afirmativas s˜ao equivalentes:

a) L pode ser reconhecida por pilha vazia e estado final. b) L pode ser reconhecida por estado final.

c) L ∪ {λ} pode ser reconhecida por pilha vazia. Prova

(a) → (b)

Seja um APN qualquer M . O AP M′_{, obtido de acordo com o M´etodo 12, ´e tal}

que LF(M′) = L(M ), de onde se segue que se L pode ser reconhecida por pilha vazia

e estado final, ent˜ao L pode ser reconhecida por estado final. (b) → (c)

De um APN M que reconhe¸ca por estado final, pode-se construir via o M´etodo 13 um APN M′ _{tal que L}

V(M′) = LF(M ) ∪ {λ}. Logo, se L pode ser reconhecida por

estado final, ent˜ao L ∪ {λ} pode ser reconhecida por pilha vazia. (c) → (a)

Como j´a foi ressaltado, um APN que reconhece por pilha vazia ´e um APN que reconhece por pilha vazia e estado final, bastando considerar todos os seus estados como estados finais. Ou seja, se M = (E, Σ, Γ, δ, I), um APN M′ tal L(M′) = LV(M )

seria, ent˜ao, M′ = (E, Σ, Γ, δ, I, E). Observe que, como LV(M ) cont´em λ, L(M′)

também contém. Embora não seja mostrado aqui como, é poss´ıvel também obter M′

(19)

Daqui para a frente, será usada também a expressão AP para designar autômato de pilha (não determin´ıstico).

Exerc´ıcios

1. Seja o AP M = ({i, f }, {a, b}, {B, C}, δ, {i}, {f }), em que δ ´e dada por: δ(i, a, λ) = [i, B]

δ(i, λ, λ) = [f, λ] δ(f, b, B) = [f, C] δ(f, c, C) = [f, λ]

a) Exiba as computa¸c˜oes para as palavras aa, bb, aabcc e aabcbc. Quais destas palavras s˜ao reconhecidas por M ?

b) Que linguagem ´e reconhecida por M ?

2. Construa um AP com um alfabeto de pilha contendo apenas dois s´ımbolos, que reconhe¸ca {w ∈ {a, b, c, d}∗_{| w = w}R_}.

3. Para as seguintes linguagens, construa APD, se poss´ıvel. Se n˜ao for poss´ıvel, construa APN. a) {(01)n₁₍₁₀₎n_{| n ∈ N};} b) {(01)n₀₍₁₀₎n_{| n ∈ N};} c) {an_b2n_c2k_{| n, k ∈ N};} d) {an_b2n_a2k_{| n, k ∈ N};} e) {an_b2n_a2k_{| n ≥ 1, k ∈ N};} f ) {an_(abc)n_{| n ∈ N}.}

4. Construa APNs que reconhe¸cam as linguagens seguintes por pilha vazia e estado final:

a) {0n₁n_{| n ≥ 0} ∪ {0}n₁2n_{| n ≥ 0};}

b) {0n₁k_{| n ≤ k ≤ 2n};}

c) {0n₁n₀k_{| n, k ≥ 0};}

d) {0m₁n_{| m > n}.}

5. Construa APDs que reconhe¸cam {an_bn_{| n ≥ 0}:}

a) por estado final; b) por pilha vazia.

6. Construa APDs que reconhe¸cam por estado final as linguagens: a) {am_bn_{| m 6= n};}

(20)

b) O complemento de {ambn| m ≥ n}; c) O complemento de {an_bn_{| n ≥ 0}.}

7. Construa APNs que reconhe¸cam as linguagens do Exerc´ıcio 4:

a) por estado final; b) por pilha vazia.

8. Mostre que um APN em que é empilhado no máximo um s´ımbolo por transi¸cão tem o mesmo poder que um APN normal.

9. Mostre como obter um APN, cuja pilha receba no m´aximo um s´ımbolo, que seja equivalente a um AFNλ dado.

10. Obtenha um APD que reconhe¸ca por estado final a linguagem L = {w ∈ {0, 1}∗| n0(w) 6=

n1(w)}. A partir dele, obtenha um APD que reconhe¸ca L{#} por pilha vazia e estado final.

11. Mostre que toda linguagem regular pode ser reconhecida por algum APD sob qualquer um dos três critérios de reconhecimento. Para isso, mostre como obter, a partir de qualquer AFD, os APDs equivalentes para cada um dos critérios de reconhecimento.

12. Mostre como obter um AP M′_{a partir de um AP M , tal que L(M}′_{) = L(M )−{λ}.}

3.4 Gram´

aticas Livres do Contexto

O seguinte trecho é uma parte de uma gramática livre do contexto, na nota¸cão BNF,4 que define uma parte da sintaxe de uma linguagem de programa¸cão similar àquela que é utilizada para a apresenta¸cão dos algoritmos deste texto:

4

(21)

hprogramai ::= hdeclara¸c˜oesi ; hlista-de-cmdsi . ..

.

hlista-de-cmdsi ::= hcomandoi ; hlista-de-cmdsi | λ

hcomandoi ::= hcmd-enquantoi | hcmd-sei |

hcmd-atribui¸c˜aoi | · · ·

hcmd-enquantoi ::= enquantohexp-lógicai fa¸ca hlista-de-cmdsi fimenquanto hcmd-sei ::= sehexp-lógicai então

hlista-de-cmdsi hsenaosesi hsenaoi fimse hsenaosesi ::= senãosehexp-lógicai então

hlista-de-cmdsi hsenaosesi | λ

hsenaoi ::= sen˜aohlista-de-cmdsi | λ

hcmd-atribui¸cãoi ::= hvariáveli ← hexpressãoi

Nessa nota¸cão, o lado esquerdo de uma regra é separado do lado direito pela sequência ”::=“. As variáveis figuram entre “h” e “i”. Os outros s´ımbolos são termi-nais; por ordem de ocorrência: “;”, enquanto, fa¸ca, fimenquanto, se, então,fimse, senãose, “←”.

Cada regra de uma gramática livre do contexto tem no lado esquerdo apenas uma variável. No lado direito pode ser colocada uma palavra qualquer constitu´ıda por variáveis e/ou terminais.

Existem programas que aceitam uma gramática livre do contexto no formato BNF e produzem um analisador sintático para a mesma. Apesar da nota¸cão BNF ser co-mumente mais adequada para a descri¸cão de linguagens que ocorrem na prática, como as linguagens de programa¸cão, a nota¸cão formal a ser introduzida na próxima se¸cão é mais adequada para o estudo de gramáticas livres do contexto em geral. Após isso, na Se¸cão 3.4.2, serão apresentados os conceitos de árvore de deriva¸cão e de ambiguidade de gramáticas, muito importantes por terem grande repercussão em aplica¸cões que en-volvem o uso de gramáticas como base no processamento de linguagens. Depois, na Se¸cão 3.4.3 será abordado o problema de manipular as regras de uma gramática com o objetivo de que a gramática resultante tenha certas caracter´ısticas. Para finalizar, na Se¸cão 3.4.4 será mostrada a equivalência dos formalismos de gramáticas livres do contexto e autômatos de pilha.

3.4.1 Defini¸c˜ao e exemplos

Segue a defini¸c˜ao de gram´atica livre do contexto.

Defini¸c˜ao 41 Uma gramática livre do contexto (GLC ) é uma gramática (V, Σ, R, P ),

(22)

Para uma GLC, em cada passo de uma deriva¸cão deve-se escolher, na forma sen-tencial, a variável A a ser substitu´ıda pelo lado direito de uma regra com A do lado esquerdo. Ao se fazer tal substitui¸c˜ao, diz-se que A é expandida.

Observe que uma gramática regular é uma gramática livre do contexto especial, em que toda deriva¸cão produz uma forma sentencial contendo uma única variável, que é sempre o s´ımbolo mais à direita. Todavia, existem linguagens que não são regulares e que, portanto, não podem ser geradas por GRs, mas que podem ser geradas por GLCs. A seguir são mostrados alguns exemplos.

Exemplo 81 A linguagem não regular {0n₁n_{| n ∈ N} é gerada pela gramática livre}

do contexto G = ({P }, {0, 1}, R, P ), em que R consta das duas regras: P → 0P 1 | λ

As únicas palavras geradas por tal gramática são aquelas que podem ser geradas por n aplica¸cões da regra P → 0P 1, n ≥ 0, seguidas de uma aplica¸cão da regra P → λ. Esquematicamente: P ⇒ 0n n_{P 1}n_{⇒ 0}n₁n_{. Logo, L(G) = {0}n₁n_{| n ∈ N}.}

Exemplo 82 A gram´atica G, a seguir, gera os pal´ındromos sobre {0, 1}, ou seja, L(G) = {w ∈ {0, 1}∗_{| w = w}R_{}. G = ({P }, {0, 1}, R, P ), em que R consta das cinco}

regras:

P → 0P 0 | 1P 1 | 0 | 1 | λ

Aplicando-se as duas primeiras regras, gera-se qualquer forma sentencial do tipo wP wR_,

para w ∈ {0, 1}∗_{. Por fim, para gerar uma palavra, aplica-se uma das trˆes ´}_{ultimas regras}

de G; a ´ultima, quando a palavra apresenta tamanho par, e uma das outras, quando ela tem tamanho ´ımpar.

Exemplo 83 A linguagem L = {w ∈ {0, 1}∗| n0(w) = n1(w)} ´e gerada pela gram´atica

G = ({P }, {0, 1}, R, P ), em que R consta das trˆes regras: P → 0P 1P | 1P 0P | λ

Como o lado direito de cada uma das três regras possui número igual de 0s e 1s, G só gera palavras de L. O fato de que G produz todas as palavras de L vem do fato de que para toda palavra w de L, tem-se um dos três casos:

a) w = λ; nesse caso, basta aplicar a regra P → λ;

b) w = 0y para algum y ∈ {0, 1}∗ e y tem um 1 a mais que 0s; logo, y é da forma x1z, onde x tem número igual de 0s e 1s e z também tem número igual de 0s e 1s; assim, basta iniciar a deriva¸cão de w com a primeira regra;

c) w = 1y para algum y ∈ {0, 1}∗ _{e y tem um 0 a mais que 1s; por motivo an´}_alogo

(23)

Nos casos (b) e (c), têm-se novamente (recursivamente) os três casos aplicados para as subpalavras x e z. Com isso, obtém-se um método para construir uma deriva¸cão de qualquer palavra de L. A seguinte deriva¸cão de 01010110 ilustra a aplica¸cão do método subjacente, em que a variável expandida é sempre a mais à esquerda:

P ⇒ 0P 1P P → 0P 1P (x = 10; z = 0110) ⇒ 01P 0P 1P P → 1P 0P (x = λ; z = λ) ⇒ 010P 1P P → λ ⇒ 0101P P → λ ⇒ 01010P 1P P → 0P 1P (x = λ; z = 10) ⇒ 010101P P → λ ⇒ 0101011P 0P P → 1P 0P (x = λ; z = λ) ⇒ 01010110P P → λ ⇒ 01010110 P → λ.

O exemplo a seguir ilustra uma gramática que contém a essência da especifica¸cão da sintaxe das expressões aritméticas das linguagens de programa¸cão usuais.

Exemplo 84 Seja a GLC ({E, T, F }, {a, +, ∗, (, )}, R, E), para express˜oes aritm´eticas, em que R consta das regras:

E → E+T | T T → T ∗F | F F → (E) | a

As duas primeiras regras dizem que uma expressão aritmética, E, é constitu´ıda por um ou mais termos, T s, somados. As duas seguintes dizem que um termo é composto de um ou mais fatores, F s, multiplicados. E as duas últimas dizem que um fator é terminal aou, recursivamente, uma expressão aritmética entre parênteses. Essa gramática será utilizada em vários exemplos daqui para a frente.

Adiante, na Se¸cão 3.4.4, será mostrado que as linguagens geradas por gramáticas livres do contexto são exatamente as reconhecidas por autômatos de pilha. A defini¸cão a seguir dá um nome à classe formada por tais linguagens.

Defini¸c˜ao 42 Uma linguagem ´e dita ser uma linguagem livre do contexto se existe

uma gram´atica livre do contexto que a gera.

Em geral, existem várias deriva¸cões de uma mesma palavra da linguagem gerada por uma gramática. Note que no Exemplo 83, página 154, inicia-se uma deriva¸cão de 01010110por

(24)

E, após isso, a vari´avel expandida é sempre a mais à esquerda. Pode-se ver que a mesma palavra pode ser derivada expandindo-se sempre a variável mais à direita em vez da variável mais à esquerda. E mais, a mesma palavra pode ser derivada expandindo-se variáveis em ordem aleatória. Isto mostra que existem várias deriva¸cões distintas para a palavra 01010110. O que tais deriva¸cões têm em comum, além de gerar a mesma palavra? Esse assunto será abordado na próxima se¸cão.

3.4.2 Deriva¸c˜oes e ambiguidade

Um conceito bastante útil, base para muitas implementa¸cões de compiladores de lin-guagens de programa¸c˜ao, é o de árvore de deriva¸cão(AD). Uma AD captura a essência de uma deriva¸cão, a história da obten¸cão de uma forma sentencial que não depende da ordem de aplica¸cão das regras da GLC. A cada deriva¸cão vai corresponder uma única AD, mas a uma AD vai corresponder, quase sempre, uma quantidade muito grande de deriva¸cões. Assim, pode-se dizer que as ADs particionam o conjunto de todas as deriva¸cões de uma GLC em “deriva¸cões equivalentes”: duas deriva¸cões seriam equiva-lentes se, e somente se, correspondessem à mesma AD.

Defini¸c˜ao 43 Seja uma GLC G = (V, Σ, R, P ). Uma ´arvore de deriva¸c˜ao (AD ) de uma

forma sentencial de G ´e uma ´arvore ordenada constru´ıda recursivamente como segue:

a) uma árvore sem arestas cujo único vértice tem rótulo P é uma AD; b) se X ∈ V é rótulo de uma folha f de uma AD A, então:

i. se X → λ ∈ R, então a árvore obtida acrescentando-se a A mais um vértice v com rótulo λ e uma aresta {f, v} é uma AD;

ii. se X → x1x2. . . xn∈ R, onde x1, x2, . . . , xn ∈ V ∪ Σ, então a árvore obtida acrescentando-se aA mais n vértices v1,v2, . . . ,vn com rótulosx1,x2, . . . ,

xn, nessa ordem, e n arestas {f, v1}, {f, v2}, . . . , {f, vn}, é uma AD. Se a sequência dos rótulos da fronteira da AD é a forma sentencialw, diz-se que a AD

´

e uma ´arvore de deriva¸c˜ao de w.

Exemplo 85 Seja a gram´atica do Exemplo 84 cujas regras s˜ao reproduzidas a seguir: E → E+T | T

T → T ∗F | F F → (E) | a

Na Figura 3.16, mostra-se uma AD de a*(a+a). Para a constru¸cão de tal árvore, tomou-se como ponto de partida a deriva¸cão:

E ⇒ T (regra E → T ) produzindo-se uma AD de T :

(25)

E

T

Em seguida, a deriva¸c˜ao evoluiu para: E ⇒ T (regra E → T )

⇒ T ∗F (regra T → T ∗F )

e a ´arvore correspondente (que ´e uma AD de T ∗F ) para: E

T

T ∗ F

Neste instante, tem-se duas op¸cões para continuar a deriva¸cão: E ⇒ T (regra E → T ) ⇒ T ∗F (regra T → T ∗F ) ⇒ F ∗F (regra T → F ) ou então E ⇒ T (regra E → T ) ⇒ T ∗F (regra T → T ∗F ) ⇒ T ∗(E) (regra F → (E)). `

A esquerda, mostra-se a AD correspondente à primeira deriva¸cão, e à direita, a AD correspondente à segunda deriva¸cão:

E T T ∗ F F E T T ∗ F ( E )

Prosseguindo-se por qualquer uma dessas alternativas, chega-se, após uma deriva¸cão de 11 passos, à AD mostrada na Figura 3.16.

(26)

E T T ∗ F F ( E ) a _E + _T T F F a a

Figura 3.16 Uma ´arvore de deriva¸c˜ao de a*(a+a).

Observe que o número de passos de qualquer deriva¸cão que leva a uma AD X é o número de vértices internos de X, já que a cada vértice interno corresponde a aplica¸cão de uma regra (e vice-versa).

A estrutura da árvore de deriva¸cão, muitas vezes, é utilizada para associar signifi-cado para as senten¸cas de uma linguagem, de forma similar ao que se faz em análise sintática de senten¸cas na l´ıngua portuguesa (em que se identifica sujeito, verbo, predi-cado etc.). Em português, se a mesma senten¸ca pode ser desmembrada de mais de uma forma durante a análise, então ela possui vários significados, e diz-se que ela é amb´ıgua. De forma análoga, se existir mais de uma AD de uma mesma palavra, provavelmente ela terá mais de um significado. Isso inspira a defini¸cão a seguir.

Defini¸c˜ao 44 Uma GLC ´e denominada amb´ıgua quando existe mais de uma AD para

alguma senten¸ca que ela gera.

Observe, no entanto, que a gramática é dita amb´ıgua, não a linguagem que ela gera nem as senten¸cas para as quais haja mais de uma AD. Afinal, podem haver outras GLCs equivalentes a uma GLC amb´ıgua que não sejam amb´ıguas.

Exemplos de gramáticas não amb´ıguas são aquelas dos Exemplos 81, 82 e 84 da Se¸cão 3.4.1. Já a gramática do Exemplo 83 é amb´ıgua, como mostra o exemplo a seguir.

(27)

P 0 _P 1 _P 1 _P 0 _P _λ λ λ P 0 _P 1 _P λ 0 _P 1 _P λ λ

Figura 3.17 Duas ´arvores de deriva¸c˜ao de 0101.

P → 0P 1P | 1P 0P | λ

As duas ADs de 0101 apresentadas na Figura 3.17 demonstram que tal GLC ´e amb´ıgua. `

A ´arvore da esquerda corresponde, entre outras, a deriva¸c˜ao: P ⇒ 0P 1P (regra P → 0P 1P ) ⇒ 01P 0P 1P (regra P → 1P 0P ) ⇒ 010P 1P (regra P → λ) ⇒ 0101P (regra P → λ) ⇒ 0101 (regra P → λ) `

A ´arvore da direita corresponde a seguinte deriva¸c˜ao, entre outras: P ⇒ 0P 1P (regra P → 0P 1P )

⇒ 01P (regra P → λ) ⇒ 010P 1P (regra P → 0P 1P ) ⇒ 0101P (regra P → λ) ⇒ 0101 (regra P → λ)

O próximo exemplo apresenta uma gramática amb´ıgua que gera a linguagem de expressões aritméticas, gerada também pela gramática não amb´ıgua do Exemplo 84.

Exemplo 87 Seja a gramática G = ({E}, {a, +, ∗, (, )}, R, E), para as expressões arit-méticas, em que R consta das regras:

E → E + E | E ∗ E | (E) | a

Essa gramática é amb´ıgua, já que existem duas ADs da palavra a+a*a, as quais estão mostradas na Figura 3.18. À árvore da esquerda corresponde, entre outras, a deriva¸cão:

(28)

E E + _E a _E * _E a a E E * _E E + _E a a a

Figura 3.18 Duas ´arvores de deriva¸c˜ao de a+a*a.

E ⇒ E + E (regra E → E + E) ⇒ a + E (regra E → a) ⇒ a+ E ∗ E (regra E → E ∗ E) ⇒ a + a ∗ E (regra E → a) ⇒ a + a ∗ a (regra E → a). `

A ´arvore da direita corresponde a seguinte deriva¸c˜ao, entre outras: E ⇒ E ∗ E (regra E → E ∗ E)

⇒ E + E ∗ E (regra E → E + E) ⇒ a + E ∗ E (regra E → a) ⇒ a + a ∗ E (regra E → a) ⇒ a + a ∗ a (regra E → a).

Como já foi dito anteriormente, em geral, o significado é associado a uma palavra de acordo com a AD obtida. Por exemplo, a AD do lado esquerdo da Figura 3.18 leva à interpreta¸cão de a+a*a como a soma de um elemento com o produto de dois elementos, isto é, a+(a∗a), enquanto a AD do lado direito da mesma figura leva à interpreta¸cão de a+a*acomo o produto da soma de dois elementos com um elemento, ou seja, (a + a) ∗ a.

Entre as deriva¸cões correspondentes a uma AD, existem duas de particular interesse: as deriva¸cões mais à esquerda e as deriva¸cões mais à direita.

Defini¸c˜ao 45 Uma deriva¸cão é dita mais à esquerda (DME ) se em cada passo é

ex-pandida a variável mais à esquerda. E é dita mais à direita (DMD ) se em cada passo

´

e expandida a variável mais à direita. Para enfatizar que uma deriva¸cão é mais à esquerda, pode-se usar “⇒e” em vez de “⇒” e, para uma deriva¸cão mais à direita, pode-se utilizar “⇒d”.

(29)

Existe uma única DME e uma única DMD correspondentes a uma AD: para obter a DME a partir de uma AD, basta ir gerando os passos de deriva¸cão à medida em que se percorre a AD visitando primeiro as subárvores à esquerda, antes de visitar as subárvores à direita; para obter a DMD, visita-se primeiro as subárvores à direita. Assim sendo, pode-se dizer que:

• uma GLC ´e amb´ıgua se, e somente se, existe mais de uma DME para alguma senten¸ca que ela gere;

• uma GLC ´e amb´ıgua se, e somente se, existe mais de uma DMD para alguma senten¸ca que ela gere.

Exemplo 88 No Exemplo 87 foram mostradas as duas DMEs que correspondem às ADs da Figura 3.18. As duas DMDs que correspondem às mesmas ADs são, para a primeira AD: E ⇒d E + E (regra E → E + E) ⇒d E + E ∗ E (regra E → E ∗ E) ⇒d E + E∗ a (regra E → a) ⇒d E + a ∗ a (regra E → a) ⇒d a+ a ∗ a (regra E → a)

e para a segunda AD:

E ⇒d E ∗ E (regra E → E ∗ E)

⇒d E ∗ a (regra E → a)

⇒d E + E ∗ a (regra E → E + E)

⇒d E + a ∗ a (regra E → a)

⇒d a+ a ∗ a (regra E → a).

Há linguagens livres do contexto (LLCs) para as quais existem apenas gramáticas amb´ıguas. Essas linguagens s˜ao denominadas linguagens inerentemente amb´ıguas. Um exemplo de linguagem inerentemente amb´ıgua é {am_bn_ck_{| m = n ou n = k}. Pode-se}

mostrar que qualquer GLC que gere tal linguagem ter´a mais de uma AD para palavras da forma an_bn_cn_.

A deteçcão e remo¸cão de ambiguidade em GLCs é muito importante, por exemplo, como um passo prévio ao uso de uma gramática para a gera¸cão de um compilador para uma linguagem de programa¸cão. Na próxima se¸cão serão vistas algumas técnicas de modifica¸cão de GLCs, que não alteram a linguagem gerada. No entanto, infelizmente, o problema de determinar se uma GLC arbitrária é amb´ıgua é indecid´ıvel, como será mostrado no Cap´ıtulo 5.

Existem dois tipos b´asicos de analisadores sint´aticos gerados5 a partir de GLCs: o bottom-up e o top-down. Um analisador bottom-up parte do programa, lendo-o da

5

Um analisador sintático é um programa cujo objetivo principal é determinar se um programa está sintaticamente correto.

(30)

esquerda para a direita, e aplica as regras de forma invertida, construindo a AD da fronteira para a raiz, ou seja, bottom-up; a deriva¸cão considerada durante o processo é uma DMD (obtida de tr´as para a frente). Por outro lado, um analisador top-down parte do s´ımbolo de partida da GLC e constrói a AD da raiz em dire¸cão à fronteira, ou seja, top-down; a deriva¸c˜ao considerada é uma DME. Os detalhes estariam fora do escopo deste texto, e podem ser encontrados em qualquer livro-texto sobre constru¸cão de compiladores. De qualquer forma, fica evidenciada a importância dos três conceitos do ponto de vista prático: AD, DME e DMD.

A mesma linguagem pode ser gerada por inúmeras gramáticas. Algumas gramáticas podem ser mais adequadas que outras, dependendo do contexto para o qual elas foram projetadas. Assim, é importante saber algumas técnicas de manipula¸cão de GLCs de forma a obter GLCs equivalentes, mas com a presen¸ca ou ausência de certa(s) carac-ter´ıstica(s) relevante(s) para determinada aplica¸cão. Em particular, existem algumas

formas normais que são apropriadas em diversas situa¸cões, como quando se pretende mostrar que certa propriedade vale para todas as linguagens livres do contexto. Na próxima se¸cão, serão apresentadas algumas técnicas de manipula¸cão de GLCs, assim como duas formas normais importantes.

3.4.3 Manipula¸c˜ao de gram´aticas e formas normais

A deteçcão de variáveis que nunca participam de deriva¸cões de palavras da linguagem gerada por uma GLC, as chamadas variáveis inúteis, é importante por vários motivos. Por exemplo, em gramáticas grandes, como as de linguagens de programa¸cão, pode acontecer de se esquecer de definir as regras relativas a uma variável; ou, então, uma variável, apesar de ter suas regras já definidas, pode não ter sido utilizada ainda na forma¸cão de novas regras. Ambos os tipos de variáveis inúteis podem ser detectados. Após a deteçcão das variáveis inúteis, pode-se acrescentar novas regras para prever a defini¸cão ou uso das variáveis. Ou então, caso uma variável seja efetivamente inútil, deve-se eliminar todas as regras que possuem alguma ocorrência da mesma.

Segue uma defini¸cão precisa de variável útil, assim como algoritmos para a deteçcão de variáveis inúteis e um método para eliminar todas as variáveis inúteis de uma GLC. Defini¸c˜ao 46 Seja uma GLC G = (V, Σ, R, P ). Uma variável X ∈ V é dita ser uma variável ´util se, e somente se, existem u, v ∈ (V ∪ Σ)∗ _e_{w ∈ Σ}∗ _{tais que:}

P ⇒ uXv∗ ⇒ w.∗

Observe que, pela Defini¸cão 46, para a variável X ser útil é necessário, não apenas que existam u e v tais que P ⇒ uXv, mas também que, para algum u e algum v, tais∗ que P ⇒ uXv, se tenha que uXv∗ ⇒ w para algum w ∈ Σ∗ ∗_.

Exemplo 89 Seja a gram´atica ({P, A, B, C}, {a, b, c}, R, P ), em que R cont´em as regras: P → AB | a

(31)

C → c

• C é inútil: não existem u e v tais que P ⇒ uCv;∗ • A é inútil: não existe w ∈ Σ∗ tal que A⇒ w;∗

• B é inútil: P ⇒ uBv apenas para u = A e v = λ, e não existe w ∈ Σ∗ ∗ tal que AB⇒ w (pois não existe w ∈ Σ∗ ∗ _{tal que A}_{⇒ w).}∗

Eliminando-se essas variáveis e todas as regras que as referenciam, além dos termi-nais b e c que não ocorrem em nenhuma regra retida,6 _{tem-se a gramática equivalente}

({P }, {a}, {P → a}, P ).

O método de elimina¸cão de variáveis inúteis consta de duas etapas. Na primeira, elimina-se as variáveis a partir das quais não é poss´ıvel gerar senten¸cas (como a variável A do exemplo anterior). Após tal elimina¸cão, na segunda etapa elimina-se as variáveis que não ocorram em formas sentenciais deriváveis a partir do s´ımbolo de partida (como a variável C do exemplo). A defini¸cão a seguir, dá o conjunto de variáveis a partir das quais é poss´ıvel gerar senten¸cas. Usa-se a nota¸c˜ao vars(w) para designar o conjunto das variáveis que ocorrem na palavra w.

Defini¸c˜ao 47 O conjunto SG= {X ∈ V | X ∗

⇒ w para algum w ∈ Σ∗_{}, para uma GLC}

G = (V, Σ, R, P ), pode ser assim definido recursivamente: • X ∈ SG, se existe X → w ∈ R tal que w ∈ Σ∗;

• se X → w ∈ R e vars(w) ⊆ SG, ent˜aoX ∈ SG.

A próxima defini¸cão mostra como obter o conjunto das variáveis que ocorrem em formas sentenciais deriváveis em uma GLC.

Defini¸c˜ao 48 O conjunto AG = {X ∈ V | P ∗

⇒ uXv para algum u, v ∈ (V ∪Σ)∗_{}, para} uma GLCG = (V, Σ, R, P ), pode ser assim definido recursivamente:

• P ∈ AG;

• se X → w ∈ R e X ∈ AG, ent˜ao vars(w) ⊆ AG.

Versões procedurais de ambas as defini¸cões, 47 e 48, estão mostradas na Figura 3.19.

M´etodo 14 Elimina¸cão de variáveis inúteis

Considere uma GLC G = (V, Σ, R, P ). A partir de G, obtém-se uma GLC equivalente sem variáveis inúteis assim:

6

Pode-se dizer que tais terminais são inúteis, visto que não são usados para formar palavras da linguagem gerada.

(32)

Entrada: uma GLC G = (V, Σ, R, P ). Sa´ıda: SG= {X ∈ V | X⇒ w para w ∈ Σ∗ ∗}. SG← ∅; repita N← {X ∈ V − SG| X → w ∈ R e vars(w) ⊆ SG}; SG← SG∪ N at´eN= ∅; retorne SG.

(a) Produzem senten¸cas

Entrada: uma GLC G = (V, Σ, R, P ). Sa´ıda: AG= {X ∈ V | P ⇒ w e X ∈ vars(w)}.∗ AG← {P }; repita N← {X ∈ V − AG| Y → w para Y ∈ AG e X ∈ vars(w)}; AG← AG∪ N at´eN= ∅; retorne AG.

(b) Alcan¸cáveis a partir de P Figura 3.19 Algoritmos para achar variáveis úteis.

1. Obtenha G′ = (SG∪ {P }, Σ, R′, P ), em que R′= {X → w ∈ R | vars(w) ⊆ SG}.

2. Obtenha G′′ = (AG′, Σ, R′′, P ), em que R′′ = {X →∈ R′| X ∈ A_G′}.

Note-se, em particular, que L(G) = ∅ se e somente se P 6∈ SG, e que, mesmo que seja

inútil, P é preservado nas GLCs G′ _{e G}′′_{constru´ıdas pelo Método 14. Alternativamente}

a Σ, pode-se considerar como alfabeto de G′′o conjunto daqueles terminais que ocorrem em regras de R′′, desde que se cuide para que Σ tenha no m´ınimo um s´ımbolo se R′′= ∅. A nota¸cão ⇒G, sendo G uma gramática, será usada a seguir para informar que a

deriva¸cão está sendo tomada com rela¸cão à gramática G.

Teorema 19 Seja uma GLC G tal que L(G) 6= ∅. Existe uma GLC, equivalente a G,

sem vari´aveis in´uteis.

Prova

Sejam G, G′ e G′′ como delineados no m´etodo descrito.

Inicialmente, veja que L(G′_{) = L(G), pois apenas as regras de G cujas vari´aveis X}

s˜ao tais que X ⇒ w, para algum w ∈ Σ∗ ∗_{, podem contribuir para a gera¸c˜ao de alguma}

palavra de L(G); e G′ contém exatamente essas regras. Analogamente, L(G′′) = L(G′). Resta então mostrar que G′′ não possui variáveis inúteis, ou seja, que todas as suas variáveis são úteis. Para isso, seja uma variável arbitrária X ∈ V′′_{. Em primeiro}

lugar, tem-se que P ⇒∗G′′ uXv, por constru¸c˜ao de R′′. E para qualquer uXv tal que

P ⇒∗G′′ uXv, tem-se que uXv

∗

⇒G′′ w e w ∈ Σ∗, pois todas as vari´aveis Y da forma

sentencial uXv são tais que Y ⇒ y e y ∈ Σ∗ ∗_{; isso porque as variáveis de R}′ _{têm essa}

propriedade por constru¸cão, e ela é preservada na constru¸cão de R′′. Esse último fato é mostrado a seguir. Ao ser eliminada uma variável Z de V′, se Y ⇒ uZv, então não∗ podem existir r e s tais que P ⇒ rY s; caso contrário, ter-se-ia que P∗ ⇒ rY s∗ ⇒ ruZvs,∗ e Z não seria eliminada de V′. Portanto, se Y ⇒ uZv, Y é também eliminada. Caso∗ contrário, a elimina¸cão de Z não altera o fato de que Y ⇒ w para algum w ∈ Σ∗ ∗ .

Segue um exemplo de aplica¸cão do método de elimina¸cão de variáveis inúteis. Deve-se notar que o Algoritmo 3.19a deve Deve-ser aplicado antes do Algoritmo 3.19b.

(33)

Exemplo 90 Seja a gram´atica G = ({A, B, C, D, E, F }, {0, 1}, R, A}), em que R cont´em as regras: A → ABC | AEF | BD B → B0 | 0 C → 0C | EB D → 1D | 1 E → BE F → 1F 1 | 1

Primeiro, determina-se SG = {B, D, F, A}. De acordo com o m´etodo descrito, R′

consta das regras: A → BD B → B0 | 0 D → 1D | 1 F → 1F 1 | 1

Agora determina-se AG′ = {A, B, D}. Pelo m´etodo descrito, R′′ cont´em apenas as

regras:

A → BD B → B0 | 0 D → 1D | 1

Durante a concep¸cão de uma gramática, o projetista pode deparar com a necessidade de modificar uma ou mais regras, sem alterar a linguagem gerada. Inicialmente, será mostrado como eliminar uma regra X → w, em que X não é a variável de partida, usando-se o expediente de “simular” a aplica¸cão da mesma em todos os contextos poss´ıveis: para cada ocorrência de X do lado direito de cada regra, prevê-se o caso em que X é substitu´ıda por w e o caso em que não o é. Com esse expediente, consegue-se produzir algumas deriva¸cões mais curtas, à custa do aumento do número de regras da gramática.

M´etodo 15 Eliminando uma regra

Sejam uma GLC G = (V, Σ, R, P ) e X → w ∈ R em que X 6= P . Uma GLC equivalente sem a regra X → w seria G′ _{= (V, Σ, R}′_{, P ) em que R}′ _{´e constitu´ıdo de:}

1. cada regra Y → z ∈ R − {X → w} tal que X 6∈ vars(z); e

2. cada regra Y → x0γ1x1γ2x2. . . γnxn, em que cada γj pode ser X ou w, para cada

Y → x0Xx1Xx2. . . Xxn ∈ R com n > 0 ocorrˆencias de X e X 6∈ vars(xi) para

0 ≤ i ≤ n. Exce¸c˜ao: no caso em que Y = X, apenas X → x0Xx1Xx2. . . Xxn

(34)

Y B1 Bp X C1 Cq A1 An · · · · △ · · · △ △ · · · △ △ · · · △ (a) Antes Y B1 Bp A1 An C1 Cq · · · · △ · · · △ △ · · · △ △ · · · △ (b) Depois

Figura 3.20 Transforma¸c˜ao entre ADs induzida por remo¸c˜ao de regra.

Teorema 20 As GLCs G e G′, em queG′ é obtida como mostrado no Método 15, são equivalentes.

Prova

Não será feita uma demonstra¸cão rigorosa desse teorema, mas uma argumenta¸cão relati-vamente precisa e clara, utilizando o conceito de árvore de deriva¸cão (AD) desenvolvido na Se¸cão 3.4.2. Uma GLC G gera uma palavra w se, e somente se, existe uma AD de w. Será mostrado, então, como transformar uma AD de w em G em uma AD de w em G′, e vice-versa. Seja, então a regra X → w eliminada de G, com w = A1A2. . . An, em que

Ai∈ V ∪ Σ, e seja uma regra da forma Y → B1. . . BpXC1. . . Cq, com Bi, Cj ∈ V ∪ Σ

(note que cada Bi e Cj pode ser ou n˜ao X). Tendo em vista como G′ ´e obtida, uma

AD de w em G pode ser transformada em uma AD de w em G′ _{substituindo-se toda}

subárvore da forma exposta na Figura 3.20a pela subárvore exibida na Figura 3.20b. Em palavras, para todo vértice vX de rótulo X, filho de vY, de rótulo Y , e cujos filhos

sejam (nesta ordem) vA1, vA2, . . . , vAn, com r´otulos A1, A2, . . . , An,

1. eliminar o v´ertice vX; e

2. colocar os v´ertices vA1, vA2, . . . , vAn (nesta ordem) como filhos de vY, entre os

v´ertices vBp e vC1.

Essa transforma¸cão, assim como a inversa, é poss´ıvel, visto que X 6= P . Nela, a subárvore à esquerda é substitu´ıda pela subárvore à direita (ou vice-versa).

O método delineado acima será exemplificado a seguir. Observe que, para se elimi-nar uma regra X → w, cada regra com n ocorrências de X no seu lado direito dá origem a até 2n_{regras: para cada ocorrência, considera-se o caso em que ela é substitu´ıda por}

w (aplica¸cão da regra X → w) e o caso em que não o é (prevendo os casos de aplica¸cões de outras regras X).

Exemplo 91 Seja a gram´atica G = ({P, A, B}, {a, b, c}, R, P ), em que R cont´em as regras:

(35)

P → ABA A → aA | a B → bBc | λ

que gera a linguagem {a}∗{bn_cn_{| n ≥ 0}{a}}∗_{. Seja o problema de eliminar a regra}

A → a. A regra P → ABA d´a origem a quatro regras: P → ABA | ABa | aBA | aBa e a regra A → aA resulta em duas regras:

A → aA | aa

Assim, a gramática resultante é G′ = ({P, A, B}, {a, b, c}, R′, P ), em que R′ contém as regras:

P → ABA | ABa | aBA | aBa A → aA | aa

B → bBc | λ

Note que o número de regras aumentou, mas as deriva¸cões propiciadas são mais curtas. Por exemplo, aa tem a seguinte deriva¸cão em G:

P ⇒ ABA (regra P → ABA) ⇒ aBA (regra A → a) ⇒ aA (regra B → λ) ⇒ aa (regra A → a).

E a mesma palavra tem a seguinte deriva¸c˜ao em G′: P ⇒ aBa (regra P → aBa)

⇒ aa (regra B → λ).

Uma GLC em uma certa forma normal admite poucos formatos de regras, porém sem alterar o poder descritivo: para qualquer LLC existirá uma GLC equivalente na formal normal considerada. Com isto, elas facilitam demonstra¸cões relativas a proprie-dades de LLCs, e, por propiciarem árvores de deriva¸cão com estrutura uniforme, podem servir de base para constru¸cão de analisadores sintáticos.

Existem duas formas normais especialmente importantes para GLCs: as formas normais de Chomsky e de Greibach. Como visto, as restri¸cões feitas às regras de uma gramática para torná-la uma gramática regular restringem a classe de linguagens que podem ser descritas à das linguagens regulares. Uma maneira de se tentar chegar a uma forma normal para GLCs é considerar: que modifica¸cões m´ınimas se poderia fazer aos formatos de regras de gramáticas regulares de forma a conseguir o poder de gerar qualquer LLC? Ora, uma ideia é simplesmente “generalizar” o formato de regra X → aY de gramáticas regulares para permitir uma variável no lugar do terminal a.