Algoritmo de inferência de anotações - Uma máquina virtual para uma linguagem concorrente in

A figura 4.2 apresenta o pseudo-código do nosso algoritmo. Este efetua duas passagens sobre o código fonte. Na primeira passagem associa duas novas variáveisLi1eLi2a cada trinco li declarado e gera restrições que relacionam Li1, Li2 e li (1.1). Estas variáveis são definidas sobre conjuntos de trincos e denotam os trincos a apanhar antes (Li1) e depois (Li2) do trinco em questão. As restrições geradas capturam estes factos: o trinco li

é apanhado após todos os trincos em Li1 e antes de qualquer trinco em Li2. Estas três restrições,Li1 < li, li < Li2 eLi1 < Li2, são escritas abreviadamente comoLi1 < li < Li2. Adicionalmente, requeremos que os trincos deLi1e deLi2correspondam a trincos que es- tejam no âmbito do bloco ou da instrução em causa. Caso contrário, a solução encontrada pode ser inválida por mencionar trincos declarados noutro ponto do programa. No caso de um trinco li conter anotações (1.2), essas anotações são colecionadas nesta fase do algoritmo através de restrições. Neste caso, as restrições adicionadas registam o valor que as variáveis de conjuntos de li devem assumir, ou seja,Li1 = MieLi2 = Ni, em queLi1eLi2

são as variáveis associadas ao trinco li, eMie Nicorrespondem aos conjuntos definidos na anotação do trinco li.

A primeira passagem no exemplo da figura 4.1, enumera os conjuntos sequencial- mente (começando emL0), resulta que na linha 3 são associadas ag1as variáveisL0eL1

e as restriçõesL0 < g1 < L1,L0⊆ ∅ eL1⊆ ∅. Na linha 14, por exemplo, são associadas ao

// Primeira passagem

1. Analisar cada bloco do programa:

1.1 para cada trinco li definido na assinatura de um bloco de código (da forma ∀li ::Lock.t), no corpo de um bloco (da forma li ::Lock), ou numa instrução unpack (da forma li , r:=unpack v), associar-lhe duas novas variáveis sobre conjuntos de trincos Li1 e Li2 e incluir as seguintes restrições: Li1 < li < Li2, Li1 ⊆ Trincos,

Li2 ⊆ Trincos, em que Trincos representa o conjunto de trincos conhecidos no âmbito do bloco ou da instrução em causa.

1.2 Se existirem anotac¸˜oes em trincos (da forma li ::Lock(Mi1,Mi2), Mi1

e Mi2 são conjuntos concretos que contêm trincos do programa, podendo estes serem vazios), então gerar as restrições: Li1 = Mi1

e Li2 = Mi2, em que Li1 e Li2 est˜ao associados ao trinco li. // Segunda passagem

2. Analisar cada bloco do programa:

2.1 Se a instrução é um salto condicional sobre o trinco li (da forma

if r==0 jump v) com v do tipo {...} requires G, então gerar a restrição: G < li.

2.2 Se a instrução inclui a aplicação de um trinco li a um valor v

(da forma v[ li ]), em que o tipo de v é ∀m::Lock.t, e m está associado aos conjuntos Li1 e Li2, então gerar as restrições:

Li1 < li < Li2.

2.3 Se a instrução é um salto (da forma jump v) ou o lançamento de um fio de execução (da forma fork v), com v do tipo

{r1: t1 ,..., rn: tn} requires G, comparar os tipos ti que são da forma ∀li ::Lock.ui, com os tipos dos registos correspondentes conhecidos até ao momento (da forma ∀mi ::Lock.si). Se li está associado aos conjuntos Li1 e Li2 e mi aos conjuntos Mi1 e Mi2, então gerar as restrições: Li1 = Mi1, Li2 = Mi2.

3. Resolver as restric¸˜oes recolhidas usando um SMT

Figura 4.2: Algoritmo para colecionar restric¸˜oes

pois o trinco e encontra-se em âmbito. Estes dois exemplos são referentes à al´ınea 1.1 do algoritmo. Como o exemplo da figura 4.1 está parcialmente anotado, a regra 1.2 pode ser aplicada diversas vezes no mesmo. Por exemplo, na linha 5 (g3::Lock({g1,g2},{})) são adicionadas as restriçõesL4 = {g1, g2}eL5 = {}, em queL4eL5são as variáveis associadas ao trincog3. A tabela 4.1 apresenta todas as restrições geradas na primeira passagem do algoritmo.

Na segunda passagem o algoritmo processa cada bloco de código e comporta-se de três formas distintas consoante se trate de um teste (2.1), da instanciação de um valor polimórfico (2.2) ou de uma instrução de salto ou de lançamento de um fio de execução (2.3). Em relação a (2.1), a recolha de restrições ocorre na instrução if. Neste ponto do programa ficamos com a indicação de que os trincos já fechados têm de ser menores do que o trinco que está a tentar fechar-se. Esta regra pode ser aplicada em duas situações no

Linha Restric¸˜oes Al´ınea 3 L0 < g1 < L1,L0⊆ ∅ eL1⊆ ∅ 1.1 4 L2 < g2 < L3,L2⊆ {g1} eL3⊆ {g1} 1.1 L2 = {g1}eL3 = {} 1.2 5 L4 < g3 < L5,L4⊆ {g1, g2} eL5⊆ {g1, g2} 1.1 L4 = {g1, g2}eL5 = {} 1.2 14, 15 L6 < e < L7,L6⊆ ∅,L7⊆ ∅,L8 < d < L9,L8⊆ {e},L9⊆ {e}, 1.1 L10 < l < L11,L10⊆ {e, d} eL11⊆ {e, d} L6 = {},L7 = {},L10 = {e}eL11 = {} 1.2 22 L12 < e1 < L13,L12⊆ ∅,L13⊆ ∅,L14 < d1 < L15,L14⊆ {e1}, e 1.1 L15⊆ {e1} L12 = {},L13 = {},L14 = {e1}eL15 = {} 1.2 29 L16 < e2 < L17,L16⊆ ∅,L17⊆ ∅,L18 < d2 < L19,L18⊆ {e2}, e 1.1 L19⊆ {e2} L16 = {},L17 = {},L18 = {}eL19 = {} 1.2

Tabela 4.1: Restric¸˜oes geradas durante a primeira passagem do algoritmo

exemplo da figura 4.1. Na linha 18 pretende-se obter o trincoesem que tenha sido fechado qualquer outro trinco anteriormente. Na linha 25 pretende-se obter o trinco d1tendo já o trincoe1fechado (cf. requires {e1}na assinatura do bloco de código na linha 22). As restrições adicionadas são, respetivamente,{} < ee{e1} < d1.

Em relação à aplicação de valores (2.2) a restrição adicionada regista o facto do trinco li respeitar a ordem do fecho dos trincos associado am, ou seja, ser fechado depois dos trincos denotados porLi1e antes dos deLi2. Esta regra pode ser aplicada por diversas vezes no exemplo que apresentamos. Por exemplo, na linha 6 (r6:=levantarGarfoDireito [g1]) são adicionadas as restriçõesL12 < g1 < L13, em queL12eL13são as variáveis associadas ao trinco polimórficoe1declarado na linha 21. A tabela 4.2 contém todas as restrições geradas de acordo com esta regra, assinaladas por (2.2).

O tratamento das instruções jumpefork (2.3) é mais complicado porque há que determinar o tipo dos registos antes da execução destas instruções, que é calculado pelo sistema de tipos. Vamos ilustrar a aplicação desta regra à linha 7. O tipo dos registos relevantes para o lançamento do fio de execução são:

• r1:lock g1; • r2:lock g2;

• r6:∀ d1::Lock.{r1:lock g1, r2: lock d1} requires {g1}.

Tanto o registo r1 como o registo r2 não são do tipo universal, ou seja, não contêm declarações de trincos polimórficos. Neste caso, o que é relevante nas instruções fork

ejump é se os tipos dos registos, antes da execução destas instruções, são subtipos dos tipos dos registos para onde é efetuado o salto ou o lançamento do novo fio de execução.

Linha Restric¸˜oes Al´ınea 6, 8, 10 L12 < g1 < L13,L12 < g2 < L13eL12 < g3 < L13 2.2 7 L6 < g1 < L7,L8[g1/e] < g2 < L9[g1/e], 2.2 L10[g1/e][g2/d] = L14[g1/e1] e L11[g1/e][g2/d] = L15[g1/e1] 2.3 9 L6 < g2 < L7,L8[g2/e] < g3 < L9[g2/e], 2.2 L10[g2/e][g3/d] = L14[g2/e1] e L11[g2/e][g3/d] = L15[g2/e1] 2.3 11 L6 < g3 < L7,L8[g3/e] < g1 < L9[g3/e], 2.2 L10[g3/e][g1/d] = L14[g3/e1] e L11[g3/e][g1/d] = L15[g3/e1] 2.3 18 L10 < d < L11e{} < e 2.2, 2.1 19 L6 < e < L7,L8[e/e] < d < L9[e/e], 2.2

L10[e/e][d/d] = L10[e/e]eL11[e/e][d/d] = L11[e/e] 2.3 25 L16 < e1 < L17, L18[e1/e2] < d1 < L19[e1/e2] e {e1} < d1 2.2, 2.1 26 L12 < e1 < L13eL14[e1/e1] < d1 < L15[e1/e1] 2.2 32 L12 < e2 < L13 2.2 33 L6 < e2 < L7,L8[e2/e] < d2 < L9[e2/e], 2.2 L10[e2/e][d2/d] = L14[e2/e1] e L11[e2/e][d2/d] = L15[e2/e1] 2.3

Tabela 4.2: Restric¸˜oes geradas durante a segunda passagem do algoritmo

Todavia, o tipo que considera as variáveis de conjuntos é o tipo universal. Um tipo universal (∀ l1 :: Lock(L0, L1).t) é subtipo de outro (∀ m1::Lock(M0, M1).t) quando as variáveis de conjuntos menor (L0) e maior (L1) do trinco (l1) são iguais às variáveis de conjuntos me- nor (M0) e maior (M1) do trinco (m1). Neste caso, o único registo que é do tipo universal é or6. Com isto, o tipo do registor6delevantarGarfoEsquerdo, após a instanciação porg1e

g2ér6:∀ l ::Lock.{r1:lock g1, r2: lock l } requires {g1}há que gerar as restriçõesL10[g1/e] [g2/d]=L14[g1/e1]eL11[g1/e][g2/d]=L15[g1/e1], em queL10eL11são as variáveis associadas ao trinco polimórfico l do blocolevantarGarfoEsquerdo e L14e L15 são as associadas ao trinco polimórficod1do bloco levantarGarfoDireito.

Por último, (3) as restrições recolhidas são passadas a um SMT que afere da sua consistência. Caso sejam consistentes, o SMT indica um modelo que instancia cada um dos conjuntos associados aos trincos, obtendo deste modo uma anotação válida; caso contrário, o SMT responde negativamente e o programa não tem qualquer anotação poss´ıvel. No caso de programas completamente anotados, o SMT não vai procurar obter conjuntos para as variáveis de conjuntos mas, no caso de programas em que não exis- tam anotações, o SMT vai procurar obter conjuntos para as variáveis de conjuntos. Ou- tra situação que pode ocorrer é ter um programa parcialmente anotado (exemplo da figura 4.1) e, neste caso, o SMT vai procurar obter conjuntos para as variáveis de conjuntos cujo os trincos não tenham anotações. No caso de os trincos estarem anotados, o SMT

n˜ao vai procurar obter conjuntos para as vari´aveis de conjuntos desses trincos.

Um resolvedor SMT consegue determinar os conjuntos (Li), porque os programas MIL declaram um conjunto finito de trincos que pode ser determinado em tempo de compilação. Portanto, os conjuntos (Li) que pretendemos determinar são finitos e definidos sobre um conjunto de trincos também finito.

Implementação da Máquina Virtual

Neste cap´ıtulo damos conta das tecnologias sobre as quais o analisador semântico estático e a máquina virtual do MIL são constru´ıdos (secção 5.1), apresentamos a sua arqui- tetura geral e funcionamento (secção 5.2), distinguindo entre as fases de análise e de interpretação (secção 5.3 e secção 5.4).

5.1 Tecnologias utilizadas para a construção da máquina

virtual do MIL

A máquina virtual MIL aceita como entrada um ficheiro . mil com o código fonte. O conteúdo do ficheiro é analisado de acordo com a especificação da gramática MIL, é feita a análise semântica estática e após a análise, a máquina virtual interpreta o ficheiro. A máquina virtual MIL é implementada em SableCC e Java. O SableCC é usado para gerar as classes Java que procedem à verificação léxica e sintática, enquanto que a análise semântica e interpretação é programada em Java. O resolvedor SMT usado para a verificação das restrições é o Z3.

5.1.1 SableCC

O SableCC [16] é uma ferramenta que gera um analisador léxico e sintático em Java a partir de um ficheiro que contém a especificação da gramática, simplificando a escrita de compiladores e interpretadores, pois gera um conjunto de classes Java, as quais contêm os analisadores léxicos e sintáticos. O resultado da análise sintática é uma árvore sintática abstrata (AST) que representa o programa.

O SableCC oferece as seguintes funcionalidades: análise léxica e sintática do programa de entrada; construção automática de uma AST do programa fonte (a ser com- pilado) e criação de visitantes para percorrer a AST, de acordo com o padrão de dese- nho visitante apresentado em GoF [18]. Este padrão separa as estruturas de dados da implementação, ou seja, permite fazer operações sobre a estrutura. Através do uso deste

padrão é poss´ıvel adicionar visitantes, para implementar as várias fases do analisador semântico e do interpretador.

5.1.2 Z3

O Z3 [13] é um resolvedor SMT (Satisfiability Modulo Theories) eficiente, sendo o estado de arte dos provadores de teoremas, desenvolvido pela Microsoft Research. Este resolvedor permite verificar a consistência de fórmulas lógicas sobre uma ou várias teorias. As teorias que suporta são as seguintes: aritmética de números inteiros e reais, vetores de bits de tamanho fixo, matrizes, funções não interpretadas e quantificadores.

O Z3 aceita como entrada um ficheiro que contém uma sequência de comandos. É através destes comandos que o Z3 determina se as fórmulas lógicas introduzidas são satisfaz´ıveis. Internamente, o Z3 mantém uma pilha que armazena as fórmulas e declarações de cada programa.

Para verificar a consistência das fórmulas são usados dois comandos: o assert e o

check−sat. O primeiro acrescenta uma fórmula à pilha interna do Z3. O segundo determina se as fórmulas que se encontram na pilha são consistentes. Em caso afirmativo o Z3, devolve sat; caso contrário, devolve unsat. Um conjunto de fórmulas é consistente se existe uma interpretação que faz com que todas as fórmulas sejam verdadeiras [17]. No caso de um conjunto de fórmulas ser consistente, o Z3 tem a capacidade de produzir o modelo que satisfaz as fórmulas.

A teoria usada para inferir as anotações definidas no cap´ıtulo 4 foi a de vetores de bits. Através dos vetores de bits representamos os trincos e as variáveis de conjuntos. Os trincos são conjuntos singulares e, é atribu´ıdo um bit diferente para representar cada trinco do programa. As variáveis de conjuntos são expressas como conjuntos de trincos, isto é, como cada trinco é representado por um bit diferente, facilmente determinamos quais os trincos que o conjunto contém. Assim, a partir desta teoria, é poss´ıvel encontrar conjuntos de bits que satisfaçam as restrições passadas ao Z3.

No documento Uma máquina virtual para uma linguagem concorrente intermédia (páginas 37-44)