Reutiliza¸c˜ ao de componentes: inclus˜ ao impl´ıcita vs expl´ıcita

4.3 Dolphin Internal Representation

5.1.1 Reutiliza¸c˜ ao de componentes: inclus˜ ao impl´ıcita vs expl´ıcita

Implementar integralmente uma solu¸cão sob a forma de um único componente, faz com que este contenha tudo o que é necessário à sua execu¸cão, é por assim dizer autónomo dos restantes componentes e a sua execu¸cão apenas obedece a uma determinada sequência imposta pela estrutura do próprio compilador. Por exemplo, um componente que implemente integralmente um front-end pode ser executado de forma independente dos demais. A única restri¸cão à qual deve obedecer, prende-se com a própria estrutura do compilador, que for¸ca a execu¸cão deste componente antes de todos os outros. Diz-se assim existir uma dependência estrutural, entre o front-end e os demais componentes.

A decomposi¸cão de uma solu¸cão em vários componentes (um principal e um ou mais de suporte), cria dependências funcionais entre esses componentes, isto é, a execu¸cão de um componente principal passa a requerer a execu¸cão de todos os componentes que o suportam. O que poderá ser feito antes, durante ou após a execu¸cão das tarefas inerentes ao componente principal.

Este tipo de dependência, que advêm do facto da solu¸cão se encontrar decomposta em vários componentes, por si só não cria grandes problemas. Basta que o componente principal inclua os componentes de suporte e tudo funcionará como antes. O componente de suporte é assim utilizado implicitamente, dado que é inserido no compilador por outro componente e não por parte de quem especifica a estrutura do compilador.

A principal vantagem da inclusão impl´ıcita advém do facto de ocultar do utilizador os componentes de suporte, fazendo com que a especifica¸cão de um compilador seja mais simples e como tal mais acess´ıvel de descrever. O Exemplo5.1 ilustra como é que a inclusão impl´ıcita dos componentes de suporte simplifica a especifica¸cão dos compiladores.

Exemplo 5.1

AStatic Single Assignment (SSA) é uma forma de RIC que facilita a implementação de muitas rotinas, nomeadamente de análise e optimização de código. O Dolphin fornece um componente, o cnv2SSA, que permite converter a RIC da forma normal para a forma SSA. Componente esse que reutiliza outros componentes, como se encontra ilustrado na Figura5.1. Se considerarmos que esses componentes de suporte são incluídos implicitamente pelo cnv2SSA, o utilizador não necessita sequer de saber da sua existência e muito menos tem que lidar com eles, basta instanciar e executar o cnv2SSA como está exemplicado na Figura 5.2.

Figura 5.1: cnv2SSA e respectivos componentes de suporte.

(1) DIR d(argc,argv); // Instanciação do objecto que contém a RIC

(2) littleC fe(&d); // Instanciação do front-end

(3) fe.execute(); // Execução do front-end

(4) // para construção da RIC

(5) ...

(6) cnv2SSA cnv(&d); // Instanciação de cnv2SSA

(7) ...

(8) cnv.execute(); // Execução de cnv2SSA para converter a RIC

(9) // da forma normal para a forma SSA

(10) ...

Figura 5.2: Especifica¸cão contendo as opera¸cões necessárias à conversão da forma normal para a forma SSA.

Apesar de todas as vantagens da inclusão impl´ıcita de componentes, a verdade é que a reutiliza¸cão do processo em si continua a não existir, isto é, reutiliza-se o código mas não o processo inerente a esse código. Isto leva a que muitas opera¸cões sejam executadas inúmeras vezes sem que da´ı advenha qualquer vantagem, antes pelo contrário, contribui de forma muito significativa para deteriorar o tempo de compila¸cão, mas não só.

O exemplo da Figura5.1 serve também para ilustrar esta situa¸cão. É poss´ıvel consta- tar que determinados componentes servem de suporte a mais do que um componente. Por exemplo, DFrontiers suporta directamente cnv2SSA, mas também IDFrontiers. Incluir implicitamente DFrontiers, faz com que existam pelo menos duas instâncias deste componente no compilador: uma que suporta cnvSSA e outra que suporta IDFrontiers. O mesmo acontece com os componentes IDominator e Dominators. A Figura5.3representa todas as instâncias que são necessárias para a utiliza¸cão de cnv2SSA, caso os componentes sejam inclu´ıdos de forma impl´ıcita.

As consequências são claramente gravosas para o processo de compila¸cão. Isto porque cada instância é independente, e como tal tem que ser executada individualmente, con-

5.1. Afinal quais s˜ao os problemas? 75

Figura 5.3: Instˆancias requeridas por cnv2SSA, se os componentes forem inclu´ıdos implicitamente.

sumindo espa¸co de memória e tempo de processamento. O que se traduz em tempos de compila¸cão mais longos (compiladores mais lentos do que eventualmente seria necessário).

O processo de compila¸cão deteriora-se ainda mais quando os componentes de suporte, visam disponibilizar informa¸cão sobre a RIC. Isto porque, a informa¸cão é normalmente dis- ponibilizada através dos próprios componentes, ou seja, é o próprio componente que mantém a informa¸cão que previamente determinou. Em termos do processo de compila¸cão, a inclusão impl´ıcita dos componentes vai fazer com que uma quantidade substancial de informa¸cão seja desnecessariamente replicada. O Exemplo 5.1 serve para ilustrar esta situa¸cão. Como foi já dito, cnv2SSA converte a RIC da forma normal para a forma SSA, mas não há qualquer tipo de informa¸cão que fique retida no componente, ou seja, na prática o componente recebe a RIC (na forma normal), processa-a e coloca-a novamente na sa´ıda (agora na forma SSA). O mesmo não acontece com os componentes de suporte. Cada um destes componentes, com base na RIC, apura um determinado tipo de informa¸cão. É essa informa¸cão que na realidade é utilizada pelo componente principal (cnv2SSA). Por exemplo, Dominators constrói inter- namente um dicionário, que contém para cada nodo do Grafo de Fluxo de Controlo (GFC), os nodos que o dominam [LT79,CFR+91].

A dependência criada pelo facto de a execu¸cão de um componente requerer informa¸cão previamente determinada por outro componente (componente de suporte), designou-se por dependência de dados, a qual é um caso especial da dependência funcional entre componentes, mas que tem outros requisitos.

Uma possibilidade para tornar a reutiliza¸cão dos componentes mais eficiente seria utilizá-los de forma expl´ıcita, isto é, aquando da constru¸cão do compilador, todos os componentes seriam explicitamente instanciados e executados pelo programador. Caberia a este gerir as instâncias dos vários componentes de forma a evitar a sua replica¸cão, tornando assim o processo de compila¸cão mais eficiente.

Para quem especifica compiladores, a inclusão expl´ıcita é o procedimento natural de utiliza¸cão dos componentes. No entanto apenas tem sido aplicada a componentes:

• Cuja execu¸cão é recomendada mas não fundamental1;

• Cuja execu¸cão é fundamental, resultando numa dependência funcional, mas em que cabe a terceiros requerer a execu¸cão desses componentes (normalmente a quem especifica o compilador)2_.

Associa¸c˜ao de componentes

Os mecanismos existentes na framework original não permitem lidar com a maioria dos casos em que há dependências funcionais, mas em especial quando há dependências de dados. Isto porque faz falta um mecanismo que vincule o componente de suporte ao componente principal. No entanto não é dif´ıcil obter uma solu¸cão, por exemplo, basta registar o componente de suporte no componente principal, à semelhan¸ca do que é feito para o registo da RIC nos componentes. A Figura 5.4 ilustra a aplica¸cão desta solu¸cão, apresentando as opera¸cões necessárias à conversão da forma normal para a forma SSA, com recurso à inclusão expl´ıcita dos componentes.

E fácil detectar pelos exemplos das Figura5.2e Figura5.4, que para a mesma opera¸cão (conversão da forma normal para a forma SSA), a especifica¸cão de um compilador com base na inclusão expl´ıcita de componentes é substancialmente mais longa e complexa do que a especifica¸cão com base na inclusão impl´ıcita. Mais grave ainda, é que a inclusão expl´ıcita de componentes requer que o utilizador conhe¸ca minimamente a forma como os componentes estão implementados, nomeadamente: quais são os componentes de suporte, qual a ordem pela qual devem ser aplicados, como devem ser utilizados, quais os efeitos da sua execu¸cão, etc. Com a agravante de que esta desvantagem é recursiva, isto é, aplica-se aos próprios componentes de suporte (agora no papel de componentes principais). O pior é que há outros factores que agravam ainda mais esta situa¸cão, como se explica adiante.

Conhecer a estrutura da RIC

Como já foi referido, aDolphin Internal Representation (DIR) é um modelo de representa¸cão de código composto por objectos com diferentes n´ıveis de abstraçcão. Nos n´ıveis de maior abstraçcão temos objectos do tipo Program, Function ou mesmo de CFG. Enquanto nos n´ıveis de menor abstraçcão temos objectos do tipo DT ou de Expression. A existên- cia de diversos n´ıveis de abstraçcão, faculta a possibilidade de se escolher o n´ıvel (conjunto

Por exemplo, a utiliza¸cão de componentes cuja execu¸cão contribui, directa ou indirectamente, para criar melhores condi¸cões e oportunidades para os componentes que são executados posteriormente.

Esta situa¸cão acontece, por exemplo, com o componente que faz a conversão da forma normal para a forma SSA (cnv2SSA). A forma SSA facilita a implementa¸cão de muitas rotinas de análise e optimiza¸cão de código, permitindo em muitos casos obter solu¸cões mais eficientes. Não significa no entanto que tais rotinas não possam ser implementadas sobre a forma normal. Existem mesmo alguns componentes que seleccionam a solu¸cão a utilizar, mediante a forma em que se encontra a RIC. Mas outros componentes há, que apenas estão aptos a executar sob uma das formas. No entanto como o processo de conversão para SSA, e posterior reconversão para a forma normal, é bastante pesado, a conversão só deverá ser feita nas seguintes condi¸cões: quando se pretende incluir no compilador um número considerável de componentes a funcionarem sobre a forma SSA (e que sejam executados sequencialmente); ou utilizar componentes que sejam fundamentais e que funcionem exclusivamente sobre a forma SSA. Estes motivos são no entanto de ordem conceptual, isto é, dependem da concep¸cão do compilador, nomeadamente do tipo de componentes que se pretende utilizar. Por isso, e apesar da conversão para a forma SSA ser fundamental para alguns componentes, normalmente só é executada se for explicitamente requerida por quem especifica o compilador. Da´ı que muitos componentes da framework Dolphin, que funcionam exclusivamente sobre a forma SSA, estejam implementados de maneira a não for¸carem a conversão, funcionando apenas se esta tiver sido previamente executada. Caso contrário, o pedido de execu¸cão do componente falha.

5.1. Afinal quais s˜ao os problemas? 77

(1) DIR d(argc,argv); // Instanciação do objecto que contém a RIC

(1) littleC fe(&d); // Instanciação do front-end

(2) fe.execute(); // Execução do front-end

(3) // para construção da RIC

(4) ...

(5) var2Indx vi(&d); // Instanciação de var2Indx

(6) indx2Var iv(&d); // Instanciação de indx2Var

(7) Dominators dom(&d); // Instanciação de Dominators

(8) IDominator idom(&d);// Instanciação de IDominator

(9) IDominated ided(&d);// Instanciação de IDominated

(10) DFrontiers df(&d); // Instanciação de DFrontiers

(11) IDFrontiers idf(&d);// Instanciação de IDFrontiers

(12) cnv2SSA cnv(&d); // Finalmente, instanciação de cnv2SSA

(13) ...

(14) vi.execute(); // Execução da instância de var2Indx

(15) iv.execute(); // Execução da instância de indx2Var

(16) dom.execute(); // Execução da instância de Dominators

(17) idom.execute(); // Execução da instância de IDominator

(18) ided.execute(); // Execução da instância de IDominated

(19) df.execute(); // Execução da instância de DFrontiers

(20) idf.execute(); // Execução da instância de IDFrontiers

(21) ...

(22) cnv.execute(); // Execução da instância de cnv2SSA

(23) ...

Figura 5.4: Especifica¸c˜ao parcial de um compilador com inclus˜ao expl´ıcita de componentes.

de elementos da RIC) que melhor se adequa à implementa¸cão e execu¸cão de cada um dos componentes.

Nos exemplos até aqui apresentados, como é o caso da especifica¸cão da Figura 5.4, a utiliza¸cão dos componentes faz-se exclusivamente sobre um objecto do tipo DIR (que caracte- riza toda a RIC). Tal tem sido feito para simplificar os exemplos e a explica¸cão dos mesmos. Na realidade, a utiliza¸cão de elementos do tipo DIR, ou mesmo do tipo Program, visa: a execu¸cão de tarefas de alto n´ıvel (análises ou optimiza¸cões de código inter-procedimentais); ou aplicar o componente de forma generalizada sobre todos os elementos de um n´ıvel de abs- traçcão menor. Mas a maior parte dos componentes requer a utiliza¸cão de elementos mais espec´ıficos, isto é, de menor abstraçcão.

Com a inclusão expl´ıcita, o utilizador é obrigado a “navegar” através dos diversos n´ıveis de abstraçcão para alcan¸car os elementos necessários à execu¸cão dos componentes. O mesmo acontece com inclusão impl´ıcita, mas a responsabilidade de “navegar” na RIC cabe neste caso a quem desenvolve o componente. Em ambos os casos é necessário conhecer o tipo de elementos que compõem a DIR e a própria estrutura da RIC. No entanto, subentende-se que tais conhecimentos serão mais acess´ıveis a quem desenvolve componentes, do que a quem vai apenas utilizá-los.

Dimens˜ao do problema

O problema torna-se particularmente complicado, quando se tem em conta que um programa submetido ao compilador normalmente contém: um único objecto do tipo DIR; algumas dezenas de objectos de alto n´ıvel, do tipo Function e CFG; e várias centenas, senão milhares, de objectos de baixo n´ıvel do tipo DT e Expression. Significa isto, que um componente que utilize elementos de baixo n´ıvel de abstraçcão poderá ter várias centenas senão milhares de instâncias. Gerir essas instâncias pode ser bastante complicado, nomeadamente quando os componentes são inclu´ıdos explicitamente. É que se com a inclusão impl´ıcita, o problema fica restrito ao contexto de implementa¸cão de cada componente (apenas há que lidar com as respectivas instâncias dos componentes de suporte); já com a inclusão expl´ıcita, esta situa¸cão pode ocorrer para vários componentes, fazendo com que o número de instâncias a gerir seja consideravelmente superior.

No caso da inclusão expl´ıcita, há ainda que ter em conta que cabe ao utilizador relacionar os componentes de suporte com os componentes principais, isto é, fazer o registo dos componentes de suporte nos componentes principais. Com tantas instâncias envolvidas que derivam de diferentes componentes pode ocorrer que esta opera¸cão, que é aparentemente simples, se torne bastante complexa.

Relacionamento das instˆancias

De notar que as instâncias dos componentes, mas também dos elementos da RIC, são identificados por endere¸cos, na melhor das hipóteses por variáveis. Supondo, por exemplo, que a RIC contém vários elementos do tipo A e B ({A0, . . ., An, B0, . . ., Bm}), que o

componente CA ´e aplicado a cada um dos elementos do tipo A ({CA0, . . . , CAn}), que o

componente CB ´e aplicado a cada um dos elementos do tipo B ({CB 0, . . . , CB m}), e que os

componentes do tipo CA suportam a execu¸c˜ao dos componentes do tipo CB. A quest˜ao que

se levanta é saber como relacionar as instâncias de CAcom as instâncias de CB? Isto é, como

fazer o registo das instˆancias de CA nas instˆancias de CB?

Para responder a esta questão, há que saber como é que os elementos da RIC estão relacionados; e como aceder aos elementos do tipo A a partir dos elementos do tipo B (ou vice-versa). O que requer novamente conhecimentos sobre a DIR e sobre a estrutura da RIC, que como já se disse, não deveria ser um requisito necessário a quem só pretende utilizar os componentes.

Além disso não basta conhecer a DIR e a estrutura da RIC, para se conseguir associar as instâncias de CA às instâncias de CB. Por exemplo, para se executar CB i, é necessário

garantir a execu¸cão prévia da correspondente instância ou instâncias de CA. Aceder a essa

instˆancia, que vamos supor que ´e representada por CAj, requer aceder ao elemento Bi, e a

partir deste aceder ao elemento Aj. Ambas opera¸cões são poss´ıveis e relativamente fáceis de

executar, desde que se conhe¸ca a DIR e a estrutura da RIC. O que não é poss´ıvel, ou pelo menos fácil, é aceder a CAj a partir de Aj. Esta situa¸cão encontra-se ilustrada na Figura5.5.

Neste caso em concreto, a solu¸c˜ao passa pelo utilizador assumir a responsabilidade de implementar mecanismos que associem os elementos de A com as instˆancias de CA. Gene-

ralizando a solu¸cão, significa implementar mecanismos que permitam determinar para cada elemento da RIC, quais os componentes que lhe estão associados. É de notar que a rela¸cão inversa é estabelecida quando se faz o registo do elemento da RIC no componente. Convém no entanto real¸car que:

• A cada instância de um componente está associado um único elemento da RIC; mas a cada elemento da RIC podem estar associadas instâncias de vários componentes;

5.1. Afinal quais s˜ao os problemas? 79

Figura 5.5: Rela¸c˜ao entre componentes e elementos da RIC.

• Componentes que são dependentes, funcionam tipicamente sobre elementos do mesmo n´ıvel de abstraçcão, o que contribui para aumentar o número de instâncias e como tal, o número de dependências.

Em suma, foram apresentadas duas solu¸cões: uma suportada pela inclusão impl´ıcita dos componentes, que apesar de facilitar a especifica¸cão dos compiladores, faz com que estes sejam muito pouco eficientes; e outra suportada pela inclusão expl´ıcita dos componentes, que permite produzir compiladores mais eficientes, mas exigindo a quem especifica o compilador, muito mais trabalho, conhecimento e experiência.

No documento Um modelo arquitectónico para desenvolvimento de compiladores: aplicação à framework Dolphin (páginas 89-95)