• Nenhum resultado encontrado

PROJETO DE PESQUISA ESTRUTURAS DISCRETAS, COMPLEXIDADE E ALGORITMOS

N/A
N/A
Protected

Academic year: 2021

Share "PROJETO DE PESQUISA ESTRUTURAS DISCRETAS, COMPLEXIDADE E ALGORITMOS"

Copied!
35
0
0

Texto

(1)

PROJETO DE PESQUISA

ESTRUTURAS DISCRETAS, COMPLEXIDADE E ALGORITMOS

MANOEL JOS´E MACHADO SOARES LEMOS

Sum´ario

1. Problemas estruturais sobre grafos e matr´oides 1

2. Combinat´oria extremal, probabil´ıstica e assint´otica 6

3. Pseudoaleatoriedade em combinat´oria e em teoria da computa¸c˜ao 16

4. Algoritmos sobre estruturas discretas e aplica¸c˜oes 19

Referˆencias 28

1. Problemas estruturais sobre grafos e matr´oides

Apresentamos a seguir alguns problemas espec´ıficos de nosso interesse sobre grafos e matr´oides. 1.1. Grafos e matr´oides menores-minimais. Uma companhia telefˆonica desejava substituir, em um distrito, sua rede convencional por uma de fibra ´otica. Uma rede telefˆonica pode ser vista como um grafo, tendo os n´os como v´ertices e os cabos como arestas. Uma liga¸c˜ao telefˆonica percorre um caminho neste grafo. Como cabos convencionais s˜ao capazes de realizar um n´umero limitado de liga¸c˜oes simultaneamente, v´arias op¸c˜oes de trajeto para cada liga¸c˜ao telefˆonica tˆem de estar dispon´ıveis. Contudo, para telefonia, podemos considerar que um cabo de fibra ´otica pode realizar um n´umero ilimitado de liga¸c˜oes. Portanto, a rede de fibra ´otica necessitava ser apenas conexa, e por raz˜oes de econˆomicas, bastava ser minimamente conexa. Mas os grafos minimamente conexos s˜ao as ´arvores, e por esta raz˜ao, a companhia telefˆonica tinha de substituir os cabos convencionais que estavam em uma ´arvore geradora por cabos de fibra ´otica e desativar os demais.

Como um grafo possui uma grande quantidade de ´arvores geradoras, a companhia desejava descobrir aquela com custo m´ınimo para a substitui¸c˜ao de seus cabos. Para tanto, estimou o custo de substituir cada cabo convencional por um de fibra ´otica e aplicou um algoritmo conhecido, chamado de guloso, para encontrar uma ´arvore geradora de custo m´ınimo. A companhia ficou bastante satisfeita com o resultado, j´a que economizou bastante. Contudo, um dos cabos foi rompido, fazendo com que uma parte do distrito ficasse sem comunica¸c˜ao com o seu exterior. Isto gerou grandes transtornos para a companhia e esta pˆos algumas quest˜oes visando resolver o problema:

(2)

para n = 3, e Mader [120], para n ≥ 4. J´a para matr´oides, Murty [133], para n = 2, e Oxley [139], para n = 3, resolveram o problema equivalente. Para n > 3, nada ´e conhecido. Existe uma grande dificuldade em obter resultados espec´ıficos para matr´oides n-conexas, quando n > 3.

• Existe algoritmo eficiente para encontrar um subgrafo gerador minimamente n-conexo em um grafo dado que possua custo m´ınimo?

• Dado um subgrafo conexo de um grafo n-conexo, qual o menor n´umero de arestas deste grafo que necessitamos adicionar a este subgrafo para que tamb´em se torne n-conexo? E como ach´a-las de forma que o custo do subgrafo resultante seja m´ınimo?

Das trˆes quest˜oes apresentadas anteriormente, a que mais interessava a companhia telefˆonica era a terceira, j´a que esta possu´ıa uma malha de fibra ´otica, que tinha a forma de uma ´arvore, e desejava substituir mais alguns cabos convencionais por fibra ´otica, aumentando a conectividade da rede, sem ter um custo elevado para realizar a substitui¸c˜ao. Um dos problemas que trataremos neste projeto ´e uma generaliza¸c˜ao do terceiro problema listado pela companhia, mas para matr´oides. Seja M uma matr´oide que ´e menor-minimal com respeito `as seguintes propriedades:

• Ter uma matr´oide N como menor. • Ser 3-conexa.

Desejamos obter um limite superior ´otimo para o n´umero de elementos que pertencem a M e n˜ao pertencem a N . Na verdade, desejamos resolver uma conjectura proposta por Lemos e Oxley [101], que passamos a descrever. Seja X o n´umero de componentes conexas de N , e Y o n´umero de matr´oides 3-conexas que obtemos a partir de N utilizando as opera¸c˜oes inversas da 1-soma e 2-soma. Ser´a verdade que

|E(M )| − |E(N )| < X + 5Y − 5 ? Lemos e Oxley [101] mostraram que

|E(M )| − |E(N )| < 5Y − 4

no caso em que N ´e conexa. Membros deste grupo est˜ao tentando melhorar este limite no caso em que N ´e um circuito (que foi a parte mais longa da demonstra¸c˜ao de Lemos e Oxley no caso geral). Acredita-se que no caso em que N ´e um circuito o seguinte limite ´e valido:

|E(M )| − |E(N )| < 3Y − b, para algum inteiro b.

(3)

• Para todos grafos G e H tais que G ´e menor-minimal com respeito a ser 2-conexo e ter H como menor,

|E(G)| − |E(H)| < a[cc(H) − 1] + b[b(H) − 1] + 1. • a + b ´e pelo menos 5; 2a + 5b ´e pelo menos 20; e b ´e pelo menos 3.

Utilizamos cc(H) e b(H) para denotar respectivamente o n´umero de componentes conexas e o n´umero de blocos de H. Os outros problemas que ser˜ao tratados neste t´opico do projeto de pesquisa tamb´em envolvem fortemente o conceito de n-conectividade em grafos e matr´oides, algumas vezes na sua formula¸c˜ao e outras na solu¸c˜ao de problemas correlatos. Membros do grupo ir˜ao considerar a generaliza¸c˜ao deste resultado para o caso em que o grafo G ´e 3-conexo. Acreditamos que ser´a imposs´ıvel resolver este problema em geral de forma satisfat´oria, isto ´e, obtendo o melhor limite poss´ıvel. Contudo, no caso em que H ´e 2-conexo, talvez seja poss´ıvel obter o melhor limite superior poss´ıvel, caso exista.

1.2. Matr´oides com poucas bases n˜ao-comuns. Mills [131] propˆos a seguinte conjectura: Conjectura 1. SeM e N s˜ao matr´oidesn-conexas com k bases que n˜ao s˜ao comuns, para algumk inferior a n, ent˜ao existe uma matr´oide que ´e obtida a partir de M e N relaxando um total de k circuitos-hiperplanos.

Esta conjectura foi demonstrada por Truemper [164], para k = 1, Mills [131], para k = 2, e Lemos [96], para todo k > 2. Lemos [97] generalizou este resultado para matr´oides verticalmente n-conexas. Em Lemos [98] h´a outras extens˜oes deste resultado. Pretendemos considerar o seguinte problema, que generaliza a conjectura de Mills: o que podemos afirmar sobre duas matr´oides n-conexas que possuem poucos circuitos contendo um elemento fixo que n˜ao s˜ao comuns?

1.3. Dupla cobertura por cocircuitos. Para uma matr´oide conexa M com pelo menos dois ele-mentos, denotamos por c(M ) a cardinalidade do maior circuito de M e por c(e, M ) a cardinalidade do maior circuito de M contendo o elemento e. Bonin, McNutly e Reid [21] propuseram a seguinte conjectura:

Conjectura 2. SeM ´e uma matr´oide conexa com pelo menos dois elementos, ent˜ao o n´umero de elementos deM ´e limitado superiormente por c(M )c(M∗

)/2.

Esta conjectura, que foi demonstrada por Lemos e Oxley [100], sugere o seguinte problema proposto por Ding:

Problema 3. Para uma matr´oide conexaM com pelo menos dois elementos, ´e poss´ıvel encontrar uma fam´ılia com c(M ) cocircuitos de M que cubra cada elemento de M pelo menos duas vezes?

Pretendemos trabalhar neste problema. Lemos e Oxley [100] responderam afirmativamente `a seguinte pergunta relacionada de Seymour:

(4)

Esta pergunta foi inspirada por um limite superior para o n´umero de elementos de uma matr´oide conexa, a saber: (c(e, M ) − 1)(c(e, M∗) − 1) + 1, demonstrado por Lemos e Oxley [100].

1.4. Maiores circuitos em matr´oides. Gr¨otschel [73] propˆos a seguinte conjectura:

Conjectura 5. Em um grafo k-conexo, quaisquer dois circuitos de comprimento m´aximo possuem pelo menosk v´ertices em comum.

No mesmo artigo, Gr¨otschel verifica esta conjectura para k < 7, e afirma que, segundo H¨aggkvist e Bondy, esta conjectura est´a resolvida para k < 11. (Aparentemente esta ´ultima afirma¸c˜ao n˜ao ´e verdadeira.) Em geral, o problema continua em aberto. Membros do grupo pretendem trabalhar em uma conjectura de Wu, que generaliza esta conjectura para matr´oides:

Conjectura 6. Se C e D s˜ao circuitos de comprimento m´aximo em uma matr´oide k-conexa, ent˜ao r(C + D) < r(C) + r(D) − k.

Utilizamos C + D para denotar a uni˜ao dos conjuntos C e D. Esta conjectura foi solucionada por McMurray, Reid, Wei e Wu [130] para k = 2. Como, para grafos, a conjectura ´e muito dif´ıcil n˜ao esperamos resolvˆe-la em geral, mas apenas para pequenos valores de k, digamos k = 3 e k = 4. 1.5. Conjuntos dominantes. Seja G um grafo. A vizinhan¸ca fechada de um v´ertice v em G, denotada por N (v), ´e o conjunto formado pelo pr´oprio v´ertice v e todos os v´ertices adjacentes a v. Dizemos que um conjunto S ⊆ V (G) ´e um conjunto dominante de G se V (G) ⊆ ∪v∈SN (v), isto

´e, cada v´ertice de G pertence a S ou ´e adjacente a algum v´ertice de S. O n´umero de domina¸c˜ao (dominating number) de G, denotado por γ(G), ´e definido como a cardinalidade m´ınima de um conjunto dominante de G, ou seja,

γ(G) := min {|S| : S ´e um conjunto dominante de G}.

O conceito de conjunto dominante foi introduzido por Berge [14] em 1962. No entanto, foi Ore [137] quem cunhou a terminologia atual e observou que γ(G) ≤ |V (G)|/2 para qualquer grafo G sem v´ertices isolados.

No que segue vamos denotar por n o n´umero de v´ertices do grafo em considera¸c˜ao. Blank [16], em 1973, mostrou que um grafo conexo G com grau m´ınimo pelo menos 2 ou satisfaz γ(G) ≤ 2 n/5, ou ´e um de sete grafos muito bem especificados: um deles com 4 v´ertices e os outros seis com 7 v´ertices. Este resultado foi obtido independentemente por McCuaig e Shepherd [129], e ´e o melhor poss´ıvel para este caso: sabe-se que existem infinitos grafos para os quais a desigualdade acima vale com igualdade.

(5)

Cropper, Greenwell, Hilton e Kostochka [41] mostraram que a conjectura ´e verdadeira quando n ≡ 0 (mod 3) e n ≡ 1 (mod 3), mas ´e falsa quando n ≡ 2 (mod 3).

Em abril de 2006, Alexandr Kostochka visitou o IME-USP e, nessa ocasi˜ao, apresentou a cons-tru¸c˜ao do exemplo que mostrou ser falsa a conjectura de Reed. Nessa ocasi˜ao, forneceu materiais recentes a respeito do assunto, e lan¸cou v´arias id´eias que podem ser ´uteis no tratamento do pro-blema. Uma das conjecturas levantadas por esse pesquisador ´e a seguinte:

Conjectura 7. Se G ´e um grafo bipartido c´ubico e hamiltoniano, ent˜aoγ(G) ≤ n/3.

Al´em dessa conjectura, h´a v´arias outras quest˜oes interessantes a respeito do parˆametro γ(G), em particular para classes especiais de grafos. Por exemplo, um problema em aberto ´e o de determinar se γ(G) ≤ n/4 quando G ´e um grafo planar triangulado de ordem n.

Pretendemos investigar esse parˆametro tendo como ponto de partida essa conjectura e a famili-ariza¸c˜ao com o assunto atrav´es da leitura de textos [80, 79] que trazem v´arios resultados sobre esse parˆametro.

Do ponto de vista algor´ıtmico, o problema de determinar γ(G) para um dado grafo G ´e um problema NP-dif´ıcil. Sabe-se que esse problema ´e equivalente ao problema da cobertura m´ınima; e portanto, ele ´e aproxim´avel dentro de uma raz˜ao 1 + log n e n˜ao admite uma raz˜ao de aproxima¸c˜ao constante (veja [9]). Outro problema correlato ´e o de encontrar, num dado grafo, um conjunto dominante conexo de cardinalidade m´ınima. Este problema ´e de grande interesse pela sua rela¸c˜ao com v´arios outros, como por exemplo os problemas do emparelhamento m´aximo induzido e o problema da ´arvore geradora com um n´umero m´aximo de folhas [30]. Dependendo do andamento da pesquisa sobre esse t´opico, contemplamos a possibilidade de estudar quest˜oes de car´ater mais algor´ıtmico e de inaproximabilidade sobre esse parˆametro.

1.6. Trabalhos anteriores. Membros deste grupo tˆem feito contribui¸c˜oes na linha de pesquisa discutida nesta se¸c˜ao; destacamos aqui os seguintes trabalhos:

• G. C˘alinescu, C.G. Fernandes, e B. Reed. Mul-ticuts in unweighted graphs and digraphs with bounded degree and bounded tree-width. J. Al-gorithms, 48(2):333–359, 2003.

• J. Donadelli e Y. Kohayakawa. A density result for random sparse oriented graphs and its re-lation to a conjecture of Woodall. Electron. J. Combin., 9(1):Research Paper 45, 10 pp. (elec-tronic), 2002.

• C.G. Fernandes, E.L. Green, e A. Mandel. From monomials to words to graphs. J. Combin. The-ory Ser. A, 105(2):185–206, 2004.

• O. Lee e Y. Wakabayashi. Note on a min-max conjecture of Woodall. J. Graph Theory, 38(1):36–41, 2001.

• O. Lee e Y. Wakabayashi. On the circuit co-ver problem for mixed graphs. Combin. Probab. Comput., 11(1):43–59, 2002.

• M. Lemos. On Mills’s conjecture on matroids with many common bases. Discrete Mathema-tics, 240:271–276, 2001.

• M. Lemos. Matroids with many common bases. Discrete Mathematics, 270:193–205, 2003. • M. Lemos. Non-separating cocircuits in binary

matroids. Linear Algebra and Its Applications, 382:171–178, 2004.

• M. Lemos e J. Oxley. On packing minors into connected matroids. Discrete Mathematics, 189:283–289, 1998.

(6)

American Mathematical Society, 353:4039–4056, 2001.

• M. Lemos e J. Oxley. On the minor-minimal 3-connected matroids having a fixed minor. Eu-ropean Journal Combinatorics, 24:1097–1123, 2003.

• M. Lemos e J. Oxley. On the minor-minimal 2-connected graphs having a fixed minor. Discrete Mathematics, 280:77–118, 2004.

• J.C. de Pina e J. Soares. A new bound for the Carath´eodory rank of the bases of a matroid. In

Proceedings of the Eleventh Annual ACM-SIAM Symposium on Discrete Algorithms, pages 942– 943, New York, 2000. ACM.

• J.C. de Pina e J. Soares. Improved bound for the Carath´eodory rank of the bases of a matroid. J. Combin. Theory Ser. B, 88(2):323–327, 2003. • H. van der Holst and J.C. de Pina.

Length-bounded disjoint paths in planar graphs. Dis-crete Appl. Math., 120(1-3):251–261, 2002. Sixth Twente Workshop on Graphs and Combinatorial Optimization (Enschede, 1999).

2. Combinat´oria extremal, probabil´ıstica e assint´otica

Combinat´oria extremal estuda qu˜ao grande ou qu˜ao pequeno pode ser um objeto (uma seq¨uˆencia, um grafo, uma configura¸c˜ao de pontos, etc.) que satisfaz certas restri¸c˜oes. Um exemplo cl´assico da teoria extremal dos grafos (veja, por exemplo, [19]), que teve Paul Erd˝os como o seu principal expoente, ´e o teorema de Tur´an de 1940 que diz qual ´e o maior n´umero de arestas em um grafo com n v´ertices que n˜ao possui um dado subgrafo completo.

Nas pr´oximas se¸c˜oes descrevemos alguns dos problemas extremais de interesse de membros do grupo. Aspectos probabil´ısticos e assint´oticos tˆem papel fundamental nesta linha de pesquisa.

2.1. Regularidade de grafos e hipergrafos. Este t´opico da combinat´oria extremal e assint´otica tem como foco um resultado fundamental da teoria dos grafos e combinat´oria conhecido como o Lema de Regularidade de Szemer´edi [157] e suas diversas variantes, conjuntamente com algumas de suas aplica¸c˜oes recentes. Para uma introdu¸c˜ao a este t´opico, veja [89, 92, 93] e tamb´em [61, 85] para desenvolvimentos mais recentes. Por simplicidade, a discuss˜ao que segue ´e restrita a grafos; a vers˜ao para hipergrafos ´e tecnicamente muito mais complexa (o leitor interessado pode consultar, por exemplo, R¨odl et al. [145] e R¨odl e Schacht [149]).

Os problemas espec´ıficos a serem estudados neste t´opico s˜ao, na maioria, problemas envolvendo a inter-rela¸c˜ao entre os v´arios lemas de regularidade desenvolvidos recentemente e algumas aplica¸c˜oes espec´ıficas desses lemas. Membros do grupo tˆem investigado aplica¸c˜oes e extens˜oes deste lema estrutural fundamental de Szemer´edi h´a v´arios anos.

O vigor da pesquisa em torno do t´opico que propomos ´e ilustrado por trabalhos recentes de Alon, Elek, Gowers, Lov´asz, R¨odl, Schacht, Szegedy, e Tao, dentre outros.

Listamos a seguir alguns t´opicos espec´ıficos a serem investigados. Para tanto, enunciamos antes o lema cl´assico de Szemer´edi, ap´os darmos algumas defini¸c˜oes fundamentais.

2.1.1. Defini¸c˜oes b´asicas e o lema de regularidade. Seja G = Gn um grafo de ordem |V (G)| = n

fixo. Para U , W ⊂ V = V (G), escrevemos E(U, W ) = EG(U, W ) para o conjunto de arestas de G

com um extremo em U e o outro extremo em W . Pomos e(U, W ) = eG(U, W ) = |E(U, W )|. O

(7)

como segue: para quaisquer dois conjuntos disjuntos n˜ao-vazios U , W ⊂ V , pomos dG(U, W ) = eG(U, W )

|U ||W | . (1)

O lema de regularidade de Szemer´edi afirma a existˆencia de parti¸c˜oes do conjunto de v´ertices de grafos em um n´umero limitado de blocos com a maioria dos pares de blocos formando pares surpreendentemente uniformes, conhecidos como pares ε-regulares.

Defini¸c˜ao 8 (Pares ε-regulares). Seja 0 < ε ≤ 1 um n´umero real. Seja G um grafo e U , W ⊂ V = V (G) dois conjuntos disjuntos n˜ao-vazios de v´ertices de G. Dizemos que o par (U, W ) ´e (ε, G)-regular, ou simplesmente ε-regular, se temos |dG(U′, W′) − dG(U, W )| ≤ ε para todo U′ ⊂ U

e W′⊂ W com |U| ≥ ε|U | e |W| ≥ ε|W |.

No lema regularidade, o conjunto de v´ertices dos grafos s˜ao particionados em um n´umero limitado de blocos, basicamente todos do mesmo tamanho.

Defini¸c˜ao 9 (Parti¸c˜ao (ε, k)-balanceada). Dado um grafo G, um n´umero real 0 < ε ≤ 1, e um inteiro k ≥ 1, dizemos que uma parti¸c˜ao Q = (Ci)k0 de V = V (G) ´e (ε, k)-balanceada se temos

(i) |C0| ≤ εn e (ii) |C1| = . . . = |Ck|. A classe C0 ´e conhecida como a classe excepcional deQ.

Podemos agora introduzir a no¸c˜ao fundamental de uma parti¸c˜aoε-regular para um grafo G. Defini¸c˜ao 10 (Parti¸c˜ao ε-regular). Dado um grafo G, uma parti¸c˜ao (ε, k)-balanceada Q = (Ci)k0

deV = V (G) ´e (ε, G)-regular, ou simplesmente ε-regular, se no m´aximoε k2 pares (Ci, Cj) com 1 ≤

i < j ≤ k n˜ao s˜ao ε-regulares.

Podemos agora enunciar o c´elebre lema de Szemer´edi [157].

Teorema 11 (Lema de regularidade). Para quaisquer ε > 0 e k0 ≥ 1, existem constantes K0 =

K0(ε, k0) ≥ k0 e N0 = N0(ε, k0) tais que todo grafo G = Gn com n ≥ N0 vertices admite uma

parti¸c˜ao(ε, G)-regular, (ε, k)-balanceada de seu conjunto de v´ertices com k0 ≤ k ≤ K0.

O Teorema 11 mostrou-se de grande utilidade, especialmente em teoria dos grafos, combinat´oria, e teoria da computa¸c˜ao. Mais recentemente, variantes foram desenvolvidas para novas aplica¸c˜oes, de forma que podemos falar hoje sobre ‘lemas de regularidade’.

2.1.2. O limite de seq¨uˆencias de grafos densos. Um resultado recente de Lov´asz e Szegedy [115] introduz o conceito de um objeto limite (natural) para seq¨uˆencias de grafos densos. O referido objeto ´e simplesmente uma fun¸c˜ao mensur´avel sim´etrica W : [0, 1]2 → [0, 1], e captura a ‘freq¨uˆencia’ com

que grafos de tamanho fixo ocorrem, como subgrafos, nos grafos da seq¨uˆencia. O trabalho [115] usa lemas de regularidade de forma essencial. (Mencionamos brevemente que a forte rela¸c˜ao entre regularidade e pseudoaleatoriedade ´e explorada por Lov´asz e T. S´os em [113], atrav´es de objetos limite.)

(8)

A testabilidade de parˆametros de grafos (um conceito muito pr´oximo `a testabilidade de propri-edades) ´e explorada por Borgs et al. [23]. A no¸c˜ao de limite de seq¨uˆencias de grafos e sua rela¸c˜ao com informa¸c˜oes estruturais dos grafos da seq¨uˆencia ´e explorada em maior generalidade em Borgs et al. [24].

Os resultados at´e agora provados na dire¸c˜ao brevemente discutida nesta se¸c˜ao restringem-se a grafos densos (isto ´e, grafos de ordem n com Ω(n2) arestas). Kohayakawa e seus colaboradores (veja, por exemplo, [61, 85]) tˆem trabalhado em problemas envolvendo a generaliza¸c˜ao do uso de regularidade para tratar grafos esparsos (grafos de ordem n com o(n2) arestas).

Problema 12. Estabelecer uma no¸c˜ao adequada de objetos limite para seq¨uˆencias de grafos esparsos e explorar suas aplica¸c˜oes.

Problema 13. Investigar a testabilidade de propriedades e parˆametros no caso esparso.

2.1.3. O lema da aproxima¸c˜ao regular. Um resultado surpreendente descoberto recentemente por R¨odl e Schacht [149] afirma que parti¸c˜oes extremamente regulares podem ser obtidas para qualquer grafo, desde que permitamos considerar perturba¸c˜oes dos grafos dados. Para podermos descrever este resultado um pouco melhor, precisamos entrar em alguns detalhes t´ecnicos.

A prova do Teorema 11 fornece uma constante K0 = K0(ε, k0) bastante grande: trata-se de uma

fun¸c˜ao ‘torrencial’, isto ´e, do tipo torre. O valor de K0 que se obt´em ´e basicamente uma torre de

exponenciais de altura proporcional a 1/ε5. Este ponto n˜ao ´e uma fraqueza da prova: Gowers [67] demonstrou que h´a grafos para os quais K0 ´e necessariamente torrencial.

O fato de K0 ser muito grande em rela¸c˜ao a 1/ε impossibilita certas aplica¸c˜oes do Teorema 11.

Grosseiramente falando, o que R¨odl e Schacht [149] descobriram ´e que, se permitimos perturbar o grafo G a ser regularizado, ent˜ao existem parti¸c˜oes δ-regulares com δ ≪ 1/k, onde k ´e o n´umero de blocos na parti¸c˜ao de Szemer´edi. Este fato, descoberto no estudo de regularidade para hipergrafos, tem conseq¨uˆencias profundas, como demonstrado em [149]. Este resultado foi recentemente deri-vado, de forma alternativa e bastante surpreendente, por Elek e Szegedy [50], atrav´es de t´ecnicas anal´ıticas n˜ao-standard.

Problema 14. Explorar aplica¸c˜oes de aproxima¸c˜oes regulares no contexto esparso.

2.1.4. As vers˜oes de Alon et al., Tao, Lov´asz e Szegedy, e Elek e Szegedy. V´arias vers˜oes do lema original de Szemer´edi s˜ao hoje importantes em v´arias aplica¸c˜oes. As variantes de maior desta-que s˜ao, possivelmente, os lemas de regularidade para hipergrafos, especialmente as vers˜oes de Gowers [66] (veja tamb´em [70]), R¨odl e Skokan [150], R¨odl e Schacht [149], Tao [159], e Elek e Szegedy [50].

(9)

´

area de teoria de Ramsey para inteiros e as respectivas vers˜oes de densidade. Comecemos com um resultado bem conhecido da teoria combinat´oria dos n´umeros, o teorema de van der Waerden [166]: Teorema 15 (van der Waerden, 1927). Toda parti¸c˜ao de N em um n´umero finito de partes ´e tal que alguma parte cont´em progress˜oes aritm´eticas arbitrariamente longas.

Erd˝os e Tur´an [51] conjecturaram uma vers˜ao mais forte que o Teorema de van der Waerden, a saber, eles conjecturam a “vers˜ao de densidade” do Teorema 15: se uma parte dos inteiros ´e “grande”, ent˜ao ela cont´em progress˜oes aritm´eticas arbitrariamente longas. Esta conjectura foi confirmada nesta generalidade apenas em 1975, por Szemer´edi, atrav´es de seu c´elebre resultado: Teorema 16 (Szemer´edi, 1975). Todo conjunto A ⊂ N com densidade superior positiva, isto ´e, com

¯

d(A) = lim sup

n→∞ n

−1|A ∩ {1, . . . , n}| > 0, (2)

cont´em progress˜oes aritm´eticas arbitrariamente longas.

Podemos interpretar os resultados acima como dizendo que progress˜oes aritm´eticas s˜ao abun-dantes nos naturais N = {1, 2, . . . }. Uma pergunta natural ´e ent˜ao a seguinte: para quais outros conjuntos de naturaisΓ progress˜oes aritm´eticas s˜ao abundantes no sentido desses teoremas? Neste projeto, estamos interessados em considerar conjuntos t´ıpicos Γ, isto ´e, conjuntos aleat´orios Γ de inteiros positivos de acordo com certas distribui¸c˜oes naturais.

A pergunta acima foi originalmente formulada por Lefmann e, independentemente, por Erd˝os e S´os (veja [147, p. 937]), ap´os um resultado an´alogo para o Teorema de Ramsey para grafos ter sido provado por R¨odl e Ruci´nski [146, 147]. Na Se¸c˜ao 2.2.1 abaixo, discutiremos os resultados principais conhecidos nesta linha, e descreveremos precisamente os problemas centrais da ´area. 2.2.1. Vers˜oes probabil´ısticas de resultados cl´assicos. Come¸camos considerando os Teoremas de van der Waerden e Szemer´edi.

Vers˜oes probabil´ısticas dos Teoremas 15 e 16. Ser´a mais conveniente considerar as seguintes vers˜oes “finitas” dos Teoremas 15 e 16.

Teorema 17. Para todo r e k inteiros positivos, existe um inteiro n0 = n0(r, k) com a seguinte

propriedade: para todon ≥ n0, toda parti¸c˜ao de[n] = {1, . . . , n} em r partes ´e tal que alguma parte

cont´em uma progress˜ao aritm´etica com k elementos.

Teorema 18. Para todo real η > 0 e inteiro positivo k, existe um inteiro n0 = n0(η, k) com a

seguinte propriedade: para todo n ≥ n0, todo conjunto A ⊂ [n] com densidade pelo menos η, isto ´e,

n−1|A ∩ [n]| ≥ η, (3)

cont´em uma progress˜ao aritm´etica com k elementos. Ser´a tamb´em conveniente escrever

(10)

se Γ ⊂ N satisfaz a propriedade descrita no Teorema 17, isto ´e, se toda parti¸c˜ao Γ = U1∪ · · · ∪ Ur´e

tal que algum Ui cont´em uma progress˜ao aritm´etica com k elementos. Definimos de forma an´aloga

a nota¸c˜ao

Γ →η PAk (5)

para todo conjunto Γ ⊂ N finito. Escrevemos (5) se todo U ⊂ Γ com |U | ≥ η|Γ| cont´em uma progress˜ao aritm´etica com k elementos. Os Teoremas 17 e 18 dizem que segmentos iniciais Γ = [n] de N suficientemente grandes satisfazem as rela¸c˜oes (4) e (5).

(*) O que podemos dizer sobre conjuntos t´ıpicos Γ ⊂ [n]?

Para podermos falar sobre “conjuntos t´ıpicos”, definimos uma distribui¸c˜ao de probabilidade sobre os subconjuntos de [n]. A distribui¸c˜ao mais simples que podemos considerar ´e a distribui¸c˜ao uniforme; na realidade, fixamos um inteiro N ≤ n e consideramos o conjunto [n]N de todos os subconjuntos Γ ⊂ [n] de cardinalidade N e o munimos com a medida de probabilidade uniforme. Escreveremos [n]N para um conjunto aleat´orio sorteado uniformemente ao acaso dentre todos os

membros de [n]N. Assim, para todo conjunto fixo X ⊂ [n] com |X| = N, temos P([n]N = X) = n

N −1

. (6)

Os dois pr´oximos resultados que enunciamos fornecem uma resposta a nossa pergunta acima (*). Observamos que o primeiro resultado, devido a R¨odl e Ruci´nski [147], ´e um resultado que pode se considerar completo, pois trata da propriedade (4) para todo k e r.

Teorema 19 (R¨odl e Ruci´nski, 1995). Para todo inteiro k ≥ 3 e r ≥ 2, existem constantes positivas c e C tais que

lim n→∞P([n]N → (PAk)r) =    0 se N ≤ cn1−1/(k−1), 1 se N ≥ Cn1−1/(k−1). (7)

O Teorema 19 afirma que ocorre uma transi¸c˜ao quando a ordem de grandeza de N passa por n1−1/(k−1). A prova do resultado acima ´e complexa. Aqui, limitamo-nos a fazer uma ob-serva¸c˜ao elementar que poderia dar suporte a um argumento heur´ıstico que d´a um papel especial `

a fun¸c˜ao n1−1/(k−1): se N n−1+1/(k−1) → 0, ent˜ao o n´umero de progress˜oes aritm´eticas com k

ele-mentos em [n]N ´e o(N ), e se N n−1+1/(k−1)→ ∞, ent˜ao o n´umero de tais progress˜oes ´e ωN , para

alguma fun¸c˜ao ω = ω(n) → ∞.

O segundo resultado probabil´ıstico que enunciamos, provado em [87],1´e ainda parcial, pois trata da rela¸c˜ao (5) apenas para k = 3.

(11)

Teorema 20 (Kohayakawa, Luczak, e R¨odl, 1996). Para todo real η > 0, existem constantes positivas c e C tais que

lim n→∞P([n]N →η PA3) =    0 se N ≤ cn1/2, 1 se N ≥ Cn1/2. (8)

A demonstra¸c˜ao do Teorema 20 ´e, infelizmente, bastante sutil e n˜ao parece admitir uma ge-neraliza¸c˜ao simples para k > 3. O fato de se conhecer uma vers˜ao probabil´ıstica ‘completa’ do Teorema 17, mas termos apenas uma tal vers˜ao para k = 3 do Teorema 18 ´e razo´avel, pois, ao que tudo indica, o Teorema 18 ´e substancialmente mais profundo que o Teorema 17.

A vers˜ao probabil´ıstica do teorema de Rado. O Teorema 19 n˜ao ´e a vers˜ao mais geral do que se conhece nesta dire¸c˜ao. De fato, pelo menos em certos casos, ´e conhecida uma vers˜ao probabil´ıstica do c´elebre Teorema de Rado [142], que generaliza o Teorema de van der Waerden.

Seja A = (aij) uma matriz k × l com entradas inteiras, e seja L(A) o sistema de equa¸c˜oes

Ax = 0. (9)

Dizemos que A ´e regular em rela¸c˜ao a parti¸c˜oes de N, ou P-regular para N, se para todo natural r e toda parti¸c˜ao N = U1 ∪ · · · ∪ Ur, existe x ∈ Nl com todas as suas entradas em algum Ui tal

que Ax = 0. Isto ´e, A ´e P-regular para N se qualquer parti¸c˜ao finita de N ´e tal que o sistema L(A) admite uma solu¸c˜ao inteiramente contida em uma das partes.

Rado [142] caracterizou as matrizes P-regulares, generalizando amplamente o resultado de van der Waerden. Para formularmos o resultado de Rado, precisamos introduzir uma nova defini¸c˜ao. Sejam aj(1 ≤ j ≤ l) as colunas de A. Dizemos que A satisfaz a propriedade das colunas se podemos

reordenar as colunas de A de forma que, para algum s, existam 0 = l0 < · · · < ls= l tais que se

bj =X{aj′: lj−1< j′ ≤ lj} (1 ≤ j ≤ s),

ent˜ao (i) b1 = 0 e (ii) para todo 1 < j ≤ s, o vetor bj ´e uma combina¸c˜ao linear sobre Q dos

vetores aj′ (j′≤ lj−1).

O c´elebre resultado de Rado ´e o seguinte.

Teorema 21 (Rado, 1937). A matriz A ´e P-regular para N se e s´o se A satisfaz a propriedade das colunas.

´

E f´acil verificar que o Teorema 21 generaliza o Teorema de van der Waerden. De fato, para se obter o Teorema de van der Waerden a partir do Teorema de Rado, basta considerar a matriz correspondente ao sistema

x1− 2x2+ x3 = · · · = xk−2− 2xk−1+ xk= 0. (10)

(12)

Uma matriz A ´e dita regular em rela¸c˜ao a densidade para N, ou D-regular para N, se todo conjunto S ⊂ N com densidade superior positiva, isto ´e, com

¯

d(S) = lim sup

n→∞ n

−1|S ∩ [n]| > 0, (11)

´e tal que (9) admite uma solu¸c˜ao x com todas as suas entradas em S. Segue que uma matriz D-regular ´e P-regular.

Diremos que uma matriz A ´e irredundante se (9) admite uma solu¸c˜ao x com todas as suas entradas distintas. No que segue, o caso das matrizes redundantes n˜ao nos interessar´a. Frankl, Graham, e R¨odl [57] provaram o seguinte resultado.

Teorema 22 (Frankl, Graham, e R¨odl, 1988). Uma matriz irredundante ´e D-regular para N se e s´o se a soma de suas colunas ´e nula.

O Teorema 22 generaliza o Teorema de Szemer´edi (veja (10)); entretanto, observamos que a prova do Teorema 22 usa o Teorema de Szemer´edi. Uma generaliza¸c˜ao impressionante do Teorema 19 ´e o Teorema 23 abaixo, devido a R¨odl e Ruci´nski [148]. Se Γ ⊂ N e A ´e uma matriz inteira, generalizando (4), escrevemos Γ → (A)r se toda parti¸c˜ao Γ = U1∪ · · · ∪ Ur de Γ em r partes ´e tal

que (9) admite uma solu¸c˜ao x com todas as suas entradas em algum Ui.

Precisamos ainda definir um parˆametro m(A) para matrizes A; este parˆametro mede, de certa forma, o grau de liberdade que temos para obter solu¸c˜oes de (9). Observamos que a defini¸c˜ao exata deste parˆametro n˜ao ´e muito importante, pelo menos em uma primeira leitura; ´e suficiente observar que m(A) ´e um real satisfazendo 0 < m(A) ≤ 1, que depende apenas de A.

Se Q ´e um subconjunto de colunas de A, escrevemos h(Q) para o posto da matriz que obtemos ao eliminar as colunas em Q de A. Pomos

m(A) = max

q maxQ

q − 1

q − 1 + h(Q) − k, (12)

onde o primeiro m´aximo ´e tomado sobre todos os inteiros 1 ≤ q ≤ l e o segundo m´aximo ´e tomado sobre todos os conjuntos de colunas Q com |Q| = q. No caso da matriz A do sistema (10), um argumento simples, mas que omitimos, mostra que m(A) = k − 1.

Teorema 23 (R¨odl e Ruci´nski, 1997). Sejam A uma matriz D-regular para N e r um inteiro positivo. Existem constantes positivas c e C tais que

lim n→∞P([n]N → (A)r) =    0 se N ≤ cn1−1/m(A), 1 se N ≥ Cn1−1/m(A). (13)

A asser¸c˜ao no Teorema 23 para o caso em que N ≤ cn1−1/m(A) ´e mais f´acil, e de fato pode ser provada para matrizes P-regulares e n˜ao s´o D-regulares.

2.2.2. Problemas centrais. No Teorema 23, o caso em que a matriz A ´e apenas regular em rela¸c˜ao a parti¸c˜oes de N ´e muito interessante, e encontra-se em aberto.

(13)

A matriz mais simples que ´e P-regular mas n˜ao ´e D-regular ´e a matriz correspondente `a equa¸c˜ao x+ y − z = 0. O fato dessa matriz ser P-regular ´e um resultado cl´assico de Schur [153].

Teorema 25 (Schur, 1916). Se N = U1∪ · · · ∪ Ur ´e uma parti¸c˜ao de N em um n´umero finito de

partes, ent˜ao a equa¸c˜ao x + y = z ´e sol´uvel em uma das partes Ui.

Um passo na dire¸c˜ao da Conjectura 24 ´e o seguinte resultado, devido a Graham, R¨odl, e Ruci´nski [71]. Abaixo, escrevemos Γ → (Schur)r se toda parti¸c˜ao de Γ em r partes ´e tal que

a equa¸c˜ao x + y = z ´e sol´uvel em alguma das partes. Teorema 26 (Graham, R¨odl, e Ruci´nski, 1996). Temos

lim n→∞P([n]N → (Schur)2) =    0 se N/n1/2→ 0, 1 se N/n1/2→ ∞. (14)

Finalmente, observamos que no caso de matrizes D-regulares, um resultado mais forte que aquele do Teorema 23 pode ser verdade. De fato, podemos levantar o seguinte problema. Generali-zando (5), dados uma matriz A, um real η > 0, e Γ ⊂ N, escrevemos Γ →η A se todo conjunto U ⊂ Γ

com |U | ≥ η|Γ| cont´em uma solu¸c˜ao de (9).

Problema 27. Sejam A uma matriz D-regular para N e η um real positivo. Prove que existem constantes positivas c e C tais que

lim n→∞P([n]N →η A) =    0 se N ≤ cn1−1/m(A), 1 se N ≥ Cn1−1/m(A). (15)

No Problema 27, o caso em que a matriz A ´e aquela correspondente a progress˜oes aritm´eticas de trˆes elementos, isto ´e, correspondente `a equa¸c˜ao x + z = 2y, ´e resolvido afirmativamente pelo Teorema 20. Podemos enunciar a seguinte conjectura, que, se correta, generaliza aquele teorema. Conjectura 28. Para todo real η > 0 e para todo inteiro k ≥ 3, existem constantes positivas c e C tais que lim n→∞P([n]N →η PAk) =    0 se N ≤ cn1−1/(k−1), 1 se N ≥ Cn1−1/(k−1). (16) ´

E nossa impress˜ao que a Conjectura 24, o Problema 27, e mesmo a Conjectura 28, s˜ao extrema-mente dif´ıceis.

Problema 29. Investigar a adaptabilidade das abordagens recentes usadas para fornecer provas alternativas do Teorema de Szemer´edi ao nosso contexto probabil´ıstico.

No Problema 29, estamos pensando nas t´ecnicas anal´ıticas de Gowers, nas t´ecnicas combinat´orias de R¨odl et al., e nas t´ecnias n˜ao-standard de Elek e Szegedy.

(14)

e conjecturas est´a ainda muito distante. Entretanto, alguns casos particulares interessantes devem estar ao nosso alcance.

De fato, encontrar uma demonstra¸c˜ao do Teorema 20 atrav´es de alguma vers˜ao probabil´ıstica dos m´etodos de Roth [151] e Gowers [68, 69] j´a seria muito interessante. Tal tentativa envolveria um estudo sistem´atico de conjuntos de inteiros pseudoaleat´orios esparsos, estendendo trabalhos de Chung e Graham [36] (veja tamb´em a Se¸c˜ao 3.3).

Acreditamos que podemos ter sucesso nesta linha, continuando [87] (veja Teorema 20 acima), de-vido a nossas investiga¸c˜oes de vers˜oes probabil´ısticas de resultados da teoria de Ramsey e resultados extremais tipo Tur´an para grafos (veja, por exemplo, [60, 77, 78, 86, 88, 90, 152]).

2.3. Modelos de redes de grande escala. Planejamos tamb´em prosseguir com o estudo de modelos de rede de grande escala que tem sido feito por membros do grupo [136]. Temos especial interesse nas seguintes classes de modelos:

• Modelos de Preferential attachment. Na sua forma mais simples, estes s˜ao modelos em que a rede cresce com o acr´escimo sucessivo de um n´o por vez, e cada novo n´o direciona uma aresta a um v´ertice antigo w escolhido com probabilidade ponal a f (deg(w)), onde f ´e uma fun¸c˜ao positiva e deg(w) ´e o grau de w no momento. Pesquisadores que j´a abordaram estes modelos incluem Bollob´as, Borgs, Chayes, Riordan, Spencer e muitos outros; ainda h´a muito o que se aprender a respeito de variantes destes modelos.

• Modelos com graus esperados ou n˜ao-homogˆeneos. Ao contr´ario do caso anterior, estes s˜ao modelos est´aticos no tempo. Na recente vers˜ao de Bollob´as, Janson e Riordan (Chung e Lu tˆem um modelo mais restrito que ´e essencialmente um subcaso deste), n v´ertices s˜ao postos num espa¸co m´etrico “secreto” S e cada aresta em potencial xy existe com probabilidade k(x, y)/n, onde k ´e uma fun¸c˜ao sim´etrica sobre S. Muitas das caracter´ısticas da Internet e da Web s˜ao melhor reproduzidas por esta classe de modelos do que pelas variantes de Preferential Attachment, que tˆem por sua vez a vantagem de “explicar a dinˆamica da rede”.

Nosso interesse espec´ıfico ´e analisar modelos como estes e provar propriedades matem´aticas a seu respeito. Uma parte especialmente importante deste programa ´e a an´alise do espectro t´ıpico dos modelos m´etricos de grafos, que ainda n˜ao foi efetuada e que, gra¸cas a teoremas gerais, j´a permite a aproxima¸c˜ao do diˆametro, conectividade e outras propriedades dos referidos objetos. Tamb´em ´e relevante o estudo geral de modelos dinˆamicos (como o de contato) sobre esta classe de grafos. Por fim, estamos interessados em compreender melhor a rela¸c˜ao entre a estrutura destes grafos e a an´alise de algoritmos sobre eles.

2.4. Geometria combinat´oria no plano. Um dos principais assuntos em geometria combi-nat´oria envolve conjuntos finitos de pontos [49]. Historicamente um dos primeiros problemas combinat´orios que perguntava sobre a existˆencia de uma configura¸c˜ao de pontos com uma certa propriedade foi proposto por Sylvester em 1893:

(15)

Este problema foi revivido por Paul Erd˝os [138] em 1943. Uma resposta em afirmativo para esta quest˜ao foi dada por Tibor Gallai [74] no que hoje ´e conhecido como teorema de Sylvester-Gallai.

Seja P um conjunto finito de pontos no plano. Por uv denotamos o segmento de reta entre os ponto u e v. Dizemos que dois pontos distintos u e v em P se enxergam (em rela¸c˜ao a P ) se P ∩ uv = {u, v}. Uma k-linha de P ´e um conjunto com k ou mais pontos colineares de P .

Neste t´opico o nosso interesse ´e na seguinte conjectura de K´ara, P´or e Wood [83]:

Conjectura 30. Para todos os n´umeros inteiros k, l ≥ 2 existe um n´umero inteiro n(k, l) tal que toda configura¸c˜ao de n(k, l) pontos no plano possui uma k-linha ou l pontos que mutuamente se enxergam.

Algum progresso nessa conjectura j´a vem sendo obtido por membros do grupo e pretendemos dar continuidade a este trabalho.

2.5. Trabalhos anteriores. Membros do grupo tˆem feito contribui¸c˜oes na linha de pesquisa dis-cutida nesta se¸c˜ao; destacamos aqui os seguintes trabalhos:

• B. Bollob´as, Y. Kohayakawa, V. R¨odl, M. Scha-cht, e A. Taraz, Essentially infinite colou-rings of hypergraphs, Proc. London Math. Soc. (3) (2007), aceito para publica¸c˜ao (doi:10.1112/plms/pdm024).

• S. Gerke, Y. Kohayakawa, V. R¨odl, e A. Ste-ger, Small subsets inherit sparse ε-regularity, J. Combin. Theory Ser. B 97 (2007), no. 1, 34–56. • D. Dellamonica Jr., Y. Kohayakawa, M. Mar-ciniszyn, e A. Steger, On the resilience of long cycles in random graphs, submetido, 2007. • V. R¨odl, B. Nagle, J. Skokan, M. Schacht,

e Y. Kohayakawa, The hypergraph regularity method and its applications, Proc. Natl. Acad. Sci. USA 102 (2005), no. 23, 8109–8113. • Y. Kohayakawa, V. R¨odl, e M. Schacht, The

Tur´an theorem for random graphs, Combin. Pro-bab. Comput. 13 (2004), no. 1, 61–91.

• C.G. Moreira e Y. Kohayakawa, Bounds for opti-mal coverings, Discrete Appl. Math. 141 (2004), no. 1-3, 263–276.

• Y. Kohayakawa, V. R¨odl, e L. Thoma, An opti-mal algorithm for checking regularity, SIAM J. Comput. 32 (2003), no. 5, 1210–1235.

• Y. Kohayakawa, B. Nagle, e V. R¨odl, Heredi-tary properties of triple systems, Combin. Pro-bab. Comput. 12 (2003), no. 2, 155–189. • Y. Kohayakawa e V. R¨odl, Szemer´edi’s regularity

lemma and quasi-randomness, Recent advances in algorithms and combinatorics, CMS Books

Math./Ouvrages Math. SMC, vol. 11, Springer, New York, 2003.

• Y. Kohayakawa e V. R¨odl, Regular pairs in sparse random graphs. I, Random Structures Al-gorithms 22 (2003), no. 4, 359–434.

• E. Friedgut, Y. Kohayakawa, V. R¨odl, A. Ruci´nski, e P. Tetali, Ramsey games against a one-armed bandit, Combin. Probab. Comput. 12 (2003), no. 5-6, 515–545, Special issue on Ramsey theory.

• Y. Kohayakawa, B. Nagle, e V. R¨odl, Ef-ficient testing of hypergraphs (extended abs-tract), ICALP 2002, 29th International Collo-quium on Automata, Languages, and Program-ming (M´alaga, Spain, July 2002), Lecture No-tes in Computer Science, Springer, Berlin, 2002, pp. 1017–1028.

• Y. Kohayakawa e B. Kreuter, The width of ran-dom subsets of Boolean lattices, J. Combin. The-ory Ser. A 100 (2002), no. 2, 376–386.

• Y. Kohayakawa, B. Kreuter, e D. Osthus, The length of random subsets of Boolean lattices, Random Structures Algorithms 16 (2000), no. 2, 177–194.

(16)

• Y. Kohayakawa, Szemer´edi’s regularity lemma for sparse graphs, Foundations of Computatio-nal Mathematics (Berlin, Heidelberg) (F. Cuc-ker e M. Shub, eds.), Springer-Verlag, January 1997, pp. 216–230.

• Y. Kohayakawa, T. Luczak, e V. R¨odl, On K4

-free subgraphs of random graphs, Combinatorica 17(1997), no. 2, 173–213.

• Y. Kohayakawa e B. Kreuter, Threshold functi-ons for asymmetric Ramsey properties involving

cycles, Random Structures and Algorithms 11 (1997), no. 3, 245–276.

• P.E. Haxell, Y. Kohayakawa, e T. Luczak, Tur´an’s extremal problem in random graphs: for-bidding odd cycles, Combinatorica 16 (1996), no. 1, 107–122.

• P.E. Haxell, Y. Kohayakawa, e T. Luczak, Tur´an’s extremal problem in random graphs: for-bidding even cycles, Journal of Combinatorial Theory, Series B 64 (1995), 273–287.

3. Pseudoaleatoriedade em combinat´oria e em teoria da computac¸˜ao

Um t´opico de bastante interesse em v´arias ´areas da matem´atica e teoria da computa¸c˜ao refere-se `a no¸c˜ao de objetos ‘t´ıpicos’ ou ‘pseudoaleat´orios’. Mencionamos um exemplo da teoria da complexidade computacional.

Em alguns contextos espec´ıficos, ´e poss´ıvel provar que algoritmos probabil´ısticos s˜ao mais ‘po-derosos’ que algoritmos determin´ısticos. Entretanto, um dos problemas fundamentais da ´area da teoria da complexidade ´e decidir se m´aquinas de Turing probabil´ısticas s˜ao efetivamente mais poderosas que m´aquinas determin´ısticas usuais. Este ponto est´a longe de ser esclarecido. Um re-sultado cl´assico que limita o poder computacional de processos aleat´orios, devido a Sipser, ´e que BPP⊂ Σ2.2 Muito grosseiramente falando, a prova desse resultado ´e baseada na construtibilidade

(de forma eficiente) de conjuntos pseudoaleat´orios pequenos Ω′que ‘tˆem o poder de simular’ espa¸cos

de probabilidade Ω maiores (de tamanho exponencial na entrada x, para o qual queremos decidir o problema de pertinˆencia “x ∈ L?”).

A id´eia de como um espa¸co menor Ω′

pode ‘simular’ um espa¸co maior pode ser descrita informal-mente como segue: basicainformal-mente, substitu´ımos o sorteio de um elemento ω ∈ Ω pelo sorteio de um elemento ω′

∈ Ω′

[gastando assim uma quantidade menor de aleatoriedade], ou (no caso em que Ω′

´e realmente pequeno) testamos todos os ω′ ∈ Ω, obtendo assim um algoritmo determin´ıstico. (Este

processo ´e uma das formas de se ‘desaleatorizar’ um algoritmo probabil´ıstico.)

A discuss˜ao acima procura ilustrar a utilidade de estruturas ‘pseudoaleat´orias’ construt´ıveis de forma eficiente. Ademais, para demonstrar que certas estruturas pseudoaleat´orias tˆem as proprie-dades relevantes, torna-se necess´ario investigar proprieproprie-dades t´ıpicas das estruturas em quest˜ao.

Neste subprojeto, estamos interessados na investiga¸c˜ao de estruturas discretas t´ıpicas, tendo em vistas aplica¸c˜oes em combinat´oria e em teoria da computa¸c˜ao. As t´ecnicas envolvidas na pesquisa que propomos s˜ao da ‘combinat´oria pura’, da teoria da probabilidade, da ´algebra, e da teoria aditiva dos n´umeros.

2BPP(bounded-error probabilistic polynomial ) ´e a classe das linguagens L tais que a pertinˆencia x ∈ L de uma palavra arbitr´aria x pode ser decidida em tempo polinomial com uma m´aquina de Turing probabil´ıstica, com probabilidade de erro limitada (n˜ao entraremos em detalhes aqui). A classe Σ2´e formada pelas linguagens L tais que a pertinˆencia x ∈ L

pode ser caracterizada pela express˜ao “∃z ∀w qL(x, z, w) = 1,” onde qL´e um predicado que pode ser verificado em

(17)

Estruturas ‘pseudoaleat´orias’ s˜ao de interesse devido a motiva¸c˜oes diversas. Naturalmente, de-pendendo da motiva¸c˜ao, a no¸c˜ao de pseudoaleatoriedade muda. Descrevemos abaixo muito breve-mente algumas perspectivas que s˜ao relevantes para este projeto.

3.1. A perspectiva de Blum, Goldwasser, Micali, e Yao. Sob o ponto de vista da ´area da complexidade computacional (ou desses autores, veja [17, 18, 65, 169]), a investiga¸c˜ao de estru-turas pseudoaleat´orias tem como princ´ıpio fundamental a filosofia de se considerar objetos como equivalentes se eles n˜ao podem ser distinguidos por algoritmos eficientes. Assim, a id´eia ´e inves-tigar como gerar objetos (ou bits) pseudoaleat´orios de forma determin´ıstica,3 tendo como crit´erio de ‘corre¸c˜ao’ do m´etodo a impossibilidade computacional de se distinguir os objetos gerados de objetos genuinamente aleat´orios, atrav´es de algoritmos de tempo polinomial.

Caso tais m´etodos para gerar estruturas pseudoaleat´orias sejam descobertos, ent˜ao poderemos desaleatorizar algoritmos probabil´ısticos. De fato, um algoritmo probabil´ıstico pode ser pensado como uma m´aquina de Turing usual M que recebe, al´em da entrada x, uma seq¨uˆencia de bits (genuinamente) aleat´orios y. Com base no par (x, y), a m´aquina M executa sua computa¸c˜ao (determin´ıstica). Para desaleatorizar este processo, poder´ıamos substituir y pela sa´ıda y′ de nosso

gerador de bits pseudoaleat´orios. Se y e y′ ao podem ser distinguidos eficientemente, ent˜ao a

m´aquina M seria ‘ludibriada’ pelo par (x, y′): ela devolveria a sa´ıda correta para a entrada x

(como se y′

fosse genuinamente aleat´orio).4

Aleatoriedade e pseudoaleatoriedade deste ponto de vista, fundamentado na teoria da complexi-dade computacional, ´e discutido por Goldreich [64] (veja tamb´em [63] e [118]).

3.2. Discrepˆancia. Diversos resultados das ´areas de algoritmos e complexidade computacional baseiam-se na constru¸c˜ao de subconjuntos Ω′ pequenos de um conjunto grande Ω, com Ωde

alguma forma refletindo as propriedades de Ω. Por exemplo, em v´arias aplica¸c˜oes, h´a um sistema de conjuntos S ⊂ 2Ω sobre Ω em que estamos interessados, mas desejamos reduzir o tamanho do

sistema (Ω, S): a id´eia ´e ent˜ao encontrar Ω′ ⊂ Ω de forma que o sistema S= {S ∩ Ω : S ∈ S} ´e

tal que o par (Ω′

, S′

) herda as propriedades relevantes de (Ω, S). Em muitos casos, a discrepˆancia de Ω′ em rela¸c˜ao ao sistema (Ω, S) ´e o que nos iteressa,5 e o problema se reduz em encontrar Ω

que tenha discrepˆancia pequena e cardinalidade pequena. Em v´arias situa¸c˜oes, tomando-se Ω′

Ω com cardinalidade adequada, de forma aleat´oria, obtemos um conjunto como procurado com alta probabilidade (quando existem). O problema ´e que em muitas circunstˆancias precisamos construir Ω′ de forma eficiente e determin´ıstica, e essa restri¸c˜ao torna este problema extremamente

dif´ıcil.

3Um pouco mais precisamente: queremos gerar uma seq¨uˆencia longa de bits pseudoaleat´orios a partir de seq¨uˆencia curta de bits genuinamente aleat´orios, atrav´es de um algoritmo determin´ıstico polinomial.

4Este esquema simplificado precisa ser elaborado, mas ele cont´em a id´eia b´asica: a substitui¸c˜ao dos bits genuinamente aleat´orios y por y′, gerado deterministicamente, mas de alguma forma ‘sofisticada’, simulando aleatoriedade.

5A discrepˆancia de Ωem rela¸c˜ao ao conjunto S ⊂ Ω ´e

˛

˛|S|/|Ω| − |S ∩ Ω′|/|Ω|˛

˛. (17)

A discrepˆancia de Ω′em rela¸c˜ao ao sistema (Ω, S) ´e o m´aximo das quantidades (17), onde o m´aximo ´e tomado sobre

(18)

Da literatura nesta linha, merece especial destaque a monografia The Discrepancy Method — Randomness and Complexity, de Chazelle [29]. Veja tamb´em Beck e Chen [13] e Matouˇsek [124]. 3.3. Grafos e estruturas correlatas. Sem d´uvida, o estudo de grafos, hipergrafos, e torneios pseudoaleat´orios j´a se encontra bastante desenvolvido. Podemos citar R¨odl [144] como um dos trabalhos iniciais nesta linha. Seguiram-se Frankl, R¨odl, e Wilson [58] e Thomason [162], que, independentemente, introduziram as t´ecnicas b´asicas da ´area. Estas investiga¸c˜oes ganharam uma estrutura mais uniforme com Chung, Graham, e Wilson [37] e Thomason [163].

Uma teoria muito mais complexa est´a sendo desenvolvida para estender os resultados dos tra-balhos acima para hipergrafos. Um trabalho ‘maximal’ nesta linha ´e Chung e Graham [34]. Veja tamb´em Chung [31, 32], Chung e Graham [33, 35], e Haviland e Thomason [76]. Uma contribui¸c˜ao nesta linha ´e um trabalho de Kohayakawa em conjunto com R¨odl e Skokan [91].

Resultados de impacto, devidos independentemente a W. T. Gowers e a V. R¨odl e seus co-autores e, mais recentemente, devidos a Alon, Elek, Lov´asz, Szegedy, e Tao, apontam para uma teoria de hipergrafos pseudoaleat´orios com grande aplicabilidade. Basicamente, esses autores tiveram sucessos substanciais na generaliza¸c˜ao do assim chamado m´etodo da regularidade de grafos para hipergrafos. O estudo dos fundamentos dessa ´area ser´a importante nesse projeto. Para mais detalhes sobre regularidade (no caso de grafos), veja a Se¸c˜ao 2.1.

Outra estrutura bastante estudada no contexto de pseudoaleatoriedade s˜ao subconjuntos de Z ou de Zn= Z/nZ. Um trabalho de nosso interesse nesta linha ´e Chung e Graham [36]. Tais estruturas

s˜ao tamb´em estudadas sob uma ´otica relacionada mas diferente por Mauduit e S´ark¨ozy (veja, por exemplo, [125]). Trabalhos de membros do grupo nessa linha s˜ao [2, 3].

3.4. Geometria fractal e complexidade de seq¨uˆencias. Um t´opico abordado por Mauduit e Moreira [126] ´e o estudo de conjuntos de seq¨uˆencias infinitas sobre alfabetos finitos com comple-xidade limitada por uma certa fun¸c˜ao. Pretendemos estudar propriedades geom´etricas e estimar dimens˜oes fractais generalizadas de tais conjuntos. Alguns resultados j´a foram obtidos nessa dire¸c˜ao, envolvendo aspectos dinˆamicos e combinat´orios.

3.5. T´opico espec´ıfico de pesquisa. Atacaremos o problema de relacionar os resultados discuti-dos nas Se¸c˜oes 3.1, 3.2, 3.3 e 3.4. Temos grande interesse nos sucessos espetaculares dessa ´area [10] e [11], que ilustram o impacto de t´ecnicas da ´area de complexidade computacional no problema do estabelecimento de cotas inferiores construtivas para problemas da teoria de Ramsey.

Problema 31. Explorar rela¸c˜oes entre a teoria da complexidade computacional e a combinat´oria, com o objetivo espec´ıfico de, entre outros, produzir constru¸c˜oes expl´ıcitas de objetos combinat´orios extremais.

3.6. Trabalhos anteriores. Membros do grupo tˆem feito contribui¸c˜oes na linha de pesquisa dis-cutida nesta se¸c˜ao; destacamos aqui os seguintes trabalhos:

• N. Alon, Y. Kohayakawa, C. Mauduit, C. G. Mo-reira, e V. R¨odl, Measures of pseudorandomness

(19)

• N. Alon, Y. Kohayakawa, C. Mauduit, C. G. Moreira, e V. R¨odl, Measures of pseudorandom-ness for finite sequences: minimal values, Com-bin. Probab. Comput. 15 (2006), no. 1–2, 1–29. • Y. Kohayakawa, V. R¨odl, M. Schacht, P. Sis-sokho, e J. Skokan, Tur´an’s theorem for pseudo-random graphs, J. Combin. Theory Ser. A 114 (2007), no. 4, 631–657.

• Y. Kohayakawa, V. R¨odl, e P. Sissokho, Embed-ding graphs with bounded degree in sparse pseu-dorandom graphs, Israel J. Math. 139 (2004), 93–137.

4. Algoritmos sobre estruturas discretas e aplicac¸˜oes

A pesquisa em fundamentos da ciˆencia da computa¸c˜ao, da matem´atica discreta e da otimiza¸c˜ao naturalmente leva ao desenvolvimento de algoritmos eficientes para uma variedade de problemas, advindos de diversas ´areas de aplica¸c˜ao.

Esta se¸c˜ao descreve os t´opicos mais aplicados desse projeto, que incluem resultados de anos de pesquisa b´asica em ´areas fundamentais, como grafos, topologia, teoria dos n´os, otimiza¸c˜ao cont´ınua e combinat´oria, autˆomatos, e t´opicos avan¸cados de algoritmos e estruturas de dados.

4.1. M´etodos computacionais e combinat´orios para variedades topol´ogicas. H´a mais de 20 anos, S. Lins e Mandel [109] propuseram uma representa¸c˜ao de variedades tridimensionais por meio de grafos aresta-coloridos, as chamadas Gemas. Ao longo dos anos, novas representa¸c˜oes combinat´orias foram propostas [27, 105, 106, 107, 108, 110], sendo as mais importantes strings e blinks. Estes ´ultimos s˜ao especialmente relevantes pelo fato de se poder decidir efetivamente se dois blinks representam a mesma variedade [84].

Durante o seu doutorado, L. Lins [104] produziu uma primeira vers˜ao de um sistema denominado BLINK, que consiste em uma linguagem para visualizar, reconhecer, classificar e manipular espa¸cos tridimensionais.

A pr´oxima etapa do projeto ´e continuar o desenvolvimento e implementa¸c˜ao do sistema com-putacional BLINK. Ele vai possibilitar a efetiva classifica¸c˜ao (a ser disponibilizada na Internet) de todas as 3-variedades fechadas e orientadas (espa¸cos) represent´aveis como framed links de at´e 9 cruzamentos.

Ademais, S. Lins tem um convite da World Scientific para elaborar uma monografia sobre este assunto cujo t´ıtulo provis´orio ´e: All Shapes of Spaces: Genealogy of Closed Oriented 3-Manifolds.

Um outro projeto computacionalmente ambicioso nesta linha ´e usar uma generaliza¸c˜ao da Teoria de Strings desenvolvida por Lins [107] para obter espa¸cos fechados 7-dimensionais aparecendo como gemas pequenas e muito sim´etricas. Os prot´otipos s˜ao S2×S1e CP2(induzido por gemas de apenas oito v´ertices) em dimens˜oes 3 e 4. Este projeto tem motiva¸c˜ao na quest˜ao central da Teoria de Strings em dimens˜ao 11 da F´ısica: qual a forma do espa¸co fechado de dimens˜ao 7 para multiplicar o espa¸co-tempo usual?

(20)

Do ponto de vista pr´atico, o melhor produto desenvolvido ´e o PACKMOL [123], um programa para empacotar mol´eculas em regi˜oes de diferentes tipos, usado em dinˆamica molecular.

O PACKMOL aborda o problema de achar uma configura¸c˜ao inicial como um problema de empa-cotamento de itens (discos, esferas, retˆangulos, etc.) em conjuntos convexos e o resolve utilizando t´ecnicas de otimiza¸c˜ao.

Alguns membros deste grupo tˆem trabalhado h´a v´arios anos em t´ecnicas de otimiza¸c˜ao cont´ınua e de otimiza¸c˜ao combinat´oria para problemas de empacotamento. Em particular, Birgin est´a en-volvido no aprimoramento do PACKMOL.

O problema espec´ıfico abordado pelo PACKMOL ´e modelado de forma tal que a distˆancia en-tre ´atomos de diferentes mol´eculas seja maior que uma distˆancia m´ınima previamente fixada. O principal inconveniente do modelo est´a relacionado ao custo de avalia¸c˜ao, que envolve o c´alculo da distˆancia entre todos os pares de ´atomos de mol´eculas diferentes. Utilizando algoritmos eficientes desenvolvidos para reduzir a complexidade computacional do chamado problema dos N-corpos [81], ´e poss´ıvel reduzir a complexidade computacional de avaliar o modelo. Mais ainda, o algoritmo resul-tante ´e fortemente paraleliz´avel. No presente projeto, pretendemos, entre outras coisas, trabalhar na implementa¸c˜ao paralela destas t´ecnicas.

Do ponto de vista te´orico, o conceito mais interessante introduzido por Birgin, Mart´ınez, Mas-carenhas e Ronconi [15] ´e o de sentinelas. Dados dois itens A e B, dizemos que SA⊆ A e SB ⊆ B

s˜ao sentinelas de A e B respectivamente se o fato de A e B possuirem um ponto interior comum implica necessariamente que um sentinela de A ´e interior a B ou que um sentinela de B ´e interior a A. Pretendemos consolidar a teoria pela qual sentinelas adequados em retˆangulos foram definidos. Possu´ımos atualmente uma teoria preliminar, completa mas excessivamente complicada.

4.3. Algoritmos lineares para an´alise de seq¨uˆencias. A combinat´oria das palavras tˆem ga-nhado bastante importˆancia recentemente com o desenvolvimento de algoritmos que possibilitem a an´alise, processamento e extra¸c˜ao de informa¸c˜oes em seq¨uˆencias cada vez mais compridas, sejam elas textos dispon´ıveis na internet, bibliotecas digitais ou seq¨uˆencias genˆomicas. Face `as dimens˜oes cada vez maiores destas seq¨uˆencias, algoritmos eficientes (lineares e at´e sublineares) tˆem sido cada vez mais requisitados.

Diversas formas de compara¸c˜oes de seq¨uˆencias acabam por recorrer `a solu¸c˜ao de problemas como alinhamento de seq¨uˆencias ou obten¸c˜ao de uma subseq¨uˆencia mais comprida que ´e comum `as seq¨uˆencias comparadas. Estes algoritmos s˜ao a grosso modo quadr´aticos, o que impossibilita sua aplica¸c˜ao a seq¨uˆencias muito compridas, como as do tamanho de um genoma completo. Por conta disto, no campo da biologia computacional por exemplo, v´arias heur´ısticas [6, 7, 140, 141, 161] tˆem sido introduzidas de forma a que se possa eliminar estas limita¸c˜oes.

Nem todo problema admite uma solu¸c˜ao eficiente, mas aqueles que admitem acabam por se tornar centrais. Tanto que novos modelos matem´aticos e boas heur´ısticas para problemas antes intrat´aveis sempre acabam por recorrer a estes problemas, na busca de solu¸c˜oes eficientes ainda que `

(21)

sufixos [46] e a obten¸c˜ao do menor ancestral comum [46] interferem na elabora¸c˜ao destes modelos de forma que os algoritmos e heur´ısticas resultantes possam valer-se delas. Este ´e o caso de diversas implementa¸c˜oes de alinhadores de seq¨uˆencias [12, 42] bem como ferramentas que se prestam ao estudo das repeti¸c˜oes numa seq¨uˆencia genˆomica [95].

De fato, as ´arvores de sufixos e as tabelas necess´arias `a resolu¸c˜ao do problema do menor an-cestral comum s˜ao duas das estruturas de dados mais avan¸cadas e importantes `a elabora¸c˜ao de algoritmos eficientes que possam ser utilizados no estudo de seq¨uˆencias extremamente compridas. Recentemente foi escrito por Lago e Simon [46] um livro que aborda novamente os dois problemas e foram tamb´em apresentados alguns algoritmos eficientes que constr˜oem e fazem uso eficiente destas estruturas.

Trˆes s˜ao os algoritmos mais conhecidos que constr˜oem uma ´arvore de sufixos em tempo linear no comprimento da palavra: o de Weiner [168], o de McCreight [128] e o algoritmo on-line de Ukko-nen [165]. O algoritmo de constru¸c˜ao em tempo linear da ´arvore de sufixos como ´e reapresentado por Lago e Simon [46] baseia-se no de McCreight [128] de forma a incluir duas generaliza¸c˜oes em rela¸c˜ao ao que ´e encontrado na literatura: (1) a palavra (string) cuja ´arvore de sufixos ´e constru´ıda pode possuir a ´ultima letra que n˜ao ´e distinta das anteriores; (2) os sufixos s˜ao tomados de um conjunto de v´arias palavras. Numa das aplica¸c˜oes apresentadas, o problema da busca de padr˜oes de comprimento m com at´e k erros (mismatches) num texto de comprimento n, ´e resolvido em tempo O(kn) (em contraposi¸c˜ao a uma solu¸c˜ao ingˆenua O(mn)) envolvendo as duas estruturas de dados acima mencionadas.

´

E nosso prop´osito, dentro deste t´opico, a amplia¸c˜ao da referida abordagem feita em rela¸c˜ao `as ´

arvores de sufixos de forma a incluir duas melhorias, sem detrimento das generaliza¸c˜oes anteriores: (1) aproveitando-se de id´eias de Ukkonen, alterar o algoritmo de constru¸c˜ao em tempo linear de forma que o mesmo seja on-line; (2) dado um conjunto dos sufixos da(s) palavra(s) em quest˜ao, construir em tempo linear ao tamanho do conjunto uma ´arvore de sufixos em que sejam soletr´aveis a partir da raiz apenas os sufixos presentes neste conjunto. Acreditamos que o prop´osito ´e vi´avel e original. Intencionamos tamb´em fazer um estudo de representa¸c˜oes eficientes dos autˆomatos que permeiam os algoritmos ora comentados.

Outro problema relacionado que nos interessa investigar ´e aquele da obten¸c˜ao de um fator (seg-mento) mais comprido de duas seq¨uencias com at´e k erros. O melhor algoritmo que conhecemos para resolver este problema tem tempo de execu¸c˜ao O(mn), onde m e n s˜ao os comprimentos das duas seq¨uˆencias. ´E nosso prop´osito investigar a possibilidade de se encontrar um algoritmo mais eficiente para o ´ultimo problema. Inspirados neste problema e no da busca de padr˜ao com erros, temos tamb´em o prop´osito de estudar altera¸c˜oes na estrutura de uma ´arvore de sufixos de forma a poder embutir o tratamento de erros. Acreditamos no entanto que o sucesso destes dois intentos ´e mais incerto e ambicioso.

(22)

conservadas; a identifica¸c˜ao de textos na internet que contenham uma dada palavra em tempo linear no n´umero de textos.

4.4. Quest˜oes algor´ıtmicas em biologia computacional. Os problemas discutidos na subse¸c˜ao anteriore j´a s˜ao de importˆancia para a ´area de biologia computacional. Aqui mencionamos mais dois problemas de nosso interesse advindos desta ´area.

4.4.1. Alinhamentos com invers˜oes. O alinhamento de seq¨uˆencias ´e amplamente utilizado [7] para compara¸c˜ao de seq¨uˆencias biol´ogicas onde s˜ao considerados apenas eventos biol´ogicos como muta¸c˜oes, inser¸c˜oes e dele¸c˜oes. Outros eventos biol´ogicos como invers˜oes n˜ao s˜ao automaticamente detectados pelos algoritmos usuais de alinhamento e algumas estrat´egias alternativas tˆem sido empregadas na tentativa de inclu´ırem invers˜oes ou outros tipos de rearranjos.

Apesar de muitos resultados importantes na ´ultima d´ecada, a complexidade do problema do alinhamento com invers˜oes ainda ´e desconhecida. Em 1992, Sh¨oniger e Waterman [155] propuseram a hip´otese simplificadora de que as invers˜oes n˜ao se sobrep˜oem. Eles tamb´em apresentaram uma solu¸c˜ao exata O(n6) para o problema do alinhamento sem a sobreposi¸c˜ao de invers˜oes, onde n ´e o comprimento da mais longa das duas seq¨uˆencias, e introduziram uma heur´ıstica que reduz a sua complexidade na pr´atica.

Lago, Muchnik, Kulikowski [44] obtiveram uma melhora substancial, apresentando algoritmos exatos relativamente simples, de programa¸c˜ao dinˆamica, para o problema simplificado. A com-plexidade de tempo destes algoritmos ´e de O(n4) e de espa¸co em O(n2) para alinhamentos sem

sobreposi¸c˜ao de invers˜oes. Isso foi melhorado ainda mais, com uma vers˜ao de implementa¸c˜ao exata e esparsa [8, 45, 167] desse procedimento, que usa muito menos recursos para algumas aplica¸c˜oes com dados reais.

Pretendemos continuar esta frente de pesquisa por exemplo na dire¸c˜ao de generalizar os resultados para diferentes tipos de alinhamentos e fun¸c˜oes de otimiza¸c˜ao.

4.4.2. Busca de regi˜oes altamente conservadas. Desde o completamento do rascunho do genoma humano, novos projetos de seq¨uenciamento tˆem sido desenvolvidos com a finalidade de serem com-parados ao genoma humano. A procura por regi˜oes altamente conservadas entre esp´ecies pr´oximas tem sido ferramenta cada vez mais utilizada no estudo das seq¨uˆencias obtidas. Muitos programas computacionais tˆem sido usados com este prop´osito, como VISTA [47, 127], GLASS, MUMmer [42], PipMaker [154], e tamb´em BLAST 2 Sequences [161].

Este tipo de an´alise tem sido amplamente utilizado como forma de complementar as ainda insa-tisfat´orias predi¸c˜oes gˆenicas baseadas unicamente em m´etodos estat´ısticos. Um dos membros deste projeto e colaboradores [132] conseguiram alguns resultados nesta linha, e pretendemos continuar o desenvolvimento de ferramentas computacionais com esta finalidade.

(23)

e tamb´em de livros mostrando o amadurecimento dessa sub´area, e o seu reconhecimento como uma disciplina importante.

V´arios membros deste grupo trabalham h´a anos com algoritmos de aproxima¸c˜ao. Assim, dando continuidade a esse trabalho, uma das linhas de pesquisa adotadas dentro deste t´opico ser´a a busca por tais algoritmos e, quando pertinente, por resultados de inaproximabilidade. A seguir, detalhamos alguns dos problemas dessa linha que pretendemos investigar. V´arios outros problemas de natureza semelhantes ser˜ao abordados dentro desse projeto.

4.5.1. ´Arvores geradoras com muitas folhas. Um dos problemas em que alguns membros deste grupo est˜ao trabalhando no momento ´e o seguinte.

Problema 32. Dado um grafo conexo, encontrar uma ´arvore geradora com n´umero m´aximo de folhas.

Sabe-se que o Problema 32 ´e NP-dif´ıcil. Um dos primeiros algoritmos de aproxima¸c˜ao para o Problema 32 foi obtido por Lu e Ravi [117], que apresentaram uma 3-aproxima¸c˜ao. Em seguida, Solis-Oba [156] melhorou esse resultado, exibindo uma 2-aproxima¸c˜ao. O algoritmo de Lu e Ravi baseia-se em trocas locais feitas a partir de uma ´arvore geradora inicial arbitr´aria. J´a o algoritmo de Solis-Oba constr´oi uma ´arvore partindo de um v´ertice, usando algumas regras simples que objetivam manter a ´arvore parcialmente constru´ıda “com bastante folhas”.

O caso especial em que o grafo de entrada ´e c´ubico tem sido bastante investigado. Esta vari-ante ainda continua NP-dif´ıcil. Lory´s e Zwo´zniak [112] apresentaram uma 7/4-aproxima¸c˜ao para Problema 32 restrito a grafos c´ubicos.

Um diamante ´e um circuito de comprimento quatro acrescido de uma corda. Recentemente, Bonsma [22] provou se G ´e um grafo conexo com grau m´ınimo pelo menos 3 e com d diamantes in-duzidos por v´ertices de grau 3, ent˜ao G tem uma ´arvore geradora com pelo menos ⌈(2n − d + 12)/7⌉ folhas. Mais recentemente, Correa, Fernandes, Matamala e Wakabayashi [40] obtiveram uma de-limita¸c˜ao inferior para o n´umero de folhas em uma ´arvores geradora do grafo dado que leva em considera¸c˜ao os diamantes presentes no grafo (n˜ao apenas o seu n´umero). Essa delimita¸c˜ao ´e sem-pre pelo menos t˜ao boa quanto a delimita¸c˜ao provada por Bonsma para grafos com grau m´ınimo pelo menos 3. A prova dessa delimita¸c˜ao ´e construtiva e fornece uma 5/3-aproxima¸c˜ao para o Pro-blema 32 em grafos c´ubicos, o que supera o resultado de Lory´s e Zwo´zniak [112]. Esses resultados ser˜ao apresentados em poucas semanas no WAOA 2007. Estamos tentando melhor´a-los, explorando certas id´eias novas que surgiram recentemente.

Temos tamb´em especial interesse em obter um algoritmo de aproxima¸c˜ao com raz˜ao melhor que 2 para o caso geral do Problema 32, ou ent˜ao provar algum resultado de inaproximabilidade mais forte do que o que se conhece at´e o momento.

4.5.2. Empacotamentos de subgrafos em grafos. Nesta linha, temos interesse tamb´em no seguinte problema.

(24)

Manic e Wakabayashi [121, 122] investigaram o caso em que F = {K3} e F = {K2, K3}, obtendo

novos algoritmos de aproxima¸c˜ao e alguns resultados de inaproximabilidade. Estes resultados est˜ao sendo estendidos para o caso em que F ´e uma fam´ılia de cliques [28].

Planejamos dar continuidade a esse trabalho, explorando novos algoritmos e considerando outras fam´ılias F.

4.6. M´etodos probabil´ısticos em otimiza¸c˜ao combinat´oria. Dentro deste t´opico, pretende-mos explorar as possibilidades de se obter cotas e solu¸c˜oes aproximadas de problemas NP-dif´ıceis de otimiza¸c˜ao combinat´oria aplicando um conjunto de t´ecnicas conhecido como m´etodo probabil´ıstico [5] `a an´alise de solu¸c˜oes aproximadas obtidas atrav´es da heur´ıstica conhecida como m´etodo gu-loso [39]. Espera-se ainda que os resultados obtidos sejam aplic´aveis `as vers˜oes on-line [25] dos mesmos problemas.

A metodologia proposta ser´a aplicada em um problema concreto de otimiza¸c˜ao combinat´oria. Trata-se de um problema em grafos que descrevemos a seguir. Seja G um grafo e ω : E(G) → Q uma fun¸c˜ao que atribui a cada aresta e de G um peso ω(e). Definimos o peso de um subgrafo H de G por ω(H) =P

e∈E(H)ω(e). O problema do subgrafo planar m´aximo ´e o seguinte.

Problema 34. Dados um grafo G e ω : E(G) → Q, encontrar um subgrafo planar H de G cujo peso ω(H) seja m´aximo.

O Problema 34 ´e NP-dif´ıcil [111, 26]. As tentativas de se obter solu¸c˜oes exatas para o Problema 34 de maneira eficiente apresentadas na literatura enquadram-se no esquema de enumera¸c˜ao inteligente do espa¸co de solu¸c˜oes, m´etodo conhecido como branch and bound [54] e sua variante baseada em programa¸c˜ao linear, conhecida como branch and cut [82]. Em ambos os m´etodos, ´e crucial para a viabilidade computacional do algoritmo a capacidade de se obter de maneira eficiente boas cotas inferiores para as instˆancias do problema examinadas ao longo do processo. Usualmente tais cotas s˜ao obtidas empregando heur´ısticas que fornecem solu¸c˜oes aproximadas (sub-´otimas) do problema. Dentre as heur´ısticas utilizadas para obter solu¸c˜oes aproximadas do Problema 34 [38, 48, 53, 55, 56, 62, 103] (veja [26] para uma an´alise comparativa), uma das que apresenta melhor desempenho ´e a conhecida como algoritmo guloso, detalhada mais adiante. Apesar de fornecer cotas inferiores de ´

otima qualidade para o problema, esta heur´ıstica n˜ao pode ser considerada “eficiente” no sentido acima empregado, pois envolve a execu¸c˜ao de um teste de planaridade para cada aresta do grafo dado. Como um teste de planaridade de um grafo de n v´ertices toma tempo Ω(n) e uma instˆancia do Problema 34 pode ter Ω(n2) arestas, o tempo necess´ario para calcular cada cota inferior seria Ω(n3). Mesmo a possibilidade de efetuar testes incrementais de planaridade proposta por Carmo [26] n˜ao pode ser considerada eficiente nesse sentido, pois o custo computacional para a determina¸c˜ao de cada cota seria ainda Ω(n2).

(25)

A explica¸c˜ao para esta lacuna t˜ao substancial entre as garantias te´oricas de aproxima¸c˜ao e os valores observados experimentalmente parece ocultar-se na correla¸c˜ao entre a distribui¸c˜ao dos valores de ω e a “evolu¸c˜ao” (no sentido de [52]) do grafo constru´ıdo pelo algoritmo guloso. Nossa proposta, portanto, pode ser entendida como sendo a de explorar esta correla¸c˜ao e suas implica¸c˜oes. O algoritmo guloso para o Problema 34 consiste em tomar o subgrafo H de G dado por V (H) = V (G) e E(H) = ∅ e da´ı examinar as arestas de G em ordem n˜ao-decrescente dos valores de ω. Para cada aresta e examinada, se H + e ´e planar, acrescenta-se e a H. Neste caso dizemos que a aresta e ´e aceita. Caso contr´ario, dizemos que a aresta e ´e rejeitada. Um subgrafo planar de G obtido atrav´es deste algoritmo ser´a chamado de subgrafo planar guloso de G.

Seja G um grafo completo de n v´ertices e L = (e1, e2, . . . , eN), com N = n2, uma lista

ordenada de suas arestas. Definimos as seq¨uˆencias de grafos GL

i e HiL, para i = 0, . . . , N , onde V (GLi ) = V (HiL) = V (G), E(GLi ) = {ej| 1 ≤ j ≤ i} e E(HiL) =   

E(Hi−1L ) ∪ {ei}, se Hi−1L + ei ´e planar

E(HL

i−1), caso contr´ario.

A seq¨uˆencia GLi ´e conhecida como um grafo em processo (graph process) no estudo de grafos aleat´orios e apresenta caracter´ısticas de grande interesse tanto te´orico como pr´atico, representando um dos modelos de grafo aleat´orio mais bem estudados [20]. Um subgrafo planar guloso de G constru´ıdo a partir da seq¨uˆencia L ´e, por sua vez, o resultado final do processo HL

i , isto ´e, o

grafo HNL.

Observe que os processos GLi e HiL, apesar de relacionados, s˜ao diferentes. Por exemplo, ambos coincidem at´e o instante t em que Gt deixa de ser um grafo planar. Colocado em termos

pro-babil´ısticos, isto ´e, considerando o espa¸co de probabilidades dado pelas N ! possibilidades para L, dir´ıamos que GLi e HiL passam a divergir no limiar da planaridade, quando (t − n/2)n−2/3 → ∞ [119].

Em outras palavras, considere a seq¨uˆencia bin´aria A(L) = (a1, . . . , aN) das arestas aceitas pelo

algoritmo guloso, dada por ai = 1 se e somente se ei ∈ E(Hi). Como o peso do subgrafo planar

guloso de G ´e dado por

ω(HNL) =

N

X

i=1

aiω(ei),

o conhecimento do comportamento da seq¨uˆencia A(L) aliado ao conhecimento da distribui¸c˜ao de ω permite a determina¸c˜ao (ou a estimativa, conforme o caso) do valor de ω(HN), sem a necessidade

de testes de planaridade ou outro processamento computacionalmente custoso, oferecendo assim uma alternativa muito interessante para a determina¸c˜ao de solu¸c˜oes exatas do problema.

Considere agora a vers˜ao do Problema 34 “em tempo real”, isto ´e, a cada aresta ei examinada,

o algoritmo deve decidir de maneira irrevog´avel se aceita ou n˜ao ei. Este problema constitui a

Referências

Documentos relacionados

Objeto: Pregão Eletrônico - Re- gistro de Preços para a eventual aquisição de materiais de audiovisual e tecnologia da informação para atender ao Campus Blumenau da

Foram desenvolvidas duas formulações, uma utilizando um adoçante natural (stévia) e outra utilizando um adoçante artificial (sucralose) e foram realizadas análises

libras ou pedagogia com especialização e proficiência em libras 40h 3 Imediato 0821FLET03 FLET Curso de Letras - Língua e Literatura Portuguesa. Estudos literários

Quanto ao tratamento periodontal em pacientes com coagulopatas hereditárias, é correto afirmar: a Polimentos coronarianos devem ser realizados de maneira esporádica, pois

A Corticeira Amorim (CA), apresenta uma estrutura repartida, na medida em que é constituída por um conjunto de UN semiautónomas (Amorim Revestimentos, Matérias

Segundo o mesmo autor, a animação sociocultural, na faixa etária dos adultos, apresenta linhas de intervenção que não se esgotam no tempo livre, devendo-se estender,

[r]

Promovido pelo Sindifisco Nacio- nal em parceria com o Mosap (Mo- vimento Nacional de Aposentados e Pensionistas), o Encontro ocorreu no dia 20 de março, data em que também