Algoritmos Sweep-Line e a Distˆancia de Manhattan

(1)

Algoritmos Sweep-Line e a Distˆ ancia de Manhattan

Lu´ıs Fernando Schultz Xavier da Silveira 4 de mar¸co de 2011

Resumo

Dada uma lista denretângulos no plano com os lados alinhados aos eixos, é poss´ıvel computar a área da união destes retângulos e um ponto coberto por uma quantidade máxima deles emO(nlogn) através de algoritmos sweep-line.

Definindo por diamante o lugar geométrico dos pontos que distam não mais do que uma certa distância de uma certa origem, onde a no¸cão de distância é dada pela distância de Manhattan, também é poss´ıvel, dada uma lista dendiamantes, calcular a área da união dos diamantes e exibir um ponto de cobertura máxima por estes diamantes emO(nlogn). Isto pode ser feito rotacionando o plano em 45 graus, pois esta transforma¸cão mapeia diamantes em quadrados ao mesmo tempo em que ela preserva a área da união e estabelece uma correspondência bijetiva entre pontos de cobertura máxima.

Quando observamos o plano como umgrid infinito de células, a defini¸cão análoga para um retângulo é a de uma matriz finita de células e a defini¸cão análoga para um diamante é a do conjunto de células que distam não mais do que uma certa distância de uma certa célula de origem na distância de Manhattan. No entanto, embora a versão do problema para retângulos ainda admita a mesma solu¸cão que o caso anterior, a versão para diamantes não mais admite a redu¸cão à versão para retângulos, uma vez que não é verdade que a rota¸cão dogrid em 45 graus mapeia diamantes em quadrados.

Felizmente, ainda é poss´ıvel resolver o problema para n diamantes em O(nlogn) através de uma redu¸cão ao caso dos retângulos. Porém, esta redu¸cão é um pouco mais complexa que a anterior.

O objetivo deste trabalho ´e apresentar esta redu¸c˜ao e implementar rotinas para resolver este problema.

Sum´ ario

1 Cr´editos 2

2 Introdu¸c˜ao 2

3 Enunciando os Problemas 3

3.1 Grids, Retˆangulos, Diamantes e ´Areas . . . 3

3.2 Coberturas . . . 4

3.3 Os Problemas para Retˆangulos . . . 4

3.4 Os Problemas para Diamantes . . . 4

4 Solu¸cões Sweep-Line para os Problemas para Retângulos 5 4.1 A Idéia dos AlgoritmosSweep-Line . . . 5

4.2 Eventos eSweep-Lines . . . 5

4.3 Os Algoritmos . . . 6

4.4 O Papel de Estruturas de Dados nos AlgoritmosSweep-Line. . . 9

4.5 Compress˜ao de Coordenadas . . . 10

(2)

4.5.1 Defini¸c˜ao . . . 10

4.5.2 C´alculo . . . 11

4.5.3 Aplica¸c˜oes . . . 13

4.6 Arvores de Segmentos . . . .´ 14

4.6.1 Introdu¸c˜ao . . . 14

4.6.2 Arvores de Segmentos para o Problema CCMR . . . .´ 15

4.6.3 Arvores de Segmentos para o Problema AUR . . . .´ 18

4.6.4 An´alise de Complexidade . . . 23

4.6.5 Implementa¸c˜oes Iterativas . . . 25

4.7 Alternativas `as ´Arvores de Segmentos . . . 28

5 Uma Redu¸cão dos Problemas dos Diamantes aos dos Retângulos 30 6 Implementa¸cão em C 33 6.1 Defini¸cões . . . 33

6.2 Utilit´arios . . . 34

6.3 Ordena¸c˜ao . . . 34

6.4 Compress˜ao de Coordenadas . . . 35

6.5 Gera¸c˜ao de Eventos . . . 36

6.6 Arvores de Segmentos . . . .´ 36

6.7 CCMR e AUR . . . 37

6.8 O Programa Principal . . . 38

1 Cr´ editos

As seguintes pessoas deram uma contribui¸c˜ao importante ao conte´udo deste trabalho:

• Joel Uchoa: propôs o problema do cálculo do número de diamantes que cobrem a célula mais coberta por diamantes no grid como uma questão para a prova de sele¸cão dos participantes brasileiros na Olimp´ıada Internacional de Informática (IOI) 2010.

• Wanderley Guimarães: realizou nossa primeira implementa¸cão do algoritmo aqui proposto para resolver este problema e observou que, com ligeiras modifica¸cões, ele poderia ser transformado num algoritmo que resolve o problema do cálculo da área da união de diamantes nogrid.

2 Introdu¸ c˜ ao

Diversos problemas fundamentais em geometria computacional admitem solu¸cões eficientes através de algoritmos sweep-line. Por exemplo, o problema do cálculo dos m pontos de interseçcão determinados porn segmentos de reta no plano pode ser resolvido emO(m+nlogn)[12], o problema da exibi¸cão de dois pontos de distância m´ınima dentrenpontos no plano pode ser resolvido em O(nlogn)[12], o problema da constru¸cão do diagrama de Voronoi de n pontos no plano pode ser resolvido em O(nlogn)[9] e o problema da constru¸cão do casco convexo de um conjunto denpontos no plano admite uma solu¸cão muito mais compacta e simples [1], ainda emO(nlogn), do que o tradicionalGraham-Scan [10].

Dois outros problemas são de fundamental importância para este trabalho. Dada uma lista denretângulos nogrid (ou no plano com os lados alinhados aos eixos), eles se referem ao cálculo da área da união destes retângulos e da

(3)

exibi¸cão de uma célula nogrid (ou de um ponto no plano) que pertence a uma quantidade máxima de retângulos.

Ambos os problemas podem ser resolvidos emO(nlogn) atrav´es de algoritmossweep-line [12].

Diamantes são o lugar geométrico dos pontos que distam não mais do que uma certa distância, o raio do diamante, de uma certa origem em rela¸cão à distância de Manhattan. Mais especificamente, se a origem for (x0, y0) e o raio forr, o diamante será o conjunto{(x, y) :|x−x0|+|y−y0|6r}.A figura 1 mostra o formato geral de diamantes no plano e nogrid.

Figura 1: Um diamante no plano e um diamante de raio 3 nogrid, respectivamente.

No plano, diamantes podem ser facilmente transformados em quadrados através de uma rota¸cão de 45 graus. Por causa disto, o problema de, dada uma lista de ndiamantes no plano, computar a área da união destes diamantes e um ponto que pertence a uma quantidade máxima deles pode ser facilmente reduzido ao problema análogo para retângulos. Diamantes no grid, contudo, não admitem uma transforma¸cão simples, no nosso conhecimento, para que a versão do problema nogrid possa ser reduzida de forma similar.

Nas próximas se¸cões nós iremos definir os problemas de computar a área da união e uma célula de cobertura máxima para retângulos e diamantes nogrid de forma formal, iremos apresentar as solu¸cõessweep-line para os problemas dos retângulos no grid (que na verdade são essencialmente as mesmas para retângulos no plano) e iremos derivar uma transforma¸cão efetiva, embora não tão simples quanto uma rota¸cão, para que possamos converter o problema dos diamantes no grid no problema dos retângulos no grid. Ao final, iremos ainda apresentar implementa¸cões na linguagem C de rotinas que resolvem estes problemas.

3 Enunciando os Problemas

Nesta se¸cão iremos enunciar formalmente os problemas de calcular a área da união e uma célula de cobertura máxima em suas versões para retângulos e diamantes, ambos nogrid.

3.1 Grids, Retˆ angulos, Diamantes e ´ Areas

O grid é o conjunto dos pontos do plano de coordenadas inteiras, Z². No entanto, é comum interpretar o grid, ao menos para fins de visualiza¸cão do conceito de área, como uma associa¸cão entre pontos (x, y)∈Z² do plano e regiões da forma [x, x+ 1]×[y, y+ 1], denominadas células.

Defini¸c˜ao 1. Denotaremos o conjunto dos n´umeros inteiros entre a∈Zeb∈Zpor [a..b] ={x∈Z:a6x6b}.

Note que [a..b] ={}sea > b.

Defini¸cão 2. Umretânguloé um subconjunto dogridda forma[x0..x1]×[y0..y1], ondex0, y0, x1, y1∈Z,x06x1

ey06y1.

Defini¸c˜ao 3. Um diamante´e um subconjunto do gridda forma

D((x0, y0), r) ={(x, y)∈Z²:|x−x0|+|y−y0|6r}, onde(x0, y0)∈Z² ´e o centrodo diamante er∈N´e seuraio.

(4)

Defini¸cão 4. A áreade um subconjunto finitoX do gridé A(X) = #X, a cardinalidade deX.

A área é interpretada mais facilmente entendendoX como um conjunto de células, todas de área unitária.

3.2 Coberturas

SejaR= [R0, R1, . . . , R_n−1] uma lista finita densubconjuntos de um certo conjunto Ω6={}.

Defini¸cão 5. O número de coberturas dex∈ΩporRé

ρ^Ω_R(x) = #{i∈[0..n−1] :x∈R_i}.

Defini¸cão 6. O número máximo de coberturas de um elemento deΩ porRé ρ^Ω_R = max

x∈Ω{ρ^Ω_R(x)}.

Este número está bem definido porqueρ^Ω_R(x) é limitado superiormente pornpara todox∈Ω6={}.

Defini¸c˜ao 7. O conjunto dos elementos cobertos pork∈Nelementos deR´e σ^Ω_R(k) ={x∈Ω :ρ^Ω_R(x) =k}.

Defini¸cão 8. O conjunto dos elementos de cobertura máxima (em rela¸cão a R) é σ^Ω_R=σ_R^Ω(ρ^Ω_R).

3.3 Os Problemas para Retˆ angulos

O problema do cálculo da área da união de retângulos no grid (AUR) pode ser descrito da seguinte forma: na entrada serão dados um número natural n ∈ N e n quádruplas de números inteiros (x_0,i, y_0,i, x_1,i, y_1,i) ∈ Z⁴, i∈[0..n−1], satisfazendox_0,i6x_1,i ey_0,i6y_1,ipara todoi, e na sa´ıda será pedido o número natural

A

n−1

[

i=0

[x0,i..x1,i]×[y0,i..y1,i]

! .

Já o problema do cálculo de uma célula de cobertura máxima por retângulos nogrid (CCMR) pode ser descrito de forma similar: na entrada serão dados um número naturalnenquádruplas de números inteiros (x0,i, y0,i, x1,i, y1,i)∈ Z⁴,i∈[0..n−1], satisfazendox0,i6x1,iey0,i6y1,i para todoi, e na sa´ıda será pedida uma célula (x, y)∈Z²do grid satisfazendo (x, y)∈σ_R^Z², ondeR= [R0, R1, . . . , R_n−1] é uma lista de nretângulos tais queRi = [x0,i..x1,i]× [y0,i..y1,i] para todoi.

3.4 Os Problemas para Diamantes

O problema do cálculo da área da união de diamantes nogrid (AUD) pode ser definido da seguinte maneira: na entrada serão apresentados um número naturaln∈Nentriplas de números (xi, yi, ri)∈Z×Z×N,i∈[0..n−1], e na sa´ıda será requisitado o número natural

A

n−1

[

i=0

D((xi, yi), ri)

! .

Ainda, o problema do cálculo de uma célula de cobertura máxima por diamantes no grid (CCMD) pode ser especificado como segue: na entrada serão colocados um número naturaln∈Nentriplas de números (xi, yi, ri)∈ Z×Z×N, i ∈[0..n−1], e na sa´ıda será pedida uma célula (x, y)∈ Z² dogrid satisfazendo (x, y) ∈σ^Z_R², onde R= [R0, R1, . . . , Rn−1] é uma lista dendiamantes nogrid tais queRi=D((xi, yi), ri) para todoi.

(5)

4 Solu¸ c˜ oes Sweep-Line para os Problemas para Retˆ angulos

Nesta se¸cão iremos mostrar como os problemas AUR e CCMR podem ser eficientemente resolvidos através de algoritmos sweep-line. Partes dos algoritmos descritos aqui serão deixadas em aberto até que tenhamos realizado um estudo de árvores de segmentos na se¸cão 4.6.

4.1 A Id´ eia dos Algoritmos Sweep-Line

Algoritmos sweep-line em geral se baseiam em invariantes que as instâncias do problema obedecem em um dos semi-planos determinados por uma reta (asweep-line, que é usualmente vertical) e em estratégias eficientes para manter essas invariantes mediante o deslocamento desta reta.

Por exemplo, no caso do problema AUR, podemos considerar a área α da união da interseçcão dos retângulos com o conjunto das células de abscissa menor que um certo valor x₀. Se asweep-line se deslocar para uma nova abscissax₁ (x₀6x₁) e o conjuntoY das ordenadas das células que estão na união dos retângulos e possuem como abscissa a abscissa dasweep-linenão variar conforme asweep-linese desloca assumindo coordenadas em [x0..x1−1], temos que a área da união da interseçcão dos retângulos com o conjunto das células de abscissa menor quex1será α+ (x1−x0)×#Y. A figura 2 ilustra esta idéia.

Figura 2: A ´area adicionada quando asweep-line se desloca dex₀parax₁.

4.2 Eventos e Sweep-Lines

Se imaginamos que uma linha, a sweep-line, se desloca da esquerda para a direita por todo o plano, é natural a no¸cão de evento. Um evento ocorre quando a sweep-line encontra um lado vertical de um dos retângulos. Na realidade, se estamos trabalhando no grid, um evento ocorre quando a sweep-line, que é uma coluna infinita de células, cobre a primeira coluna de um retângulo (um evento de entrada) ou deixa de cobrir a última coluna de um retângulo (um evento de sa´ıda).

Mais ainda, eventos possuem um ordenamento natural dado pelo “tempo” de ocorrência dos mesmos. É processando eventos nessa ordem que os algoritmossweep-line irão se desenrolar.

Defini¸c˜ao 9. O espa¸co de eventos´e o conjunto

E ={(x, a, b, t)∈Z×Z×Z× {+,−}:a6b}.

(6)

Um evento é um elemento e= (x, a, b, t)∈ E. Chamaremos de a abscissa do evento o valor x, de o intervalo de ordenadasdo evento o conjunto [a..b] e de otipodo evento o s´ımbolot. Set= +, diremos que o evento é um evento de entradae se t=−, diremos que o evento é um evento de sa´ıda.

Defini¸cão 10. Aordem de execu¸cãode eventos é um ordenamento parcial ≺⊆ E × E definido por (x, a, b, t)≺(x⁰, a⁰, b⁰, t⁰)⇐⇒x < x⁰.

Seja ent˜aoR= [R0, R1, . . . , Rn−1] uma lista denretˆangulos nogrid, onde Ri = [x0,i..x1,i]×[y0,i..y1,i] para cada i∈[0..n−1].

Defini¸c˜ao 11. Definimos umalista de eventos geradosporRcomo um ordenamento da lista[e₀, e₁, . . . , e_2n−1] pelo ordenamento parcial≺, onde

e2i = (x0,i, y0,i, y1,i,+) e e2i+1= (x1,i+ 1, y0,i, y1,i,−) para todo i∈[0..n−1].

4.3 Os Algoritmos

Aqui iremos definir formalmente os algoritmos que iremos empregar para resolver os problemas AUR e CCMR.

Come¸camos mostrando um algoritmo para gerar uma lista de eventos paraR.

Gera-Lista-de-Eventos(R):

1 E ←uma lista de 2nelementos 2 para ide0at´en−1fa¸ca 3 E2i←(x0,i, y0,i, y1,i,+) 4 E2i+1←(x1,i+ 1, y0,i, y1,i,−) 5 ordene E por≺

6 retorneE

Dado que podemos ordenar um vetor de nelementos emO(nlogn) como descrito em [2], este algoritmo pode ser implementado emO(nlogn) tamb´em.

Agora iremos exibir um algoritmo para resolver o problema AUR.

Area-da-Uni˜´ ao-de-Retˆangulos(R):

1 E←Gera-Lista-de-Eventos(R) 2 S←uma lista vazia

3 α←0

4 para i de 0 at´e 2n−2 fa¸ca 5 (x, a, b, t)←E_i

6 set= + ent~ao

7 insere (a, b) emS

8 sen~ao

9 remove uma c´opia de (a, b) deS 10 (x⁰, a⁰, b⁰, t⁰)←E_i+1

11 α←α+ (x⁰−x)·# [

(a,b) emS

[a..b]

12 retornea

O estado deste algoritmo durante sua execu¸cão é composto duas variáveis: S eα. Sé uma lista de pares ordenados representando intervalos não-vazios de números inteiros eαé um número natural. Inicialmente, é computada uma lista de eventos E gerada por R. A principal invariante deste algoritmo é que, toda a vez que ele chega na linha 4, antes de testar a condi¸cão doloop, a área da união das interseçcões dos retângulos em Rcom o conjunto das células de coordenadasxmenores quexi, ondexié a abscissa doi-ésimo evento emE, é igual aα. Ainda, irá valer

(7)

que sempre quexi < xi+1, quando o algoritmo estiver executando a linha 11, o conjunto das ordenadas das células na união dos retângulos emRde abscissaxserá o mesmo para todoxsatisfazendoxi6x < xi+1 e este conjunto poderá ser expresso como a união dos intervalos emS.

Brevemente demonstraremos a corretude deste algoritmo com base no que foi descrito anteriormente. Porém, antes disso, cabe dizer que é poss´ıvel implementá-lo emO(nlogn) se utilizarmos uma estrutura de dados apropriada para manter a listaS. Mais detalhes de como isto pode ser feito estão nas se¸cões 4.4, 4.5 e 4.6.

Teorema 1. O algoritmo Area-da-Uni˜´ ao-de-Retângulos(R)corretamente computa a área da união da lista de retângulosR.

Demonstra¸cão. Após o cálculo de uma lista de eventos gerados por R na linha 1, defina xi como a abscissa do eventoEi.

A demonstra¸cão será baseada na seguinte invariante deloop: toda vez que o algoritmo passa pela linha 4 (antes de executar a compara¸cão doloop), é válido queα= #A_i, onde

Ai =





 (x, y)∈

n−1

[

j=0

Rj :x < xi





 .

Como a lista E está ordenada por ≺, x0 6xi para todoi. Ainda, cada célula (x, y) de um retângulo é tal que xu6x < xv para ´ındices uev, e assimx06x, donde conclu´ımos queA0={}. Mas como inicializamosαcomo 0 na linha 3, temos que come¸camos a invariante corretamente.

Suponha agora que a invariante valha quando entramos na linha 4 para um determinado valor dei. Sexi=xi+1, temos que o valor deαficará o mesmo e, por defini¸cão,Ai=Ai+1, e assim a invariante será trivialmente mantida.

Suponha então, sem perda de generalidade, que x_i < x_i+1. Considere então que o algoritmo foi executado até a linha 11 (não a tendo executado ainda). Seja então

C(x) =







y∈Z: (x, y)∈

n−1

[

j=0

R_j





 .

Chamaremos deC(x) o corte dos retˆangulos na abscissax.

Gostar´ıamos de demonstrar queC(x) =C(xi) para todoxsatisfazendox_i 6x < x_i+1. Fixe então umxsatisfazendo esta restri¸cão. Vamos mostrar quey ∈ C(x)⇐⇒y∈ C(x_i) para todoy∈Z. Suponha então quey∈ C(x_i). Existe então um retânguloR_j tal que (x_i, y)∈R_j. Logox_0,j 6x_i6x_1,j. Masx_1,j >x_i+1−1, pois do contrário o evento de sa´ıda deR_j teria abscissax_1,j+ 1, masx_i< x_1,j+ 1< x_i+1, contradizendo a listaE estar ordenada por≺(este evento deveria vir antes do eventoi+ 1 e depois do eventoi). Logox0,j 6xi6x6x1,j, poisx < xi+16x1,j+ 1.

Assim a célula (x, y) também pertence aRj ey∈ C(x). A prova dey∈ C(x) =⇒y∈ C(xi) é análoga.

Agora mostraremos que

C(xi) = [

(a, b) emS

[a..b].

Para isso, considere um retângulo Rj. Se x1,j < xi, temos que seu evento de sa´ıda tem abscissa x1,j + 1 6xi e portanto já foi processado. Assim, a cópia que seu evento de entrada deixou emS já foi retirada. Similarmente, sex0,j > xi, seu evento de entrada ainda não foi processado e assim seu evento de sa´ıda ainda não foi processado.

Portanto nenhum evento gerado por este retângulo afetou a lista S ainda. Finalmente, se x0,j 6xi 6x1,j, seu evento de entrada (abscissax0,j 6xi) já foi processado mas seu evento de sa´ıda (abscissax1,j+ 1> xi) ainda não e, portanto, S contém uma cópia do intervalo de ordenadas [ai..bi] de Rj. Assim, conclu´ımos que S é uma lista contendo uma cópia de cada intervalo de ordenadas de retângulos que intersectam{(xi, y) :y∈Z}, a sweep-line, e assim o resultado segue.

Para manter a invariante, precisamos somar emαo valor #B, onde

B=





 (x, y)∈

n−1

[

j=0

Rj:xi6x < xi+1





 ,

(8)

poisAi∩B={}eAi∪B =Ai+1. Mas

#B=

x_i+1−1

X

x=xi

#







y∈Z: (x, y)∈

n−1

[

j=0

R_j







=

x_i+1−1

X

x=xi

#C(x) = (x_i+1−x_i)#C(x_i).

E isso mostra que o assinalamento deαna linha 11 preserva o invariante.

Dessa forma acabamos de demonstrar que este invariante deloop´e preservado durante toda a execu¸c˜ao do algoritmo e assim que, em particular, ele vale na passagem pela linha 4 quandoi= 2n−1.

Porém, por um argumento similar ao que fizemos no in´ıcio da demonstra¸cão, não há célula na união dos retângulos com abscissa maior ou igual ax_2n−1, e assim

#A_2n−1= #

n−1

[

j=0

R_j.

Mas comoα= #A_2n−1, temos que o algoritmo retorna o valor correto na linha 12, e isso conclui a sua prova de corretude.

Iremos agora exibir um algoritmo para tratar do problema CCMR.

C´elula-de-Maior-Cobertura(R):

1 E←Gera-Lista-de-Eventos(R) 2 S←uma lista vazia

3 ρ←0

4 (x^∗, y^∗)←(0,0)

5 para i de 0 at´e 2n−2 fa¸ca 6 (x, a, b, t)←Ei

7 set= + ent~ao

8 insere (a, b) emS

9 sen~ao

10 remove uma c´opia de (a, b) deS 11 (x⁰, a⁰, b⁰, t⁰)←E_i+1

12 sex6=x⁰ ent~ao

13 ρ⁰ ←ρ^Z_S

14 seρ⁰> ρent~ao

15 ρ←ρ⁰

16 x^∗←x

17 y^∗←algu´em emσ_S^Z 18 retorna(x^∗, y^∗)

Os comentários e a demonstra¸cão da corretude deste algoritmo a seguir serão análogos aos do algoritmo anterior.

O estado deste algoritmo é constitu´ıdo de quatro variáveis: S, ρ, x^∗ e y^∗. S é uma lista de pares ordenados representando intervalos não-nulos de números inteiros,ρé um número natural e (x^∗, y^∗)∈Z² são as coordenadas de uma célula do grid. No in´ıcio do algoritmo é calculada uma lista de eventosEgerada porR. A invariante mais importante que este algoritmo irá manter é que, toda vez que ele passa pela linha 5 (antes de testar a condi¸cão do loop), (x^∗, y^∗) é um ponto coberto por uma quantidade máxima de elementos na lista da interseçcão dos retângulos em Rcom o conjunto de células dogrid com abscissa xmenor do que x_i, x_i sendo a abscissa do i-ésimo evento deE, e ρé a quantidade destes elementos cobrindo (x^∗, y^∗). Ainda, sempre quex_i < x_i+1 para algum i, quando o algoritmo estiver passando pela linha 12 (antes de executá-la), a lista dos intervalos de ordenadas das células de um retângulo de Rque possuem abscissaxserá, a menos de uma permuta¸cão, a mesma para todo xsatisfazendo x_i6x < x_i+1. Além disso, esta lista será, após os intervalos vazios serem removidos, uma permuta¸cão deS.

Antes de provarmos que este algoritmo funciona corretamente, cabe dizer que se utilizarmos uma estrutura de dados apropriada para implementar a lista S, podemos fazer com que ele execute emO(nlogn). Mais detalhes de como isso pode ser feito est˜ao nas se¸c˜oes 4.4, 4.5 e 4.6.

Teorema 2. O algoritmo C´elula-de-Maior-Cobertura(R)corretamente computa uma c´elula emσ_R^Z².

(9)

Demonstra¸cão. Após a execu¸cão da linha 1, onde obtemos uma listaE de eventos gerados por R, definaxi como a abscissa doi-ésimo evento.

A demonstra¸cão terá como base a seguinte invariante deloop: toda vez que o algoritmo passa pela linha 5 (antes de executar a compara¸cão doloop), é válido que

ρ=ρ^Z_A²

i e (x^∗, y^∗)∈σ_A^Z²

i, ondeA_i´e a lista denelementos

{(x, y)∈R_j:x < x_i}ⁿ⁻¹_j=0 .

Como E foi ordenado por≺, xi 6xi+1 para todo i. Além disso, pelo modo como foram gerados os eventos, cada célula (x, y) de um retângulo é tal quexu6x < xvpara ´ındicesuev, e assimx06x, e portanto a listaAicontém apenas intervalos vazios no in´ıcio do algoritmo. Dessa forma, a inicializa¸cão deρcomo 0 e a de (x^∗, y^∗) como um ponto qualquer são suficientes para come¸car a invariante corretamente.

Suponha então que a invariante valha quando entramos na linha 5 para um determinado valor dei. Sexi=xi+1, a listaAi não muda incrementandoi(Ai=Ai+1) e, pela checagem feita na linha 12, os valores deρ,x^∗ ey^∗também não. Portanto nesse caso a invariante é mantida trivialmente.

Suponha então, sem perda de generalidade, quex_i < x_i+1. Considere então que o algoritmo executou até a linha 12 (exclusive). Defina

C(x) ={y∈Z: (x, y)∈Rj}ⁿ⁻¹_j=0 .

Por um argumento completamente an´alogo ao empregado no teorema 1, C(x) = C(xi) para todo xsatisfazendo xi6x < xi+1.

O que gostar´ıamos de mostrar agora é que se removermos todos os intervalos vazios da listaC(xi), obteremos uma permuta¸cão da lista S. Para isso, considere um retângulo Rj. Se x1,j < xi, o retângulo Rj já teve seus dois eventos processados, não contribuindo nenhum intervalo para S, e assim marcamos para remo¸cão em C(xi) seu j-ésimo elemento. Similarmente, sex0,j > xi, o evento de entrada (e logo o de sa´ıda) do retânguloRj ainda não foi processado, e assim ele também não contribuiu nenhum intervalo paraS e podemos marcar oj-ésimo elemento deC(xi) para remo¸cão.

Remova agora os elementos marcados deC(x_i). Vamos mostrar que esta lista resultante é uma permuta¸cão da lista dos intervalos em S. Seja entãoj tal quex0,j 6xi6x1,j. O evento de entrada deste retângulo (abscissax0,j) foi processado mas seu evento de sa´ıda (abscissax1,j+ 1> xi) ainda não. Assim, ele contribui um intervalo [y0,j..y1,j] paraS. E comoS não possui outros intervalos (analisamos todas as possibilidades para Rj), o resultado segue.

Para manter a invariante, observe que uma c´elula (x⁰, y⁰) ∈σ^Z_A²

i+1 deve satisfazer ou x⁰ < xi ou xi 6x⁰ < xi+1. Dentre as células que satisfazemx⁰ < xi temos que (x^∗, y^∗) é uma célula coberta por uma quantidade máxima de elementos. Agora considere quexi6x⁰< xi+1. Nesse caso, note queρ^Z_A²_i+1=ρ^Z_A²

i+1\Ai =ρ^Z_C(x0)=ρ^Z_C(x

i)=ρ^Z_S. Como o teste executado na linha 14 ´e suficiente para discernir se existe uma c´elula emσ^Z_A²

i+1 com coordenada menor do que x_i, a invariante é mantida. Isso ocorre porque se ela existir, nossa decisão de manter (x^∗, y^∗) será correta e, se ela não existir, a nova célula terá coordenada (x_i, y⁰), ondey⁰∈σ_S^Z, de forma queρ^Z_A²

i+1(x_i, y⁰) =ρ^Z_C(x

i)(y⁰) = ρ^Z_S(y⁰) =ρ^Z_S e (xi, y⁰)∈σ_A^Z²

i+1.

Assim, quando oloop acaba comivalendo 2n−1, a invariante nos mostra que (x^∗, y^∗)∈σ^Z_A²_2n−1, masA2n−1=R, pois todo retˆanguloR_j emRsatisfazx_1,j < x_2n−1 e isso conclui a demonstra¸c˜ao.

4.4 O Papel de Estruturas de Dados nos Algoritmos Sweep-Line

Um ponto importante que ficou em aberto nos algoritmos Area-da-Uni˜´ ao-de-Retângulos e Célula-de- Maior-Coberturaé a representa¸cão da listaS. Se ela for representada como uma simples sequência de pares ordenados de números inteiros, as opera¸cões de inser¸cão e remo¸cão (linhas 7 e 9 deArea-da-Uni˜´ ao-de-Retângulos e linhas 8 e 10 deCélula-de-Maior-Cobertura) podem ser implementadas emO(1) eO(n), respectivamente.

Isso em si é ineficiente para nossos propósitos, pois dessa forma os dois algoritmos teriam como limite superior no seu tempo de execu¸cão apenas O(n²), sem contar o tempo tomado pela opera¸cão de cálculo da cardinalidade da união (linha 11 deArea-da-Uni˜´ ao-de-Retângulos) ou do cálculo de ρ^Z_S e de um elemento de σ_S^Z (linhas 13 e 17 deCélula-de-Maior-Cobertura).

(10)

Aliás, essas opera¸cões são as mais dif´ıceis de se implementar eficientemente, visto que uma implementa¸cão ingênua tem uma complexidade que depende (ao menos linearmente) da magnitude das coordenadas da entrada, algo que é altamente indesejável, pois estes valores podem ser muito grandes.

Os principais resultados que iremos demonstrar nesta se¸cão são referentes a limites superiores para o tempo de execu¸cão dos algoritmos que expusemos na se¸cão anterior se pudermos assumir certos limites superiores para as principais opera¸cões na listaS. Com eles, poderemos nos preocupar, daqui em diante, apenas em implementar S eficientemente, deixando para trás a natureza geométrica dos problemas.

Teorema 3. Suponha que exista uma implementa¸cão deStal que as opera¸cões de inser¸cão de um intervalo, remo¸cão de uma cópia de um intervalo existente e cálculo da cardinalidade da união dos intervalos possam ser implementadas todas em O(logn). Então, com essa implementa¸cão, o algoritmo Area-da-Uni˜´ ao-de-Retângulos roda em O(nlogn).

Demonstra¸cão. O loop da linha 4 tem O(n) itera¸cões, sendo que em cada uma delas cada opera¸cão descrita é executada no máximo uma vez.

Teorema 4. Suponha que exista uma implementa¸cão deStal que as opera¸cões de inser¸cão de um intervalo, remo¸cão de uma cópia de um intervalo existente, cálculo deρ^Z_S e cálculo de um elemento emσ_S^Z possam ser implementadas emO(logn). Então, com essa implementa¸cão, o algoritmoCélula-de-Maior-Coberturaroda em O(nlogn).

Demonstra¸cão. O loop da linha 5 tem O(n) itera¸cões, sendo que em cada uma delas cada opera¸cão descrita é executada no máximo uma vez.

4.5 Compress˜ ao de Coordenadas

Em vários algoritmos, não só geométricos, a habilidade de indexar valores por coordenadas é essencial. Técnicas modernas de implementa¸cão dearrays associativos tornam isso poss´ıvel, usualmente custandoO(logn) por mapeamento dentro de um espa¸co den coordenadas. Contudo, para a maioria das aplica¸cões, a constante envolvida na nota¸cãoOdestas técnicas é muito alta, além de suas implementa¸cões serem não-triviais em geral.

O que descreveremos aqui é um método para utilizar o conhecido problema da ordena¸cão para possibilitar uma versão um pouco mais restrita deste tipo de mapeamento. Os algoritmos envolvidos são, portanto, bem estudados e altamente eficientes.

4.5.1 Defini¸c˜ao

Defini¸cão 12. Seja a0, a1, . . . , an−1 ∈Z uma sequência finita de n coordenadas inteiras. Uma compressão de coordenadasparaa₀, a₁, . . . , a_n−1 é um par de fun¸cões(ϕ, ξ)da forma

ϕ: [0..n−1] −→ [0..n−1]

i 7−→ ϕ(i) e ξ: Im(ϕ) −→ Z

y 7−→ ξ(y)

satisfazendo as seguintes condi¸c˜oes:

• Preserva¸c˜ao da ordem: para todos i, j∈[0..n−1],ai< aj ⇐⇒ϕ(i)< ϕ(j).

• Compacidade: existe m∈[0..n]tal queIm(ϕ) = [0..m−1].

• Consistˆencia: para todoi∈[0..n−1],ξ(ϕ(i)) =a_i.

Proposi¸cão 1. Seja (ϕ, ξ) uma compressão de coordenadas para a₀, a₁, . . . , a_n−1 ∈ Z. Então, para todos x, y ∈ Im(ϕ),x < y⇐⇒ξ(x)< ξ(y).

Demonstra¸c˜ao. Sejamiej tais quex=ϕ(i) e y=ϕ(j). Ent˜aox < y⇐⇒ϕ(i)< ϕ(j)⇐⇒ai< aj⇐⇒ξ(ϕ(i))<

ξ(ϕ(j))⇐⇒ξ(x)< ξ(y).

(11)

A idéia é que uma compressão de coordenadas mapeia as coordenadasa0, a1, . . . , an−1em um conjunto “pequeno”

e cont´ıguo de números inteiros, nominalmente algum conjunto da forma [0..m−1] para algum m ∈ [0..n], que pode ser usado como o conjunto de entradas de um vetor. A compressão de coordenadas precisa preservar a ordem relativa das coordenadas e, além disso, deve ser poss´ıvel obter as coordenadas originais a partir das coordenadas comprimidas. Note, no entanto, que não é poss´ıvel obter as coordenadas comprimidas a partir das coordenadas originais: devemos usar um ´ındice de uma coordenada original.

A figura 3 mostra um exemplo de compress˜ao de coordenadas.

Figura 3: Uma compressão de coordenadas para uma sequência de 11 elementos. A tabela define a sequência e a fun¸cãoϕ. A fun¸cãoξestá ilustrada graficamente. Seu dom´ınio, o intervalo [0..m−1] comm= 8, está representado em baixo de seu contradom´ınio, os números inteiros. O dom´ınio e a imagem deξestão hachurados.

4.5.2 C´alculo

Como as fun¸cõesϕeξ são fun¸cões de dom´ınios da forma [0..k−1] para determinados valores dek, é natural que, em nossos algoritmos, representemos estas duas fun¸cões como vetores. Assim sendo, podemos exibir um algoritmo para computar uma compressão de coordenadas, mas primeiro precisamos das seguintes defini¸cões.

Defini¸cão 13. Asfun¸cões projecãoem Z² são

π0: Z² −→ Z

(x, y) 7−→ x e π1: Z² −→ Z (x, y) 7−→ y.

Defini¸cão 14. O ordenamento parcial de pares de números inteiros≺⁰⊆Z²×Z² é definido por(a, b)≺⁰ (x, y)⇐⇒

a < x.

Consideremos ent˜ao o seguinte algoritmo.

(12)

Compress˜ao-de-Coordenadas(a₀, a₁, . . . , a_n−1):

1 para i de 0 at´e n−1 fa¸ca 2 bi←(ai, i)

3 ordeneb0, b1, . . . , bn−1 pelo ordenamento parcial≺⁰ 4 m←0

5 i←0

6 enquanto i6=n fa¸ca

7 j←i

8 enquanto j6=n∧π₀(b_i) =π₀(b_j) fa¸ca 9 ϕ(π₁(b_j))←m

10 j←j+ 1

11 ξ(m)←π0(bi)

12 m←m+ 1

13 i←j

14 retorne (m, ϕ, ξ)

Antes de demonstrar que ele está correto, vamos considerar sua eficiência. Durante a execu¸cão das linhas de 7 a 13, o valor deié incrementado no número de vezes que oloop da linha 8 é executado. Como esteloopé executado no m´ınimo uma vez (a condi¸cão é sempre verdadeira parai=j), o valor deisempre é incrementado em ao menos um.

Assim, as linhas 9 e 10 são executadas precisamentenvezes e as linhas 7, 8, 11, 12 e 13 são executadas no máximo nvezes. Portanto oloop da linha 6 roda emO(n). Além disso, oloop da linha 1 obviamente roda em O(n), o que faz a ordena¸cão na linha 3, que roda emO(nlogn), dominar o custo do algoritmo. Temos então que o algoritmo como um todo roda emO(nlogn).

A demonstra¸cão da corretude deste algoritmo se dará através do seguinte resultado.

Teorema 5. Se (m, ϕ, ξ) é retornado por uma chamada a Compressão-de-Coordenadas(a₀, a₁, . . . , a_n−1), então (ϕ, ξ)é uma compressão de coordenadas paraa₀, a₁, . . . , a_n−1 eIm(ϕ) = [0..m−1].

Demonstra¸cão. Durante esta demonstra¸cão os valores deb0, b1, . . . , bn−1serão considerados ordenados por≺⁰assumindo que o algoritmo já passou pela linha 3. Defina entãoXi={π1(b0), π1(b1), . . . , π1(bi−1)}. Iremos demonstrar a seguinte invariante de loop: toda vez que o algoritmo passa pela linha 6, antes de executar a compara¸cão, são válidas as seguintes afirma¸cões, considerando os valores atuais dei em.

• ϕj´a foi definida no dom´ınioXi eξj´a foi definida no dom´ınio [0..m−1].

• Para todos os valoresp, q∈Xi, ap< aq ⇐⇒ϕ(p)< ϕ(q).

• Im(ϕ) = [0..m−1] = Dom(ξ).

• Para todop∈Xi,ξ(ϕ(p)) =ap.

• Oui∈ {0, n} ouπ₀(b_i−1)< π₀(b_i).

Na primeira vez que o algoritmo passa pela linha 6, temos i=m= 0, então as afirma¸cões acima são triviais, pois Xi = [0..m−1] = Im(ϕ) = Dom(ξ) ={}.

Suponha então que o algoritmo esteja na linha 6 e estas condi¸cões se verifiquem. Vamos mostrar que se ele retornar a esta linha as condi¸cões ainda serão verificadas. Podemos então assumir, sem perda de generalidade, que i6=n, uma vez quei=nimplica que oloop será cancelado.

Definak= 1 + max{j ∈[i..n−1] :π₀(b_i) =π₀(b_j)}. Claramente,π₀(b_i) =π₀(b_i+1) =· · ·=π₀(b_k−1) e ouk=nou π₀(b_k−1)< π₀(b_k). Quando o algoritmo executar as linhas de 7 a 13, antes de retornar à linha 6, as seguintes a¸cões serão executadas:

• ϕ(p) ser´a definida parap∈ {π1(bi), π1(bi+1), . . . , π1(bk−1)}=Xk\Xi comom.

• ξ(m) ser´a definida comoπ0(bi).

• m ser´a incrementado.

(13)

• i se tornar´ak.

Portanto, para manter a invariante precisamos provar que:

• ϕestar´a definida emX_k eξestar´a definida em [0..m].

• Sep, q∈X_k masp6∈X_i ouq6∈X_i, ent˜aoa_p < a_q ⇐⇒ϕ(p)< ϕ(q).

• Im(ϕ) = [0..m] = Dom(ξ).

• Para todop∈Xk\Xi, ξ(ϕ(p)) =ap.

• Ouk=nouπ0(b_k−1)< π0(bk).

A primeira afirma¸cão é trivial. A segunda pode ser mostrada da seguinte forma. Seja p, q∈ X_k comp=π₁(b_x) e q = π₁(b_y). Suponha primeiro que 0 6 x < i 6 y < k de forma que p ∈ X_i mas q 6∈ X_i. Neste caso, pela defini¸cão de b0, b1, . . . , b_n−1, temos que ap = π0(bx) e aq = π0(by). Pela quinta hipótese da invariante, π0(bx) < π0(bi) = · · · = π0(by) = · · · = π0(b_k−1), donde ap = π0(bx) < π0(by) = aq. Mas ϕ(p) < m = ϕ(q), pois mé sempre incrementado durante o curso do algoritmo e seu valor atual só foi usado para definirϕ(x) para x∈Xk\Xi, o que prova este caso. Suponha agora que i6p, q < k, ou seja,p, q∈Xk\Xi. Temos, similarmente, queap=π0(bx) =π0(by) =aq e também temos que ϕ(p) =m=ϕ(q), o que prova esta afirma¸cão.

A terceira afirma¸cão também é trivial. Para demonstrar a quarta afirma¸cão, observe que sep∈X_k\X_i,ϕ(p) =m e assimξ(ϕ(p)) =ξ(m) =π₀(b_i) =· · ·=π₀(b_x) =a_p, ondep=π₁(b_x). Logo,ξ(ϕ(p)) =a_p para todop∈X_k\X_i, o que prova o resultado.

A quinta e última afirma¸cão é simples: sek6=n, entãoπ0(bk−1) =π0(bk) contradiz a maximalidade dek, conforme sua defini¸cão.

Com a invariante demonstrada, podemos olhar para o que ocorre após a última itera¸cão do algoritmo, ou seja, quandoi=n. Especificamente, a primeira, segunda, terceira e quarta afirma¸cões são precisamente a defini¸cão de (ϕ, ξ) ser uma compressão de coordenadas paraa0, a1, . . . , an−1, pois, visto que x7→π1(bx) é uma permuta¸cão de [0..n−1] (pela defini¸cão deb0, b1, . . . , bn−1), temos queXn= [0..n−1].

Finalmente, o fato de Im(ϕ) = [0..m−1] pode ser extra´ıdo da terceira afirma¸c˜ao da invariante.

4.5.3 Aplica¸c˜oes

A compressão de coordenadas é uma técnica que pode ser utilizada para reduzir problemas a casos particulares em que estruturas de dados eficientes podem ser utilizadas. Por exemplo, considere o problema do cálculo do número de subsequências crescentes de uma determinada sequência a₀, a₁, . . . , a_n−1 (possivelmente módulo algum valor para limitar a magnitude da resposta). Se (ϕ, ξ) é uma compressão de coordenadas paraa₀, a₁, . . . , a_n−1, então o número de subsequências crescentes é igual paraa₀, a₁, . . . , a_n−1eϕ(a₀), ϕ(a₁), . . . , ϕ(a_n−1). Contudo, temos queϕ(a_i)< n para todo i, e assim podemos indexar as coordenadas, possibilitando uma solu¸cão eficiente em O(nlogn) através do uso de árvores de Fenwick [8][11].

O que se pode observar deste exemplo é que a compressão de coordenadas é um artif´ıcio muito útil para lidar com problemas onde a ordem dos elementos é o que importa, não a magnitude deles. É um exerc´ıcio interessante demonstrar que o número de retângulos que cobrem um ponto coberto por uma quantidade máxima de retângulos numa lista finita de retângulos não varia se as coordenadas no eixoxe no eixoydos retângulos forem comprimidas.

Um resultado ligeiramente diferente ser´a demonstrado no final desta se¸c˜ao.

As estruturas de dados que iremos utilizar para resolver os problemas AUR e CCMR só são realmente eficientes se pudermos assumir que as coordenadas y dos eventos estão contidas em um intervalo de números inteiros de comprimentoO(n). Se isso não se verificar, elas serão em geral terr´ıvelmente ineficientes.

Mas os problemas que iremos resolver tratam de coordenadasygerais. Assim, é o propósito desta se¸cão estabelecer um resultado que nos possibilitará reduzir o problema CCMR a uma versão onde as coordenadasysão limitadas, de forma que nossa estrutura de dados seja eficiente o suficiente para aplicarmos o teorema 4. O problema AUR tem uma redu¸cão um pouco mais complicada, pois ela está fortemente ligada à estrutura de dados que iremos utilizar, e assim nós iremos postergar esta redu¸cão até que tenhamos tratado dela com mais propriedade.

(14)

Teorema 6. Seja R = [R0, R1, . . . , Rn−1] uma lista de n retângulos onde Ri = [x0,i..x1,i]×[y0,i..y1,i]. Sejam a0, a1, . . . , a2n−1 ∈Z definidos por a2i =y0,i ea2i+1 =y1,i para todo i ∈[0..n−1]. Seja (ϕ, ξ) uma compressão de coordenadas para a₀, a₁, . . . , a_2n−1. Defina entãoR⁰ = [R⁰₀, R⁰₁, . . . , R⁰_n−1]como uma lista de nretângulos onde R_i⁰ = [x0,i..x1,i]×[ϕ(2i)..ϕ(2i+ 1)]. Então ρ^Z_R² =ρ^Z_R²0 e, se(x, y)∈σ_R^Z²0,(x, ξ(y))∈σ^Z_R².

Demonstra¸c˜ao. Seja (x, y)∈ σ^Z_R²0 um ponto coberto pelos retˆangulos R⁰_i₀, R⁰_i₁, . . . , R⁰_i_k−1, onde k = ρ^Z_R²0 e ip 6=iq

sempre quep6=q, 06p, q < k. Sejaj =ip para algump∈[0..k−1]. (x, y)∈R⁰_j ´e equivalente a x0,j 6x6x1,j

eϕ(2j)6y6ϕ(2j+ 1). Comoϕ(2j)6y 6ϕ(2j+ 1) e a imagem de ϕ´e cont´ıgua, y∈Im(ϕ). Dessa forma, pela proposi¸c˜ao 1, temos que

ϕ(2j)6y6ϕ(2j+ 1) ⇐⇒ ξ(ϕ(2j))6ξ(y)6ξ(ϕ(2j+ 1))

⇐⇒ a_2j 6ξ(y)6a_2j+1

⇐⇒ y0,j 6ξ(y)6y1,j, o que mostra que (x, ξ(y))∈Rj.

Assim, conseguimos um ponto, nominalmente (x, ξ(y)), coberto por ao menos k =ρ^Z_R²0 retângulos de R, o que é suficiente para conclu´ırmos queρ^Z_R² >ρ^Z_R²0. Dessa forma, se pudermos provar queρ^Z_R² 6ρ^Z_R²0, teremos conclu´ıdo a demonstra¸cão, poisρ^Z_R²(x, ξ(y))>ρ^Z_R²0 >ρ^Z_R² =⇒(x, ξ(y))∈σ_R^Z².

De fato, seρ^Z_R²= 0, o resultado ´e imediato. Seρ^Z_R² 6= 0 e (x, y)∈σ_R^Z² de forma queρ^Z_R²(x, y) =ρ^Z_R², ent˜ao existeRi

emRtal quey>y0,i, pois do contr´arioρ^Z_R²(x, y) = 0. Assim podemos definiry⁰= max (

y⁰∈

n−1

[

i=0

{y0,i, y1,i}:y⁰6y )

. Se (x, y)∈R_i para algum i, x_0,i 6x6x_1,i ey_0,i 6y⁰ 6y 6 y_1,i, de forma que (x, y⁰) ∈R_i, o que mostra que ρ^Z_R²(x, y⁰)>ρ^Z_R²(x, y) =ρ^Z_R². Mas, pela defini¸c˜ao dey⁰, existej∈[0..2n−1] tal queaj =y⁰. Assim,

(x, ϕ(j))∈R⁰_i ⇐⇒ x0,i6x6x1,i∧ϕ(2i)6ϕ(j)6ϕ(2i+ 1)

⇐⇒ x_0,i6x6x_1,i∧a_2i6a_j6a_2i+1

⇐⇒ x0,i6x6x1,i∧y0,i6y⁰6y1,i,

o que ´e verdadeiro. Dessa forma, o ponto (x, ϕ(y)) pertence a R⁰_i sempre que (x, y) ∈ Ri, o que mostra que ρ^Z_R²0 >ρ^Z_R², como desej´avamos.

Por causa deste resultado, podemos desenvolver um algoritmo que, emO(nlogn) comprime as coordenadas no eixo y dos retângulos e então executa Célula-de-Cobertura-Máxima com a nova lista de retângulos, também em O(nlogn). A diferen¸ca é que agora a nossa estrutura de dados poderá assumir que as coordenadas y dos eventos estão no intervalo [0..2n−1], como quer´ıamos.

4.6 Arvores de Segmentos ´

4.6.1 Introdu¸c˜ao

Arvores de segmentos s˜´ ao estruturas de dados gerais, simples de programar, flex´ıveis e eficientes que operam sobre monóides. Contudo, infelizmente um estudo padrão sobre estas árvores não cabe aqui porque suas estruturas gerais tiveram de ser enormemente modificadas para que elas fossem utilizáveis nos problemas que iremos resolver. Dessa forma apresentaremos duas versões destas estruturas de dados voltadas especificamente aos problemas CCMR e AUR.

Antes, no entanto, gostar´ıamos de descrever a estrutura geral das árvores de segmentos. Árvores de segmentos são formadas por um número fixo mde folhas e m−1 nós internos, cada um com exatamente dois filhos. Ainda, há uma restri¸cão de que m deve ser uma potência de 2, digamos m= 2^k para algum k∈N. Podemos denominar os elementos da árvore por t₁, t₂, . . . , t_m−1, t_m, t_m+1, . . . , t_2m−1, onde os elementost₁, t₂, . . . , t_m−1 são nós internos e os elementostm, tm+1, . . . , t_2m−1 são folhas. Ainda, de acordo com o estudo deheaps realizado em [3], o pai de um elementoticomi6= 1 é o elementotbⁱ₂ce os filhos do elementoticomi < msão os elementost2iet2i+1. Finalmente, quando nos referirmos aointervalo determinadopor um elementoti, estamos nos referindo ao conjunto cont´ıguo

(15)

Ii dos ´ındices das folhas que têm como ancestral o nó ti menosm. Especificamente, o intervalo determinado pelo nó ti é o conjunto

Ii=

m(i−2^h)

2^h ..m(i+ 1−2^h)

2^h −1

,

onde hé a altura do elemento ti (sua distância até a raiz da árvore). Os extremos deste intervalo são números inteiros porque 2^h dividem= 2^k, sendoka altura das folhas.

A figura 4 ilustra uma ´arvore de segmentos.

1

2 3

4 5 6 7

8 9 10 11 12 13 14 15

Figura 4: Uma ´arvore de segmentos comm= 8.

4.6.2 Arvores de Segmentos para o Problema CCMR´

A árvore de segmentos que iremos utilizar para resolver o problema CCMR é uma estrutura de dados que guarda intervalos de números inteiros. Em virtude da nossa compressão de coordenadas no eixoydos retângulos da entrada, podemos assumir que estes intervalos de números inteiros têm extremos no intervalo [0..2n−1]. Na realidade, devido

`

a forma das ´arvores de segmentos, iremos assumir apenas que eles tˆem extremos no intervalo [0..2^k−1], ondek∈N

´

e o menor n´umero natural tal quem= 2^k>2n.

Inicialmente vamos estabelecer qual a invariante que nossa ´arvore de segmentos deve seguir.

Defini¸cão 15. Uma árvore de segmentos t1, t2, . . . t_m−1, tm, tm+1, . . . , t_2m−1 é correta com respeito à lista S de intervalos de números inteiros com extremos no intervalo[0..m−1]se

• A cada n´oti estiverem associados valores ci, mi∈N.

• Se definirmos Σ(i)como

dlog₂(i+1)e−1

X

w=0

cb2ⁱwc,

ent˜ao, para cada folhati,i>m,Σ(i) =ρ^Z_S(i−m).

• Para cada n´oti,mi= max

j∈Ii

ρ^Z_S(j) −Σ(i).

Intuitivamente, uma árvore de segmentos é correta com respeito a S se, para cada folha, a soma dos valoresc_i no caminho da raiz até a folha (incluindo ambos) é o número de intervalos em S que cobrem a coordenada da folha e, para cada nó t_i, m_i é o número de intervalos que cobrem a coordenada mais coberta por intervalos em S no intervalo determinado pelo nó menos a soma dosc_i no caminho da raiz até o nó interno (incluindo ambos).

Um fato interessante é que na árvore não fica registrada a listaS: ela apenas é nossa referência de quais intervalos foram inseridos mas não removidos da estrutura. Este fato é de suma importância e está resumido no seguinte resultado.

Lema 1. SejamS eS⁰ duas listas de intervalos de números inteiros de extremos em[0..m−1]com a propriedade de queρ^Z_S(i) =ρ^Z_S0(i)para todo i∈[0..m−1]. Então uma árvore de segmentost1, t2, . . . tm−1, tm, tm+1, . . . , t2m−1

´

e correta com rela¸c˜ao aS se, e somente se, ela for correta com rela¸c˜ao a S⁰.

(16)

Demonstra¸c˜ao. Trivial, pois a invariante ´e expressa apenas em termos deρ^Z_S(i) para coordenadasi∈[0..m−1].

Do jeito que a invariante foi proposta, podemos inicializar esta árvore de segmentos para que ela fique correta em rela¸cão à lista vazia simplesmente fazendoci =mi= 0 para todos os valores dei∈[1..2m−1]. Já para adicionar ou remover segmentos, precisamos primeiro definir a seguinte subrotina.

CCMR-Auxiliar(r, i, j, a, b, δ) : 1 se a6b ent~ao

2 se a=i∧b=j−1 ent~ao

3 c_r←c_r+δ

4 sen~ao

5 k← ^i+j₂

6 CCMR-Auxiliar(2r, i, k, a,min{b, k−1}, δ) 7 CCMR-Auxiliar(2r+ 1, k, j,max{a, k}, b, δ) 8 mr←max{m2r+c2r, m2r+1+c2r+1}

Com este procedimento, que iremos discutir logo em seguida, podemos implementar a inser¸c˜ao e a remo¸c˜ao na

´

arvore de segmentos como segue.

CCMR-Insere(a, b):

1 CCMR-Auxiliar(1,0, m, a, b,1) CCMR-Remove(a, b):

2 CCMR-Auxiliar(1,0, m, a, b,−1)

Dedicaremos o restante desta se¸cão a demonstrar que os procedimentos acima estão corretos e a mostrar como implementar as linhas 13 e 17 deCélula-de-Maior-Coberturaeficientemente. A análise de complexidade deles será deixada para depois, visto que a estrutura dos algoritmos análogos para o problema AUR é muito parecida e compensa unificarmos as demonstra¸cões.

Teorema 7. Sejam t₁, t₂, . . . , t_m−1, t_m, t_m+1, . . . , t_2m−1 uma árvore de segmentos correta em rela¸cão a uma lista S de intervalos de números inteiros com extremos em [0..m−1], r ∈ [1..2m−1], [i..j−1] = I_r e [a..b] ⊆ I_r. Então, após uma execu¸cão de CCMR-Auxiliar(r, i, j, a, b,1), a árvore de segmentos estará correta em rela¸cão à listaS mais uma cópia do intervalo[a..b]exceto por valores demα comtαascendente estrito detr, isto é, podemos modificar estes valores de forma que a árvore fique correta. Ainda, se a listaScontiver uma cópia do intervalo[a..b], após uma execu¸cão deCCMR-Auxiliar(r, i, j, a, b,−1), se todos os valores deci com i∈[1..2m−1]terminarem não-negativos, então a árvore de segmentos resultante estará correta com rela¸cão à lista S menos uma cópia do intervalo[a..b]exceto também pelos valores demα comtα ascendente estrito detr, isto é, podemos modificar estes valores de forma que a árvore fique correta.

Demonstra¸cão. A prova será por indu¸cão emr, mas esta será uma indu¸cão ligeramente diferente do usual. Iremos assumir que o resultado vale para todor⁰ > re iremos prová-lo parar, sem casos base.

Para tal, considere uma execu¸cão deCCMR-Auxiliar(r, i, j, a, b, δ) onder∈[1..2m−1], [i..j−1] =I_r, [a..b]⊆ I_r, δ ∈ {−1,1} e, caso δ =−1, existe uma cópia de [a..b] na lista S. Se [a..b] = {}, a inser¸cão ou remo¸cão de uma cópia deste intervalo não surte qualquer efeito sobre o valor deρ^Z_S(x) para qualquer coordenadax∈[0..m−1], e portanto, pelo lema 1, a invariante é mantida caso simplesmente não fa¸camos nada. Mas comoa > b, temos que a condi¸cão na linha 1 deCCMR-Auxiliarnão é satisfeita, e de fato o algoritmo não faz nada. Inclusive, a árvore resultante é correta mesmo sem alterar os valores de mαcomtα ascendente estrito detr.

Suponha então que [a..b]6={}. A condi¸cão na linha 1 será satisfeita, o que nos permite assumir que o algoritmo passará então pela linha 2. Se [a..b] = I_r = [i..j−1], então a = i e b = j−1. Neste caso, com a inser¸cão deste intervalo todos os valores xem I_r terão ρ^Z_S(x) incrementado em 1, e, com sua remo¸cão, todos estes valores serão decrementados em 1. Assim sendo, como essas coordenadas são precisamente as coordenadas cujas folhas são descendentes (inclusive) detr, é suficiente incrementar o valor decrem δ. Mas é exatamente isto que o algoritmo faz, pois a condi¸cão na linha 2 é satisfeita. Note quecr ficar negativo é um evento previsto pela hipótese indutiva.

Agora note que se tα ´e descendente (inclusive) de tr, o valor de max

j∈Iα

ρ^Z_S(j) ´e aumentado em δ, mas mα n˜ao