Shellsort - Análise de Algoritmos e Estruturas de Dados

OShellsort é uma varia¸cão do Insertion sort que faz compara¸cão de elementos mais distantes e não apenas vizinhos.

algoritmo. Dizemos que um vetor está h-ordenado se, a partir de qualquer posi¸cão, considerar todo elemento a cada h posi¸cões leva a uma sequência ordenada. Por exemplo, o vetor A = (1,3,5,8,4,15,20,7,9,6) está 5-ordenado, pois as sequências de elementos (1,15), (3,20), (5,7), (8,9) e (4,6) estão ordenadas. Já o vetor A = (1,3,5,6,4,9,8,7,15,20) está 3-ordenado, pois (1,6,8,20), (3,4,7), (5,9,15), (6,8,20), (4,7), (9,15) e (8,20) são sequências ordenadas de elementos que estão à distância 3

entre si. Note que um vetor 1-ordenado est´a totalmente ordenado.

A ideia do Shellsort é iterativamente h-ordenar o vetor de entrada com uma sequência de valores de h que termina em 1. Ele usa o fato de que é fácil h⁰-ordenar um vetor que já estáh-ordenado, parah⁰ < h. Esse algoritmo se comporta exatamente como oInsertion sort quando h= 1. O procedimento _Shellsort é formalizado no Algoritmo 28. Ele recebe o vetor A com n números a serem ordenados e um vetor

H com m inteiros. Ele assume queH mant´em uma sequˆencia decrescente de inteiros menores do quen tal que H[m] = 1.

Algoritmo 28: _Shellsort(A, n,H, m)

1 para t= 1 at´e m fa¸ca

2 para i=H[t] + 1 at´e n fa¸ca

3 aux=A[i]

4 j =i−1

5 enquanto j ≥H[t] e A[j −H[t] + 1]> aux fa¸ca

6 A[j+ 1] =A[j−H[t] + 1]

7 j =j−H[t]

8 A[j+ 1] =aux

Note que o tempo de execu¸cão do _Shellsort depende drasticamente dos valores emH. Uma questão em aberto ainda hoje é determinar sua complexidade de tempo. Knuth por exemplo propôs a sequência 1,4,13,40,121,246, . . . e ela dá bons resultados na prática e faz O(n3/2) compara¸cões. Uma sequência do tipo 1,2,4,8,16, . . . dá resultados muito ruins, já que elementos em posi¸cões ´ımpares não são comparados com elementos em posi¸cões pares até a última itera¸cão.

Cap´ıtulo

Ordena¸c˜ao por intercala¸c˜ao

O algoritmo que veremos nesse cap´ıtulo usa a ideia de ordena¸cão por intercala¸cão e faz uso do paradigma de divisão e conquista. Dado um vetorA com n números, esse algoritmo divide A em duas partes de tamanho bn/2c edn/2e, ordena as duas partes recursivamente e depois intercala o conteúdo as duas partes ordenadas em uma única parte ordenada. Esse algoritmo foi inventado por Jon von Neumann em 1945.

O procedimento, _MergeSort, é dado no Algoritmo 29, onde _Combina é um procedimento para combinar duas partes ordenadas em uma só parte ordenada e será visto com mais detalhes adiante. Como o procedimento recursivamente acessa partes do vetor, ele recebeA e duas posi¸cões inicioef im, e seu objetivo é ordenar o subvetor

A[inicio..f im]. Assim, para ordenar um vetor A inteiro de n posi¸c˜oes, basta executar

MergeSort(A, 1, n).

Algoritmo 29: _MergeSort(A, inicio,f im)

1 se inicio < f im ent˜ao

2 meio=b(inicio+f im)/2c

3 MergeSort(A, inicio, meio)

4 MergeSort(A, meio+ 1, f im)

5 Combina(A, inicio, meio,f im)

Na Figura 12.1 ilustramos uma execu¸cão do algoritmo _MergeSort. Note que a metade superior da figura corresponde às chamadas recursivas das linhas 3 e 4. A metade inferior da figura corresponde às chamadas recursivas ao procedimento

Figura 12.1: Execu¸c˜ao de _MergeSort(A, 1, 8) para A= (7,3,1,10,2,8,15,6).

Combina(linha 5).

Veja que a execu¸cão do _MergeSorté realmente simples. A opera¸cão chave aqui é realizada pelo_Combina. Esse algoritmo recebe o vetor A e as posi¸cões inicio, meio,

f im, e considera queA[inicio..meio] eA[meio+ 1..f im] estão ordenados. Seu objetivo é deixar A[inicio..f im] ordenado com os mesmos elementos. Como o conteúdo a ser deixado emA[inicio..f im] já está armazenado nesse mesmo subvetor, esse procedimento faz uso de dois vetores auxiliaresB eC, que irão manter uma cópia de A[inicio..meio] eA[meio+ 1..f im], respectivamente.

O fato dos dois vetoresB eC já estarem ordenados nos dá algumas garantias. Veja que o menor de todos os elementos que estão em B eC, que será colocado em A[inicio], só pode ser B[1] ou C[1], o que for menor dentre os dois. Se B[1] < C[1], então o elemento a ser colocado em A[inicio+ 1] só pode ser B[2] ou C[1], o que for menor dentre esses dois. Mas se C[1]< B[1], então o elemento que vai para A[inicio+ 1] só pode ser B[1] ou C[2], o que for menor dentre esses. E, a garantia mais importante é que uma vez que um elemento B[i] ou C[j] é copiado para sua posi¸cão final em A, esse elemento não precisa mais ser considerado. É poss´ıvel, portanto, realizar todo esse procedimento fazendo uma única passagem por cada elemento de B e C.

Pela discuss˜ao acima, vemos que precisamos manter um ´ındice i para acessar elementos a serem copiadas deB, um ´ındicej para acessar elementos emC e um ´ındice

k para acessar o vetor A. A cada itera¸c˜ao, precisamos colocar um elemento em A[k], que ser´a o menor dentre B[i] e C[j]. Se B[i] (resp. C[j]) for copiado, incrementamosi

(resp. j) para que esse elemento n˜ao seja considerado novamente. Veja o procedimento

Combinaformalizado no Algoritmo 30.

Algoritmo 30: _Combina(A, inicio, meio,f im)

1 n₁ =meio−inicio+ 1

2 n2 =f im−meio

3 Crie vetores auxiliares B[1..n₁] eC[1..n₂]

4 para i= 1 at´e n₁ fa¸ca

5 B[i] =A[inicio+i−1]

6 para j = 1 at´e n₂ fa¸ca

7 C[j] =A[meio+j] 8 i= 1 9 j = 1 10 j =inicio 11 enquanto i < n₁ e j < n₂ fa¸ca 12 se B[i]≤C[j] ent˜ao 13 A[k] =B[i] 14 i=i+ 1 15 sen˜ao 16 A[k] =C[j] 17 j =j+ 1 18 k =k+ 1 19 enquanto i < n₁ fa¸ca 20 A[k] =B[i] 21 i=i+ 1 22 k =k+ 1 23 enquanto j < n₂ fa¸ca 24 A[k] =C[j] 25 j =j+ 1 26 k =k+ 1

Note que como o procedimento _Combina usar vetores auxiliares, o _MergeSort n˜ao ´e um algoritmo in-place.

Na Figura 12.2 temos uma simula¸c˜ao da execu¸c˜ao do _Combina.

Considere uma execu¸c˜ao de_Combina ao receber um vetor A e parˆametros inicio,

meio e f im como entrada. Note que além das linhas que são executadas em tempo constante, o la¸co para na linha 4 é executado meio−inicio+ 1 vezes, o la¸co para

Figura 12.2: Execu¸c˜ao de _Combina(A, p, q, r) sobre o vetor A = (1,3,7,10,2,6,8,15,28,19,2) com parˆametrosp= 1, q = 4 e r= 8.

na linha 6´e executado f im−meio vezes, e os la¸cos enquantodas linhas 11, 19 e23

são executados ao todof im−inicio+ 1 vezes (podemos notar isso pela quantidade de valores diferentes que k assume). Se R(n) é o tempo de execu¸cão de _Combina(A,

inicio, meio, f im) onden =f im−inicio+ 1, então claramente temosR(n) = Θ(n). Vamos agora analisar o tempo de execu¸cão do algoritmo _MergeSort quando ele é utilizado para ordenar um vetor com n elementos. Vimos que o tempo para combinar as solu¸cões recursivas é Θ(n). Como os vetores em questão são sempre divididos ao meio no algoritmo _MergeSort, seu tempo de execu¸cão T(n) é dado por T(n) =T(bn/2c) +T(dn/2e) + Θ(n). Como estamos preocupados em fazer uma análise assintótica, podemos substituir Θ(n) por n apenas, pois isso não fará diferen¸ca no resultado obtido. Também podemos desconsiderar pisos e tetos, como visto na Se¸cão 3.2.1, de forma que o tempo do _MergeSort pode ser descrito por

T(n) = 2T(n/2) +n ,

para n > 1, e T(n) = 1 para n = 1. Assim, como visto no Cap´ıtulo 3, o tempo de execu¸c˜ao de _MergeSort´e T(n) = Θ(nlogn).

Cap´ıtulo

Ordena¸c˜ao por sele¸c˜ao

Neste cap´ıtulo vamos introduzir dois algoritmos para o problema de ordena¸cão que utilizam a ideia de ordena¸cão por sele¸cão. Em ambos, consideramos uma posi¸cão i do vetor por vez, selecionamos o i-ésimo menor elemento do vetor e o colocamos em i, posi¸cão final desse elemento no vetor ordenado.

13.1 Selection sort

OSelection sort é um algoritmo que sempre mantém o vetor de entradaA[1..n] dividido em dois subvetores cont´ıguos separados por uma posi¸cão i, um à direita e outro à esquerda, estando um deles ordenado. Aqui consideraremos uma implementa¸cão onde o subvetor da esquerda,A[1..i], contém os menores elementos da entrada ainda não ordenados e o subvetor da direita, A[i+ 1..n], contém os maiores elementos da entrada já ordenados. A cada itera¸cão, o maior elementox do subvetor A[1..i] é encontrado e colocado na posi¸cão i, de forma que o subvetor da direita é aumentado em uma unidade1.

O Algoritmo 31 descreve o procedimento _{SelectionSort} e possui uma estrutura muito simples, contendo dois la¸cos para aninhados. O primeiro la¸co, indexado por

i, é executado n−1 vezes e, em cada itera¸cão, aumenta o subvetor da direita que já

1Não é dif´ıcil adaptar toda a discussão que faremos considerando que o subvetorA[1..i−1] da esquerda contém os menores elementos ordenados e o da direita contém os elementos não ordenados. Com isso, a cada itera¸cão, o menor elemento do subvetorA[i..n] deve ser encontrado e colocado na posi¸cãoi.

estava ordenado em uma unidade. Ademais, esse subvetor da direita sempre contém os maiores elementos deA. Para manter essa propriedade, a cada passo, o maior elemento que não está nesse subvetor já ordenado é adicionado ao in´ıcio dele.

Algoritmo 31: _{SelectionSort}(A, n)

1 para i=n at´e 2fa¸ca

2 indiceM ax=i

3 para j = 1 at´e i−1 fa¸ca

4 se A[j]> A[indiceM ax] ent˜ao

5 indiceM ax=j

6 trocaA[indiceM ax] com A[i]

7 retorna A

Note que todas as linhas s˜ao executadas em tempo constante e cada um dos la¸cos

paraé executado Θ(n) vezes cada. Como um dos la¸cos está dentro do outro, temos que o tempo de execu¸cão de _{SelectionSort}(A, n) é Θ(n2).

Na Figura 13.1 temos um exemplo de execu¸c˜ao do algoritmo _{SelectionSort}. No que segue vamos utilizar a seguinte invariante de la¸co para mostrar que o algoritmo_{SelectionSort} funciona corretamente, isto ´e, para qualquer vetor A e n

dados na entrada, ele corretamente deixa osnelementos deAem ordem n˜ao-decrescente.

Invariante: SelectionSort

Antes de cada itera¸c˜ao do primeiro la¸co para indexado por i, o subvetor

A[i+ 1..n] está ordenado de modo não-decrescente e contém os maiores elementos deA.

Teorema 13.2

O algoritmo _{SelectionSort} ordena qualquer vetor A com n elementos de modo n˜ao-decrescente.

Demonstra¸c˜ao. Como inicialmente i = n, a invariante ´e trivialmente satisfeita pois trata-se de um vetor sem elementos.

Fixe agora um valor de ientre 2 en e que a invariante é válida imediatamente antes da itera¸cão correspondente a i do primeiro la¸co para, i.e., o subvetorA[i+ 1..n] está ordenado de modo não-decrescente e contém os maiores elementos de A. Precisamos mostrar que antes da próxima itera¸cão, quando teremosi−1, o subvetor A[i..n] estará ordenado de modo não-decrescente e conterá os maiores elementos de A.

Note que na itera¸cão correspondente ai, o segundo la¸copara (da linha3) encontra o ´ındice indiceM ax do maior elemento do vetor A[1..i] (isso pode ser formalmente provado por outra invariante de la¸co!). Na linha6, o maior elemento deA[1..i] é trocado de lugar com o elementoA[i]. Como, pela invariante, todos os elementos de A[i+ 1..n] são maiores do queA[i], temos queA[i..n] está ordenado e contém os maiores elementos deA, valendo assim a invariante antes da próxima itera¸cão.

Por fim, note que na última vez que a linha é executada, temosi= 1. Assim, pela invariante de la¸co, o vetor A[2..n] está ordenado com os maiores elementos de A. Logo, conclu´ımos que o vetor A[1..n] está ordenado.

No documento Análise de Algoritmos e Estruturas de Dados (páginas 122-132)