Anda di halaman 1dari 149

Ordenao

ltima alterao: 31 de Agosto de 2010

Transparncias

elaboradas por Charles Ornelas Almeida, Israel Guerra e Nivio Ziviani

Projeto de Algoritmos Cap.4 Ordenao

Contedo do Captulo
4.1 Ordenao Interna 4.1.1 Seleo 4.1.2 Insero 4.1.3 Shellsort 4.1.4 Quicksort 4.1.5 Heapsort Filas de Prioridades Heaps 4.1.6 Ordenao Parcial Seleo Parcial Insero Parcial Heapsort Parcial Quicksort Parcial 4.1.7 Ordenao em Tempo Linear Ordenao por Contagem Radixsort para Inteiros Radixsort para Cadeias de Caracteres 4.2 Ordenao Externa 4.2.1 Intercalao Balanceada de Vrios Caminhos 4.2.2 Implementao por meio de Seleo por Substituio 4.2.3 Consideraes Prticas 4.2.4 Intercalao Polifsica 4.2.5 Quicksort Externo

Projeto de Algoritmos Cap.4 Ordenao

Introduo - Conceitos Bsicos


Ordenar: processo de rearranjar um conjunto de objetos em uma ordem ascendente ou descendente. A ordenao visa facilitar a recuperao posterior de itens do conjunto ordenado. Diculdade de se utilizar um catlogo telefnico se os nomes das pessoas no estivessem listados em ordem alfabtica. Notao utilizada nos algoritmos: Os algoritmos trabalham sobre os registros de um arquivo. Cada registro possui uma chave utilizada para controlar a ordenao. Podem existir outros componentes em um registro.

Projeto de Algoritmos Cap.4 Ordenao

Introduo - Conceitos Bsicos


Estrutura de um registro:
typedef long TipoChave; typedef struct TipoItem { TipoChave Chave; / outros componentes / } TipoItem ;

Qualquer tipo de chave sobre o qual exista uma regra de ordenao bem-denida pode ser utilizado. Um mtodo de ordenao estvel se a ordem relativa dos itens com chaves iguais no se altera durante a ordenao. Alguns dos mtodos de ordenao mais ecientes no so estveis. A estabilidade pode ser forada quando o mtodo no-estvel. Sedgewick (1988) sugere agregar um pequeno ndice a cada chave antes de ordenar, ou ento aumentar a chave de alguma outra forma.

Projeto de Algoritmos Cap.4 Ordenao

Introduo - Conceitos Bsicos


Classicao dos mtodos de ordenao: Interna: arquivo a ser ordenado cabe todo na memria principal. Externa: arquivo a ser ordenado no cabe na memria principal. Diferenas entre os mtodos: Em um mtodo de ordenao interna, qualquer registro pode ser imediatamente acessado. Em um mtodo de ordenao externa, os registros so acessados seqencialmente ou em grandes blocos. A maioria dos mtodos de ordenao baseada em comparaes das chaves. Existem mtodos de ordenao que utilizam o princpio da distribuio.

Projeto de Algoritmos Cap.4 Ordenao

Introduo - Conceitos Bsicos


Exemplo de ordenao por distribuio: considere o problema de ordenar um baralho com 52 cartas na ordem: A < 2 < 3 < < 10 < J < Q < K e < < < . Algoritmo: 1. Distribuir as cartas em treze montes: ases, dois, trs, . . ., reis. 2. Colete os montes na ordem especicada. 3. Distribua novamente as cartas em quatro montes: paus, ouros, copas e espadas. 4. Colete os montes na ordem especicada.

Projeto de Algoritmos Cap.4 Ordenao

Introduo - Conceitos Bsicos


Mtodos como o ilustrado so tambm conhecidos como ordenao digital, radixsort ou bucketsort. O mtodo no utiliza comparao entre chaves. Uma das diculdades de implementar este mtodo est relacionada com o problema de lidar com cada monte. Se para cada monte ns reservarmos uma rea, ento a demanda por memria extra pode tornar-se proibitiva. O custo para ordenar um arquivo com n elementos da ordem de O(n).

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1

Ordenao Interna
Na escolha de um algoritmo de ordenao interna deve ser considerado o tempo gasto pela ordenao. Sendo n o nmero registros no arquivo, as medidas de complexidade relevantes so: Nmero de comparaes C(n) entre chaves. Nmero de movimentaes M (n) de itens do arquivo. O uso econmico da memria disponvel um requisito primordial na ordenao interna. Mtodos de ordenao in situ so os preferidos. Mtodos que utilizam listas encadeadas no so muito utilizados. Mtodos que fazem cpias dos itens a serem ordenados possuem menor importncia.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1

Ordenao Interna
Classicao dos mtodos de ordenao interna: Mtodos simples: Adequados para pequenos arquivos. Requerem O(n2 ) comparaes. Produzem programas pequenos. Mtodos ecientes: Adequados para arquivos maiores. Requerem O(n log n) comparaes. Usam menos comparaes. As comparaes so mais complexas nos detalhes. Mtodos simples so mais ecientes para pequenos arquivos.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1

Ordenao Interna
Tipos de dados e variveis utilizados nos algoritmos de ordenao interna:
typedef int TipoIndice ; typedef TipoItem TipoVetor [ MAXTAM + 1]; / MAXTAM + 1 por causa da sentinela em Insercao / TipoVetor A;

O ndice do vetor vai de 0 at M axT am, devido s chaves sentinelas. O vetor a ser ordenado contm chaves nas posies de 1 at n.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.1

10

Ordenao por Seleo (1)


Um dos algoritmos mais simples de ordenao. Algoritmo: Selecione o menor item do vetor. Troque-o com o item da primeira posio do vetor. Repita essas duas operaes com os n 1 itens restantes, depois com os n 2 itens, at que reste apenas um elemento.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.1

11

Ordenao por Seleo (2)


O mtodo ilustrado abaixo:
1 Chaves iniciais: i=1 i=2 i=3 i=4 i=5 O A A A A A 2 R R D D D D 3 D D R E E E 4 E E E R N N 5 N N N N R O 6 A O O O O R

As chaves em negrito sofreram uma troca entre si.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.1

12

Ordenao por Seleo


void Selecao(TipoItem A, TipoIndice n) { TipoIndice i , j , Min; TipoItem x ; for ( i = 1; i <= n 1; i ++) { Min = i ; for ( j = i + 1; j <= n ; j ++) i f (A[ j ] .Chave < A[Min ] .Chave) Min = j ; x = A[Min ] ; A[Min] = A[ i ] ; A[ i ] = x ; } }

Comparaes entre chaves e movimentaes de registros: C(n) =


n2 2

n 2

M (n) = 3(n 1)

A atribuio M in := j executada em mdia n log n vezes, Knuth (1973).

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.1

13

Ordenao por Seleo


Vantagens: Custo linar para o nmero de movimentos de registros. o algoritmo a ser utilizado para arquivos com registros muito grandes. muito interessante para arquivos pequenos. Desvantagens: O fato de o arquivo j estar ordenado no ajuda em nada, pois o custo continua quadrtico. O algoritmo no estvel.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.2

14

Ordenao por Insero


Mtodo preferido dos jogadores de cartas. Algoritmo: Em cada passo a partir de i=2 faa: Selecione o i-simo item da seqncia fonte. Coloque-o no lugar apropriado na seqncia destino de acordo com o critrio de ordenao.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.2

15

Ordenao por Insero


O mtodo ilustrado abaixo:
1 Chaves iniciais: i=2 i=3 i=4 i=5 i=6 O O D D D A 2 R R O E E D 3 D D R O N E 4 E E E R O N 5 N N N N R O 6 A A A A A R

As chaves em negrito representam a seqncia destino.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.2

16

Ordenao por Insero


void Insercao(TipoItem A, TipoIndice n) { TipoIndice i , j ; TipoItem x ; for ( i = 2; i <= n ; i ++) { x = A[ i ] ; A[0] = x ; j = i 1; / sentinela / j ;

while ( x .Chave < A[ j ] .Chave) { A[ j +1] = A[ j ] ; } A[ j +1] = x ; } }

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.2

17

Ordenao por Insero


Consideraes sobre o algoritmo: O processo de ordenao pode ser terminado pelas condies: Um item com chave menor que o item em considerao encontrado. O nal da seqncia destino atingido esquerda. Soluo: Utilizar um registro sentinela na posio zero do vetor.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.2

18

Ordenao por Insero


Seja C(n) a funo que conta o nmero de comparaes. No anel mais interno, na i-sima iterao, o valor de Ci : Melhor caso : Ci (n) = 1 Pior caso Caso mdio e : Ci (n) = i : Ci (n) = 1 (1 + 2 + + i) = i
i+1 2

Assumindo que todas as permutaes de n so igualmente provveis no caso mdio, temos: Melhor caso : C(n) = (1 + 1 + + 1) = n 1 Pior caso Caso mdio e : C(n) = (2 + 3 + + n) =
n2 2

1 : C(n) = 2 (3 + 4 + + n + 1) =

n 1 2 n2 + 3n 4 4

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.2

19

Ordenao por Insero


Seja M (n) a funo que conta o nmero de movimentaes de registros. O nmero de movimentaes na i-sima iterao : Mi (n) = Ci (n) 1 + 3 = Ci (n) + 2 Logo, o nmero de movimentos : Melhor caso : M (n) = (3 + 3 + + 3) = 3(n 1) Pior caso Caso mdio e : M (n) = (4 + 5 + + n + 2) =
1 : M (n) = 2 (5 + 6 + + n + 3) n2 + 5n 3 2 2 2 = n + 11n 4 4

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.2

20

Ordenao por Insero


O nmero mnimo de comparaes e movimentos ocorre quando os itens esto originalmente em ordem. O nmero mximo ocorre quando os itens esto originalmente na ordem reversa. o mtodo a ser utilizado quando o arquivo est quase ordenado. um bom mtodo quando se deseja adicionar uns poucos itens a um arquivo ordenado, pois o custo linear. O algoritmo de ordenao por insero estvel.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.3

21

Shellsort
Proposto por Shell em 1959. uma extenso do algoritmo de ordenao por insero. Problema com o algoritmo de ordenao por insero: Troca itens adjacentes para determinar o ponto de insero. So efetuadas n 1 comparaes e movimentaes quando o menor item est na posio mais direita no vetor. O mtodo de Shell contorna este problema permitindo trocas de registros distantes um do outro.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.3

22

Shellsort
Os itens separados de h posies so rearranjados. Todo h-simo item leva a uma seqncia ordenada. Tal seqncia dita estar h-ordenada. Exemplo de utilizao:
1 Chaves iniciais: h=4 h=2 h=1 O N D A 2 R A A D 3 D D N E 4 E E E N 5 N O O O 6 A R R R

Quando h = 1 Shellsort corresponde ao algoritmo de insero.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.3

23

Shellsort
Como escolher o valor de h: Seqncia para h: h(s) = 3h(s 1) + 1, para s > 1 h(s) = 1, para s = 1.

Knuth (1973, p. 95) mostrou experimentalmente que esta seqncia difcil de ser batida por mais de 20% em ecincia. A seqncia para h corresponde a 1, 4, 13, 40, 121, 364, 1.093, 3.280, . . .

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.3

24

Shellsort
void Shellsort (TipoItem A, TipoIndice n) { int i , j ; TipoItem x ; do h = h 3 + 1; while (h < n) ; do { h /= 3; for ( i = h + 1; i <= n ; i ++) { x = A[ i ] ; j = i; while (A[ j h ] .Chave > x .Chave) { A[ j ] = A[ j h ] ; j = h; i f ( j <= h) goto L999; } L999: A[ j ] = x ; } } while (h ! = 1 ) ; } int h = 1;

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.3

25

Shellsort
A implementao do Shellsort no utiliza registros sentinelas. Seriam necessrios h registros sentinelas, uma para cada h-ordenao.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.3

26

Shellsort: Anlise
A razo da ecincia do algoritmo ainda no conhecida. Ningum ainda foi capaz de analisar o algoritmo. A sua anlise contm alguns problemas matemticos muito difceis. A comear pela prpria seqncia de incrementos. O que se sabe que cada incremento no deve ser mltiplo do anterior. Conjecturas referente ao nmero de comparaes para a seqncia de Knuth: Conjetura 1 : C(n) = O(n1,25 ) Conjetura 2 : C(n) = O(n(ln n)2 )

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.3

27

Shellsort
Vantagens: Shellsort uma tima opo para arquivos de tamanho moderado. Sua implementao simples e requer uma quantidade de cdigo pequena. Desvantagens: O tempo de execuo do algoritmo sensvel ordem inicial do arquivo. O mtodo no estvel,

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.4

28

Quicksort
Proposto por Hoare em 1960 e publiccado em 1962. o algoritmo de ordenao interna mais rpido que se conhece para uma ampla variedade de situaes. Provavelmente o mais utilizado. A idia bsica dividir o problema de ordenar um conjunto com n itens em dois problemas menores. Os problemas menores so ordenados independentemente. Os resultados so combinados para produzir a soluo nal.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.4

29

Quicksort
A parte mais delicada do mtodo o processo de partio. O vetor A[Esq..Dir] rearranjado por meio da escolha arbitrria de um piv x. O vetor A particionado em duas partes: A parte esquerda com chaves menores ou iguais a x. A parte direita com chaves maiores ou iguais a x.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.4

30

Quicksort
Algoritmo para o particionamento: 1. Escolha arbitrariamente um piv x. 2. Percorra o vetor a partir da esquerda at que A[i] x. 3. Percorra o vetor a partir da direita at que A[j] x. 4. Troque A[i] com A[j]. 5. Continue este processo at os apontadores i e j se cruzarem. Ao nal, o vetor A[Esq..Dir] est particionado de tal forma que: Os itens em A[Esq], A[Esq + 1], . . . , A[j] so menores ou iguais a x. Os itens em A[i], A[i + 1], . . . , A[Dir] so maiores ou iguais a x.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.4

31

Quicksort
Ilustrao do processo de partio:
1 O A A 2 R R D 3 D D R 4 E E E 5 N N N 6 A O O

O piv x escolhido como sendo A[(i + j) div 2]. Como inicialmente i = 1 e j = 6, ento x = A[3] = D. Ao nal do processo de partio i e j se cruzam em i = 3 e j = 2.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.4

32

Quicksort
Procedimento Particao:
void Particao ( TipoIndice Esq, TipoIndice Dir , TipoIndice i , TipoIndice j , TipoItem A) { TipoItem x , w; i = Esq; do { while ( x .Chave > A[ i ] .Chave) ( i )++; while ( x .Chave < A[ j ] .Chave) ( j ); i f ( i <= j ) { w = A[ i ] ; A[ i ] = A[ j ] ; A[ j ] = w; ( i )++; ( j ); } } while ( i <= j ) ; } j = Dir ; x = A[( i + j ) / 2 ] ; / obtem o pivo x /

O anel interno do procedimento Particao extremamente simples. Razo pela qual o algoritmo Quicksort to rpido.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.4

33

Quicksort
Procedimento Quicksort:
/ Entra aqui o procedimento Particao da transparencia 32/ void Ordena( TipoIndice Esq, TipoIndice Dir , TipoItem A) { TipoIndice i , j ; Particao (Esq, Dir , & i , & j , A) ; i f (Esq < j ) Ordena(Esq, j , A) ; i f ( i < Dir ) Ordena( i , Dir , A) ; } void QuickSort(TipoItem A, TipoIndice n) { Ordena(1 , n, A) ; }

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.4

34

Quicksort
Exemplo do estado do vetor em cada chamada recursiva do procedimento Ordena:
1 Chaves iniciais: 1 2 3 4 5 A D E N O A A 2 R D D E R N N R O O O O R R 3 D R 4 E E 5 N N 6 A O

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.4

35

Quicksort: Anlise
Seja C(n) a funo que conta o nmero de comparaes. Pior caso: C(n) = O(n2 ) O pior caso ocorre quando, sistematicamente, o piv escolhido como sendo um dos extremos de um arquivo j ordenado. Isto faz com que o procedimento Ordena seja chamado recursivamente n vezes, eliminando apenas um item em cada chamada. O pior caso pode ser evitado empregando pequenas modicaes no algoritmo. Para isso basta escolher trs itens quaisquer do vetor e usar a mediana dos trs como piv.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.4

36

Quicksort: Anlise
Melhor caso: C(n) = 2C(n/2) + n = n log n n + 1 Esta situao ocorre quando cada partio divide o arquivo em duas partes iguais. Caso mdio de acordo com Sedgewick e Flajolet (1996, p. 17): C(n) 1, 386n log n 0, 846n, Isso signica que em mdia o tempo de execuo do Quicksort O(n log n).

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.4

37

Quicksort
Vantagens: extremamente eciente para ordenar arquivos de dados. Necessita de apenas uma pequena pilha como memria auxiliar. Requer cerca de n log n comparaes em mdia para ordenar n itens. Desvantagens: Tem um pior caso O(n2 ) comparaes. Sua implementao muito delicada e difcil: Um pequeno engano pode levar a efeitos inesperados para algumas entradas de dados. O mtodo no estvel.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.5

38

Heapsort
Possui o mesmo princpio de funcionamento da ordenao por seleo. Algoritmo: 1. Selecione o menor item do vetor. 2. Troque-o com o item da primeira posio do vetor. 3. Repita estas operaes com os n 1 itens restantes, depois com os n 2 itens, e assim sucessivamente. O custo para encontrar o menor (ou o maior) item entre n itens n 1 comparaes. Isso pode ser reduzido utilizando uma la de prioridades.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.5

39

Heapsort
Filas de Prioridades uma estrutura de dados onde a chave de cada item reete sua habilidade relativa de abandonar o conjunto de itens rapidamente. Aplicaes: SOs usam las de prioridades, nas quais as chaves representam o tempo em que eventos devem ocorrer. Mtodos numricos iterativos so baseados na seleo repetida de um item com maior (menor) valor. Sistemas de gerncia de memria usam a tcnica de substituir a pgina menos utilizada na memria principal por uma nova pgina.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.5

40

Heapsort
Filas de Prioridades - Tipo Abstrato de Dados Operaes: 1. Constri uma la de prioridades a partir de um conjunto com n itens. 2. Informa qual o maior item do conjunto. 3. Retira o item com maior chave. 4. Insere um novo item. 5. Aumenta o valor da chave do item i para um novo valor que maior que o valor atual da chave. 6. Substitui o maior item por um novo item, a no ser que o novo item seja maior. 7. Altera a prioridade de um item. 8. Remove um item qualquer. 9. Ajunta duas las de prioridades em uma nica.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.5

41

Heapsort
Filas de Prioridades - Representao Representao atravs de uma lista linear ordenada: Neste caso, Constri leva tempo O(n log n). Insere O(n). Retira O(1). Ajunta O(n). Representao atravs de uma lista linear no ordenada: Neste caso, Constri tem custo linear. Insere O(1). Retira O(n). Ajunta O(1) para apontadores e O(n) para arranjos.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.5

42

Heapsort
Filas de Prioridades - Representao A melhor representao atravs de uma estruturas de dados chamada heap: Neste caso, Constri O(n). Insere, Retira, Substitui e Altera so O(log n). Observao: Para implementar a operao Ajunta de forma eciente e ainda preservar um custo logartmico para as operaes Insere, Retira, Substitui e Altera necessrio utilizar estruturas de dados mais sosticadas, tais como rvores binomiais (Vuillemin, 1978).

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.5

43

Heapsort
Filas de Prioridades - Algoritmos de Ordenao As operaes das las de prioridades podem ser utilizadas para implementar algoritmos de ordenao. Basta utilizar repetidamente a operao Insere para construir a la de prioridades. Em seguida, utilizar repetidamente a operao Retira para receber os itens na ordem reversa. O uso de listas lineares no ordenadas corresponde ao mtodo da seleo. O uso de listas lineares ordenadas corresponde ao mtodo da insero. O uso de heaps corresponde ao mtodo Heapsort.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.5

44

Heap
uma seqncia de itens com chaves c[1], c[2], . . . , c[n], tal que: c[i] c[2i], c[i] c[2i + 1], para todo i = 1, 2, . . . , n/2. A denio pode ser facilmente visualizada em uma rvore binria completa:
1 S

2 R

5 N

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.5

45

Heap
rvore binria completa: Os ns so numerados de 1 a n. O primeiro n chamado raiz. O n k/2 o pai do n k, para 1 < k n. Os ns 2k e 2k + 1 so os lhos esquerda e direita do n k, para 1 k k/2.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.5

46

Heap
As chaves na rvore satisfazem a condio do heap. A chave em cada n maior do que as chaves em seus lhos. A chave no n raiz a maior chave do conjunto. Uma rvore binria completa pode ser representada por um array:
1 S 2 R 3 O 4 E 5 N 6 A 7 D

A representao extremamente compacta. Permite caminhar pelos ns da rvore facilmente. Os lhos de um n i esto nas posies 2i e 2i + 1. O pai de um n i est na posio i div 2.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.5

47

Heap
Na representao do heap em um arranjo, a maior chave est sempre na posio 1 do vetor. Os algoritmos para implementar as operaes sobre o heap operam ao longo de um dos caminhos da rvore. Um algoritmo elegante para construir o heap foi proposto por Floyd em 1964. O algoritmo no necessita de nenhuma memria auxiliar. Dado um vetor A[1], A[2], . . . , A[n]. Os itens A[n/2 + 1], A[n/2 + 2], . . . , A[n] formam um heap: Neste intervalo no existem dois ndices i e j tais que j = 2i ou j = 2i + 1.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.5

48

Heap

1 Chaves iniciais: Esq = 3 Esq = 2 Esq = 1 O O O S

2 R R R R

3 D S S O

4 E E E E

5 N N N N

6 A A A A

7 S D D D

Os itens de A[4] a A[7] formam um heap. O heap estendido para a esquerda (Esq = 3), englobando o item A[3], pai dos itens A[6] e A[7].

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.5

49

Heap
A condio de heap violada: O heap refeito trocando os itens D e S. O item R incluindo no heap (Esq = 2), o que no viola a condio de heap. O item O incluindo no heap (Esq = 1). A Condio de heap violada: O heap refeito trocando os itens O e S, encerrando o processo. O Programa que implementa a operao que informa o item com maior chave:
TipoItem Max(TipoItem A) { return (A[ 1 ] ) ; }

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.5

50

Heap
Programa para refazer a condio de heap:
void Refaz( TipoIndice Esq, TipoIndice Dir , TipoItem A) { TipoIndice i = Esq; int j ; TipoItem x ; j = i 2; x = A[ i ] ; while ( j <= Dir ) { i f ( j < Dir ) { i f (A[ j ] .Chave < A[ j +1].Chave) j ++; } i f ( x .Chave >= A[ j ] .Chave) goto L999; A[ i ] = A[ j ] ; i = j ; } L999: A[ i ] = x ; } j = i 2;

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.5

51

Heap
Programa para construir o heap:
void Constroi(TipoItem A, TipoIndice n) { TipoIndice Esq; Esq = n / 2 + 1 ; while (Esq > 1) { Esq; Refaz(Esq, n, A) ; } }

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.5

52

Heap
Programa que implementa a operao de retirar o item com maior chave:
TipoItem RetiraMax(TipoItem A, TipoIndice n) { TipoItem Maximo; i f (n < 1) p r i n t f ( "Erro : heap vazio \n" ) ; else { Maximo = A[ 1 ] ; A[1] = A[n ] ; Refaz(1 , n, A) ; } return Maximo; } (n);

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.5

53

Heap
Programa que implementa a operao de aumentar o valor da chave do item i:
void AumentaChave( TipoIndice i , TipoChave ChaveNova, TipoItem A) { TipoItem x ; i f (ChaveNova < A[ i ] .Chave) { p r i n t f ( "Erro : ChaveNova menor que a chave atual \n" ) ; return ; } A[ i ] .Chave = ChaveNova; while ( i > 1 && A[ i / 2 ] .Chave < A[ i ] .Chave) { x = A[ i / 2 ] ; A[ i / 2 ] = A[ i ] ; A[ i ] = x ; i /= 2; } }

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.5

54

Heap
Exemplo da operao de aumentar o valor da chave do item na posio i:
(a)
S

(b)

i
E N S A D E N U

i
U D

(c)

(d) i

i
S

O tempo de execuo do procedimento AumentaChave em um item do heap O(log n).

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.5

55

Heap
Programa que implementa a operao de inserir um novo item no heap:
void Insere (TipoItem x , TipoItem A, TipoIndice n) {(n)++; A[n] = x ; A[n ] .Chave = INT_MIN ; AumentaChave(n, x>Chave, A) ; }

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.5

56

Heapsort
Algoritmo: 1. Construir o heap. 2. Troque o item na posio 1 do vetor (raiz do heap) com o item da posio n. 3. Use o procedimento Refaz para reconstituir o heap para os itens A[1], A[2], . . . , A[n 1]. 4. Repita os passos 2 e 3 com os n 1 itens restantes, depois com os n 2, at que reste apenas um item.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.5

57

Heapsort
Exemplo de aplicao do Heapsort:
1 S R O N E D A 2 R N N E D A D 3 O O A A A E 4 E E E D N 5 N D D O 6 A A R 7 D S

O caminho seguido pelo procedimento Refaz para reconstituir a condio do heap est em negrito. Por exemplo, aps a troca dos itens S e D na segunda linha da Figura, o item D volta para a posio 5, aps passar pelas posies 1 e 2.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.5

58

Heapsort
Programa que mostra a implementao do Heapsort:
void Heapsort(TipoItem A, TipoIndice n) { TipoIndice Esq, Dir ; TipoItem x ; Constroi(A, n ) ; Esq = 1; while ( Dir > 1) { / ordena o vetor / x = A[ 1 ] ; A[1] = A[ Dir ] ; A[ Dir ] = x ; Refaz(Esq, Dir , A) ; } } Dir; / constroi o heap / Dir = n;

Anlise O procedimento Refaz gasta cerca de log n operaes, no pior caso.

Logo, Heapsort gasta um tempo de execuo proporcional a n log n, no pior caso.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.5

59

Heapsort
Vantagens: O comportamento do Heapsort sempre O(n log n), qualquer que seja a entrada. Desvantagens: O anel interno do algoritmo bastante complexo se comparado com o do Quicksort. O Heapsort no estvel. Recomendado: Para aplicaes que no podem tolerar eventualmente um caso desfavorvel. No recomendado para arquivos com poucos registros, por causa do tempo necessrio para construir o heap.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.5

60

Comparao entre os Mtodos


Complexidade:
Complexidade Insero Seleo Shellsort Quicksort Heapsort O(n2 ) O(n2 ) O(n log n) O(n log n) O(n log n)

Apesar de no se conhecer analiticamente o comportamento do Shellsort, ele considerado um mtodo eciente).

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.5

61

Comparao entre os Mtodos


Tempo de execuo: Oservao: O mtodo que levou menos tempo real para executar recebeu o valor 1 e os outros receberam valores relativos a ele. Registros na ordem aleatria:
5.00 Insero Seleo Shellsort Quicksort Heapsort 11,3 16,2 1,2 1 1,5 5.000 87 124 1,6 1 1,6 10.000 161 228 1,7 1 1,6 30.000 2 1 1,6

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.5

62

Comparao entre os Mtodos


Registros na ordem ascendente:
500 Insero Seleo Shellsort Quicksort Heapsort 1 128 3,9 4,1 12,2 5.000 1 1.524 6,8 6,3 20,8 10.000 1 3.066 7,3 6,8 22,4 30.000 1 8,1 7,1 24,6

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.5

63

Comparao entre os Mtodos


Tempo de execuo: Registros na ordem descendente:
500 Insero Seleo Shellsort Quicksort Heapsort 40,3 29,3 1,5 1 2,5 5.000 305 221 1,5 1 2,7 10.000 575 417 1,6 1 2,7 30.000 1,6 1 2,9

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.5

64

Comparao entre os Mtodos


Observaes sobre os mtodos: 1. Shellsort, Quicksort e Heapsort tm a mesma ordem de grandeza. 2. O Quicksort o mais rpido para todos os tamanhos aleatrios experimentados. 3. A relao Heapsort/Quicksort constante para todos os tamanhos. 4. A relao Shellsort/Quicksort aumenta se o nmero de elementos aumenta. 5. Para arquivos pequenos (500 elementos), o Shellsort mais rpido que o Heapsort. 6. Se a entrada aumenta, o Heapsort mais rpido que o Shellsort. 7. O Insero o mais rpido se os elementos esto ordenados. 8. O Insero o mais lento para qualquer tamanho se os elementos esto em ordem descendente. 9. Entre os algoritmos de custo O(n2 ), o Insero melhor para todos os tamanhos aleatrios experimentados.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.5

65

Comparao entre os Mtodos


Inuncia da ordem inicial dos registros:
Shellsort 5.000 Asc Des Ale 1 1,5 2,9 10.000 1 1,6 3,1 30.000 1 1,5 3,7 5.000 1 1,1 1,9 Quicksort 10.000 1 1,1 2,0 30.000 1 1,1 2,0 5.000 1,1 1 1,1 Heapsort 10.000 1,1 1 1 30.000 1,1 1 1

1. Shellsort bastante sensvel ordenao ascendente ou descendente da entrada. 2. Em arquivos do mesmo tamanho, o Shellsort executa mais rpido para arquivos ordenados. 3. Quicksort sensvel ordenao ascendente ou descendente da entrada. 4. Em arquivos do mesmo tamanho, o Quicksort executa mais rpido para arquivos ordenados. 5. O Quicksort o mais rpido para qualquer tamanho para arquivos na ordem ascendente. 6. O Heapsort praticamente no sensvel ordenao da entrada.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.5

66

Comparao entre os Mtodos


Mtodo da Insero: o mais interessante para arquivos com menos do que 20 elementos. O mtodo estvel. Possui comportamento melhor do que o mtodo da bolha (Bubblesort) que tambm estvel. Sua implementao to simples quanto as implementaes do Bubblesort e Seleo. Para arquivos j ordenados, o mtodo O(n). O custo linear para adicionar alguns elementos a um arquivo j ordenado.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.5

67

Comparao entre os Mtodos


Mtodo da Seleo: vantajoso quanto ao nmero de movimentos de registros, que O(n). Deve ser usado para arquivos com registros muito grandes, desde que o tamanho do arquivo no exceda 1.000 elementos.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.5

68

Comparao entre os Mtodos


Shellsort: o mtodo a ser escolhido para a maioria das aplicaes por ser muito eciente para arquivos de tamanho moderado. Mesmo para arquivos grandes, o mtodo cerca de apenas duas vezes mais lento do que o Quicksort. Sua implementao simples e geralmente resulta em um programa pequeno. No possui um pior caso ruim e quando encontra um arquivo parcialmente ordenado trabalha menos.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.5

69

Comparao entre os Mtodos


Quicksort: o algoritmo mais eciente que existe para uma grande variedade de situaes. um mtodo bastante frgil no sentido de que qualquer erro de implementao pode ser difcil de ser detectado. O algoritmo recursivo, o que demanda uma pequena quantidade de memria adicional. Seu desempenho da ordem de O(n2 ) operaes no pior caso. O principal cuidado a ser tomado com relao escolha do piv. A escolha do elemento do meio do arranjo melhora muito o desempenho quando o arquivo est total ou parcialmente ordenado. O pior caso tem uma probabilidade muito remota de ocorrer quando os elementos forem aleatrios.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.5

70

Comparao entre os Mtodos


Quicksort: Geralmente se usa a mediana de uma amostra de trs elementos para evitar o pior caso. Esta soluo melhora o caso mdio ligeiramente. Outra importante melhoria para o desempenho do Quicksort evitar chamadas recursivas para pequenos subarquivos. Para isto, basta chamar um mtodo de ordenao simples nos arquivos pequenos. A melhoria no desempenho signicativa, podendo chegar a 20% para a maioria das aplicaes (Sedgewick, 1988).

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.5

71

Comparao entre os Mtodos


Heapsort: um mtodo de ordenao elegante e eciente. Apesar de ser cerca de duas vezes mais lento do que o Quicksort, no necessita de nenhuma memria adicional. Executa sempre em tempo proporcional a n log n, Aplicaes que no podem tolerar eventuais variaes no tempo esperado de execuo devem usar o Heapsort.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.5

72

Comparao entre os Mtodos


Consideraes nais: Para registros muito grandes desejvel que o mtodo de ordenao realize apenas n movimentos dos registros. Com o uso de uma ordenao indireta possvel se conseguir isso. Suponha que o arquivo A contenha os seguintes registros: A[1], A[2], . . . , A[n]. Seja P um arranjo P [1], P [2], . . . , P [n] de apontadores. Os registros somente so acessados para ns de comparaes e toda movimentao realizada sobre os apontadores. Ao nal, P [1] contm o ndice do menor elemento de A, P [2] o ndice do segundo menor e assim sucessivamente. Essa estratgia pode ser utilizada para qualquer dos mtodos de ordenao interna.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.6

73

Ordenao Parcial
Consiste em obter os k primeiros elementos de um arranjo ordenado com n elementos. Quando k = 1, o problema se reduz a encontrar o mnimo (ou o mximo) de um conjunto de elementos. Quando k = n camos no problema clssico de ordenao.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.6

74

Ordenao Parcial
Aplicaes: Facilitar a busca de informao na Web com as mquinas de busca: comum uma consulta na Web retornar centenas de milhares de documentos relacionados com a consulta. O usurio est interessado apenas nos k documentos mais relevantes. Em geral k menor do que 200 documentos. Normalmente so consultados apenas os dez primeiros. Assim, so necessrios algoritmos ecientes de ordenao parcial.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.6

75

Ordenao Parcial
Algoritmos considerados: Seleo parcial. Insero parcial. Heapsort parcial. Quicksort parcial.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.6

76

Seleo Parcial
Um dos algoritmos mais simples. Princpio de funcionamento: Selecione o menor item do vetor. Troque-o com o item que est na primeira posio do vetor. Repita estas duas operaes com os itens n 1, n 2 . . . n k.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.6

77

Seleo Parcial
void SelecaoParcial(TipoVetor A, TipoIndice n, TipoIndice k) { TipoIndice i , j , Min ; { Min = i ; for ( j = i + 1; j <= n ; j ++) i f (A[ j ] .Chave < A[Min ] .Chave) Min = j ; x = A[Min ] ; A[Min] = A[ i ] ; A[ i ] = x ; } } TipoItem x ; for ( i = 1; i <= k ; i ++)

Anlise: Comparaes entre chaves e movimentaes de registros: C(n) = kn M (n) = 3k


k2 2

k 2

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.6

78

Seleo Parcial
muito simples de ser obtido a partir da implementao do algoritmo de ordenao por seleo. Possui um comportamento espetacular quanto ao nmero de movimentos de registros: Tempo de execuo linear no tamanho de k.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.6

79

Insero Parcial
Pode ser obtido a partir do algoritmo de ordenao por Insero por meio de uma modicao simples: Tendo sido ordenados os primeiros k itens, o item da k-sima posio funciona como um piv. Quando um item entre os restantes menor do que o piv, ele inserido na posio correta entre os k itens de acordo com o algoritmo original.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.6

80

Insero Parcial
void InsercaoParcial (TipoVetor A, TipoIndice n, TipoIndice k) { /Nao preserva o restante do vetor / TipoIndice i , j ; { x = A[ i ] ; i f ( i > k ) j = k ; else j = i 1; A[0] = x ; / sentinela / while ( x .Chave < A[ j ] .Chave) { A[ j +1] = A[ j ] ; j ; } A[ j +1] = x ; } } TipoItem x ; for ( i = 2; i <= n ; i ++)

A modicao realizada verica o momento em que i se torna maior do que k e ento passa a considerar o valor de j igual a k a partir deste ponto.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.6

81

Insero Parcial: Preserva Restante do Vetor


void InsercaoParcial2 (TipoVetor A, TipoIndice n, TipoIndice k) { / Preserva o restante do vetor / TipoIndice i , j ; { x = A[ i ] ; i f ( i > k) { j = k ; i f ( x .Chave < A[ k ] .Chave) A[ i ] = A[ k ] ; } else j = i 1; A[0] = x ; / sentinela / while ( x .Chave < A[ j ] .Chave) { i f ( j < k ) {A[ j +1] = A[ j ] ; } j ; } i f ( j < k ) A[ j +1] = x ; } } TipoItem x ; for ( i = 2; i <= n ; i ++)

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.6

82

Insero Parcial: Anlise


No anel mais interno, na i-sima iterao o valor de Ci :
Melhor caso : Ci (n) = 1 Pior caso Caso mdio e : Ci (n) = i : Ci (n) = 1 (1 + 2 + + i) = i
i+1 2

Assumindo que todas as permutaes de n so igualmente provveis, o nmero de comparaes :


Melhor caso : C(n) = (1 + 1 + + 1) = n 1 Pior caso : C(n) = (2 + 3 + + k + (k + 1)(n k)) = kn + n Caso mdio e
kn 2 n 2 k2 2 k 2

: C(n) = 1 (3 + 4 + + k + 1 + (k + 1)(n k)) 2 = +


k2 4

k 4

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.6

83

Insero Parcial: Anlise


O nmero de movimentaes na i-sima iterao :
Mi (n) = Ci (n) 1 + 3 = Ci (n) + 2

Logo, o nmero de movimentos :


Melhor caso : M (n) = (3 + 3 + + 3) = 3(n 1) Pior caso : M (n) = (4 + 5 + + k + 2 + (k + 1)(n k)) = kn + n Caso mdio e
kn 2 n 2 k2 2 3k 2

1 : M (n) = 2 (5 + 6 + + k + 3 + (k + 1)(n k))

k2 4

5k 4

O nmero mnimo de comparaes e movimentos ocorre quando os itens esto originalmente em ordem. O nmero mximo ocorre quando os itens esto originalmente na ordem reversa.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.6

84

Heapsort Parcial
Utiliza um tipo abstrato de dados heap para informar o menor item do conjunto. Na primeira iterao, o menor item que est em a[1] (raiz do heap) trocado com o item que est em A[n]. Em seguida o heap refeito. Novamente, o menor est em A[1], troque-o com A[n-1]. Repita as duas ltimas operaes at que o k-simo menor seja trocado com A[n k]. Ao nal, os k menores esto nas k ltimas posies do vetor A.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.6

85

Heapsort Parcial
/ Entram aqui os procedimentos Refaz e Constroi das transparencias 50 e 51/ / Coloca menor em A[n] , segundo menor em A[n 1 ] , . . . , / ksimo em A[nk ] { TipoIndice Esq = 1; TipoIndice Dir ; TipoItem x ; Dir = n; while (Aux < k) { / ordena o vetor / x = A[ 1 ] ; A[1] = A[n Aux] ; A[n Aux] = x ; Dir; Aux++; Refaz(Esq, Dir , A) ; } } long Aux = 0; / constroi o heap / Constroi(A, n ) ; / /

void HeapsortParcial(TipoItem A, TipoIndice n, TipoIndice k)

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.6

86

Heapsort Parcial: Anlise:


O HeapsortParcial deve construir um heap a um custo O(n). O procedimento Refaz tem custo O(log n). O procedimento HeapsortParcial chama o procedimento Refaz k vezes. Logo, o algoritmo apresenta a complexidade: O(n + k log n) =
O(n)

se k se k >

O(k log n)

n log n n log n

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.6

87

Quicksort Parcial
Assim como o Quicksort, o Quicksort Parcial o algoritmo de ordenao parcial mais rpido em vrias situaes. A alterao no algoritmo para que ele ordene apenas os k primeiros itens dentre n itens muito simples. Basta abandonar a partio direita toda vez que a partio esquerda contiver k ou mais itens. Assim, a nica alterao necessria no Quicksort evitar a chamada recursiva Ordena(i,Dir).

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.6

88

Quicksort Parcial
1 Chaves iniciais: 1 2 3 4 5 A D E N O A A 2 R D D E R N N R O O O O R R 3 D R 4 E E 5 N N 6 A O

Considere k = 3 e D o piv para gerar as linhas 2 e 3. A partio esquerda contm dois itens e a partio direita, quatro itens. A partio esquerda contm menos do que k itens. Logo, a partio direita no pode ser abandonada. Considere E o piv na linha 3. A partio esquerda contm trs itens e a partio direita tambm. Assim, a partio direita pode ser abandonada.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.6

89

Quicksort Parcial
void Ordena(TipoVetor A, TipoIndice Esq, TipoIndice Dir , TipoIndice k) { TipoIndice i , j ; Particao (A, Esq, Dir , & i , & j ) ; i f ( j Esq >= k 1) { i f (Esq < j ) Ordena(A, Esq, j , k ) ; return ; } i f (Esq < j ) Ordena(A, Esq, j , k ) ; i f ( i < Dir ) Ordena(A, i , Dir , k ) ; } void QuickSortParcial (TipoVetor A, TipoIndice n, TipoIndice k) { Ordena(A, 1 , n, k ) ; }

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.6

90

Quicksort Parcial: Anlise:


A anlise do Quicksort difcil. O comportamento muito sensvel escolha do piv. Podendo cair no melhor caso O(k log k). Ou em algum valor entre o melhor caso e O(n log n).

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.6

91

Comparao entre os Mtodos de Ordenao Parcial (1)


n, k n : 101 k : 100 n : 101 k : 101 n : 102 k : 100 n : 102 k : 101 n : 102 k : 102 n : 103 k : 100 n : 103 k : 101 n : 103 k : 102 n : 103 k : 103 n : 105 k : 100 n : 105 k : 101 n : 105 k : 102 n : 105 k : 103 n : 105 k : 104 n : 105 k : 105 Seleo 1 1,2 1 1,9 3 1 4,6 11,2 15,1 1 5,9 67 304 1445 Quicksort 2,5 2,8 3 2,4 1,7 3,7 2,9 1,3 1 2,4 2,2 2,1 1 1 1 Insero 1 1 1,1 1 1 1,4 1 1 3,9 1,1 1 1 1,1 33,1 Insero2 1,2 1,1 1,4 1,2 1,1 1,6 1,2 1,4 4,2 1,1 1 1,1 1,3 43,3 Heapsort 1,7 2,8 4,5 3 2,3 9,1 6,4 1,9 1,6 5,3 4,9 4,8 2,3 1,7 1,9

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.6

92

Comparao entre os Mtodos de Ordenao Parcial (2)


n, k n : 106 k : 100 n : 106 k : 101 n : 106 k : 102 n : 106 k : 103 n : 106 k : 104 n : 106 k : 105 n : 106 k : 106 n : 107 k : 100 n : 107 k : 101 n : 107 k : 102 n : 107 k : 103 n : 107 k : 104 n : 107 k : 105 n : 107 k : 106 n : 107 k : 107 Seleo 1 6,6 83,1 690 1 8,6 82,1 Quicksort 3,9 2,7 3,2 2,2 1 1 1 3,4 2,6 2,6 3,1 1,1 1 1 1 Insero 1,2 1 1 1 5 1,1 1 1 1 1 Insero2 1,3 1 1,1 1,1 6,4 1,1 1,1 1,1 1,1 1,2 Heapsort 8,1 7,3 6,6 5,7 1,9 1,7 1,8 7,4 6,7 6,8 6,6 2,6 2,2 1,2 1,7

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.6

93

Comparao entre os Mtodos de Ordenao Parcial


1. Para valores de k at 1.000, o mtodo da InseroParcial imbatvel. 2. O QuicksortParcial nunca car muito longe da InseroParcial. 3. Na medida em que o k cresce,o QuicksortParcial a melhor opo. 4. Para valores grandes de k, o mtodo da InseroParcial se torna ruim. 5. Um mtodo indicado para qualquer situao o QuicksortParcial. 6. O HeapsortParcial tem comportamento parecido com o do QuicksortParcial. 7. No entano, o HeapsortParcial mais lento.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.7

94

Ordenao em Tempo Linear


Nos algoritmos apresentados a seguir no existe comparao entre chaves. Eles tm complexidade de tempo linear na prtica. Necessitam manter uma cpia em memria dos itens a serem ordenados e uma rea temporria de trabalho.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.7

95

Ordenao por Contagem


Este mtodo assume que cada item do vetor A um nmero inteiro entre 0 e k. O algoritmo conta, para cada item x, o nmero de itens antes de x. A seguir, cada item colocado no vetor de sada na sua posio denitiva.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.7

96

Ordenao por Contagem


1 A 1 0 C 2 2 4 1 3 3 0 2 0 4 5 6 7 8 3 0 1 4 1 3 4 1 2 (a) B C B 0 1 2 3 4 2 5 5 6 8 (b) 1 2 3 4 1 0 1 2 3 2 3 5 6 (e) 5 6 7 8 1 4 4 7 C 1 2 3 4 5 6 7 8 1 0 1 2 3 4 2 4 5 6 8 (c) 1 2 3 4 5 6 7 8 0 0 1 1 1 3 4 4

B C

1 2 3 4 5 6 7 8 1 4 0 1 2 3 4 2 4 5 6 7 (d)

(f)

A contm oito chaves de inteiros entre 0 e 4. Cada etapa mostra: (a) o vetor de entrada A e o vetor auxiliar C contendo o nmero de itens iguais a i, 0 i 4; (b) o vetor C contendo o nmero de itens i, 0 i 4; (c), (d), (e) os vetores auxiliares B e C aps uma, duas e trs iteraes, considerando os itens em A da direita para a esquerda; (f) o vetor auxiliar B ordenado.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.7

97

Ordenao por Contagem


void Contagem(TipoItem A, TipoIndice n, int k) { int i ; for ( i = 0; i <= k ; i ++) C[ i ] = 0; for ( i = 1; i <= n ; i ++) C[A[ i ] .Chave] = C[A[ i ] .Chave] + 1; for ( i = 1; i <= k ; i ++) C[ i ] = C[ i ] + C[ i 1]; for ( i = n ; i > 0; i) { B[C[A[ i ] .Chave] ] = A[ i ] ; C[A[ i ] .Chave] = C[A[ i ] .Chave] 1; } for ( i = 1; i <= n ; i ++) A[ i ] = B[ i ] ; }

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.7

98

Ordenao por Contagem


Os arranjos auxiliares B e C devem ser declarados fora do procedimento Contagem para evitar que sejam criados a cada chamada do procedimento. No quarto for, como podem haver itens iguais no vetor A, ento o valor de C[A[j]] decrementado de 1 toda vez que um item A[j] colocado no vetor B. Isso garante que o prximo item com valor igual a A[j], se existir, vai ser colocado na posio imediatamente antes de A[j] no vetor B. O ltimo for copia para A o vetor B ordenado. Essa cpia pode ser evitada colocando o vetor B como parmetro de retorno no procedimento Contagem, como mostrado no Exerccio 4.24. A ordenao por contagem um mtodo estvel.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.7

99

Ordenao por Contagem: Anlise


O primeiro for tem custo O(k). O segundo for tem custo O(n). O terceiro for tem custo O(k). O quarto for tem custo O(n + k). Na prtica o algoritmo deve ser usado quando k = O(n), o que leva o algoritmo a ter custo O(n). De outra maneira, as complexidades de espao e de tempo cam proibitivas. Na seo seguinte vamos apresentar um algoritmo prtico e eciente para qualquer valor de k.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.7

100

Radixsort para Inteiros


Utiliza o princpio da distribuio das antigas classicadoras de cartes perfurados. Os cartes eram organizados em 80 colunas e cada coluna permitia uma perfurao em 1 de 12 lugares. Para nmeros inteiros positivos, apenas 10 posies da coluna eram usadas para os valores entre 0 e 9. A classicadora examinava uma coluna de cada carto e distribuia mecanicamente o carto em um dos 12 escaninhos, dependendo do lugar onde fora perfurado. Um operador ento recolhia os 12 conjuntos de cartes na ordem desejada, ascendente ou descendente.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.7

101

Radixsort para Inteiros


Radixsort considera o dgito menos signicativo primeiro e ordena os itens para aquele dgito. Depois repete o processo para o segundo dgito menos signicativo, e assim sucessivamente.
07 33 18 22 01 07 01 22 33 07 07 18 01 07 07 18 22 33

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.7

102

Radixsort para Inteiros


Primeiro renamento:
#define BASE 256 #define M 8 #define NBITS 32 RadixsortInt (TipoItem A, TipoIndice n) { for ( i = 0; i < NBITS / M; i ++) Ordena A sobre o dgito i menos significativo usando um algoritmo estvel ; }

O programa recebe o vetor A e o tamanho n do vetor. O nmero de bits da chave (NBits) e o nmero de bits a considerar em cada passada (m) determinam o nmero de passadas, que igual a NBits div m.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.7

103

Radixsort para Inteiros


O algoritmo de ordenao por contagem uma excelente opo para ordenar o vetor A sobre o dgito i por ser estvel e de custo O(n). O vetor auxiliar C ocupa um espao constante que depende apenas da base utilizada. Por exemplo, para a base 10, o vetor C armazena valores de k entre 0 e 9, isto , 10 posies. A implementao a seguir utiliza Base = 256 e o vetor C armazena valores de k entre 0 e 255 para representar os caracteres ASCII. Nesse caso podemos ordenar inteiros de 32 bits (4 bytes com valores entre 0 e 232 ) em apenas d = 4 chamadas do algoritmo de ordenao por contagem.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.7

104

Radixsort para Inteiros


O algoritmo de ordenao por contagem precisa ser alterado para ordenar sobre m bits de cada chave do vetor A. A funo GetBits extrai um conjunto contguo de m bits do nmero inteiro. Em linguagem de mquina, os bits so extrados de nmeros binrios usando operaes and, shl (shift left), shr (shift right), e not (complementa todos os bits). Por exemplo, os 2 bits menos signicativos de um nmero x de 10 bits so extrados movendo os bits para a direita com x shr 2 e uma operao and com a mscara 0000000011.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.7

105

Ordenao por Contagem Alterado


#define GetBits(x, k, j ) ( x >> k) & ~((~0) < < j ) void ContagemInt(TipoItem A, TipoIndice n, int Pass) { int i , j ; for ( i = 0; i <= BASE 1; i ++) C[ i ] = 0; for ( i = 1; i <= n ; i ++) { j = GetBits(A[ i ] .Chave, Pass M, M) ; C[ j ] = C[ j ] + 1; } i f (C[0] == n) return ; for ( i = 1; i <= BASE 1; i ++) C[ i ] = C[ i ] + C[ i 1]; for ( i = n ; i > 0; i) { j = GetBits(A[ i ] .Chave, Pass M, M) ; B[C[ j ] ] = A[ i ] ; C[ j ] = C[ j ] 1; } for ( i = 1; i <= n ; i ++) A[ i ] = B[ i ] ; }

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.7

106

Radixsort para Inteiros


No Programa, quando qualquer posio i do vetor C contm um valor igual a n signica que todos os n nmeros do vetor de entrada A so iguais a i. Isso vericado no comando if logo aps o segundo for para C[0]. Nesse caso todos os valores de A so iguais a zero no byte considerado como chave de ordenao e o restante do anel no precisa ser executado. Essa situao ocorre com frequncia nos bytes mais signicativos de um nmero inteiro. Por exemplo, para ordenar nmeros de 32 bits que tenham valores entre 0 e 255, os trs bytes mais signicativos so iguais a zero.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.7

107

Radixsort para Inteiros


void RadixsortInt (TipoItem A, TipoIndice n) { int i ; for ( i = 0; i < NBITS / M; i ++) ContagemInt(A, n, i ) ; }

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.7

108

Radixsort para Inteiros: Anlise


Cada passada sobre n inteiros em ContagemInt custa O(n + Base). Como so necessrias d passadas, o custo total O(dn + dBase). Radixsort tem custo O(n) quando d constante e Base = O(n). Se cada nmero cabe em uma palavra de computador, ento ele pode ser tratado como um nmero de d dgitos na notao base n. Para A contendo 1 bilho de nmeros de 32 bits (4 dgitos na base 28 = 256), apenas 4 chamadas de Contagem so necessrias. Se considerarmos um algoritmo que utiliza o princpio da comparao de chaves, como o Quicksort, ento so necessrias log n = 30 operaes por nmero (considerando que uma palavra de computador ocupa O(log n) bits). Isso signica que o Radixsort mais rpido para ordenar inteiros. O aspecto negativo o espao adicional para B e C.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.7

109

Radixsort para Cadeias de Caracteres


O algoritmo de ordenao por contagem precisa ser alterado para ordenar sobre o caractere k da chave de cada item x do vetor A.
void ContagemCar(TipoItem A, TipoIndice n, int k) { int i , j ; for ( i = 0; i <= BASE 1; i ++) C[ i ] = 0; for ( i = 1; i <= n ; i ++) { j = ( int ) A[ i ] .Chave[ k ] ; C[ j ] = C[ j ] + 1; } i f (C[0] == n) return ; for ( i = 1; i <= BASE 1; i ++) C[ i ] = C[ i ] + C[ i 1]; for ( i = n ; i > 0; i) { j = ( int ) A[ i ] .Chave[ k ] ; B[C[ j ] ] = A[ i ] ; C[ j ] = C[ j ] 1; } for ( i = 1; i <= n ; i ++) A[ i ] = B[ i ] ; }

Projeto de Algoritmos Cap.4 Ordenao Seo 4.1.7

110

Radixsort para Cadeias de Caracteres


void RadixsortCar(TipoItem A, TipoIndice n) { int i ; for ( i = TAMCHAVE 1; i >= 0; i ) ContagemCar (A, n, i ) ; }

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2

111

Ordenao Externa
A ordenao externa consiste em ordenar arquivos de tamanho maior que a memria interna disponvel. Os mtodos de ordenao externa so muito diferentes dos de ordenao interna. Na ordenao externa os algoritmos devem diminuir o nmero de acesso as unidades de memria externa. Nas memrias externas, os dados cam em um arquivo seqencial. Apenas um registro pode ser acessado em um dado momento. Essa uma restrio forte se comparada com as possibilidades de acesso em um vetor. Logo, os mtodos de ordenao interna so inadequados para ordenao externa. Tcnicas de ordenao diferentes devem ser utilizadas.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2

112

Ordenao Externa
Fatores que determinam as diferenas das tcnicas de ordenao externa: 1. Custo para acessar um item algumas ordens de grandeza maior. 2. O custo principal na ordenao externa relacionado a transferncia de dados entre a memria interna e externa. 3. Existem restries severas de acesso aos dados. 4. O desenvolvimento de mtodos de ordenao externa muito dependente do estado atual da tecnologia. 5. A variedade de tipos de unidades de memria externa torna os mtodos dependentes de vrios parmetros. 6. Assim, apenas mtodos gerais sero apresentados.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2

113

Ordenao Externa
O mtodo mais importante o de ordenao por intercalao. Intercalar signica combinar dois ou mais blocos ordenados em um nico bloco ordenado. A intercalao utilizada como uma operao auxiliar na ordenao. Estratgia geral dos mtodos de ordenao externa: 1. Quebre o arquivo em blocos do tamanho da memria interna disponvel. 2. Ordene cada bloco na memria interna. 3. Intercale os blocos ordenados, fazendo vrias passadas sobre o arquivo. 4. A cada passada so criados blocos ordenados cada vez maiores, at que todo o arquivo esteja ordenado.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2

114

Ordenao Externa
Os algoritmos para ordenao externa devem reduzir o nmero de passadas sobre o arquivo. Uma boa medida de complexidade de um algoritmo de ordenao por intercalao o nmero de vezes que um item lido ou escrito na memria auxiliar. Os bons mtodos de ordenao geralmente envolvem no total menos do que dez passadas sobre o arquivo.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2.1

115

Intercalao Balanceada de Vrios Caminhos


Considere um arquivo armazenado em uma ta de entrada:
INTERCALACAOBALANCEADA

Objetivo: Ordenar os 22 registros e coloc-los em uma ta de sada. Os registros so lidos um aps o outro. Considere uma memria interna com capacidade para para trs registros. Considere que esteja disponvel seis unidades de ta magntica.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2.1

116

Intercalao Balanceada de Vrios Caminhos


Fase de criao dos blocos ordenados:
ta 1: ta 2: ta 3: INT CER AAL ACO ABL ACN ADE A

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2.1

117

Intercalao Balanceada de Vrios Caminhos


Fase de intercalao - Primeira passada: 1. O primeiro registro de cada ta lido. 2. Retire o registro contendo a menor chave. 3. Armazene-o em uma ta de sada. 4. Leia um novo registro da ta de onde o registro retirado proveniente. 5. Ao ler o terceiro registro de um dos blocos, sua ta ca inativa. 6. A ta reativada quando o terceiro registro das outras tas forem lidos.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2.1

118

Intercalao Balanceada de Vrios Caminhos


Fase de intercalao - Primeira passada: 7. Neste instante um bloco de nove registros ordenados foi formado na ta de sada. 8. Repita o processo para os blocos restantes. Resultado da primeira passada da segunda etapa:
ta 4: ta 5: ta 6: AACEILNRT AAABCCLNO AADE

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2.1

119

Intercalao Balanceada de Vrios Caminhos


Quantas passadas so necessrias para ordenar um arquivo de tamanho arbitrrio? Seja n, o nmero de registros do arquivo. Suponha que cada registro ocupa m palavras na memria interna. A primeira etapa produz n/m blocos ordenados. Seja P (n) o nmero de passadas para a fase de intercalao. Seja f o nmero de tas utilizadas em cada passada. Assim: n . m No exemplo acima, n=22, m=3 e f=3 temos: P (n) = logf P (n) = log3 22 = 2. 3

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2.1

120

Intercalao Balanceada de Vrios Caminhos


No exemplo foram utilizadas 2f tas para uma intercalao-de-f -caminhos. possvel usar apenas f + 1 tas: Encaminhe todos os blocos para uma nica ta. Redistribuia estes blocos entre as tas de onde eles foram lidos. O custo envolvido uma passada a mais em cada intercalao. No caso do exemplo de 22 registros, apenas quatro tas seriam sucientes: A intercalao dos blocos a partir das tas 1, 2 e 3 seria toda dirigida para a ta 4. Ao nal, o segundo e o terceiro blocos ordenados de nove registros seriam transferidos de volta para as tas 1 e 2.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2.2

121

Implementao por meio de Seleo por Substituio


A implementao do mtodo de intercalao balanceada pode ser realizada utilizando las de prioridades. As duas fases do mtodo podem ser implementadas de forma eciente e elegante. Operaes bsicas para formar blocos ordenados: Obter o menor dentre os registros presentes na memria interna. Substitu-lo pelo prximo registro da ta de entrada. Estrutura ideal para implementar as operaes: heap. Operao de substituio: Retirar o menor item da la de prioridades. Colocar um novo item no seu lugar. Reconstituir a propriedade do heap.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2.2

122

Implementao por meio de Seleo por Substituio


Algoritmo: 1. Inserir m elementos do arquivo na la de prioridades. 2. Substituir o menor item da la de prioridades pelo prximo item do arquivo. 3. Se o prximo item menor do que o que saiu, ento: Considere-o membro do prximo bloco. Trate-o como sendo maior do que todos os itens do bloco corrente. 4. Se um item marcado vai para o topo da la de prioridades ento: O bloco corrente encerrado. Um novo bloco ordenado iniciado.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2.2

123

Implementao por meio de Seleo por Substituio


Entra E R C A L A C A O B A 1 I N R T A* C* E* L* A A B 2 N E* E* E* E* E* A A A O O 3 T T T C* C* L* L* C C C C

Entra L A N C E A D A

1 C L O A* A* C* E* N* A A D

2 O O A* N* N* N* N* D D D

3 A* A* A* A* C* E* A A A

Primeira passada sobre o arquivo exemplo. Os asteriscos indicam quais chaves pertencem a blocos diferentes.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2.2

124

Implementao por meio de Seleo por Substituio


Fase de intercalao dos blocos ordenados obtidos na primeira fase: Operao bsica: obter o menor item dentre os ainda no retirados dos f blocos a serem intercalados. Algoritmo: Monte uma la de prioridades de tamanho f . A partir de cada uma das f entradas: Substitua o item no topo da la de prioridades pelo prximo item do mesmo bloco do item que est sendo substitudo. Imprima em outra ta o elemento substitudo.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2.2

125

Implementao por meio de Seleo por Substituio


Exemplo:
Entra A L E R N T 1 A A C E I L N R T 2 C C L L L N R T 3 I I I I R R

Para f pequeno no vantajoso utilizar seleo por substituio para intercalar blocos: Obtm-se o menor item fazendo f 1 comparaes. Quando f 8 ou mais, o mtodo adequado: Obtm-se o menor item fazendo log2 f comparaes.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2.3

126

Consideraes Prticas
As operaes de entrada e sada de dados devem ser implementadas ecientemente. Deve-se procurar realizar a leitura, a escrita e o processamento interno dos dados de forma simultnea. Os computadores de maior porte possuem uma ou mais unidades independentes para processamento de entrada e sada. Assim, pode-se realizar processamento e operaes de E/S simultaneamente.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2.3

127

Consideraes Prticas
Tcnica para obter superposio de E/S e processamento interno: Utilize 2f reas de entrada e 2f de sada. Para cada unidade de entrada ou sada, utiliza-se duas reas de armazenamento: 1. Uma para uso do processador central 2. Outra para uso do processador de entrada ou sada. Para entrada, o processador central usa uma das duas reas enquanto a unidade de entrada est preenchendo a outra rea. Depois a utilizao das reas invertida entre o processador de entrada e o processador central. Para sada, a mesma tcnica utilizada.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2.3

128

Consideraes Prticas
Problemas com a tcnica: Apenas metade da memria disponvel utilizada. Isso pode levar a uma inecincia se o nmero de reas for grande. Ex: Intercalao-de-f -caminhos para f grande. Todas as f reas de entrada em uma intercalao-de-f -caminhos se esvaziando aproximadamente ao mesmo tempo.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2.3

129

Consideraes Prticas
Soluo para os problemas: Tcnica de previso: Requer a utilizao de uma nica rea extra de armazenamento durante a intercalao. Superpe a entrada da prxima rea que precisa ser preenchida com a parte de processamento interno do algoritmo. fcil saber qual rea car vazia primeiro. Basta olhar para o ltimo registro de cada rea. A rea cujo ltimo registro o menor, ser a primeira a se esvaziar.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2.3

130

Consideraes Prticas
Escolha da ordem de intercalao f : Para tas magnticas: f deve ser igual ao nmero de unidades de ta disponveis menos um. A fase de intercalao usa f tas de entrada e uma ta de sada. O nmero de tas de entrada deve ser no mnimo dois. Para discos magnticos: O mesmo raciocnio acima vlido. O acesso seqencial mais eciente. Sedegwick (1988) sugere considerar f grande o suciente para completar a ordenao em poucos passos. Porm, a melhor escolha para f depende de vrios parmetros relacionados com o sistema de computao disponvel.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2.4

131

Intercalao Polifsica
Problema com a intercalao balanceada de vrios caminhos: Necessita de um grande nmero de tas. Faz vrias leituras e escritas entre as tas envolvidas. Para uma intercalao balanceada de f caminhos so necessrias 2f tas. Alternativamente, pode-se copiar o arquivo quase todo de uma nica ta de sada para f tas de entrada. Isso reduz o nmero de tas para f + 1. Porm, h um custo de uma cpia adicional do arquivo. Soluo: Intercalao polifsica.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2.4

132

Intercalao Polifsica
Os blocos ordenados so distribudos de forma desigual entre as tas disponveis. Uma ta deixada livre. Em seguida, a intercalao de blocos ordenados executada at que uma das tas esvazie. Neste ponto, uma das tas de sada troca de papel com a ta de entrada.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2.4

133

Intercalao Polifsica
Exemplo: Blocos ordenados obtidos por meio de seleo por substituio:
ta 1: ta 2: ta 3: INRT AACEN ACEL AAD AABCLO

Congurao aps uma intercalao-de-2-caminhos das tas 1 e 2 para a ta 3:


ta 1: ta 2: ta 3: AACEINNRT AAACDEL AABCLO

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2.4

134

Intercalao Polifsica
Exemplo: Depois da intercalao-de-2-caminhos das tas 1 e 3 para a ta 2:
ta 1: ta 2: ta 3: AAAABCCEILNNORT AAACDEL

Finalmente:
ta 1: ta 2: ta 3: AAAAAAABCCCDEEILLNNORT

A intercalao realizada em muitas fases. As fases no envolvem todos os blocos. Nenhuma cpia direta entre tas realizada.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2.4

135

Intercalao Polifsica
A implementao da intercalao polifsica simples. A parte mais delicada est na distribuio inicial dos blocos ordenados entre as tas. Distribuio dos blocos nas diversas etapas do exemplo:
ta 1 3 1 0 1 ta 2 2 0 1 0 ta 3 0 2 1 0 Total 5 3 2 1

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2.4

136

Intercalao Polifsica
Anlise: A anlise da intercalao polifsica complicada. O que se sabe que ela ligeiramente melhor do que a intercalao balanceada para valores pequenos de f . Para valores de f > 8, a intercalao balanceada pode ser mais rpida.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2.5

137

Quicksort Externo
Foi proposto por Monard em 1980. Utiliza o paradigma de diviso e conquista. O algoritmo ordena in situ um arquivo A = {R1 , . . . , Rn } de n registros. Os registros esto armazenados consecutivamente em memria secundria de acesso randmico. O algoritmo utiliza somente O(log n) unidades de memria interna e no necessria nenhuma memria externa adicional.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2.5

138

Quicksort Externo
Seja Ri , 1 i n, o registro que se encontra na i-sima posio de A. Algoritmo: 1. Particionar A da seguinte forma: {R1 , . . . , Ri } Ri+1 Ri+2 . . . Rj2 Rj1 {Rj , . . . , Rn }, 2. chamar recursivamente o algoritmo em cada um dos subarquivos A1 = {R1 , . . . , Ri } e A2 = {Rj , . . . , Rn }.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2.5

139

Quicksort Externo
Para o partionamento utilizanda uma rea de armazenamento na memria interna. Tamanho da rea: TamArea = j i 1, com TamArea 3. Nas chamadas recusivas deve-se considerar que: Primeiro deve ser ordenado o subarquivo de menor tamanho. Condio para que, na mdia, O(log n) subarquivos tenham o processamento adiado. Subarquivos vazios ou com um nico registro so ignorados. Caso o arquivo de entrada A possua no mximo TamArea registros, ele ordenado em um nico passo.

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2.5

140

Quicksort Externo
i Li Ls j rea Linf Lsup i Li Ls j 4 rea Linf Lsup

a)

5 3 10 6 1 7 4 Ei i Li Ls Es j 4 5

b)

5 3 10 6 1 7 4 Ei i Li Ls Es j

c)

5 3 10 6 1 7 4 Ei i Li Ls Es j

d)

5 3 10 6 1 7 4 Ei i Li Ls Es j

4 5 7

e)

5 3 10 6 1 7 7 Ei i Li Ls Es j

4 5

f)

5 3 10 6 1 7 7 Ei i Li Ls 3 3 10 6 1 7 7 Ei Li Ls Es j Es j

3 4 5

g)

3 3 10 6 1 7 7 Ei i Li Ls Es j

4 5

h)

4 5

i 4 5 3 7

i)

3 1 10 6 1 7 7 Ei i Li Ls Es j

j)

3 1 10 6 1 7 7 Ei i Ls Li Es j

4 5

k)

3 1 10 6 1 10 7 Ei i Ls Li Es j

4 5

l)

3 1 10 6 1 10 7 Ei i Ls Li Es j

4 5 6

m) 3 1 10 6 6 10 7
Ei Es

4 5

n)

3 1 4 5 6 10 7 Es Ei

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2.5

141

Quicksort Externo
void QuicksortExterno(FILE ArqLi , FILE ArqEi , FILE ArqLEs, int Esq, int Dir ) { int i , j ; TipoArea Area ; / Area de armazenamento interna / i f ( Dir Esq < 1) return ; FAVazia(&Area) ; Particao (ArqLi , ArqEi , ArqLEs, Area, Esq, Dir , & i , & j ) ; i f ( i Esq < Dir j ) { / ordene primeiro o subarquivo menor / QuicksortExterno(ArqLi , ArqEi , ArqLEs, Esq, i ) ; QuicksortExterno(ArqLi , ArqEi , ArqLEs, j , Dir ) ; } else { QuicksortExterno(ArqLi , ArqEi , ArqLEs, j , Dir ) ; QuicksortExterno(ArqLi , ArqEi , ArqLEs, Esq, i ) ; } }

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2.5

142

Quicksort Externo: Procedimentos Auxiliares


void LeSup(FILE ArqLEs, TipoRegistro UltLido , int Ls,short OndeLer) { fseek(ArqLEs, ( Ls 1) sizeof(TipoRegistro ) ,SEEK_SET ) ; fread ( UltLido , sizeof(TipoRegistro ) , 1 , ArqLEs) ; (Ls); OndeLer = FALSE ; } void LeInf (FILE ArqLi , TipoRegistro UltLido , int Li ,short OndeLer) { fread ( UltLido , sizeof(TipoRegistro ) , 1 , ArqLi ) ; ( Li )++; OndeLer = TRUE ; } void InserirArea (TipoArea Area, TipoRegistro UltLido , int NRArea) { /Insere UltLido de forma ordenada na Area/ InsereItem(UltLido , Area ) ; } NRArea = ObterNumCelOcupadas(Area) ;

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2.5

143

Quicksort Externo: Procedimentos Auxiliares


void EscreveMax(FILE ArqLEs, TipoRegistro R, int Es) { fseek(ArqLEs, ( Es 1) sizeof(TipoRegistro ) ,SEEK_SET ) ; fwrite(&R, sizeof(TipoRegistro ) , 1 , ArqLEs) ; } void EscreveMin(FILE ArqEi , TipoRegistro R, int Ei ) (Ei )++; } (Es);

{ fwrite(&R, sizeof(TipoRegistro ) , 1 , ArqEi ) ; void RetiraMax(TipoArea Area, { RetiraUltimo (Area, R) ;

TipoRegistro R, int NRArea)

NRArea = ObterNumCelOcupadas(Area ) ; }

void RetiraMin(TipoArea Area, TipoRegistro R, int NRArea) { RetiraPrimeiro (Area, R) ; NRArea = ObterNumCelOcupadas(Area ) ; }

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2.5

144

Quicksort Externo: Procedimento Particao


void Particao (FILE ArqLi , FILE ArqEi , FILE ArqLEs, TipoArea Area, int Esq, int Dir , int i , int j ) { int Ls = Dir , Es = Dir , Li = Esq, Ei = Esq, NRArea = 0 , Linf = INT_MIN , Lsup = INT_MAX ; short OndeLer = TRUE ; TipoRegistro UltLido , R; fseek (ArqLi , ( Li 1) sizeof(TipoRegistro ) , SEEK_SET ) ; fseek (ArqEi , ( Ei 1) sizeof(TipoRegistro ) , SEEK_SET ) ; i = Esq 1; j = Dir + 1; while (Ls >= Li ) { i f ( NRArea < TAMAREA 1) { i f (OndeLer) LeSup(ArqLEs, &UltLido , &Ls, &OndeLer) ; else LeInf (ArqLi, &UltLido , & Li , &OndeLer) ; InserirArea(&Area, &UltLido , &NRArea ) ; continue; } i f (Ls == Es) LeSup(ArqLEs, &UltLido , &Ls, &OndeLer) ; else i f ( Li == Ei ) LeInf (ArqLi, &UltLido , & Li , &OndeLer) ; else i f (OndeLer) LeSup(ArqLEs, &UltLido , &Ls, &OndeLer) ; else LeInf (ArqLi, &UltLido , & Li , &OndeLer) ;

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2.5

145

Quicksort Externo: Procedimento Particao


i f ( UltLido .Chave > Lsup) { j = Es; EscreveMax(ArqLEs, UltLido , &Es) ; continue; } i f ( UltLido .Chave < Linf ) { i = Ei ; EscreveMin(ArqEi , UltLido , &Ei ) ; continue; } InserirArea(&Area, &UltLido , &NRArea ) ; i f ( Ei Esq < Dir Es) { RetiraMin(&Area, &R, &NRArea ) ; EscreveMin(ArqEi , R, &Ei ) ; Linf = R.Chave; } else { RetiraMax(&Area, &R, &NRArea ) ; EscreveMax(ArqLEs, R, &Es) ; Lsup = R.Chave; } } while ( Ei <= Es) { RetiraMin(&Area, &R, &NRArea ) ; EscreveMin(ArqEi , R, &Ei ) ; } }

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2.5

146

Quicksort Externo: Programa Teste


typedef int TipoApontador; / Entra aqui o Programa C.23/ typedef TipoItem TipoRegistro ; /Declaracao dos tipos utilizados pelo quicksort externo/ FILE ArqLEs; FILE ArqLi ; FILE ArqEi ; TipoItem R; / Entram aqui os Programas J.4, D.26, D.27 e D.28/ int main( int argc , char argv [ ] ) { ArqLi = fopen ( " teste . dat" , "wb" ) ; i f (ArqLi == NULL ) { p r i n t f ( "Arquivo nao pode ser aberto \n" ) ; exit ( 1 ) ; } R.Chave = 5; R.Chave = 3; R.Chave = 6; R.Chave = 1; R.Chave = 7; R.Chave = 4; fclose (ArqLi ) ; fwrite(&R, sizeof(TipoRegistro ) , 1 , ArqLi ) ; fwrite(&R, sizeof(TipoRegistro ) , 1 , ArqLi ) ; fwrite(&R, sizeof(TipoRegistro ) , 1 , ArqLi ) ; fwrite(&R, sizeof(TipoRegistro ) , 1 , ArqLi ) ; fwrite(&R, sizeof(TipoRegistro ) , 1 , ArqLi ) ; fwrite(&R, sizeof(TipoRegistro ) , 1 , ArqLi ) ; / Gerencia o Ls e o Es / / Gerencia o Li / / Gerencia o Ei /

R.Chave = 10; fwrite(&R, sizeof(TipoRegistro ) , 1 , ArqLi ) ;

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2.5

147

Quicksort Externo: Programa Teste


ArqLi = fopen ( " teste . dat" , " r+b" ) ; i f ( ArqLi == NULL ) { p r i n t f ( "Arquivo nao pode ser aberto \n" ) ; exit ( 1 ) ; } ArqEi = fopen ( " teste . dat" , " r+b" ) ; i f ( ArqEi == NULL ) { p r i n t f ( "Arquivo nao pode ser aberto \n" ) ; exit ( 1 ) ; } ArqLEs = fopen ( " teste . dat" , " r+b" ) ; i f (ArqLEs == NULL ) { p r i n t f ( "Arquivo nao pode ser aberto \n" ) ; exit ( 1 ) ; } QuicksortExterno(&ArqLi, &ArqEi, &ArqLEs, 1 , 7 ) ; fflush (ArqLi ) ; fclose (ArqEi ) ; fclose (ArqLEs) ; fseek(ArqLi ,0 , SEEK_SET ) ; while( fread(&R, sizeof(TipoRegistro ) , 1 , ArqLi ) ) { p r i n t f ( "Registro=%d\n" , R.Chave) ; } fclose (ArqLi ) ; return 0; }

Projeto de Algoritmos Cap.4 Ordenao Seo 4.2.5

148

Quicksort Externo: Anlise


Seja n o nmero de registros a serem ordenados. Seja e b o tamanho do bloco de leitura ou gravao do Sistema operacional. Melhor caso: O( n ) b Por exemplo, ocorre quando o arquivo de entrada j est ordenado. Pior caso:
n2 O( TamArea )

ocorre quando um dos arquivos retornados pelo procedimento Particao tem o maior tamanho possvel e o outro vazio. A medida que n cresce, a probabilidade de ocorrncia do pior caso tende a zero.
n Caso Mdio: O( n log( TamArea )) b

o que tem amaior probabilidade de ocorrer.