Anda di halaman 1dari 2

Universidade Federal da Paraba Centro de Cincias Exatas e da Natureza Departamento de Informtica Programa de Ps-Graduao em Informtica - PPGI Disciplina: Arquitetura

de Computadores Professor: Alisson Brito Perodo: 2011.2

Aluna: Andrea Fernanda

Resenha 10 GPU
Slawomir Walkowiak, Konrad Wawruch, Marita Nowotka, Lukasz Ligowski, Witold Rudnicki, Exploring utilisation of GPU for database applications, Procedia Computer Science, Volume 1, Issue 1, May 2010, Pages 505-513, ISSN 1877-0509, 10.1016/j.procs.2010.04.054. (http://www.sciencedirect.com/science/article/pii/S1877050910000554)

GPU para aplicaes em banco de dados

GPU so processadores de alto desempenho cuja aplicao no se restringe somente a algoritmos grficos. Portanto, seu uso vem sendo explorado para diversas aplicaes, dentre elas, banco de dados. O algoritmo Nsearch foi desenvolvido no laboratrio dos autores com a finalidade de busca de busca rpida em bancos de dados com grande volume de textos, usado como motor de busca no NLM PubMed database, que contm mais de 16 milhes de abstracts de artigos cientficos na rea de cincias biomdicas. Os autores fornecem uma implementao do referido algoritmo em uma GPU; o algoritmo 1 se baseia numa representao n-gram do texto. O algoritmo Nsearch foi testado em duas arquiteturas: CPU(no especificada) e GPU (Tesla C1070 card) com a finalidade de avaliar o benefcio de substituir a arquitetura atualmente utilizada (CPU). Para cada artigo da base de dados, todos os 3-gram presentes so indexados. Cada artigo divido em 32 segmentos contento ao menos W palavras (W = 9); em caso de o tamanho do artigo ser menor que 32 x W, alguns dos segmentos estaro vazios. Uma entrada de ndice para um n-gram para um artigo consiste do ID do artigo e seu mapa de 32-bit map, exibindo a distribuio de n-grams no artigo. Existem cerca de 40 mil 3-grams nicos no 2 banco de dados. Um nmero de entradas indexadas para cada 3-gram segue a seguinte distribuio : poucos n-grams presentes em quase todos os artigos e muitos n-grams presentes em muito poucos artigos. O resultado de uma query deve conter todos os artigos que possuem ao mesmo X% dos ngrams contidos na query. Constri-se uma lista de artigos com base nos segmentos contendo nmero
1 3

Lank, E.; Blostein, D.; , "N-grams: a well-structured knowledge representation for recognition of graphical documents," Document Analysis and Recognition, 1997., Proceedings of the Fourth International Conference on , vol.2, no., pp.801-804 vol.2, 18-20 Aug 1997 doi: 10.1109/ICDAR.1997.620621 URL: http://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=620621&isnumber=13496 2 Power law distribution http://en.wikipedia.org/wiki/Power_law
3

No foi especificado o valor de X.

suficiente de n-grams de uma query. A busca procede do n-gram mais discriminativo ao menos discriminativo. O prximo estgio a fase de gathering (coleta), em que os artigos contendo os n-grams da query so coletados numa hit-list e recebem um score igual ao nmero mais alto de n-grams diferentes em um segmento. As ltimas fases do algoritmo, onde a lista de candidatos processada, foram conduzidas somente sobre CPU. O tempo total de execuo do teste foi de 260,2 segundos para a verso CPU e 13,6 para a verso GPU (18 vezes menor) (para as fases executadas em GPU, naturalmente). Conclui-se que a tendncia substituir, quando possvel, CPUs por GPUs, para execuo de tarefas que requerem/suportem processamento de alto volume de dados de forma paralela, considerando que GPUs no se limitam ao processamento grfico apenas. A abordagem dividir para conquistar foi explorada como soluo para a busca e o paralelismo provido pela GPU torna isso mais fcil de implementar. Ainda, os autores realizaram a diviso dos passos do algoritmo entre as arquiteturas, o que se mostrou confuso para o leitor memorizar em que arquitetura cada sequncia do algoritmo foi executada durante a leitura. O artigo, ainda, carece de esquemas para representao visual (em fluxograma) do algoritmo de busca, o que torna a leitura maante.

Anda mungkin juga menyukai