Dissertao de Mestrado
RECIFE
2015
RECIFE
2015
Agradecimentos
A Emanoel Barreiros, meu esposo, pelo carinho, dedicao, pacincia, compreenso e
suporte em todos os momentos mais decisivos e marcantes de minha vida.
Ao melhor presente que o meu pequeno Davi Barreiros, por simplesmente existir e fazer
os momentos mais difceis se transformarem nos mais inspiradores apenas com o seu lindo
sorriso.
A Dulce Lins, Marcos Lins, Heline Lins, Igor Lins e Jssica Barbosa, Rejane Barreiros, Manoel
Barreiros, Manoela Barreiros, Maurcio Barreiros e Thuanne Paiva, minha famlia, que uniram
todos os esforos para que este sonho se tornasse realidade.
Ao meu orientador Vinicius Garcia, obrigada pela oportunidade, confiana, suporte e parceria
durante a caminhada do mestrado.
Ao meu co-orientador Sergio Soares, obrigada pelo apoio e disponibilidade para conversas
e orientaes at mesmo nos momentos mais corridos de seus compromissos.
A Adauto Trigueiro, Alex Nery, Andreza Leite, Diogo Vincius, Emanoel Barreiros, Eudis
Teixeira, Gert Ucha, Jos Fernando, Juliana Saraiva, Leandro Marques, Liliane Fonseca, Marco
Machado, Michael Frana, Samuel Romeiro, Thiago Jamir, Vilmar Nepomuceno, Vinicius
Garcia que uniram esforos para analisar os estudos deste mapeamento.
A FACEPE, que acreditou no projeto e nos financiou.
A todos do laboratrio INES, que compartilharam conversas e ideias.
Aos integrantes dos grupo de pesquisa ASSERT Lab e ESEG pelas participao ativa no desenvolvimento desta pesquisa.
A todos que no foram mencionados acima, mas contriburam de maneira direta ou indireta para
a realizao e concluso deste trabalho.
Resumo
Contexto: Para que os leitores possam avaliar a validade de um estudo emprico, replicar
seus resultados, ou para que editores possam julgar efetivamente o verdadeiro potencial de
impacto da pesquisa, os autores devem relatar e documentar cuidadosamente elementos da
pesquisa como: motivao, objetivo, mtodo, anlise dos dados, resultados, concluses e
limitaes. Infelizmente autores tm indicado que a comunicao dos resultados de estudos
empricos (EE) na computao em nuvem (CN) omitem informaes relevantes destes elementos
de pesquisa.Tais inconvenincias na comunicao dos resultados destes estudos, ampliadas a todo
um campo de pesquisa, podem levar a um conjunto potencial de evidncias fracas ou ilusrias
para futuras pesquisas cientficas.
Objetivo: Apesar de crticas aos relatos dos estudos empricos serem evidenciadas, at o
presente momento, no foi realizada uma caracterizao das informaes omitidas pelos autores.
Neste sentido, o presente estudo tem como objetivo apresentar um esforo primeiro que analisa
nos relatos a apresentao dos elementos de pesquisa acima citados, considerados essenciais para
a anlise da validade e protencial de uma pesquisa emprica. Analisar a forma de apresentao
dos resultados um primeiro passo relevante para a compreenso do cenrio atual da prtica
dos relatos dos estudos empricos. Assim, foi analisado nos relatos o grau de completude: o
quo presentes esto as informaes dos elementos da pesquisa em seus relatos. Afim de realizar
uma anlise mais profunda, o foco inicial da pesquisa foi direcionado ao mtodo emprico de
experimentao, com foco nas avaliaes da caracterstica de elasticidade da CN.
Mtodo: Atravs de um mapeamento sistemtico da literatura (MSL) foram identificados
os experimentos em elasticidade na computao em nuvem e, atravs de instrumento de avaliao
criado com base em orientaes existentes para se reportar experimentos na engenharia de
software experimental, a completude de seus relatos foi avaliada.
Resultado: Aps a avaliao inicial de 3.611 estudos, foram selecionados e analisados
os relatos de 59 experimentos. Constatamos que em geral os autores omitem informaes
relacionadas ao planejamento da pesquisa, coleta dos dados, procedimentos de execuo, instrumentao, anlise dos dados, relao dos resultados com pesquisas anteriores, ameaas
validade e generalizao dos resultados. Em relao ao ndice de completude o maior grau
foi 6.67 em uma escala de 0 a 10, sendo considerada baixa em valores quantitativos. Tambm
foi realizada uma breve anlise qualitativa que revela que, ainda que reportadas, muitas das
informaes apresentadas pelos relatos so superficiais e dificultam a interpretao, validao,
generalizao e replicao dos resultados dos estudos.
Palavras-chave: Engenharia de Software, Computao em Nuvem, Elasticidade, Engenharia
de Software Experimental, Experimentos.
Abstract
Context: To enable readers to assess the validity of an empirical study, replicate their
results, or allow publishers to effectively judge its true potential impact of research, the authors
should report and carefully document elements of research, such as: motivation, goal, method,
data analysis, findings, conclusions and limitations. Unfortunately authors have indicated that
communication of the results of empirical studies in cloud computing omit relevant information
from these elements. Such inconveniences in reporting the results of these studies, expanded to
an entire field of research, can lead to a potential set of weak or misleading evidence for future
scientific research.
Objective: Despite criticism of the reports of empirical studies are highlighted, to date,
has not been performed a characterization of the information omitted by the authors. In this
sense, this study aims to present a first effort which analyzes the reports presenting the research
elements mentioned above, considered essential for the analysis of the validity and protencial
of empirical research. To examine how to present the results is an important first step towards
understanding the current state of the practice of the reports of empirical studies. Thus, it was
analyzed in the reports of the studies the degree of completeness: which information from
research elements in their reports. In order to conduct a deeper analysis of the reports, the initial
focus of the research was directed to the empirical method of experimentation, focusing on
evaluations of cloud computing elasticity characteristic.
Method: Through a systematic mapping of literature were identified experiments on
elasticity in the cloud computing and through an assessment instrument, created based on existing
guidelines to report experiments in experimental software engineering, the completeness of their
reports was evaluated.
Results: After the initial evaluation of 3,611 studies, 59 experiments were selected and
had their reports analyzed. It was found that in general the authors omit information related
to the research design, data collection, execution procedures, instrumentation, data analysis,
comparison of the results with previous research, threats to validity and generalizability of the
results. In relation to the completeness index, the highest score reached was 6.67 on a scale of 0
to 10, and such completion is considered low in quantitative terms. A brief qualitative analysis
was also conducted which reveals that, although reported, much of the information presented by
the reports are superficial and difficult to interpret, validate, generalize and hinder replication of
study results.
Keywords: Software Engineering, Cloud Computing, Elasticity, Empirical Software Engineering, Experiments.
Lista de Figuras
1.1
22
2.1
26
2.2
29
2.3
Movimentao da comunidade para a criao dos guias para reportar experimentos na engenharia de software . . . . . . . . . . . . . . . . . . . . . . . . . . .
36
3.1
42
3.2
45
4.1
53
55
57
58
58
4.6
59
4.7
59
4.8
61
4.9
. . . . . . . . . . . . . . . .
61
. . . . . . . . . . . . . . . .
62
62
63
64
65
66
67
68
68
69
70
70
4.2
4.3
4.4
4.5
4.22
4.23
4.24
4.25
4.26
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
71
72
72
73
73
Lista de Tabelas
3.1
3.2
3.3
39
40
3.4
3.5
3.6
4.1
4.2
4.3
4.4
4.5
4.6
4.7
52
54
55
56
59
60
63
41
47
47
48
94
122
Sumrio
1
Introduo
21
1.1
Contribuio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
23
1.2
Estrutura da Dissertao . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
23
Referencial Terico
25
2.1
Computao em Nuvem . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
25
2.1.1
Caractersticas Essenciais . . . . . . . . . . . . . . . . . . . . . . . .
27
2.1.2
Modelos de Servio . . . . . . . . . . . . . . . . . . . . . . . . . . . .
27
2.1.3
Formas de Distribuio . . . . . . . . . . . . . . . . . . . . . . . . . .
28
2.1.4
28
2.1.5
Elasticidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
29
2.1.5.1
Elasticidade x Escalabilidade . . . . . . . . . . . . . . . . .
30
2.1.5.2
30
2.1.5.3
Mtodo . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
30
2.1.5.4
Poltica . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
31
31
2.2.1
32
2.2.1.1
Estudo de Caso . . . . . . . . . . . . . . . . . . . . . . . .
33
2.2.1.2
Survey . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
33
2.2.1.3
Etnografia . . . . . . . . . . . . . . . . . . . . . . . . . . .
34
2.2.1.4
Pesquisa-ao . . . . . . . . . . . . . . . . . . . . . . . . .
34
2.2.1.5
Experimento Controlado . . . . . . . . . . . . . . . . . . .
34
2.2.1.6
Teoria Fundamentada . . . . . . . . . . . . . . . . . . . . .
35
35
2.3
37
2.4
Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
38
2.2
2.2.2
Mtodo
39
3.1
39
3.2
40
3.3
Ciclo da Pesquisa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
42
3.3.1
42
3.3.1.1
43
3.3.1.2
43
3.3.1.3
Definio da Metodologia . . . . . . . . . . . . . . . . . . .
44
3.3.2
44
3.3.2.1
45
Definio do Protocolo . . . . . . . . . . . . . . . . . . . .
3.3.2.1.1
Questes de Pesquisa . . . . . . . . . . . . . . . .
45
3.3.2.1.2
46
3.3.2.1.3
47
3.3.2.1.4
Avaliao da Qualidade . . . . . . . . . . . . . . .
48
3.3.2.1.5
Estratgia de Extrao . . . . . . . . . . . . . . . .
48
Reviso do Protocolo . . . . . . . . . . . . . . . . . . . . .
49
3.3.3
49
3.3.4
49
3.3.5
Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
49
3.3.2.2
Resultados
51
4.1
51
4.1.1
51
4.1.2
52
4.1.3
56
4.1.4
56
4.2
Anlise Geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
57
4.3
63
4.3.1
4.3.2
4.3.3
4.3.4
4.4
5
64
65
66
67
4.3.5
4.3.6
4.3.7
4.3.8
72
73
70
Consideraes Finais
77
5.1
Ameaas validade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
77
5.2
Trabalhos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
78
5.3
Concluses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
79
19
Referncias
81
Apndice
87
89
95
109
113
E Autores Envolvidos
117
123
F.1
Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
F.2
F.3
F.4
F.5
F.6
F.7
F.8
G Ferramenta ExtractViewer
133
137
20
H.0.10 Apndices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
21
1
Introduo
MARTENS; TEUTEBERG (2011) enfatizam a necessidade de se aumentar a utilizao
de mtodos empricos na computao em nuvem para facilitar a transferncia de tecnologias
entre academia e industria. Ao mesmo tempo, alguns autores relatam enfrentar dificuldades
para interpretar os relatos de estudos empricos pois no conseguem avaliar a validade da
pesquisa e seu potencial de impacto por causa da omisso e superficialidade das informaes
reportadas (DURAO et al., 2014; LI et al., 2013; HUANG et al., 2013; NASIR; NIAZI, 2011;
SILVA; ROSE; CALINESCU, 2013a). Em geral, tais registros apontam desde o descuido em
no apresentar as questes de pesquisa, a omisso de procedimentos metodolgicos, a no
caracterizao do contexto da pesquisa, a ocultao da anlise dos dados at a superficialidade
na discusso dos resultados.
O problema com os relatos de estudos empricos tambm recorrente em outras reas
da engenharia de software (ES). Por exemplo, na comunidade de software de cdigo aberto,
uma recente reviso da literatura identificou que a qualidade dos relatos de estudos empricos
precisa ser substancialmente melhorada STOL; BABAR (2009). Em geral, os autores dos estudos
analisados no descreveram claramente a motivao da pesquisa, no justificam a escolha do
mtodo, a seleo da amostra dos dados e nem as limitaes da pesquisa. J outro estudo
sistemtico no campo do desenvolvimento gil de software, constatou que a fora das evidncias
de seus estudos empricos foi considerada muito baixa e prejudicou o processo de extrao dos
dados por causa da superficialidade e omisso de informaes DYB; DINGSYR (2008).
Na engenharia de software experimental (ESE), rea da ES dedicada aos mtodos empricos, alguns autores tambm apontam insuficincias no relato de sues estudos. Tais problemas
incluem relatrios incompletos, informaes relacionadas dispersas em diferentes sees do
relato e falta de utilizao de uma terminologia consistente. MACDONELL; SHEPPERD (2007)
tambm enfatizam a necessidade de melhorar a forma como os estudos so publicados, atravs
de uma forma consistente, utilizando resumos estruturados, ttulos significativos e esquemas de
palavras-chave. SMITE et al. (2008) recomendam tambm que os relatos devem ser mais claros
e consistentes para permitir que profissionais possam aprender atravs da literatura existente.
Em estudo sistemtico realizado, DYB; KAMPENES; SJ BERG (2006) relatam dificuldades
22
CAPTULO 1. INTRODUO
em avaliar o poder estatstico dos estudos pois em 67% deles no era possvel identificar quais
testes foram realizados para se avaliar as hipteses.
Outras reas do conhecimento como a medicina e psicologia, reportam problemas no
relato de seus experimentos. Tais problemas so similares aos relatados na engenharia de
software e vrias melhorias tem sido alcanadas atravs da padronizao e criao de diretrizes
para reportar os resultados destes experimentos. Muitas revises tm registrado deficincias nos
relatrios dos experimentos realizados na pesquisa mdica, e tais anlises culminaram na criao
e utilizao de guias para como melhor report-las ALTMAN et al. (2001); MOHER; SCHULZ;
ALTMAN (2001). A psicologia tambm tem vivenciado problemas similares e tambm aderiu
utilizao de guias para publicao dos resultados dos experimentos realizados ASSOCIATION
et al. (2001); WILKINSON (1999); HARRIS (2008); SHIFFMAN et al. (2003).
Pode ser observado na literatura da ES, a iniciativa de se seguir o mesmo movimento
promissor da medicina e psicologia na criao de guias para auxiliar os esforos de melhoria da
prtica de experimentao. Tais esforos datam da dcada de 80, e como pode ser visto na linha
do tempo da Figura 1.1, so apresentados em forma de livros, guias, avaliaes e estudos do
estado da arte. Neste movimento possvel observar que guias implcitos (cor preta) e explcitos
(cor azul) foram construdos para se relatar experimentos na ES. Entretanto, apenas em 2008 foi
apresentada por JEDLITSCHKA; CIOLKOWSKI; PFAHL (2008) a verso final do primeiro
guia especfico para orientar os pesquisadores a relatar estudos empricos de experimentao.
Figura 1.1 Linha do tempo dos guias para relato de experimentos. (do autor)
1.1. CONTRIBUIO
23
foi realizada uma caracterizao das informaes omitidas nos relatos de estudos emprcos
realizados no contexto da computao em nuvem. Neste sentido, o presente estudo tem como
objetivo apresentar um esforo primeiro que analisa nos relatos a apresentao destes elementos
de pesquisa j mencionados, considerados essenciais para a anlise da validade e potencial das
pesquisas empricas. Analisar a forma de apresentao dos relatos um primeiro passo relevante
para a compreenso do cenrio atual da prtica de comunicao das pesquisas empricas. Assim,
foi analisado nos relatos o grau de completude: a presena das informaes dos elementos da
pesquisa em seus relatos.
Afim de realizar uma anlise inicial mais profunda e obter uma contribuio mais
relevante no estudo destes relatos, o foco inicial deste trabalho foi direcionado s pesquisas que
utilizaram realizaram experimentos. Escolheu-se focar em experimentos pois este um mtodo
emprico bem representativo mediante as caractersticas da rea de pesquisa em computao
em nuvem. Entretanto, mediante s limitaes de tempo e espao, foi necessrio condensar o
escopo da pesquisa e ento foi decidido estudar os relatos dos experimentos que avaliavam a
caracterstica mais marcante da computao em nuvem: a elasticidade. Embora o escopo tenha
sido reduzido, a quantidade de estudos avaliados matm a representatividade da rea de pesquisa
como um todo, tanto em nmero quanto natureza dos experimentos realizados.
1.1
Contribuio
1.2
Estrutura da Dissertao
Alm deste captulo introdutrio a presente dissertao est organizada de acordo com a
seguinte estrutura:
Captulo 2 (Referencial Terico): este captulo trata de toda a fundamentao terica para o entendimento do trabalho. Primeiramente o paradigma da computao em
nuvem apresentado permeando suas caractersticas essenciais, modelos de servio,
formas de distribuio e acordo de nvel de servio. Outro ponto do paradigma discutido em detalhe a sua principal caracterstica e objeto deste trabalho: a elasticidade.
Em seguida a engenharia de software experimental abordada em relao sua
24
CAPTULO 1. INTRODUO
definio, influncia sofrida pelo posicionamento filosfico do pesquisador, seus
mtodos e uma discusso especial sobre guias para relato de experimentos. Logo
depois a engenharia de software baseada em evidncias discutida em sua definio,
mtodos e aplicao na pesquisa.
Captulo 3 (Metodologia): o captulo detalha toda a abordagem metodolgica e mtodos empregados na pesquisa. So discutidos aspectos relacionados classificao,
ciclo da pesquisa, a utilizao do mtodo de pesquisa de mapeamento sistemtico da
literatura e as peculiaridades de sua instanciao.
Captulo 4 (Execuo e Resultados): apresenta e discute os resultados obtidos nesta
pesquisa por meio de uma anlise geral dos estudos selecionados. As perguntas de
pesquisas so respondidas e os principais achados so discutidos.
Captulo 5 (Consideraes Finais): trata das ameaas validade da pesquisa e
respectivas mitigaes. Apresenta as perspectivas de trabalhos futuros para que a
comunidade possa dar continuidade pesquisa. E por fim as lies aprendidas e
concluses so enunciadas.
25
2
Referencial Terico
Este captulo tem como objetivo explanar os conceitos e estudos utilizados como base
para a presente pesquisa. Na seo 2.1 so apresentados os conceitos da Computao em Nuvem
(CN). A seo 2.2 discute as noes relacionadas Engenharia de Software Experimental (ESE) e
seus mtodos. A seo 2.3 expe os conceitos da Engenharia de Software Baseada em Evidncias
(ESBE) para apoiar o mtodo de pesquisa adotado.
2.1
Computao em Nuvem
26
O termo nuvem uma abstrao que encobre toda a complexidade de infraestrutura que
fornecida atravs de servios utilizando hardware compartilhado para computao e armazenamento (BUYYA et al., 2009). Em geral, como pode ser visto na Figura 2.1, a infraestrutura da
nuvem composta por uma grande quantidade de mquinas ou ns fsicos conectados em rede.
Cada uma das mquinas pode ter diferentes configuraes de hardware e software e variar em
termos de capacidade de CPU, memria e armazenamento em disco (SOROR et al., 2010).
2.1.1
27
Caractersticas Essenciais
2.1.2
Modelos de Servio
28
2.1.3
Formas de Distribuio
Os ambientes de computao em nuvem podem ser distribudos de quatro formas diferentes nos quesitos acesso e disponibilidade: (i) Nuvem Privada, (ii) Nuvem Pblica, (iii) Nuvem
Comunidade e (iv) Nuvem Hbrida (MELL; GRANCE, 2009). As restries de acesso dependem
do processo de negcio, tipo de informao e nvel de viso desejado.
1. Nuvem Pblica: a infraestrutura da nuvem disponibilizada ao pblico geral, acessvel qualquer usurio que tenha conhecimento da localicao do servio.
2. Nuvem Privada: a infraestrutura de utilizao exclusiva de uma organizao,
sendo disponibilizada local ou remotamente, administrada pela prpria empresa ou
terceiros.
3. Nuvem Comunitria: a infraestrutura compartilhada por uma comunidade de
organizaes com interesses em comum.
4. Nuvem Hbrida: a infraestrutura composta por duas ou mais nuvens de quaisquer
tipos mencionados acima. A conexo entre elas feita via tecnologia proprietria ou
padronizada e permite a portabilidade de dados e aplicaes.
2.1.4
29
2.1.5
Elasticidade
A seguir sero apresentados brevemente os conceitos fundamentais relacionados elasticidade e seus mecanismos: elasticidade x escalabilidade, velocidade de ao x remoo, mtodo
e poltica.
30
2.1.5.1
Mtodo
Atravs do mtodo possvel decidir qual ser o tratamento dado aos novos recursos
provisionados. Segundo vrios autores, quanto diviso, a elasticidade pode se dar horizontalmente ou verticalmente (ALI-ELDIN; TORDSSON; ELMROTH, 2012; GUERRERO; SACHS;
PETROV, 2010; SHARMA et al., 2011; SULEIMAN et al., 2011).
A elasticidade horizontal consiste na adio/remoo do quantitativo de instncias de
um usurio, alm da migrao para novos ns de processamento. Estas instncias podem ser
aplicaes, containers ou mquinas virtuais (MV). Em geral, a replicao o mtodo mais
utilizado para prover elasticidade.
A elasticidade vertical equivale a adio / remoo de recursos como memria, CPU e
armazenamento a partir de uma instncia virtual. Existem duas abordagens para se prover esse
tipo de elasticidade:
31
Poltica
Existem duas polticas de reao da nuvem em relao a execuo de aes de elasticidade: manual e automtica.
Poltica Manual: neste tipo de poltica o usurio responsvel por monitorar seu
ambiente e recursos a fim de operar todas as aes de elasticidade. Para tal, o provedor
de servio deve fornecer ao usurio uma interface ou API por meio da qual o mesmo
iterage com o sistema.
Poltica Automtica: o controle e aes so tomadas pela prpria nuvem ou pela
aplicao que est executando nela, em conformidade com as regras e configuraes
que foram definidas pelo usurio ou SLA. Atravs da coleta de informaes dos
sistemas de monitoramento a nuvem decide quando e como os recursos de elasticidade
sero utilizados. De acordo com a tcnica a poltica automtica pode ser classificada
como reativa e preditiva (GALANTE; BONA, 2012).
Reativa: fundamentada em regras de mecanismos baseadas em gatilhos.
Uma regra possui um conjunto de condies que, quando so satisfeitas,
disparam um gatilho que ir tomar algumas aes sobre os recursos da
nuvem. Este mecanismo alimentado por meio dos dados fornecidos pelo
sistema de monitoramento de infra-estrutura ou da aplicao na nuvem.
Preditiva: utiliza heursticas e tcnicas matemticas/analticas para tentar
prever o comportamento da carga de trabalho no sistema e, com base nisto,
decidir quando adicionar ou remover os recursos.
2.2
32
2.2.1
33
Estudo de Caso
Estudo de caso um mtodo emprico originado nas cincias sociais e, ainda hoje,
h divergncias na literatura quanto ao seu conceito. Tem por objetivo investigar fenmenos
que ocorrem em seu contexto real, principalmente, quando as fronteiras entre o contexto e
os fenmenos no so evidentes (YIN, 2013). De forma a compreender como e porque, tal
fenmeno acontece sem que haja nenhum controle sobre as variveis envolvidas (FUKS, 2011)
Entretanto h muita confuso em relao aos estudos de caso na ES, pelo fato do mtodo
ser frequentemente utilizado para denominar demonstraes simples do uso de uma determinada
tecnologia (SJOBERG; DYBA; JORGENSEN, 2007), quando na verdade o mtodo sistemtico
e rigoroso no apoio a pesquisas exploratrias e qualitativas (RUNESON; HST, 2009).
2.2.1.2
Survey
Originado na economia e sociologia o survey o mtodo emprico utilizado para identificar caractersticas de populaes amplas por meio da produo de dados estatsticos (KITCHENHAM; PFLEEGER, 2008). Valendo-se de questionrios, os pesquisadores selecionam
uma amostra representativa da populao e procuram respostas de um conjunto de populao,
relacionadas s aes, experincias, opinies ou comportamentos desta em relao ao objeto de
estudo.
Alm de questionrios, podem ser utilizados entrevistas estruturadas e tcnicas de logging
para a coleta dos dados. Tambm possvel observar a utilizao da estratgia em conjunto com
outros mtodos quando se deseja descrever, explanar e explorar informaes preliminares ou
ainda levantar as variveis do estudo a serem avaliadas (TRAVASSOS; GUROV; AMARAL,
34
2002). Em funo destas caractersticas os surveys tendem a lidar com pesquisas quantitativas,
descritivas e de design fixo (RUNESON; HST, 2009).
2.2.1.3
Etnografia
Pesquisa-ao
Experimento Controlado
35
fixa algumas e varia outras. Atravs deste processo, os pesquisadores investigam como as
variveis se relacionam e se existe alguma relao de causalidade entre elas.
2.2.1.6
Teoria Fundamentada
2.2.2
36
Figura 2.3 Movimentao da comunidade para a criao dos guias para reportar experimentos na
engenharia de software
37
foi lanada uma nova verso do guia incorporando sugestes de mais pesquisadores. Em 2008
foi lanada a verso final do guia, com todas as sugestes de melhorias e defeitos registrados
anteriormente (JEDLITSCHKA; CIOLKOWSKI; PFAHL, 2008).
O presente trabalho utilizou o guia de JEDLITSCHKA; CIOLKOWSKI; PFAHL (2008)
como base para construir o instrumento de coleta, pelo fato do mesmo ser uma evoluo de
todos os guias publicados anteriormente que tratavam do relato de experimentos na ES. O fato
de o desenvolvimento do guia ter sido iterativo e seu teor validado, incorporado feedbacks dos
membros da comunidade tambm pesou na escolha pelo guia. Outro ponto importante o fato
do guia apresentar um contedo com orientaes detalhadas por sees e subsees seguidas de
exemplos.
2.3
38
2.4
Resumo
39
3
Mtodo
O objetivo deste captulo detalhar a abordagem metodolgica utilizada na presente
pesquisa por meio de trs sees: Classificao Geral da Pesquisa, Classificao do Estudo
Sistemtico Segundo Cooper e Ciclo da Pesquisa.
A Seo 3.1 apresenta a classificao da pesquisa perante cinco aspectos; j a Seo 3.2
apresenta a classificao do mapeamento sistemtico mediante taxonomia amplamente utilizada
em estudos sistemticos; a por fim Seo 3.3 apresenta uma viso geral do planejamento
metodgico da pesquisa atravs de suas etapas e atividades.
3.1
A pesquisa realizada nesta dissertao foi classificada perante cinco aspectos: mtodo de
abordagem, mtodo de procedimento, objetivo, natureza dos dados e posicionamento filosfico.
Atravs da Tabela 3.1 possvel observar o quadro metodolgico que resume estes elementos.
Quadro Metodolgico
Mtodo de Abordagem
Indutivo
Mtodo de Procedimento Mapeamento Sistemtico da Literatura
Quanto ao Objetivo
Pesquisa Descritiva
Natureza dos Dados
Qualitativa
Posicionamento Filosfico Pragmtico
Tabela 3.1: Classificao Geral da Pesquisa
Quanto ao mtodo de abordagem essa dissertao de carter indutivo, uma vez que
baseia-se em estudos primrios particulares para delinear o cenrio geral do tema em discusso. As concluses so concebidas por meio de uma cadeia de raciocnio ascendente onde
se permite, atravs dos dados obtidos, realizar inferncias de uma verdade geral sobre o tema
estudado (MARCONI; LAKATOS, 2004).
Justificado pela natureza exploratria das perguntas deste trabalho, o mtodo de procedimento adotado foi o mapeamento sistemtico da literatura (MSL), um tipo de reviso
40
CAPTULO 3. MTODO
sistemtica da literatura (RSL). Este tipo de procedimento utilizado em pesquisas mais amplas, que permitem uma perspectiva geral e de granulao grossa de uma determinada rea sob
investigao (KITCHENHAM, 2004; PETERSEN et al., 2008a).
No que diz respeito ao objetivo, a pesquisa classificada como descritiva, uma vez
que os fatos foram sistematicamente coletados, registrados, classificados e interpretados com
o intuito de analisar e caracterizar a completude dos relatos dos experimentos em elasticidade
realizados no contexto da computao em nuvem (ANDRADE, 2001).
Em relao natureza dos dados e das anlises adotadas, a pesquisa caracteriza-se
majoritariamente como qualitativa , uma vez que foca em aspectos mais profundos atravs
da anlise detalhada, classificao e interpretao do contexto do objeto de pesquisa (MARCONI; LAKATOS, 2004; CRESWELL, 2013). Tambm possvel perceber pequenos traos
quantitativos, uma vez que foram utilizados mtodos estatsticos para representar os dados da
pesquisa.
Do ponto de vista do posicionamento filosfico o estudo pragmtico, uma vez que tem
como objetivo auxiliar na resoluo dos problemas relacionados completude dos relatos dos
experimentos por meio de abordagem majoritariamente qualitativa, no abstendo-se de alguns
mtodos quantitativos.
3.2
Categoria
Resultados de pesquisa [ou] Mtodos de pesquisa [ou] Teorias [ou] Prticas e
aplicaes
[Integrao (Generalizao; Resoluo de conflito; Construo de pontelingustica) ] [Crtica] [Identificao de questes centrais]
[Representao neutra] [Exposio de posio]
[Exaustiva] [Exaustiva com seleo seletiva] [Representativa] [Central ou piv]
[Histrica] [Conceitual] [Metodolgica]
[Estudiosos especializados] [Estudiosos gerais] [Profissionais] [Pblico geral]
Tabela 3.2: Taxonomia para classificao dos estudos secundrios segundo Cooper
A utilizao desta taxonomia tem o intuito de auxiliar a comunidade em trs pontos
especficos: (i) avaliao da qualidade dou trabalho, (ii) divulgao comunidade atravs de
um conjunto de termos bem definidos e, (iii) facilitar a pedagogia em cursos de graduao
41
Caractersticas
Foco
Objetivo
Perspectiva
Cobertura
Organizao
Audincia
Classificao
[Resultados de Pesquisa] [Prticas ou aplicaes]
[Integrao (Generalizao) ] [Identificao de problemas centrais]
[Representao neutra]
[Exaustiva com citao seletiva]
[Metodolgica]
[Acadmicos Especializados] [Praticantes]
42
3.3
CAPTULO 3. MTODO
Ciclo da Pesquisa
O objetivo desta seo apresentar como foi planejada a metodologia para realizao
deste trabalho de mestrado em suas etapas e atividades. A Figura 3.1 apresenta todas as etapas
e respectivas atividades planejadas desde a definio da pesquisa at a divulgao de seus
resultados.
A seguir sero detalhadas as etapas de definio e planjeamento da pesquisa e divulgao
dos resultados. Escolheu-se apresentar a etapa de Execuo na Seo 4, visto que estas informaes dizem respeito materializao do mtodo planejado para a pesquisa na forma da execuo
do mapeamento sistemtico. A seguir sero apresentados os planejamentos de atividades, decises de pesquisa e suas particularidades. Quanto ordem, a execuo das atividades sequencial
e definida pelo fluxo das setas e suas direes.
Figura 3.1 Ciclo geral da pesquisa de mestrado apresentado em suas etapas e atividades.
3.3.1
Esta etapa foi fundamental para todo o delineamento da pesquisa e teve como principais
objetivos: (i) identificao das oportunidades de pesquisa, (ii) definio do tema a ser trabalhado,
(iii) escopo, (iv) perguntas de pesquisa e (v) definio da metodologia e do mtodo emprico a
ser utilizado. Nas demais sub-sees a seguir, todas as definies da pesquisa sero detalhadas
seguindo a ordem de acontecimentos.
43
Para adquirir um maior embasamento terico sobre o assunto e definir o tema, objetivo e
escopo da pesquisa, foi realizada uma reviso bibliogfica tradicional nos principais temas relacionados ao assunto: computao em nuvem, estudos empricos e engenharia de software baseada
em evidncias. Assim observamos que, o problema em questo no especfico apenas do contexto da CN (SMITE et al., 2008; KAMPENES et al., 2009; RUNESON; STEFIK; ANDREWS,
2013) e que existe uma mobilizao dos pesquisadores da engenharia de software experimental
para melhorar os relatrios dos estudos empricos atravs da utilizao de guias para reportar
resultados(CARVER, 2010; BUDGEN; ZHANG, 2009; ?; KITCHENHAM; CHARTERS, 2007;
SMITE et al., 2008).
No melhor do nosso conhecimento e atravs de pesquisas feitas na literatura (Seo F.2),
at o inicio da presente pesquisa no haviam estudos sistemticos, no contexto da computao
em nuvem, que caracterizassem a completude dos relatos de maneira aprofundada, baseado em
guias existentes na literatura da engenharia de software experimental. Assim, conclumos que
o problema apresentava relevncia para gerar contribuies importantes, conforme discusso
apresentada na Seo 1.
As prticas de avaliao no contexto da CN so reportadas em vrias fontes como blogs,
revistas, relatrios tcnicos, publicaes acadmicas, etc. Publicaes acadmicas, em particular,
normalmente so mais formais e seguem um processo rigoroso de reviso. Considerando a
documentao especfica produzida nas publicaes formais, limitamos a este trabalho apenas s
publicaes acadmicas. No h desconfiana de que as publicaes informais tambm possam
fornecer informaes altamente relevantes, entretanto impraticvel explorar e coletar dados
teis atravs de diferentes fontes de dados de uma s vez.
A fim de realizar uma anlise inicial mais profunda e obter uma contribuio mais
relevante no estudo destes relatos, o foco inicial deste trabalho foi direcionado s pesquisas que
utilizaram realizaram experimentos. Escolheu-se focar em experimentos pois este um mtodo
emprico bem representativo mediante as caractersticas da rea de pesquisa em computao
44
CAPTULO 3. MTODO
Definio da Metodologia
Uma vez definidos o tema, objetivo e escopo da pesquisa, o prximo passo foi definir
qual seria o mtodo emprico a ser utilizado. Dentre os mtodos apresentados anterioremente
(Seo 2.2.1 e Seo 2.3) o mtodo considerado mais adequado foi o Mapeamento Sistemtico
da Literatura, tomando como base o objetivo, natureza exploratria das questes de pesquisa e
apresentao dos resultados pretendidos.
Inicialmente existia a dvida entre se realizar uma reviso sistemtica ou mapeamento
sistemtico. Em sua grande maioria, as revises sistemticas tem como objetivo avaliar, comparar ou decidir entre tcnicas, entretanto nosso objetivo a realizao de uma anlise temtica o
que se adequa mais ao objetivo de um mapeamento sistemtico. Outro aspecto que foi decisivo
na escolha do mtodo foi a ampla natureza exploratria da pergunta de pesquisa: Quo completos so os relatos de experimentos em elasticidade na computao em nuvem, em relao
apresentao de elementos da pesquisa que permitam a interpretao, avaliao da validade
e o potencial da pesquisa?. Visto que parte do objetivo realizar uma anlise de viso mais
profunda das evidncias da prtica dos relatos dos experimentos, o mtodo escolhido foi o
mais adequado, uma vesz que para tal precisamos integrar de forma exaustiva e sintetizar as
evidncias existentes (KEELE, 2007; PETERSEN et al., 2008a; BUDGEN et al., 2008). Outro
fator est relacionado forma de apresentao dos resultados, pois em um estudo de mapeamento
sistemtico eles so apresentados de forma categorizada e proporcionam uma viso sumria
que permite a melhor visualizao dos dados em forma de grficos e mapas (PETERSEN et al.,
2008a). Nas sub-sees a seguir todo o planejamento do mapeamento sistemtico ser detalhado
seguindo atravs da definio do protocolo da pesquisa.
3.3.2
45
Definio do Protocolo
46
CAPTULO 3. MTODO
3.3.2.1.2 Estratgia de Busca dos Estudos A busca dos estudos inclui as estratgias manuais e automticas. Foi planejado que ambas as estratgias deveriam ser executadas pelo autor da
pesquisa e os resultados obtidos exportados para o sistema ExtractViewer, ferramenta criada para
auxiliar toda a realizao do estudo sistemtico. Mais informaes sobre a feramenta podem
ser obtidas no Apndice G As fontes de busca manuais planejadas e os respectivos perodos de
coleta so as apresentadas na Tabela 3.4.
Para a estatgia automtica planejou-se a utilizao dos mecanismos IEEE Xplore Digital
Library 1 , ACM Digital Library 2 , Elsevier Scopus 3 , Springer Link 4 . A string de busca
1 http://ieeexplore.ieee.org
2 http://portal.acm.org
3 http://www.scopus.com
4 http://link.springer.com
47
Perodo
2006-2014
Tipo
Conferncia
rea
ESE
2007-2014
Simpsio
ESE
2006-2014
2009-2014
Journal
Conferncia
ESE
CN
2010-2014
Conferncia
CN
2006-2014
Journal
CN
(Cloud Computing <OR> Cloud Platform <OR> Cloud Service <OR> Cloud Provider
<OR> PaaS <OR> Platform as a Service <OR> Platform-as-a-Service <OR> IaaS <OR>
Infrastructure as a Service <OR> Infrastructure-as-a-Service <OR> SaaS <OR>
Software-as-a-Service"<OR> Software as a Service)
[AND]
(Elasticity)
[AND]
(Experiment OR Evaluate OR Evaluation OR Evaluating OR Benchmark)
Tabela 3.5: String de Busca utilizada na pesquisa dos estudos do MS
3.3.2.1.3 Estratgia de Seleo dos Estudos A seleo dos estudos foi planejada em duas
etapas, onde a primeira consiste na leitura do ttulo e resumo de todos os estudos pelo autor
da pesquisa em conjunto com um pesquisador experiente e, apenas os trabalhos claramente
fora do escopo da pesquisa e duplicados devem ser excludos. Em caso de dvida em relao
permanncia do estudo o mesmo deve ser mantido para a segunda rodada de seleo conforme
recomenda KITCHENHAM; CHARTERS (2007).
A segunda etapa contempla a participao de pesquisadores configurados em duplas e
todos os estudos devem ser lidos sinteticamente e analisados conforme os critrios de excluso
definidos. O grau de concordncia entre os revisores deve ser calculado para garantir que o
resultado obtido no foi meramente ao acaso.
48
CAPTULO 3. MTODO
Quanto aos critrios de excluso, os mesmos foram definidos com objetivo de identificar
apenas os experimentos que avaliavam a elasticidade na computao em nuvem, o que deixa
implcito que todos os estudos que no se enquadraram nestes critrios deve ser automaticamente
includos. A lista dos critrios pode ser observada na Tabela 3.6. Todo o processo deve ser
assitido pela ferramenta ExtractViewer e cada um dos revisores, de posse de suas credenciais de
acesso devem proceder com a anlise dos estudos designados a ele. Mais detalhes sobre as telas
e informaes disponibilizadas aos revisores pode ser vista no Apndice G. Inicialmente alguns
dos critrios podem parecer similares entre si, entretanto o objetivo realizar uma anlise com
granularidade fina a fim de facilitar futuros estudos com os resultados das selees de estudos
realizada nesta reviso.
Cdigo
C01
C02
C03
C04
C05
C06
C07
C08
C09
C10
C11
Critrios de Excluso
O arquivo no corresponde ao Estudo. (Ex: ndice)
O arquivo no um Estudo. (Ex: proceedings, editorial)
O Estudo duplicado.
O Estudo um slideshow ou resumo expandido.
O Estudo est fora do intervalo de avaliao.
O Estudo est relacionado Elasticidade mas no relata um Experimento.
O Estudo est relacionado Elasticidade, reporta um Experimento porm no
avalia Elasticidade.
O Estudo no est disponvel.
O Estudo no est em ingls.
O Estudo no est relacionado Computao em Nuvem.
O Estudo no est relacionado Elasticidade na Computao em Nuvem.
Tabela 3.6: Lista dos Critrios de Excluso em ordem alfabtica.
3.3.2.1.5 Estratgia de Extrao Foi planejado que o processo de extrao dos dados seria
feito em duas partes: extrao dos metadados e extrao atravs do instrumento de anlise de
completude dos relatos. A primeira parte contempla os metadados relacionados ao ttulo do
estudo, autores, instituies, pases, fonte e ano de publicao. Uma vez que tais dados devem
ser coletados durante a etapa de busca e importados para o sistema ExtractViewer, sua extrao
deve ser realizada atravs de consultas ao banco de dados do sistema. J a segunda parte deve
ser extrada atravs da leitura e aplicao do instrumento de coleta nos estudos selecionados
conforme orientaes e detalhes apresentados no Apndice H e Seo 2.2.2.
49
Reviso do Protocolo
Com a concluso do protocolo, conforme orientao dos guias utilizados, o mesmo foi
apreciado por especialistas da computao em nuvem, engenharia de software experimental
e engenharia de software baseada em evidncias. Aps a realizao dos sucessivos ajustes
propostos, a verso final do protocolo foi ento estabelecida para permitir assim o incio da etapa
de execuo da pesquisa.
3.3.3
3.3.4
Esta etapa possui uma dinmica de execuo diferente das demais em termos de execuo,
suas atividades so: (i) Escrita da Dissertao e (ii) Submisso Journal. Todos os resultados
detalhados e demais detalhes relacionados execuo e planejamento da pesquisa esto sendo
divulgados por meio desta dissertao. Ao dissertar tentou-se acrescentar a maior quantidade
de informaes possveis em relao ao mtodo da pesquisa, de forma a propiciar uma melhor
visualizao do planejamento e da execuo do mtodo, transparecer a credibilidade da pesquisa
e facilitar possveis replicaes.
A execuo da primeira atividade, escrita da dissertao, no foi sequencial e sim
iterativa e incremental, onde em cada etapa do ciclo da pesquisa as informaes produzidas eram
redigidas e registradas nesta dissertao.
A segunda atividade, submisso journal, extrapola o marco de apresentao deste trabalho
de dissertao e visa apresentar comunidade os resultados desta pesquisa de maneira mais
ampla. Aps a concluso e apresentao do trabalho sero recebidas as sugestes de correo e
melhorias e, aps a realizao das mesmas, os resultados desta pesquisa sero submetidos dois
peridicos: ESE e TPDS.
3.3.5
Resumo
Neste captulo foi descrita a metodologia utilizada nesta pesquisa, sua classificao,
estruturao, planejamento, conduo e as razes de uso dos procedimentos ou mtodos. Tambm
foi apresentada a estratgia planejada para a divulgao dos resultados obtidos na pesquisa. No
prximo captulo so apresentados todos os detalhes de execuo do mapeamento sistemtico e
uma anlise dos resultados obtidos.
51
4
Resultados
Este captulo tem como objetivo trazer informaes a cerca da etapa de execuo do
mapeamento sistemtico e apresentar os resultados encontrados na anlise das evidncias. Na
seo Execuo do Mapeamento Sistemtico so apresentados todo os detalhes da execuo do
mapeamento, compreendendo as atividades de busca, seleo, extrao dos dados e sintetizao
dos resultados.
A anlise e discusso dos resultados obtidos constituem as principais contribuies deste
trabalho e sero apresentados em trs Sees distintas: Anlise Geral, Anlises das Evidncias
e Discusso dos Resultados. A Seo 4.2 apresenta os dados quantitativos do processo de
mapeamento sistemtico e caractersticas gerais dos estudos analisados. A Seo 4.3 apresenta a
anlise das evidncias identificadas respondendo a cada uma das perguntas de pesquisa. E por
fim a Seo 4.4 se dedica a discutir os principais resultados obtidos.
4.1
4.1.1
A atividade de busca foi guiada pelo planejamento realizado na Seo 3.3.2.1.2 e executada em dois momentos: (i) busca automtica e (ii) busca manual. No foi necessrio nenhum
replanejamento desta atividade e todos os estudos foram coletados juntamente com suas informaes de metadados. Todos os resultados foram importados e devidamente tratados pela
ferramenta ExtractViewer. importante ressaltar que esta atividade conhecidamente laborosa e
exige do pesquisador um certo volume de trabalho manual e repetitivo na montagem e organizao das informaes que so apreciadas na atividade de seleo dos estudos primrios. Neste
52
CAPTULO 4. RESULTADOS
quesito, o apoio da ExtractViewer foi essencial para diminuir a propenso a erros e acelerar o
andamento da pesquisa.
No primeiro momento foram executadas as buscas automticas e para todas elas a
string de busca foi adaptada para atender sintaxe do mecanismo. Toda a lgica e semntica
definidas foram inteiramente mantidas. A busca no IEEE Xplore foi realizada sem maiores
dificuldades e o engenho permitiu que o resultado fosse exportado por completo em um nico
arquivo no formato csv. Todos os metadados necessrios para a interpretao dos estudos foram
adquiridos e importados sem nenhuma intercorrncia. Na ACM Digital Library houve um pouco
de dificuldade na exportao dos resultados, visto que o engenho no apresenta a funcionalidade
especfica para este propsito. Mesmo com tais dificuldades, todos os dados da pesquisa e
metadados dos estudos foram adquiridos e importados para a ferramenta. No Springer Link
tambm houve a mesma dificuldade em relao exporto dos resultados. Por fim, no Elsevier
Scopus a busca foi executada sem maiores dificuldades e os resultados exportados por completo
em um arquivo csv. A nica diferena deste engenho que a consulta era executada em sistema
de processamento em lotes e o resultado da consulta era recebido via email.
J a busca manual foi realizada com sucesso em todas as conferncias planejadas e concluda sem intercorrncias. Todas as buscas foram importadas com sucesso para a ExtractViewer
e a contabilizao destes por conferncia pode ser vista na Tabela 4.1. Ao trmino das atividades
desta etapa foram identificados 3.611 estudos candidatos para anlise. Mais detalhes em relao
a anlise dos engenhos utilizados podem ser conferidos na Seo 4.2 deste captulo.
Fonte de Dados
ACM Digital Library
IEEEXplorer Digital Library
Elsevier Scopus
Springer Link
TPDS
CLOUDCOM
CLOUD
EASE
ESE
ESEM
Tipo
Quantidade de Estudos
Automtica
Automtica
Automtica
Automtica
Manual
Manual
Manual
Manual
Manual
Manual
490
170
163
251
1315
517
454
85
75
91
4.1.2
O processo de seleo dos estudos foi realizado em duas rodadas sequenciais: primeira
rodada e segunda rodada. Ambas as rodadas utilizaram a ferramenta ExtractViewer. Atravs
dela os revisores puderam trabalhar em paralelo em um ambiente distribudo, o que ajudou a
acelerar a execuo desta etapa.
53
Na primeira rodada, como ilusta a Figura 4.1, o ttulo, resumo e palavra-chave de todos
os 3.611 estudos candidatos foram lidos e avaliados pelo autor e outro pesquisador experiente.
As anlises desta rodada foram feitas pelo autor do estudo atravs da ferramenta ExtractViewer.
Figura 4.1 Esquema de execuo da primeira rodada de seleo dos estudos do mapeamento sistemtico
54
CAPTULO 4. RESULTADOS
Origem dos Dados
Busca
Manual
Automtica
Springer Link
Automtica
Motivo Excluso
Recup.
Excl.
1199
%
Excl.
91%
480
93%
421
93%
323
66%
121
48%
Tabela 4.2: Critrios de excluso apliados na primeira etapa de seleo dos estudos candidatos
A segunda rodada contou com a participao de 18 pesquisadores, configurados em 10
duplas para realizar a anlise dos 196 estudos resultantes da primeira rodada. O processo de
seleo pode ser visto na Figura 4.2 que contm a mesma semntica da Figura 4.1. Vale destacar
que o processo apresentado repetido para cada uma das duplas participantes. A configurao
de duplas foi feita conforme a Tabela F.2 e cada uma delas analisou 10% dos trabalhos, o que
resulta em aproximadamente 20 estudos por revisor.
Com o acesso ao sistema, cada integrante das duplas analisou todos os estudos presentes na sua lista, registrando os possveis critrios aplicados e caso desejasse os respectivos
comentrios. Ao final das anlises a ferramenta identificou todos os conflitos existentes entre
os revisores de cada uma das duplas. Todos os conflitos foram resolvidos atravs de reunio e
sem intercorrncias e ao final desta etapa foram selecionados 59 estudos. A listagem dos estudos
selecionados, juntamente com seu respectivo cdigo, ttulo, ano, origem dos dados e autores
apresentado no Apndice A.
Para mensurar o grau de confiabilidade da aplicao dos critrios a segunda rodada,
foram executados testes de Kappa (VIERA; GARRETT, 2005) para aferir a concordncia entre
os revisores (KITCHENHAM; CHARTERS, 2007; EDWARDS et al., 2002). A estatstica de
Kappa denotada pela letra "K"e calculada atravs de um teste que retorna valores de menos
infinito a 1, sendo interpretado conforme a Tabela 4.3. O clculo desta estatstica acompanhado
de um teste de confiabilidade, que ajuda a identificar se o valor de K foi obtido atravs de mera
chance por meio de um p-value (VIERA; GARRETT, 2005).
55
Figura 4.2 Esquema de execuo da segunda rodada de seleo dos estudos do mapeamento sistemtico
Kappa
<0
0,0
0,01 - 0,20
0,21 - 0,40
0,41 - 0,60
0,61 - 0,80
0,81 - 0,99
Concordncia
Menos que mera chance de concordncia
Nvel pobre de concordncia
Nvel leve de concordncia
Nvel razovel de concordncia
Nvel moderado de concordncia
Nvel substancial de concordncia
Nvel quase perfeito de concordncia
56
CAPTULO 4. RESULTADOS
quanto incluso/excluso dos estudos primrios evidencia uma taxa segura de confiabilidade
para os critrios utilizados nesta pesquisa.
Dupla
D1
D2
D3
D4
D5
D6
D7
D8
D9
D10
Kappa
0,21
0,36
0,26
0,61
0,24
0,05
0,66
0,78
0,38
0,21
p-value
0,36
0,04
0,16
0,003
0,21
0,83
0,002
0,001
0,07
0,36
Concordncia
Nvel razovel de concordncia
Nvel razovel de concordncia
Nvel razovel de concordncia
Nvel substancial de concordncia
Nvel razovel de concordncia
Nvel leve de concordncia
Nvel substancial de concordncia
Nvel substancial de concordncia
Nvel razovel de concordncia
Nvel razovel de concordncia
4.1.3
A atividade de extrao dos dados ocorreu sem maiores intercorrncias e foi realizada por
dois pesquisadores conforme justificado na Seo 3.3.2.1.5. A etapa de extrao dos metadados
dos estudos foi realizada atravs de consultas sql executadas diretamente do banco de dados
do sistema ExtractViewer. A extrao dos dados para identificar a completude dos relatos foi
norteado pelo instrumento de coleta detalhado no Apndice H.
4.1.4
4.2
57
Anlise Geral
O objetivo desta seo apresentar uma anlise dos dados obtidos no mapeamento
sistemtico. Sero apresentados inicialmente dados relacionados busca, seleo e extrao
dos dados. Em seguida sero apresentados dados relacionados aos estudos selecionados, seus
metadados, grupos de pesquisa, pas e outras caractersticas gerais.
Atravs do grfico da Figura 4.3 possvel visualizar a participao das estratgias de
busca no quantitativo de estudos candidatos identificados. Fica ntido que a maior participao
na identificao dos estudos foi da estratgia manual (70%), entretanto ao final do processo
de seleo dos estudos este cenrio se inverte e o maior nmero de estudos selecionados
proveniente da estratgia automtica (92%).
Figura 4.3 Participao das estratgias de busca no quantitativo de estudos candidatos identificados
A anlise da busca automtica apresentada na Figura 4.4 revela que o engenho de busca
ACM se sobressai no quantitativo de estudos candidatos identificados (490), entretanto ao final
da seleo dos estudos o IEEE apresentou a maior quantidade de estudos selecionados (29).
A anlise da busca manual apresentada na Figura 4.5 revela que o jornal IEEE Transactions on Parallel and Distributed Systems retornou o maior quantitativo de estudos candidatos. Tal
fato se justifica pelo fato do jornal ser de publicao mensal e o perodo de busca ter compreendido o perodo de nove anos. Nas anlises tambm foi possvel constatar que ao final da segunda
etapa de seleo dos estudos a estratgia utilizada apresentou uma baixa preciso ao se comparar
a quantidade de estudos candidatos (1315) versus a de estudos selecionados (2).
Ainda sobre os engenhos de busca, podemos atravs da Figura 4.6 observar a participao
de cada deles no quantitativo dos estudos selecionados. Como j pode ser visto, a estratgia
manual identificou um grande nmero de estudos candidatos, entretanto foi o que teve o menor
desempenho em relao aos estudos selecionados, sendo a estratgia automtica a mais efetiva.
As anlises realizadas na primeira e segunda etapa do processo de seleo de estudos esto
58
CAPTULO 4. RESULTADOS
Figura 4.4 Distribuio do quantitativo dos estudos candidatos identificados pela busca automtica em
relao s fontes de dados
Figura 4.5 Distribuio dos estudos candidatos resultantes da busca manual em relao aos meios de
publicao
resumidas na Tabela 4.5 e Tabela 4.6 respectivamente. As tabelas apresentam informaes que
indicam por critrios e fonte de dados os quantitativos aplicados. Os critrios so apresentados
na forma de seus respectivos cdigos e suas descries podem ser vistas na Tabela 3.6.
Os 59 estudos selecionados esto apresentados no Apndice A, bem como seus respectivos cdigos iniciados com a sigla EPS (estudo primrio selecionado). J os estudos
excludos na segunda etapa esto apresentados no Apndice B, tambm com os respectivos
codigos iniciados com a sigla EPE (estudo primrio excludo).
A distribuio temporal dos estudos selecionados pode ser observada no grfico da Figura 4.7. Observa-se que o primeiro relato de experimento que avalia elasticidade na computao
em nuvem data de 2010. Tambm possvel perceber uma tendncia de crescimento do quantitativo de publicaes apesar da inquietude vivenciada em meados de 2010 em relao segurana,
que influenciou negativamente as tendncias em servios sob-demanda e a elasticidade (DURAO
59
Fontes
Est.
C1
ACM
490
1
IEEE
170
1
Scopus
163
0
Springer
251
1
ESE
75
0
CLOUD
454
0
CLOUDCOM 517
0
TPDS
1315 0
EASE
85
0
ESEM
91
0
Total
3.611 3
C2
9
0
6
22
0
0
2
32
0
0
71
C3
31
42
58
5
0
8
6
5
0
0
155
C4
12
0
0
0
0
1
0
2
0
15
C5
0
0
0
1
0
0
0
0
0
0
1
1 Etapa
Excludos
C6 C7 C8
11
4
0
4
6
0
4
4
0
14
0
0
0
0
0
1
1
0
3
0
0
0
0
0
0
0
0
0
0
0
37 15
0
C9
1
0
0
0
0
0
0
0
0
0
1
C10
37
0
3
73
73
6
9
1.199
85
89
1.574
C11
324
53
64
122
2
421
480
75
0
2
1.543
Incl.
60
64
24
13
0
16
17
2
0
0
196
60
CAPTULO 4. RESULTADOS
Fontes
Est.
ACM
60
IEEE
64
Scopus
24
Springer
13
ESE
0
CLOUD
16
CLOUDCOM 17
TPDS
2
EASE
0
ESEM
0
Total
196
C1
0
0
0
0
0
0
0
0
0
0
0
C2
0
0
0
0
0
0
0
0
0
0
0
C3
1
2
0
0
0
0
0
0
0
0
3
C4
1
5
0
0
0
1
0
0
0
7
2 Etapa
Excludos
C5 C6 C7 C8
0
8
22
0
0
5
16
0
0
4
5
5
0
1
3
0
0
0
0
0
0
3
4
0
0
4
4
0
0
0
0
0
0
0
0
0
0
0
0
0
0
25 54
5
C9
0
0
0
0
0
0
0
0
0
0
0
C10
4
0
0
3
0
2
1
0
0
0
10
C11
10
7
2
3
0
3
7
1
0
0
33
Selec.
14
29
8
3
0
3
1
1
0
0
59
61
Figura 4.8 Distribuio do quantitativo de estudos selecionados por fonte de dado e ano.
62
CAPTULO 4. RESULTADOS
Frana (4). J s instituies acadmicas foram lideradas pelos Estados Unidos (13), Brasil (7)
e China (7).
Em relao distribuio dos estudos selecionados pelo modelo de servio e ano, como
mostra a Figura 4.12, possvel observar que 78% dos estudos giram em torno da modalidade
IaaS e PaaS. Tambm constatamos que apenas 5% deles so relacionados apenas a SaaS.
Os 59 estudos primrios selecionados foram conduzidos por 217 autores no total. A
listagem completa destes autores pode ser encontrada no Apndice E. Na Tabela 4.7 possvel
observar os 12 autores que esto envolvidos em mais de um trabalho, em sua maioria eles so
da academia e representam os seguintes pases: (i) Alemanha, (ii), Austrlia, (iii) Brasil, (iv)
Canad, (v) Frana e (vi) Portugal.
63
Instituio
Fetzer, C.
Venugopal, S.
Ajila, S.A.
Da .Silva, T.L.C.
Machado, J.C.
Martin, A.
Matos, M.
Morin, C.
Nascimento, A.M.
Nikravesh, A.Y.
Oliveira, R.
Vilaa, R.
Publicaes
3
3
2
2
2
2
2
2
2
2
2
2
Tipo
Academia
Academia
Academia
Academia
Academia
Academia
Academia
Pesquisa
Academia
Academia
Academia
Academia
Pas
Alemanha
Austrlia
Canad
Brasil
Brasil
Alemanha
Portugal
Frana
Canad
Canad
Portugal
Portugal
4.3
64
CAPTULO 4. RESULTADOS
os autores relatam elementos da pesquisa que permitam analisar sua validade e potencial como:
motivao, objetivo, mtodo, anlise dos dados, resultados, concluses e limitaes. Assim,
como o objetivo no era de ranquear os estudos e sim obter um grau de completude em relao
ao guia de JEDLITSCHKA; CIOLKOWSKI; PFAHL (2008), no foi aplicado na computao
do valor o conceito de pesos entre os acertos obtidos e sim o somatrio dos mesmos. Maiores
detalhes sobre o instrumento de pesquisa, seus critrios, objetivos e contabilizao de pontos
podem ser obtidos no Apndice H.
4.3.1
O ttulo do relato de um experimento deve ser informativo, uma vez que atravs dele
potenciais leitores so alertados sobre a existncia de um artigo de interesse. O guia utilizado
recomenda que o ttulo indique facilmente que o estudo trata de um experimento, incluindo
termos como experimento, experimento controlado, quasi-experimento, replicao de
experimento. Uma outra recomendao que, caso o espao disponvel para o ttulo permita,
tambm se inclua informaes do tratamento e as variveis dependentes do experimento.
As perguntas criadas para responder esta questo de pesquisa esto presentes na Seo H.0.1 do Apndice H. A pontuao mxima possvel neste critrio tem o valor 3, sendo
atribuda a pontuao mxima 1 para cada uma das perguntas respondidas completamente. O
desempenho dos estudos foi considerado ruim e nenhum deles alcanou a pontuao geral
mxima como pode ser visto na Figura 4.13. A maior nota obtida foi 2, alcanada pelos estudos
EPS54 e EPS1, o que representa apenas 3% do total de estudos. A segunda maior nota, 1, foi
alcanada por 24 estudos (41%) . Porm o que chamou bastante a ateno foi que 53% (33) dos
estudos no pontuou em nenhum dos itens avaliados nesta seo.
Figura 4.13 Pontuaes dos estudos nas questes que avaliam o ttulo.
Nenhum dos estudos apresenta em seu ttulo termos que fazem referncia a um experimento, nem mesmo os estudos que se dedicam exclusivamente a relatar o experimento. J
65
4.3.2
SQ2 - Informaes importantes do resumo como motivao, objetivos, mtodos, resultados, limitaes e concluses da pesquisa so
relatadas?
O quantitativo de acertos em cada uma das perguntas pode ser visto no grfico da
Figura 4.15. Em geral, 88% dos estudos apresentam a motivao para realizao da pesquisa,
enquanto que 3% apresentam parcialmente e 8% no apresentam tal informao. O objetivo
66
CAPTULO 4. RESULTADOS
claramente descrito em 98% dos casos. Em 100% dos casos o objeto estudado apresentado.
Em 83% o foco da pesquisa completamente apresentado, porm em apenas 47% dos casos a
perspectiva do estudo apresentada. J sobre o mtodo verificou-se que em apenas 42% dos
estudos ele citado, enquanto que nenhum deles cita os procedimentos de anlise. Os resultados
das pesquisas so mencionados em apenas 61% dos resumos. Nenhum dos estudos citou
limitaes da pesquisa e apenas 27% dos estudos abordou o impacto dos resultados alcanados
no estudo.
Figura 4.15 Pontuaes dos estudos nas questes que avaliam o resumo.
4.3.3
67
4.3.4
SQ4 - A fundamentao informa sobre a tecnologia em investigao, s possveis opes alternativas ela, pesquisas relacionadas e
a relevncia para a prtica?
4.3.5
68
CAPTULO 4. RESULTADOS
Figura 4.18 Pontuaes dos estudos nas questes que avaliam a fundamentao.
69
estudo EPS36, j a mais baixa foi de 1 ponto obtida pelo estudo EPS34.
70
CAPTULO 4. RESULTADOS
Figura 4.20 Pontuaes dos estudos nas questes que avaliam o planejamento.
4.3.6
71
no grfico da Figura 4.22. De um modo geral o dempenho dos estudos foram supreendentemente
baixos em relao s perguntas relacionadas aos dados brutos, validao do modelo de anlise,
preparao e avaliao dos dados. Em todos os casos estas informaes foram omitidas em pelo
menos 93% dos estudos. Em 54% (32) dos estudos, os dados no so apresentados atravs de
estatstica descritiva.
Figura 4.22 Pontuaes dos estudos nas questes que avaliam a anlise.
4.3.7
Segundo o guia utilizado em um relato de experimento os resultados devem ser apresentados atravs de pelo menos trs elementos: avaliao dos resultados e implicaes, ameaas
validade e inferncias. O grande prpsito quando se discute os resultados deve ser apresentar os
achados da pesquisa e se as hipteses investigadas podem ser confirmadas ou refutadas.
As perguntas criadas para responder esta questo de pesquisa esto presentes na Seo H.0.8 do Apndice H. A pontuao mxima a ser alcanada de 3 pontos. As distribuies
das pontuaes gerais podem ser observadas no grfico da Figura 4.23. A pontuao mxima a
ser obtida de 8 pontos sendo 1 o valor mximo a ser atribudo a cada questo. Ao se analisar as
notas gerais dos estudos identificamos que 4 foi a maior nota alcanada pelo estudo EPS26 e 0
alcanada pelo estudo EPS17.
O grfico da Figura 4.24 apresenta uma viso da potuao obtida pelos estudos em
cada uma das questes. Em 88% (52) dos estudos os resultados da pesquisa so apresentados
claramente, em 8% (5) parcialmente e em 3% (2) a informao omitida. Em apenas 12% (7)
dos relatos claramente relacionados pesquisas anteriores, em 88% (52) nenhuma informao
apresentada. As ameaas validade so relatadas nitidamente em apenas 5% (3) estudos,
parcialmente em 2% (1) e em 93% (55) a informao no apresentada. Em 44% (26) estudos
a generalizao da pesquisa citada claramente e em 56% (33) ela no relatada. Apenas 12%
72
CAPTULO 4. RESULTADOS
(7) dos estudos as lies aprendidas so citadas claramente, em 3% (2) parcialmente e em 85%
(50) a mesma no foi apresentada.
Figura 4.24 Pontuaes dos estudos nas questes que avaliam a discusso.
4.3.8
As concluses do relato devem ser baseadas nos resultados e devem discutir sobre os
seguintes topicos: resumo, impacto da pesquisa e trabalhos futuros (JEDLITSCHKA; CIOLKOWSKI; PFAHL, 2008). Tambm sugerido, quando possvel, que informaes sobre o
impacto em custo, tempo e qualidade sejam discutidas.
As perguntas criadas para responder esta questo de pesquisa esto presentes na Seo H.0.9 do Apndice H. A maior pontuao geral que pode ser alcanada de 3 pontos,
possveis de atribuio cada questo. As pontuaes gerais alcanadas pelos estudos apresentada no grfico da Figura 4.25.
73
A anlise da pontuao individual das questes pode ser vista no grfico da Figura 4.26.
Em geral os estudos apresentam claramente um resumo conciso da pesquisa e seus resultados.
Os impactos da pesquisa so claramente apresentados por 59% (35) dos estudos, parcialmente
por 2% (1) e no relatados por 39% (23). Os trabalhos futuros so indicados explicitamente por
69% (41) dos estudos e no relatados por 31% (18).
Figura 4.26 Pontuaes dos estudos nas questes que avaliam a discusso.
4.4
74
CAPTULO 4. RESULTADOS
foi realizada uma breve anlise qualitativa que revela que, ainda que reportadas, muitas das
informaes apresentadas pelos relatos so superficiais e dificultam a interpretao, validao,
generalizao e replicao dos resultados dos estudos.
Em geral, as informaes mais negligenciadas pelos autores so relativas ao planejamento da pesquisa, coleta dos dados, procedimentos de execuo, instrumentao, anlise dos
dados, relao dos resultados com pesquisas anteriores, ameaas validade e generalizao dos
resultados. Em geral, no foram encontrados problemas relacionados introduo dos relatos j
que todos apresentam s informaes esperadas e sem problemas relacionados compreenso.
O mesmo caso acontece quando analisamos s informaes referentes fundamentao da
pesquisa.
A forma como os autores descrevem o ttulo dos estudos no permite aos potenciais
leitores a fcil identificao do experimento. Em 53% dos casos nenhum termo que permita
a fcil identificao do experimento, os tratamentos utilizados e as variveis dependentes foi
informado. Em geral, a simples incluso do termo experimento aumentaria a probabilidade e a
preciso de se identificar tais estudos com mais facilidade.
J na apresentao do resumo, nenhum dos estudos trouxe informaes sobre o desenho
experimental, procedimentos de anlise e coleta dos dados. Informaes sobre os principais
achados da pesquisa, limitaes, anlise dos resultados e impacto da pesquisa so mencionados
em poucos estudos e quando citados a informao superficial. Tornar os resumos mais
claros, objetivos e consistentes muito importante, uma vez ele a nica parte de livre acesso
aos potenciais leitores do estudo. Apesar das fortes recomendaes na utilizao do formato
estruturado, no conseguimos identificar a utilizao dele em nenhum dos estudos avaliados.
No que se refere s informaes de planejamento da pesquisa o cenrio chamou bastante
a ateno, tanto pela quantidade de informaoes relevantes omitidas quanto pela superficialidade
das informaes apresentadas. Em muitas situaes em que dados esperados so apresentados
as informaes deixam a desejar do ponto de vista qualitativo da informao. O relato dos
procedimentos de obteno dos dados insatisfatrio, pois no esclarece de onde e nem como os
dados utilizados so coletados. O mesmo acontece com os dados referentes aos procedimentos
de execuo, que mesmo sendo apresentados pela grande maioria dos estudos o contedo da
informao incompleto e qualitativamente insuficiente. Outro ponto que chamou bastante a
ateno que os procedimentos relativos aos instrumentos, materiais e ferramentas utilizados nos
experimentos no recebem a devida importncia nos relatos. As hipteses, quando mencionadas,
no apresentavam nenhum grau de formalismo em sua representao e forma de avaliao.
Diante destas circunstncias a interpretao, entendimento e anlise das informaes por parte
do leitor perigosamente comprometida. Em todos os casos a replicao dos experimentos seria
pouco factvel considerado o nvel das informaes apresentadas. Tambm percebemos que
nenhum dos estudos mencionou utilizar algum guia ou mecanismo de suporte para a realizao
ou planejamento dos experimentos.
Outro achado preocupante diz respeito anlise dos dados dos experimentos. Menos
75
da metade dos estudos apresentam a anlise dos dados do experimento atravs de estatstica
descritiva. Em apenas dois dos relatos os dados brutos da pesquisa foram disponibilizados. Na
maior parte dos estudos foi mencionado qualquer referncia ao tratamento ou preparao dos
dados necessrios para a anlise dos dados. O mesmo acontece em relao s hipteses, que
quando existem no estudo os mesmos no mostram como a sua avaliao foi realizada. Outra
constatao relevante diz respeito no utilizao de mtodos estatsticos na anlise dos dados.
No quesito apresentao dos resultados os estudos selecionados apresentaram um baixo
desempenho. A maior parte deles no relaciona seus resultados pesquisas anteriores. As ameaas validade tambm no foram direcionadas na maior parte dos estudos. As generalizaes
dos resultados no so citadas pela maioria, e nos casos em que estas so feitas no apresentam o
grau de confiana necessrio, uma vez que muitos dados e informaes relevantes so omitidas.
Tambm foi possvel constatar que as lies aprendidas durante a execuo do experimento so
pouco reportadas.
Tambm foi possvel constatar que so poucos os estudos que se dedicam unicamente
a relatar os experimentos. Em geral, os autores apresentam suas tcnicas, algoritmos e/ou
abordagens e incluem no relato apenas uma seo destinada ao experimento em si. Tal fato
tem impacto direto na disposio e organizao das informaes apresentadas no relato e,
diferentemente das orientaes apresentadas no guia de JEDLITSCHKA; CIOLKOWSKI;
PFAHL (2008), decidiu-se ento procurar pelas informaes estudadas em todas as sees
apresentadas pelo estudo. Outro achado que chamou a ateno foi que em nenhum dos estudos
analisados, foi feita meno a qualquer guia para relatar ou at mesmo conduzir e planejar os
experimentos.
Os resultados deste estudo sistemtico apresentam informaes iniciais sobre o estado
da prtica do relato de experimentos em elasticidade na computao em nuvem. Esperamos
que atravs dos indcios encontrados o resultado desta pesquisa possa trazer tona o debate
e iniciativas que permitam que os resultados dos estudos empricos sejam melhor relatados.
A mobilizao em torno de tal aperfeioamento vai ajudar, no somente comunidade da
computao em nuvem, a melhor entender os resultados, limitaes e permita um melhor
aproveitamento dos estudos empricos realizados.
77
5
Consideraes Finais
Este captulo apresenta as consideraes finais do trabalho. Sero discutidas as ameaas
validade do estudo, recomendaes para trabalhos futuros e as concluses obtidas com a
pesquisa.
5.1
Ameaas validade
78
A ameaa relacionada aos erros de classificao (3) foi reduzida com a utilizao de
classificao bem definida e j existente na literatura da computao (2.1.2). Atravs de sua
utilizao os estudos foram separados de acordo com o modelo de servio abordado. Outra
estratgia adotada foi a participao de outro pesquisador experiente para validar o resultado da
classificao aplicada.
Quanto a possibilidade de problema apontada pelo item 4 foram utilizados quatro engenhos de busca automtica: IEEE Xplore, Scopus, Science Direct e Springer Link. As estratgias
de busca manuais foram acrescentadas ao estudo com o intuito de identificar estudos que no
fossem identificados atravs das strings de busca criadas.
O vis apontado pelo item 5 foi contido atravs da participao de outros pesquisadores
experientes nas reas da engenharia de software experimental, computao em nuvem e engenharia de software baseada em evidncias. Para aumentar a confiabilidade no resultado dos estudos
selecionados e garantir que o resultado produzido no foi gerado ao mero acaso, foi realizado
teste Kappa de concordncia entre as duplas de revisores participantes.
5.2
Trabalhos Futuros
A partir da realizao desta pesquisa, pode-se levantar algumas oportunidades de trabalhos futuros, bem como direcionamentos para novas pesquisas, que podero contribuir para a
melhoria de pesquisas no contexto da computao em nuvem.
5.3. CONCLUSES
5.3
79
Concluses
81
Referncias
ALI-ELDIN, A.; TORDSSON, J.; ELMROTH, E. An adaptive hybrid elasticity controller for
cloud infrastructures. In: NETWORK OPERATIONS AND MANAGEMENT SYMPOSIUM
(NOMS), 2012 IEEE. Anais. . . [S.l.: s.n.], 2012. p.204212.
ALTMAN, D. G. et al. The revised CONSORT statement for reporting randomized trials:
explanation and elaboration. Annals of internal medicine, [S.l.], v.134, n.8, p.663694, 2001.
ANDRADE, M. M. d. Introduo metodologia do trabalho cientfico. [S.l.]: So Paulo:
Atlas, 2001.
ARKSEY, H.; OMALLEY, L. Scoping studies: towards a methodological framework.
International journal of social research methodology, [S.l.], v.8, n.1, p.1932, 2005.
ASSOCIATION, A. P. et al. Publication manual of the American psychological association.
[S.l.]: American Psychological Association Washington, DC, 2001.
BASILI, V. R.; SELBY, R. W.; HUTCHENS, D. H. Experimentation in software engineering.
Software Engineering, IEEE Transactions on, [S.l.], n.7, p.733743, 1986.
BRERETON, P. et al. Lessons from applying the systematic literature review process within the
software engineering domain. Journal of Systems and Software, [S.l.], v.80, n.4, p.571583,
Apr. 2007.
BUDGEN, D. et al. Using mapping studies in software engineering. Proceedings of PPIG,
[S.l.], v.2, 2008.
BUDGEN, D.; ZHANG, C. Preliminary reporting guidelines for experience papers.
International Conference on Evaluation and Assessment in Software Engineering, [S.l.],
p.110, 2009.
BUYYA, R. et al. Cloud computing and emerging IT platforms: vision, hype, and reality for
delivering computing as the 5th utility. Future Generation computer systems, [S.l.], v.25, n.6,
p.599616, 2009.
CALHEIROS, R. N. et al. The Aneka platform and QoS-driven resource provisioning for elastic
applications on hybrid Clouds. Future Generation Computer Systems, [S.l.], v.28, n.6,
p.861870, 2012.
CAMPBELL-KELLY, M. Historical reflections The rise, fall, and resurrection of software as a
service. Communications of the ACM, [S.l.], v.52, n.5, p.2830, 2009.
CARVER, J. Towards reporting guidelines for experimental replications: a proposal. 1st
International Workshop on Replication in Empirical . . . , [S.l.], p.25, 2010.
COOPER, H. M. Organizing knowledge syntheses: a taxonomy of literature reviews.
Knowledge in Society, [S.l.], v.1, n.1, p.104126, 1988.
CORBIN, J.; STRAUSS, A. Basics of qualitative research: techniques and procedures for
developing grounded theory. [S.l.]: Sage publications, 2014.
82
REFERNCIAS
REFERNCIAS
83
JAMSHIDI, P.; AHMAD, A.; PAHL, C. Cloud Migration Research: a systematic review. IEEE
Transactions on Cloud Computing, [S.l.], v.1, n.2, p.142157, 2013.
JEDLITSCHKA, A.; CIOLKOWSKI, M.; PFAHL, D. Reporting experiments in software
engineering. In: Guide to advanced empirical software engineering. [S.l.]: Springer, 2008.
p.201228.
JEDLITSCHKA, A.; PFAHL, D. Reporting guidelines for controlled experiments in software
engineering. In: EMPIRICAL SOFTWARE ENGINEERING, 2005. 2005 INTERNATIONAL
SYMPOSIUM ON. Anais. . . [S.l.: s.n.], 2005. p.10pp.
JURISTO, N.; MORENO, A. Basics of Software Engineering Experimentation Kluwer
Academic. [S.l.]: Boston, 2001.
JURISTO, N.; MORENO, A. M. Basics of software engineering experimentation. [S.l.]:
Springer Science & Business Media, 2013.
KAMPENES, V. B. et al. A systematic review of quasi-experiments in software engineering.
Information and Software Technology, [S.l.], v.51, n.1, p.7182, Jan. 2009.
KARN, J.; COWLING, A. Using ethnographic methods to carry out human factors research in
software engineering. Behavior research methods, [S.l.], v.38, n.3, p.495503, 2006.
KEELE, S. Guidelines for performing systematic literature reviews in software engineering. In:
Technical report, Ver. 2.3 EBSE Technical Report. EBSE. [S.l.: s.n.], 2007.
KITCHENHAM, B. A.; PFLEEGER, S. L. Personal opinion surveys. In: Guide to Advanced
Empirical Software Engineering. [S.l.]: Springer, 2008. p.6392.
KITCHENHAM, B. Evidence-based software engineering. Software Engineering, . . . , [S.l.],
2004.
KITCHENHAM, B. Whats up with software metrics?A preliminary mapping study. Journal
of systems and software, [S.l.], v.83, n.1, p.3751, 2010.
KITCHENHAM, B.; CHARTERS, S. Guidelines for performing systematic literature reviews in
software engineering. In: . [S.l.: s.n.], 2007.
KITCHENHAM, B. et al. Evaluating guidelines for empirical software engineering studies. In:
ACM/IEEE INTERNATIONAL SYMPOSIUM ON EMPIRICAL SOFTWARE
ENGINEERING, 2006. Proceedings. . . [S.l.: s.n.], 2006. p.3847.
KITCHENHAM, B.; PFLEEGER, S. Preliminary guidelines for empirical research in software
engineering. . . . Engineering, IEEE . . . , [S.l.], v.28, n.8, p.721734, 2002.
LAU, F. Toward a framework for action research in information systems studies. Information
Technology & People, [S.l.], v.12, n.2, p.148176, 1999.
LI, Q. et al. Adaptive management of virtualized resources in cloud computing using feedback
control. In: INFORMATION SCIENCE AND ENGINEERING (ICISE), 2009 1ST
INTERNATIONAL CONFERENCE ON. Anais. . . [S.l.: s.n.], 2009. p.99102.
LI, Z. et al. On evaluating commercial Cloud services: a systematic review. Journal of Systems
and Software, [S.l.], 2013.
84
REFERNCIAS
REFERNCIAS
85
86
REFERNCIAS
SOROR, A. A. et al. Automatic virtual machine configuration for database workloads. ACM
Transactions on Database Systems (TODS), [S.l.], v.35, n.1, p.7, 2010.
STOL, K.-J.; BABAR, M. A. Reporting Empirical Research in Open Source Software: the state
of practice. 5th IFIP WG 2.13 International Conference on Open Source Systems (OSS
2009), [S.l.], p.156169, 2009.
SULEIMAN, B. et al. On understanding the economics and elasticity challenges of deploying
business applications on public cloud infrastructure. Journal of Internet Services and
Applications, [S.l.], v.3, n.2, p.173193, 2011.
TRAVASSOS, G. H.; GUROV, D.; AMARAL, E. Introduo engenharia de software
experimental. [S.l.]: UFRJ, 2002.
VEGAS, S.; JURISTO, N.; BASILI, V. R. A Process for identifying relevant information for a
repository: a case study for testing techniques. In: Managing Software Engineering
Knowledge. [S.l.]: Springer, 2003. p.199230.
VIERA, A. J.; GARRETT, J. M. Understanding interobserver agreement: the kappa statistic.
Family Medicine, [S.l.], v.37, n.5, p.360363, 2005.
WILKINSON, L. Statistical methods in psychology journals: guidelines and explanations.
American psychologist, [S.l.], v.54, n.8, p.594, 1999.
WOHLIN, C. et al. Experimentation in software engineering: an introduction. 2000. [S.l.]:
Kluwer Academic Publishers, 2000.
WOHLIN, C. et al. Experimentation in software engineering. [S.l.]: Springer Science &
Business Media, 2012.
WOHLIN, C.; PETERSSON, H.; AURUM, A. Combining data from reading experiments in
software inspections. Lecture Notes on Empirical Software Engineering, World Scientific
Publishing, River Edge, NJ, USA, [S.l.], p.85132, 2003.
YIN, R. K. Case study research: design and methods. [S.l.]: Sage publications, 2013.
ZHANG, H.; BABAR, M. A.; TELL, P. Identifying relevant studies in software engineering.
Information and Software Technology, [S.l.], v.53, n.6, p.625637, June 2011.
Apndice
89
A
Estudos Primrios Includos
As informaes apresentadas neste apndice so detalhadas no Captulo 4. Por causa
de limitaes de espao esto sendo apresentadas apenas informaes de cdigo, ttulo, ano,
origem, autores e nota.
Cd.
Ttulo
Ano
Origem
Autores
Nota
EPS1
A
benefit-aware
on- 2013
demand
provisioning
approach for multi-tier
applications in cloud
computing
Springer
EPS2
IEEE
EPS3
IEEE
EPS4
IEEE
EPS5
A Pluggable Autoscaling
Service for Open Cloud
PaaS Systems
2012
IEEE
EPS6
IEEE
5,78
4,02
90
EPS7
ACM
Yingchi Mao;
Ren; Xi Chen
EPS8
IEEE
EPS9
IEEE
ACM
IEEE
2012
ACM
ACM
ACM
5,88
Scopus
5,10
ACM
EPS17 Benchmarking
Private
Cloud Performance with
User-Centric Metrics
IEEE
2014
Daoning
5,88
5,39
5,49
4,51
91
IEEE
ACM
IEEE
IEEE
4,41
TPDS
5,10
ACM
IEEE
Lipyeow Lim
EPS25 Elastic
management
of web server clusters
on distributed virtual
infrastructures
Scopus
IEEE
Scopus
2011
5,00
92
2012
IEEE
ACM
Scopus
CLOUD
IEEE
IEEE
IEEE
EPS35 Hierarchical
self- 2013
optimization of SaaS
applications in clouds
Scopus
ACM
IEEE
IEEE
IEEE
2012
5,49
5,98
A.; 4,31
93
ACM
5,39
IEEE
EPS43 Non-Intrusive
Elastic
Query Processing in the
Cloud
2013
Springer
Springer
CLOUD
IEEE
IEEE
IEEE
IEEE
94
2011
IEEE
ACM
CLOUD
Scopus
ACM
ACM
IEEE
2014
Scopus
Scopus
IEEE
2014
4,02
5,29
5,10
5,88
95
B
Estudos Primrios Excludos
Este apndice apresenta a lista dos estudos primrios excludos, demais informaes
podem ser vistas na Seo 4.2. Por causa de limitaes de espao esto sendo apresentadas
apenas informaes de cdigo, ttulo, ano, origem e autores.
Cdigo
Ttulo
Ano
Origem
Autores
EPE1
ACM
Daniel Warneke,
Leng
EPE2
IEEE
EPE3
CLOUDCOM
EPE4
2013
ACM
EPE5
IEEE
EPE6
CLOUDCOM
2011
Christof
96
EPE7
EPE8
2013
CLOUDCOM
IEEE
EPE9
IEEE
EPE10
CLOUDCOM
EPE11
CLOUD
Salah, K.
EPE12
IEEE
EPE13
ACM
Johannes
Meyer
EPE14
ACM
EPE15
Abstractions
for
Loo- 2010
sely,Coupled and Ensemble,Based Simulations on
Azure
CLOUDCOM
EPE16
Accelerating
MapReduce
Analytics Using CometCloud
CLOUD
2013
2012
Krude,
Ulrike
97
EPE17
EPE18
2010
CLOUDCOM
ACM
EPE19
2012
CLOUD
EPE20
2014
ACM
EPE21
ACM
EPE22
CLOUDCOM
EPE23
CLOUDCOM
EPE24
ACM
EPE25
IEEE
EPE26
IEEE
EPE27
An
improved
max,min
task,scheduling algorithm for
elastic cloud
Scopus
2014
98
EPE28
Springer
EPE29
IEEE
EPE30
ACM
EPE31
2013
IEEE
EPE32
2012
TPDS
EPE33
ACM
EPE34
Scopus
Feehs R.J.
EPE35
ACM
EPE36
IEEE
EPE37
2013
IEEE
EPE38
Computational Neuroscience
as a Service: Porting MIIND
to the Cloud
2011
CLOUDCOM
EPE39
Scopus
EPE40
CLOUDCOM
2013
99
EPE41
ACM
EPE42
CLOUD
EPE43
IEEE
EPE44
Scopus
EPE45
IEEE
EPE46
Scopus
EPE47
IEEE
EPE48
2012
IEEE
EPE49
IEEE
EPE50
2014
ACM
EPE51
ACM
EPE52
CLOUDCOM
2014
100
EPE53
ACM
EPE54
IEEE
EPE55
Springer
EPE56
CLOUD
EPE57
Efficient provisioning of
bursty scientific workloads
on the cloud using adaptive
elasticity control
2012
ACM
EPE58
2014
IEEE
EPE59
2010
ACM
EPE60
ACM
Iulian Neamtiu
EPE61
ACM
Rafael Moreno,Vozmediano,
Ruben S. Montero, Ignacio M.
Llorente
EPE62
Scopus
EPE63
ACM
EPE64
CLOUD
101
EPE65
Elastic SI,Cache:
consis- 2011
tent and scalable caching in
multi,tier architectures
ACM
Francisco
Perez,Sorrosal,
Marta Patio,Martinez, Ricardo Jimenez,Peris, Bettina
Kemme
EPE66
2011
CLOUD
EPE67
2012
IEEE
EPE68
IEEE
EPE69
IEEE
EPE70
Elasticity Economics of
Cloud,Based Applications
2012
IEEE
Suleiman, B.
EPE71
2013
Scopus
EPE72
2011
CLOUDCOM
EPE73
2011
CLOUD
EPE74
2013
CLOUD
EPE75
EventWave: programming
model and runtime support for
tightly,coupled elastic cloud
applications
2013
ACM
EPE76
IEEE
EPE77
CLOUD
102
EPE78
Scopus
EPE79
Springer
J. Octavio Gutierrez,Garcia,
Kwang Mong Sim
EPE80
2011
ACM
EPE81
2013
ACM
EPE82
ACM
EPE83
ACM
Paul C. Brebner
EPE84
IEEE
EPE85
Kaleidoscope:
cloud mi- 2011
cro,elasticity via VM state coloring
ACM
EPE86
2012
IEEE
EPE87
IEEE
EPE88
ACM
103
EPE89
CLOUDCOM
EPE90
ACM
EPE91
IEEE
EPE92
2013
ACM
EPE93
2012
ACM
EPE94
CLOUDCOM
EPE95
2013
IEEE
EPE96
ACM
EPE97
Springer
EPE98
IEEE
EPE99
ACM
EPE100
Scopus
2014
104
EPE101
Optimization,Based Virtual
Machine Manager for Private
Cloud Computing
2011
CLOUDCOM
Niyato, D.
EPE102
CLOUDCOM
EPE103
PRESC {2} :
efficient
self,reconfiguration of cache
strategies for elastic caching
platforms
Springer
EPE104
IEEE
EPE105
Scopus
EPE106
ACM
EPE107
Springer
EPE108
2014
IEEE
EPE109
2009
ACM
EPE110
CLOUD
EPE111
Scopus
1996
2014
2011
105
EPE112
CLOUD
EPE113
ACM
EPE114
CLOUD
EPE115
SLA
evaluation
in
cloud,based
data,centric
distributed services
Scopus
EPE116
SLA
evaluation
with 2014
on,the,fly
measurements
of distributed service implementation over clouds
ACM
EPE117
Springer
EPE118
Springer
EPE119
Springer
EPE120
Scopus
EPE121
Symbiotic
and
sensiti- 2014
vity,aware architecture for
globally,optimal benefit in
self,adaptive cloud
ACM
2014
2013
106
EPE122
EPE123
2012
ACM
Lamia Youseff, Nathan Beckmann, Harshad Kasture, Charles Gruenwald, David Wentzlaff, Anant Agarwal
Scopus
EPE124
Springer
EPE125
IEEE
EPE126
Scopus
EPE127
2014
ACM
EPE128
ACM
EPE129
Trade,Off
Analysis
of
Elasticity Approaches for
Cloud,Based
Business
Application
Scopus
EPE130
ACM
EPE131
Transforming
reactive
auto,scaling into proactive
auto,scaling
ACM
2012
2013
107
EPE132
ACM
Ganesh Ananthanarayanan,
Christopher Douglas, Raghu
Ramakrishnan, Sriram Rao,
Ion Stoica
EPE133
2013
IEEE
EPE134
IEEE
EPE135
ACM
EPE136
IEEE
Binnig, C.; Salama, A.; Zamanian, E.; Kornmayer, H.; Listing, S.; Mueller, A.C.
EPE137
ACM
109
C
Listagem dos Meios de Publicao Identificados
O objetivo este apndice apresentar a lista das meios de publicaes identificados
atravs dos estudos selecionados nesta pesquisa, de forma colaborar com pesquisas futuras
sobre experimentao em elasticidade na computao em nuvem.
Cdigo
Venue
Estudos
V1
V2
V3
V4
V5
V6
V7
V8
V9
V10
V11
V12
V13
V14
V15
V16
FAST
V17
V18
110
V19
V20
V21
V22
V23
V24
V25
V26
V27
V28
V29
V30
V31
V32
V33
V34
V35
V36
V37
V38
V39
V40
V41
V42
V43
NETWORKING
V44
V45
V46
V47
111
V48
V49
V50
V51
V52
113
D
Grupos de Pesquisa Identificados
O objetivo este apndice apresentar a lista dos grupos de pesquisas identificados atravs
dos estudos selecionados nesta pesquisa, de forma colaborar com pesquisas futuras sobre
experimentao em elasticidade na computao em nuvem.
Instituio
Publicaes
Tipo
Pas
Academia
Alemanha
Academia
Austrlia
Carleton University
Academia
Canad
Academia
Brasil
Academia
Reino Unido
Pesquisa
Frana
Universidade do Minho
Academia
Portugal
Pesquisa
Blgica
Pesquisa
Estados Unidos
Academia
Estados Unidos
Canonical Ltd
Indstria
Reino Unido
Academia
Estados Unidos
Academia
India
Academia
China
Academia
Irlanda
Duke University
Academia
Estados Unidos
Academia
Reino Unido
Academia
Brasil
Pesquisa
Alemanha
Academia
Estados Unidos
Pesquisa
Portugal
Hohai University
Academia
China
Pesquisa
China
114
IBM Research
Pesquisa
Estados Unidos
Pesquisa
Sua
Pesquisa
Canad
Pesquisa
Estados Unidos
IIT Madras
Academia
India
Institut Mines-Telecom
Pesquisa
Frana
Intel Labs
Pesquisa
Estados Unidos
Academia
Sucia
Pesquisa
India
Mines-Nantes
Pesquisa
Frana
Pesquisa
Austrlia
Academia
Grcia
Academia
China
Academia
Estados Unidos
Peking University
Academia
China
Potsdam University
Academia
Alemanha
Academia
Estados Unidos
SAP AG
Indstria
Alemanha
Shanghai University
Academia
China
SIGMA Informatique
Indstria
Frana
Tsinghua University
Academia
China
Umea University
Academia
Sucia
Academia
Espanha
Academia
Espanha
Academia
Brasil
Academia
Brasil
Academia
Brasil
Academia
Espanha
Universit de Neuchtel
Academia
Sua
University Montpellier
Academia
Frana
University of Alberta
Academia
Canad
University of California
Academia
Estados Unidos
University of Chicago
Academia
Estados Unidos
Academia
Frana
University of Hawaii
Academia
Estados Unidos
University of Lugano
Academia
Sua
University of Massachusetts
Academia
Estados Unidos
115
Academia
Estados Unidos
University of St Andrews
Academia
Reino Unido
Academia
Austrlia
Academia
ustria
Academia
Blgica
Academia
Estados Unidos
Yahoo! Research
Pesquisa
Estados Unidos
York University
Academia
Canad
117
E
Autores Envolvidos
A informao apresentada neste apndice refere-se lista dos autores identificados na
pesquisa. Mais informaes detalhadas podem ser encontradas na seo 4.2 .
Autores
Estudos
Fetzer, C.
Venugopal, S.
Ajila, S.A.
Da Silva, T.L.C.
MacHado, J.C.
Martin, A.
Matos, M.
Morin, C.
Nascimento, A.M.
Nikravesh, A.Y.
Oliveira, R.
Sousa, F.R.C
Vilaa, R.
Aakash Ahmad
Adam Silberstein
Agrawal, G.
Al-Shishtawy, A.
Alan Fekete
Aldhalaan A.
Alexey Tumanov
Amr El Abbadi
Amziani, M.
Anna Liu
Arman, A.
118
Arora, V.
Azevedo, E.
Barazzutti, R.
Barker A.
Beernaert, L.
Bin Sun
Binder, W.
Bjorkqvist, M
Bona L.C.E.
Brian F. Cooper
Brito, A.
Bunch, C.
Casalicchio E.
Chen, L.Y.
Chen, Q.
Chiu, D.
Chohan, N.
Chokhani, P.
Chung-Horng Lung
Claudio Forlivesi
Claus Pahl
Costache, S.
Cristian Cotes
Cruz, F.
Da Wei Zhang
Dantas, R.
Daoning Ren
Daren Fang
Dawoud W.
de Oliveira, F.A.
Dias, C.
Dimitrios Tsoumakos
Divyakant Agrawal
Du Dajun
Dupont, S.
Dustdar, S.a
Elie Krevat
119
Elmroth, E.
Erwin Tam
Evangelos Angelou
Fei Minrui
Felber, P.
Feller, E.
Fernandes, S.
Ferreira Coutinho, E.
Galante G.
Gao, J.
Ghanbari H.
Ghanem M.M.
Ghanem, M.M.
Goncalves Gomes, D.
Gregory R. Ganger
Guangquan Zhang
Gulisano, V.
Guo L.
Guo Y.
Guodong Long
Hall, B.
Han Li
Han R.
Harold C. Lim
Hegde, S.
Heinze, T.
Heng Wu
Hoenisch, P.a
Hongji Yang
Hu Wang
Huangke Chen
Ioannis Konstantinou
Iszlai G.
James Cipar
Janwillem Swalens
Jeffrey S. Chase
Jerzak, Z.
120
Jianghan Zhu
Jianhua Zhang
Jianjiang Wang
Jie Lu
Jimnez-Peris, R.
Jing Jiang
John Lenton
Jun Wei
Kai Ding
Kamienski, C.
Keahey, K.
Kevin Lee
Koen Daenen
Kortas, S.
Kouki, Y.
Krintz, C.
Ledoux, T.
Li Guo
Lianghong Xu
Liaskos S.
Lin Liu
Lipyeow Lim
Litoiu M.
Llorente I.M.
Lode Hoste
Lung, C.-H.
Ma, X.
MaCedo J.A.F.
MaCedo, J.A.F.
Magedanz, T.
Maia, F.
Marc Sanchez-Artigas
Margery, D.
Meinel C.
Melliti, T.
Menasce D.A.
Michael A. Kozuch
121
Montero R.S.
Moreno-Vozmediano R.
Nectarios Koziris
Neuman de Souza, J.
Nico Janssens
Nicolae, B.
Nikolaos Papailiou
Nitin Gupta
Onica, E.
Osmond M.
Parlavantzas, N.
Pasin, M.
Pasumarthy, R.
Patio-Martnez, M.
Pattabhiraman, P.
Paulo, J.
Pereira, J.
Pooyan Jamshidi
Prasanna, V.K.
Raghu Ramakrishnan
Ray, P.
Redekopp, M.
Riteau, P.
Riviere, E.
Rohr, C.
Rui Han
Russell Sears
Sadeka Islam
Sadok, D.
Sahu, S.
SaiKrishna, P.S.
Schreiner, F.
Schulte, S.a
Sergi Toda
Shaikh, A.
Shenoy, P.
122
Shetty, A.
Shivnath Babu
Simmhan, Y.
Simmons B.
Simoes, R.
Somani, G.
Song Yang
Song, W.
Soriente, C.
Srivastava, A.
Stefan Marr
Sudipto Das
Suleiman, B.
Takouna I.
Tao Huang
Tata, S.
Thierry Renaux
Tordsson, J.
Tsai, W.T.
Upendra Sharma
Valduriez, P.
Vlassov, V.
Wang, Y.
Ward J.S.
Wenbo Zhang
Wolfgang De Meuter
Wubin Li
123
F
Protocolo do Mapeamento Sistemtico
F.1
Introduo
124
empricos na CN, e como um primeiro esforo neste sentido, o presente trabalho se prope a:
identificar os experimentos em elasticidade na computao em nuvem, caracteriz-los e, atravs
de guias existentes na literatura da engenharia de software experimental, avali-los quanto a
completude de seus relatos.
F.2
(Cloud Computing <OR> Cloud Platform <OR> Cloud Service <OR> Cloud Provider
<OR> PaaS <OR> Platform as a Service <OR> Platform-as-a-Service <OR> IaaS <OR>
Infrastructure as a Service <OR> Infrastructure-as-a-Service <OR> SaaS <OR>
Software-as-a-Service"<OR> Software as a Service)
[AND]
(Systematic Literature Review <OR> Systematic Review <OR> SLR <OR> Systematic
Mapping <OR> Literature Survey <OR> Research Review <OR> Research Synthesis
<OR> Secondary Study)
F.3
Pesquisadores Envolvidos
A etapa de busca, a primeira etapa de seleo dos estudos, bem como a sntese, foram
executados exclusivamente pela pesquisara Helaine Barreiros. A segunda etapa de seleo dos
1 http://ieeexplore.ieee.org/
2 http://www.scopus.com/
3 http://dl.acm.org/
4 http://scholar.google.com/
125
estudos ser realizada com a participao de oito pesquisadores configurados em dez duplas.
A etapa de extrao de dados e aplicao do instrumento de coleta ser executada por dois
pesquisadores.
Todo o processo ser realizado sob a superviso do orientador Professor Doutor Vinicius
Garcia e co-orientador Professor Doutor Sergio Soares. A equipe envolvida na pesquisa
apresentada na Tabela F.2
Dupla
Revisor 1
Especialidade
CN
ESBE
Revisor 2
D1
D2
ESBE
D3
ESBE
ESE
Helaine Barreiros
D4
D5
D6
D7
D8
D9
Liliane Fonseca
D10
ESBE
ESE
CN
CN
ESBE
CN
ESBE
ESE
ESBE
ESE
ESBE
ESE
ESBE
ESE
Vilmar Nepomuceno
Jos Fernando (JF)
Leandro Marques (LM)
Emanoel Barreiros (EB)
Thiago Jamir (TJ)
Samuel Romeiro (SR)
Adauto Trigueiro (AT)
Especialidade
CN
ESBE
ESBE
ESE
CN
ESBE
ESE
ESBE
ESE
CN
CN
ESBE
ESBE
ESE
CN
ESBE
ESBE
ESE
ESBE
ESE
F.4
Escopo do Estudo
126
F.5
Questes de Pesquisa
127
F.6
Processo de Busca
.
O processo de busca de um estudo sistemtico deve ser rigoroso e imparcial, capaz de
permitir que a maior quantidade de estudos primrios relacionados s perguntas de pesquisa
sejam encontrados (DICKERSIN; SCHERER; LEFEBVRE, 1994). Na prtica, a identificao de
estudos primrios pode ser difcil por vrias razes como por exemplo: estratgia inadequada de
pesquisa, heterogeneidade da linguagem, limitaes dos termos de indexao, entre outras. Uma
estratgia de pesquisa ideal deve atender aos seguintes questionamentos relativos ao processo de
busca (ZHANG; BABAR; TELL, 2011):
5 http://ieeexplore.ieee.org
6 http://portal.acm.org
128
Elsevier Scopus 7 ;
Springer Link 8 .
A busca manual deve ser utilizada como estratgia para ampliar a cobertura da pesquisa
e tentar reduzir o risco de no selecionar estudos relevantes que por ventura ainda no estejam
indexados pelos engenhos. Devem ser utilizadas fontes de dados as principais conferncias
e peridicos da engenharia de software emprica e da computao em nuvem, devidamente
escolhidas atravs da consulta a especialistas da rea:
EASE International Conference on Evaluation and Assessment in Software Engineering (2006 a 2014);
ESEM International Symposium on Empirical Software Engineering and Measurement (2007 a 2014);
Pesquisadores reportam que buscas automatizadas so falhas em alguns pontos importantes (BRERETON et al., 2007; KEELE, 2007), logo, importante no apenas confiar em tais
mecanismos, com o intuito de reduzir os riscos de no selecionar estudos relevantes.
Os termos relevantes identificados foram os seguintes:
Elasticidade: elasticity;
Algumas palavras chave podem parecer no estar relacionadas a experimentos, mas elas
foram escolhidas, novamente, na tentativa de no excluir sem avaliao estudos que realizam
experimentos mas no se classificam como tal. Infelizmente, este fato ainda ocorre na rea de
computao em nuvem. Uma string de busca foi ento elaborada para ser aplicada nos engenhos
de busca escolhidos:
7 http://www.scopus.com
8 http://link.springer.com
129
(Cloud Computing <OR> Cloud Platform <OR> Cloud Service <OR> Cloud
Provider <OR> PaaS <OR> Platform as a Service <OR> Platform-as-aService <OR> IaaS <OR> Infrastructure as a Service <OR> Infrastructureas-a-Service <OR> SaaS <OR> Software-as-a-Service<OR> Software as a
Service)
[AND] (Elasticity)
[AND] (Experiment OR Evaluate <OR> Evaluation OR Evaluating <OR>
Benchmark)
F.6.1
Critrios de Excluso
O arquivo no corresponde ao Estudo. (Ex: ndice)
O arquivo no um Estudo. (Ex: proceedings, editorial)
O Estudo duplicado.
O Estudo um slideshow ou resumo expandido.
O Estudo est fora do intervalo de avaliao.
O Estudo est relacionado Elasticidade mas no relata um Experimento.
O Estudo est relacionado Elasticidade, reporta um Experimento porm no
avalia Elasticidade.
O Estudo no est disponvel.
O Estudo no est em ingls.
O Estudo no est relacionado Computao em Nuvem.
O Estudo no est relacionado Elasticidade na Computao em Nuvem.
Tabela F.3: Lista dos Critrios de Excluso em ordem alfabtica.
F.7
Processo de Seleo
O processo de seleo detalhado a seguir:
1. O pesquisador utiliza os engenhos de busca e aplica a string de busca como um filtro.
As buscas manuais tambm so realizadas. Neste segundo caso, todos os estudos
so includos para avaliao de ttulo, palavras-chave e resumo. Como resultado,
130
Foi criado um instrumento, com base em guia existente na literatura, para se avaliar a
completude dos relatos. O respectivo formulrio e suas orientaoes de utilizao esto detlhados
na Seo H. Sempre que estudos devem ser avaliados, discordncias referentes a sua permanncia
no mapeamento podem surgir uma vez que mais de um pesquisador avalia cada artigo.
Cada revisor dever analisar a lista de estudos na ferramenta ExtractViewer e registrar as
informaes pertinentes. Aps a avaliao, a ferramenta cria um relatrio descrevendo os estudos
que foram includos e excludos e identifica os conflitos a serem resolvidos. Eventualmente
conflitos devem ser resolvidos em uma reunio com a presena dos integrantes do time. Cada
integrante deve apresentar sua opinio defendendo a incluso ou excluso. Os resultados
desta reunio devero ser registrados na ferramenta ExtractViewer. uma boa prtica ter um
pesquisador snior supervisionando as reunies de resoluo de conflitos para auxiliar na sua
conduo e atuar como voto de minerva caso os avaliadores no cheguem a um acordo.
F.7.0.0.1 Avaliao da Qualidade Nos estudos de reviso sistemtica comum se avaliar
a qualidade dos estudos que foram includos na pesquisa atravs da aplicao dos critrios de
incluso/excluso. Tal avaliao complementar ao processo de aplicao dos critrios e tem
como objetivo avaliar a qualidade dos estudos segundo trs aspectos: (i) vis, (ii) validade interna
e (iii) validade externa. Atravs deste instrumento o pesquisador pode, por exemplo, decidir um
critrio mnimo para que o estudo seja includo na pesquisa.
Uma vez que no presente trabalho deseja-se contruir uma viso panormica da atual
situao dos relatos dos experimentos interessante que todos os estudos que atendam o critrio
de incluso/excluso sejam includos para anlise. Assim sendo, a anlise de qualidade dos
131
estudos selacionados no foi realizada, uma vez que a incluso do maior nmero de estudos pode
contribuir potencialmente para a formao de uma viso ampla.
F.8
Processo de Sntese
Em particular, os dados coletados devero ser distinguidos entre metadados das publicaes e dados sobre o relato dos experimentos em elasticidade. Os metadados devem ser
utilizados principalmente para realizar uma investigao estatstica dos estudos selecionados,
enquanto os dados de relato dos experimentos devem ser analisads com o objetivo de responder
s questes de pesquisa.
133
G
Ferramenta ExtractViewer
O intuito deste apndice apresentar uma breve descrio da ferramenta ExtractViewer
que foi desenvolvida e utilizada neste trabalho de mapeamento sistemtico.
G.1
Contexto
G.2
Propsito da Ferramenta
134
que julgassem relevantes durante suas anlises, o que posterioremente apoiou a resoluo de
conflitos e anlise dos estudos.
G.3
Tecnologias Utilizadas
A ferramenta vem sendo desenvolvida na linguagem Java para web, proporcionando aos
pesquisadores um ambiente de trabalho distribudo e acessvel atravs da internet. A camada de
apresentao foi desenvolvida em JSF utilizado o framework Primefaces. A camada de acesso
dados foi implementada utilizado o framework Hibernate e banco de dados PostgreSQL. O
framework Apache POI foi utilizado no desenvolvimento de alguns relatrios em formato de
planiha Excel.
Toda a arquitetura da aplicao foi desenvolvida utilizando o framework de aplicao
Spring em todas as camadas do sistema. Foi utilizado o container de servlets Apache Tomcat para
publicao do sistema. O projeto de desenvolvimento foi construdo utilizando a IDE Eclipse e o
cdigo-fonte do projeto est disponvel no repositrio Assembla.
G.4
Telas do Sistema
135
137
H
Instrumento de Coleta
O presente instrumento tem como objetivo aferir, no relatos dos experimentos, o grau do
que denominamos completude: o quo completas so as informaes relacionadas metodologia
e concluses dos estudos segundo s diretrizes e orientaes estabelecidas para se reportar
experimentos na engenharia de software experimental, de acordo com o guia de JEDLITSCHKA;
CIOLKOWSKI; PFAHL (2008).
O instrumento proposto contempla quase que na ntegra as orientaes do guia, excluindo
apenas trechos relacionados experimentos com participantes humanos que no faziam sentido
para o contexto dos experimentos da computao em nuvem. O mesmo foi dividido em sees,
cada uma delas correspondendo s sees esperadas em um relatrio de experimento segundo o
guia: Ttulo, Autoria, Resumo, Introduo, Fundamentao, Planejamento, Anlises, Discusso,
Concluso e Trabalhos Futuros (contabilizados como uma seo) e Apndices.
Para cada seo h um conjunto de perguntas (51 no total) onde para cada uma delas a
pontuao alcanada de 0,0 pontos caso a resposta para a pergunta seja NO, 0,5 ponto caso a
resposta para a pergunta seja PARCIALMENTE, e 1,0 ponto caso a resposta para a pergunta
seja SIM. A seguir cada seo do instrumento ser detalhada juntamente com as perguntas
correspondentes e seus objetivos.
Vale ressaltar que embora o instrumento indique que cada informao deva estar presente
em uma seo especfica, este tipo de exigncia no foi feita durante a extrao dos dados, pois
foi obsevado que pouqussimos estudos apresentavam as sees como foram especificadas no
presente instrumento, o que faria com que a nota dos mesmos fosse muito reduzida mesmo
quando eles apresentassem as informaes requeridas pelo instrumento. Dessa forma, decidiu-se
ser flexvel neste quesito e considerar a informao onde quer que ela estivesse presente no artigo.
Foi-se mais rigoroso em relao localizao das informaes apenas na seo de resumo.
H.0.1
Ttulo
138
tratamento que est sendo aplicado no experimento e (iii) apresente as variveis dependentes.
Com base nestas orientaes foram criadas no instrumento de coleta as seguintes perguntas:
H.0.2
Autoria
Esta seo visa identificar se o estudo fornece informaes de contato dos autores.
Apenas uma pergunta faz parte desta seo:
Neste item, se pelo menos os nomes, instituies e emails forem fornecidos, o estudo
sendo avaliado recebe 1,0 ponto. Caso o estudo deixe de apresentar algumas dessas informaes,
ele recebe 0,5. Caso no fornea nenhuma das informaes acima, ele recebe 0,0 pontos.
H.0.3
Resumo
Esta seo uma das mais importantes do instrumento, pois trata de uma das poucas
sees utilizadas pelos potenciais leitores para decidirem se o estudo em questo de seu
interesse ou no. Esta seo possui treze perguntas, divididas em seis subsees:
Fundamentao
Objetivo
139
Mtodo
Resultados
Limitaes
Concluso
H.0.4
Introduo
140
Formulao do Problema
Objetivo da Pesquisa
Contexto da Pesquisa
Os trechos a seguir foram extrados de estudo EPS18. Um exemplo de um texto descrevendo o contexto da pesquisa pode ser encontrado abaixo:
[...]Plataformas de computao em nuvem tanto pblicas (por exemplo.
Amazon EC2) como privadas esto ganhando aceitao como uma maneira
econmica de compartilhamento e gerenciamento de recursos de
computao. Na comunidade cientfica de computao, onde os usurios
precisam lidar com grandes quantidades de dados (terabytes e acima), a
gesto de grandes bases de dados paralelas em uma plataforma de
computao em nuvem especialmente atraente dado o crescimento
exponencial dos dados cientficos e os recursos fortemente limitados
(financeiros). Uma das principais vantagens de uma plataforma de
computao em nuvem a capacidade dos usurios cientficos poderem
pagar pelos recursos de computao que precisam, quando precisam. Para
aproveitar essa elasticidade proporcionada por uma plataforma de
computao em nuvem, um sistema de processamento paralelo SQL baseado
em nuvem precisa ser capaz de expandir e diminuir o nmero de ns de
banco de dados com facilidade. [...]
NICOLAE ET AL.
141
Novamente do mesmo artigo, o trecho a seguir relata o objetivo do trabalho:
[...]Neste artigo apresentamos um primeiro esforo para tratar o problema
de soporte de particionamento de dados elsticos em bancos de dados
DBMS paralelos baseados em nuvem.[...]
NICOLAE ET AL.
H.0.5
Fundamentao
A relevncia para a prtica pode ser identificada atravs da presena de informaes que
descrevam o quo eficiente ou efetiva foi a aplicao da tcnica na indstria.
H.0.6
Planejameto
Esta seo mais extensa, dedicando-se a identificar o quo completo foi o planejamento
do experimento. As perguntas utilizadas pelo instrumento so as seguintes:
Objetivos
Unidades Experimentais
Materiais Experimentais
142
Atividades
Desenho Experimental
Procedimentos
Procedimentos de Anlise
143
necessria a implementao de alguma instrumentao para a execuo dos testes, se foram
usados benchmarks. Em relao aos procedimentos de execuo, o autor deve relatar quaisquer
alteraes necessrias no sistema para execuo do experimento, cronograma de realizao, entre
outros. A coleta de dados tambm deve ser descrita. Pode ser feita, por exemplo, atravs de
programas especficos para coleta de dados da execuo, atravs da utilizao de APIs especficas
da plataforma onde o sistema est sendo executado, atravs de arquivos de log, etc. Por fim,
importante relatar como as hipteses sero testadas, quais testes estatsticos de hipteses sero
necessrios/adotados.
H.0.7
Anlises
Estatstica Descritiva
Teste de Hiptese
144
H.0.8
Discusso
Ameaas validade
Inferncias
Lies Aprendidas
Ao contrrio da seo de anlises, que tem como objetivo mostrar os dados crus, a seo
de discusso deve interpret-los. Pode incluir uma viso geral sobre os dados, alguma discusso
sobre a generalizao dos resultados, potenciais impactos em custos, tempo e qualidade. Nesta
seo, quando apropriado, os autores devem relatar se as hipteses foram confirmadas ou no.
Tambm importante relatar as ameaas validade (ameaas validade de construto, interna,
externa e de concluso).
H.0.9
Resumo
Impacto
145
Trabalhos Futuros
H.0.10
Apndices