Anda di halaman 1dari 225

Sumario

I Introdu cao `a rob otica 1


Introdu c ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
Rob otica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
Aplica c oes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
Componentes e estruturas de rob os . . . . . . . . . . . . . . . . . . . . . . . 6
Classica c ao de rob os pelo tipo de articula c ao . . . . . . . . . . . . . . . . . 11
Outros tipos de classica c ao . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
II Sistema de controle de rob os 16
Introdu c ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
Treinamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
III Movimento de corpos rgidos e transforma c oes homogeneas 22
Introdu c ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Rota c ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Composi c ao de rota c oes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
Rota c ao em torno de um eixo arbitr ario . . . . . . . . . . . . . . . . . . . . . 27
Representa c ao eixo/ angulo . . . . . . . . . . . . . . . . . . . . . . . . . 29

Angulos de Euler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

Angulos de Roll, Pitch e Yaw . . . . . . . . . . . . . . . . . . . . . . . . . . . 31


Transforma c oes homogeneas . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
IV Cinematica direta e inversa 37
Introdu c ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
Cadeias cinem aticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
Representa c ao de Denavit-Hartenberg . . . . . . . . . . . . . . . . . . . . . . 41
i
Sum ario ii
Algoritmo para a representa c ao D-H de manipuladores . . . . . . . . . 44
Cinem atica Inversa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
Manipuladores de 6 gdls com punho esferico . . . . . . . . . . . . . . . 49
V Cinematica da velocidade 51
Introdu c ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
Matriz Jacobiana geometrica . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
Derivada da Matriz de Rota c ao . . . . . . . . . . . . . . . . . . . . . . . . . 53
Velocidade linear . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
Velocidade Angular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
Computa c ao da Matriz Jacobiana . . . . . . . . . . . . . . . . . . . . . . . . 56
Matriz Jacobiana Analtica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
Rela c ao entre Jacobiana Geometrica e Jacobiana Analtica . . . . . . . . . . 59
Singularidades Cinem aticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
Est atica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
Cinem atica Inversa: Solu c ao via Matriz Jacobiana . . . . . . . . . . . . . . . 62
VI Dinamica de manipuladores 63
Introdu c ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
Equa c oes de Euler-Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
Equa c oes de Movimento de Manipuladores . . . . . . . . . . . . . . . . . . . 69
VII Controle de Manipuladores 78
Introdu c ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
Planejamento de trajet oria . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
Trajet oria desejada: polin omio do 3

grau . . . . . . . . . . . . . . . . . 80
Trajet oria desejada: fun c ao linear com extremidades parab olicas . . . . 81
Controle independente de juntas . . . . . . . . . . . . . . . . . . . . . . . . . 82
Lineariza c ao por realimenta c ao . . . . . . . . . . . . . . . . . . . . . . . . . . 83
Lineariza c ao por realimenta c ao para manipuladores: Torque Calculado . . . 85
Torque calculado + PD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
Torque Calculado com Valores Estimados . . . . . . . . . . . . . . . . . . . . 88
Controle combinado: Torque Calculado + PD + Controle robusto . . . . . . 89
Sum ario iii
VIII Projeto de controle H
2
, H

e H
2
/H

92
Controles H
2
, H

e H
2
/H

. . . . . . . . . . . . . . . . . . . . . . . . . . . 93
Equa c oes Algebricas de Riccati . . . . . . . . . . . . . . . . . . . . . . . 94
O controle H
2
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
O controle H

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
O controle H
2
/H

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
Pondera c ao de desempenho . . . . . . . . . . . . . . . . . . . . . . . . . 106
Representa c oes de incertezas n ao-estruturadas . . . . . . . . . . . . . . 106
Procedimento de Projeto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
Sele c ao de K
p
e K
v
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
Sele c ao de W
e
e W

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
Determina c ao da planta aumentada e sntese H
2
, H

e H
2
/H

. . . . 110
IX Controle H

nao linear de manipuladores 111


Controle H

n ao linear . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
Controle H

n ao linear via representa c ao quase-LPV . . . . . . . . . . 114


Representa c ao quase-LPV de um manipulador . . . . . . . . . . . . . . 118
Controle H

n ao linear via teoria dos jogos . . . . . . . . . . . . . . . . . . 119


Controle H

n ao linear via teoria dos jogos . . . . . . . . . . . . . . . 120


Controle adaptativo H

n ao linear . . . . . . . . . . . . . . . . . . . . 123
Controle adaptativo H

n ao linear com redes neurais . . . . . . . . . . 125


Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
Controle quase-LPV via realimenta c ao do estado . . . . . . . . . . . . . 129
Controle H

n ao linear via teoria dos jogos . . . . . . . . . . . . . . . 134


Controle adaptativo H

n ao linear . . . . . . . . . . . . . . . . . . . . 135
Controle adaptativo H

n ao linear com redes neurais . . . . . . . . . . 137


X Manipuladores Subatuados 148
Introdu c ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
Modelo din amico de manipuladores subatuados . . . . . . . . . . . . . . . . 149
Representa c ao quase-LPV para manipuladores subatuados . . . . . . . . . . 154
Controle H

n ao linear via teoria dos jogos para manipuladores subatuados 156


Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
Congura c ao APA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
Congura c ao PAP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
Sum ario iv
XI Controle Markoviano 179
0.1 Introdu c ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
0.2 O Rob o UArm II como um sistema Markoviano . . . . . . . . . . . . . 182
0.3 Controle Markoviano H
2
. . . . . . . . . . . . . . . . . . . . . . . . . . 187
0.4 Controle Markoviano H

. . . . . . . . . . . . . . . . . . . . . . . . . . 188
0.5 Controle Markoviano Misto H
2
/H

. . . . . . . . . . . . . . . . . . . . 191
0.6 Resultados Experimentais . . . . . . . . . . . . . . . . . . . . . . . . . . 194
XII O rob o UArm II 201
UArm II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202
C alculo dos par ametros do manipulador . . . . . . . . . . . . . . . . . . 206
Modelo Din amico do UArmII . . . . . . . . . . . . . . . . . . . . . . . . 208
Express oes Algebricas do Modelo . . . . . . . . . . . . . . . . . . . . . 208
Ambiente de controle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209
Referencias Bibliogr acas 214
Parte I
Introdu cao `a rob otica
1
2
Introdu cao
Rob otica e um campo relativamente novo da moderna tecnologia, que atravessa
as fronteiras da engenharia tradicional. Entender a complexidade dos rob os e suas
aplica c oes requer conhecimentos de engenharia eletrica, engenharia mec anica, enge-
nharia industrial, ciencia da computa c ao, economia e matem atica.
Neste curso exploramos a cinem atica, din amica e controle de manipuladores
rob oticos, [SPONG & VIDYASAGAR (1989); SCIAVICCO & SICILIANO (1996);
CRAIG (1986); LEWIS et al. (1993); KOIVO (1989)]. Assim, omitiremos muitas areas
que em conjunto formam a disciplina conhecida como rob otica, tais como, locomo c ao,
vis ao computacional, inteligencia articial, arquitetura de computadores, linguagens de
programa c ao, projeto assistido por computador, sensoreamento e manipula c ao. Ape-
sar das areas omitidas serem temas relevantes, um curso introdut orio em rob otica deve
abordar inicialmente a cinem atica, din amica e controle de manipuladores rob oticos, que
formam a base para um bom entendimento dos outros t opicos.
Rob otica
A ideia de m aquinas sucientemente complexas para executar tarefas de precis ao
tipicamente humanas e antiga, muito mais do que a tecnologia que as possibilitariam.
Filmes de c c ao cientca da primeira metade do seculo XX retratam rob os como
formas de vida articial, geralmente se diferenciando dos homens apenas pela falta de
sentimento e pela aparencia.
O termo rob o foi introduzido pela primeira vez em nosso vocabul ario pelo autor
teatral tcheco Karel Capek em sua pe ca Os Rob os Universais de Rossum, sendo
a palavra robota o termo tcheco para trabalho. Desde ent ao o termo tem sido apli-
cado a uma grande variedade de dispositivos mec anicos, como dispositivos teleopera-
dos, veculos submarinos, veculos aut onomos, etc. Virtualmente qualquer coisa que
opere com algum grau de autonomia, geralmente sob controle computacional, tem sido
chamado de rob o. Neste curso o termo rob o vai se referir a manipuladores controla-
dos por computador do tipo mostrado na gura 93. Este tipo de rob o e basicamente
um bra co mec anico funcionando sob controle computacional. Tais dispositivos, apesar
de distantes dos rob os da c c ao cientca, s ao sistemas eletromec anicos extremamente
3
Figura 1: Manipulador rob otico.
complexos cuja descri c ao analtica requer avan cados metodos, e que apresentam muitos
t opicos de pesquisa interessantes e desaadores.
Uma deni c ao ocial de tais sistemas vem do Robot Institute of America (RIA):
Um rob o e um manipulador multifuncional reprogram avel projetado para mover ma-
teriais, ferramentas, ou dispositivos especializados atraves de movimentos variados e
programados para a execu c ao de uma variedade de tarefas.
O elemento chave na deni c ao acima e a reprogramabilidade dos rob os.

E o cerebro
computacional que d a ao rob o sua utilidade e adaptabilidade. A t ao falada revolu c ao
rob otica e, na verdade, parte da revolu c ao mais abrangente dos computadores.
Mesmo essa vers ao particular de um rob o tem muitas propriedades que os tornam
atrativos num ambiente industrial. Dentre as vantagens geralmente citadas a favor da
introdu c ao de rob os est ao, diminui c ao dos custos de trabalho, aumento da precis ao e
produtividade, maior exibilidade comparado ` a m aquinas especializadas, e execu c ao de
tarefas em condi c oes de trabalho n ao apropriadas aos humanos.
Os rob os, como os denimos, nasceram da uni ao de duas tecnologias anteriores:
a dos dispositivos teleoperados e das m aquinas controladas numericamente.
Dispositivos teleoperados, ou dispositivos mestre-escravo, foram desenvolvidas durante
a Segunda Guerra Mundial para manipular materiais radioativos. Controle numerico
4
por computador (CNC) foi desenvolvido devido a exigencia de alta precis ao na confec c ao
de certos itens, como componentes de aeronaves de alto desempenho. Os primeiros
rob os, essencialmente, combinaram os ligamentos mec anicos do dispositivo teleoperado
com a autonomia e programabilidade das m aquinas CNC.
Aplica c oes
As primeiras aplica c oes com sucesso de rob os manipuladores geralmente envolveram
algum tipo de transferencia de material, tais como inje c ao em moldes ou estampagem
onde o rob o meramente auxiliava uma prensa carregando a pe ca ou transferindo a pe ca
nalizada. Os primeiros rob os eram capazes de ser programados para executar uma
seq uencia de movimentos, tais como mover-se para um ponto A, fechar a garra, mover-
se para um ponto B, etc., mas n ao tinham capacidade sensorial externa. Aplica c oes
mais complexas, tais como solda, pintura e montagem exigiram n ao s o movimentos
mais complexos mas tambem algum tipo de sensoreamento externo como vis ao, tato,
ou sensoreamento de for ca, devido a maior intera c ao do rob o com o ambiente.
Deve-se destacar que as aplica c oes dos rob os n ao est ao de maneira alguma limi-
tadas ` a tarefas industriais onde o rob o est a diretamente substituindo um trabalhador
humano. Existem diversas outras aplica c oes de rob otica em areas onde a presen ca de
humanos e indesej avel ou impratic avel. Dentre essas aplica c oes est ao a explora c ao sub-
marina e interplanet aria, o resgate e reparo de satelites, a desativa c ao de dispositivos
explosivos, o trabalho em ambientes radioativos, entre outras. Finalmente, pr oteses,
como membros articiais, s ao elas pr oprias dispositivos rob oticos que exigem metodos
de an alise e projeto similar a dos manipuladores industriais.
Conforme vimos anteriormente, uma das principais aplica c oes de rob os e no campo
industrial. Gra cas a grande variedade de efetuadores e avan cos na area de controle,
temos uma enorme gama de atividades possveis, desde prensagem de pe cas ate pintura.
Seguem ent ao algumas breves descri c oes das atividades mais tpicas de rob os industriais.
Carga e descarga em prensas: O trabalho do bra co n ao e complexo nessa ativi-
dade, mas exige bastante velocidade no processo. Ent ao e utilizado uma garra de
dois dedos, que pega a pe ca bruta, insere na prensa (sem necessidade de precis ao
de posicionamento), e depois a move para a pr oxima prensa, ou a move para fora
5
da linha de prensagem. Para acelerar o processo geralmente usam-se duas garras.
Fundi c ao em molde: o metal e despejado com a temperatura adequada no molde,
e ent ao e retirado para um pr oximo banho ou outra etapa.

E semelhante ao
processo de carga e descarga em prensa.
Carga e descarga de ferramentas: ao inves de designar um funcion ario para car-
regar um torno, por exemplo, projeta-se-se um rob o para esta tarefa. A tarefa
do rob o e tambem simples, como nos dois ultimos tipos, mas com um grau de
integra c ao do subsistema de produ c ao maior: esteira, ferramenta e bra co devem
se comunicar perfeitamente para uma atividade sem problemas.
Solda: tarefa difcil para seres humanos devido ao grau de precis ao exigido, alem
das condi c oes perigosas e desagrad aveis. O primeiro tipo de solda e a ponto-a-
ponto, onde o principal fator e a precis ao do posicionamento da pistola (uma solda
mal posicionada pode acarretar uma estrutura met alica pouco resistente). Rob os
nesta atividade necessitam geralmente de 6 graus de liberdade (3 posi c oes e 3
orienta c oes do efetuador), pois os eletrodos de solda devem estar perpendiculares
ao plano de solda, o que exige extrema mobilidade do bra co. Na solda em arco,
onde o efetuador descreve um desenho enquanto solda, o sistema deve possuir
movimento preciso, alem de bom controle de velocidade e de acionamento de
g as e eletrodos. Muitas vezes recebem treinamento por ensino, o que diculta o
processo. A solu c ao ent ao e utilizar sensores que permitem acompanhar a linha
de contato entre as duas pe cas que devem ser soldadas.
Pintura com spray: parecido com a solda em arco, mas com um sistema onde
precis ao n ao e primordial. Alguns requisitos s ao necess arios nesta atividade, como
alta velocidade no movimento do efetuador, necessidade de proteger o sistema de
poeira e fascas (o ambiente de pintura e altamente inam avel) e o bra co deve
possuir 6 ou mas graus de liberdade, pois alguns pontos da pe ca s ao difceis de
se atingir.
Montagem: sabendo-se que 40% da m ao de obra da produ c ao de uma pe ca vem
da montagem, a automatiza c ao desta atividade reduz em muito os custos de
produ c ao.

E onde as garras complexas est ao mais presentes na ind ustria. Pelo fato
de os rob os n ao serem capazes de montar pe cas complexas, eles s ao normalmente
6
utilizados para montagem de componentes simples, de f acil alinhamento e encaixe.
Componentes e estruturas de rob os
Um manipulador rob otico n ao deve ser encarado somente como uma serie de li-
gamentos mec anicos. O bra co mec anico e somente um dos componentes de um Sis-
tema Rob otico, que consiste de bra co, fonte de energia externa, efetuador,
atuadores e drives, sensores, interface computacional e controlador. Segue
uma explana c ao mais detalhada de alguns destes dispositivos:
1. Controlador
An alogo ao caso humano no qual os m usculos s ao geralmente comandados pelo
cerebro, o bra co mec anico precisa de um computador que receba informa c oes do
meio, tome decis oes e ordene ao bra co o que fazer. O controlador pode estar
ainda conectado a uma rede maior que o permite tomar decis oes baseado em
informa c oes de todo o sistema (ex. um rob o de solda automotivo ligado ` a esteira
que move os carros).
Controladores geralmente s ao baseados em programas de computador, ou em um
conjunto de instru c oes escritas em c odigo, restringindo sua a c ao ao que lhe foi
dito, nada mais. Entretanto, atualmente tem-se realizado esfor cos no sentido
de prover inteligencia articial ao rob o. Pesquisas nesse sentido s ao realizadas,
por exemplo, com redes neurais articiais no Laborat orio de Sistemas Inteligentes
(LASI) do Departamento de Engenharia Eletrica da Escola de Engenharia de S ao
Carlos (USP).
No captulo seguinte estes sistemas ser ao analisados com mais detalhes.
2. Bra co
Respons avel por posicionar o efetuador no ponto desejado, o bra co aparece em
diversas congura c oes e formas.

E composto de ligamentos conectados por
juntas, geralmente numa cadeia cinem atica aberta.
Existem tres tipos de juntas: as prism aticas ou deslizantes (g. 2), de rota c ao
(g. 3) e as de esfericas (g. 4). A deslizante permite um movimento linear entre
dois ligamentos, sendo que um deles desliza por dentro do outro, possibilitando
7
Figura 2: Junta
prism atica ou deslizante.
Figura 3: Junta rota-
cional.
Figura 4: Junta esferica.
o movimento linear. A junta rotacional une dois ligamentos como se fosse uma
dobradi ca. Enm, a junta esferica consiste em uma esfera que une dois ligamentos,
possibilitando rota c ao em 3 eixos. Este ultimo tipo e raramente usado devido ` a
diculdade da sua atua c ao.
3. Atuador
Atuador e o dispositivo que fornece o movimento ` a junta. Pode-se classicar os
atuadores pela forma de movimento (rota c ao ou deslizamento), pela forma de
acionamento (eletrico, hidr aulico ou pneum atico) e pela forma de conex ao (direto
ou indireto).
Ser direto ou n ao depende de estar ou n ao diretamente acoplado ` a junta, o que
inui no peso do bra co, na precis ao dos movimentos e na potencia nal do atuador.
A forma de movimento depende da forma com que o atuador gera o movimento,
podendo ser linear ou de rota c ao (como por exemplo, em um motor de corrente
contnua).
A forma de acionamento depende exatamente da fonte de energia do atuador,
que pode ser eletricidade, ar comprimido ou hidr aulica. Nos prim ordios, sis-
temas hidr aulicos eram os mais comuns devido ao grande torque que propiciam
(o qual tambem pode ser mantido por longos perodos). Entretanto esses sis-
temas dependem de equipamentos como bombas, acumuladores e v alvulas servo,
que alem de encarecer, demandam manuten c ao intensa. Sistemas pneum aticos
s ao semelhantes aos hidr aulicos, com a diferen ca de que s ao muito mais limpos
(logo, menos sujeitos a problemas por resduos), mas possuem um grande defeito:
8
a compressibilidade do ar atrapalha em muito o controle.
Com o avan co das tecnicas de controle, os atuadores foram obrigados a fornecer
uma precis ao maior na for ca aplicada, levando os sistemas pneum aticos e hidr aulicos
a serem drasticamente substitudos pelos motores eletricos. Apesar de n ao possurem
alto torque, sua facilidade de controle e f acil acoplamento fazem do motor eletrico
a solu c ao perfeita para manipuladores de pequeno e medio porte. O primeiro tipo
de motor eletrico e o de escova, onde a corrente e transmitida ` as bobinas do rotor
via escovas, colocads no estator e em contato com o comutador do motor. Isso
pode trazer problemas devido ao superaquecimento devido ao atrito, o que limita
diretamente o torque do motor. Uma solu c ao e usar os motores sem escova, ou
brushless. Neles a bobina ca estacion aria, e o rotor n ao tem contato com o es-
tator. A comuta c ao e feita ent ao atraves de um sensor de angulo. Uma grande
vantagem ainda e que a bobina ca presa na carca ca, facilitando a dissipa c ao
de calor. Logo, o torque sustentado aumenta em rela c ao a motores similares
(com escova) de mesmo tamanho. Motores do tipo CA (corrente alternada) n ao
s ao muito utilizados na ind ustria devido ` a sua diculdade de controle e ao baixo
torque que produzem.
4. Efetuador

E um termo geral para designar todos os dispositivos montados na
extremidade do bra co rob otico. Para poder executar a innidade de tarefas dadas
aos rob os, sua variedade e enorme. Pode-se divid-los em dois grupos principais:
garras e ferramentas.
(a) Garras: tem como objetivo executar tarefas que s ao caractersticas da m ao
humana. Apesar de n ao possurem a mesma habilidade da m ao, possuem
caractersticas bem dirigidas ` as suas tarefas, tais como for ca e forma. A
garra mais comum e a de dois dedos, que pode ser de movimento paralelo
ou de movimento rotacional (como um alicate). Apesar de n ao conseguir
manipular com eciencia objetos complexos, possui um acionamento bem
simples. Outro tipo e a garra com 3 dedos, que j a possibilita agarrar obje-
tos triangulares ou esfericos. Com complexidade maior na forma, temos as
garras articuladas, que se estendem e retraem atraves de cabos. Para ativi-
dades bem direcionadas temos outras garras, como a de objetos cilndricos
(igual a de 2 dedos, mas com formas cilndricas esculpidas no interior dos
9
dedos), e a garra para objetos fr ageis, normalmente feita com acionamento
pneum atico. Existem ainda atuadores que s ao classicados como garra, pois
apesar de n ao lembrarem sicamente uma m ao, s ao usados para manipular
objetos. Entre eles est ao a garra de v acuo, muito usada para transportar
objetos com superfcies lisas (como o p ara-brisa de um autom ovel), e a garra
eletromagnetica, usada para o transporte de objetos met alicos passveis de
magnetiza c ao. A grande habilidade destes dois ultimos tipos e poder dis-
pensar precis ao na hora de posicionar o bra co visto que n ao precisam de um
ponto especco para agarrar o objeto.
(b) Ferramentas: praticamente qualquer ferramenta convencional que o rob o
tiver habilidade e for ca suciente para trabalhar pode ser adaptada. Entre
as v arias, temos a pistola de spray utilizada na pintura de pe cas, os eletrodos
utilizados para solda, a pistola utilizada na solda ponto-a-ponto, o ma carico
utilizado na solda em arco, as brocas e as outras ferramentas de debastagem
utilizadas no processo de usinagem, a parafusadeira, entre outras.
5. Sensores Podem ser de contato ou n ao. Sensores de contato s ao utilizados para
detectar a presen ca de um objeto, e para mensurar a for ca, press ao e escorrega-
mento da pe ca na garra. J a os sensores sem contato s ao utilizados para detectar
a presen ca de um objeto, medir dist ancias, detectar movimentos e indicar a ori-
enta c ao e posi c ao de um objeto.
Podemos citar agora os principais tipos de sensores e suas aplica c oes tpicas. Os
sensores de contato chamado simples s ao uteis para indicar a existencia de um
objeto no local em que ele est a situado (por exemplo, pode ser usado para in-
dicar se a garra est a ou n ao segurando o objeto). S ao fundamentais em sistemas
autom aticos e quando v arios sensores de contato simples s ao agrupados em uma
superfcie, temos superfcies sensoras de m ultiplo contato que desempenham prati-
camente a mesma fun c ao do sensor simples, mas com maior precis ao. Semelhante
` a superfcie sensora temos as l aminas de contato que, quando pressionadas, retor-
nam um sinal eletrico. J a os sensores do tipo pelo, que s ao compostos por uma
haste muito sensvel que retorna informa c oes quando e movida, s ao muito pr aticos
para detectar padr oes e contornos de superfcies. Um problema que ocorre com
estes sensores e que por serem pequenos e sensveis, comumente s ao danicados.
10
Um dos sensores mais utilizados em rob otica e o sensor de for ca e momento,
o que lhes propiciou um grande desenvolvimento. S ao geralmente posicionados
no atuador ou pr oximo dele, e usualmente medem for ca ou momento atraves
da deforma c ao. Os dispositivos respons aveis por esta medi c ao s ao chamados de
strain gauges, e retornam tens ao ao serem deformados. Quando instalados dois
strain gauges na mesma pe ca, e possvel medir tambem a tor c ao da mesma.
No caso de manipuladores, o comando de for ca ou torque para um atuador e
calculado baseado no erro entre a posi c ao medida da junta e a posi c ao desejada.
Isto requer que cada junta tenha algum tipo de sensor de posi c ao.
Nocaso das juntas rotacionais, a abordagem mais comum e posicionar um sensor
de posi c ao diretamente no eixo do atuador. Se n ao existirem folgas ou rec uos no
acoplamento da junta com o atuador, os angulos das juntas podem ser calculados
a partir das posi c oes angulares do eixo do atuador. Tais mecanismos com sensores
posicionados nos atuadores s ao mais f aceis de serem controlados.
O sensor de posi c ao mais comum e o encoder optico. Existem dois tipos de en-
coders. O encoder absoluto e constitudo por um disco com crculos concentricos,
nos quais existem sequencias de setores transparentes e n ao transparentes. Feixes
de luz s ao emitidos de um lado do disco e s ao capturados do outro lado atraves
de fotodiodos ou fototransistores. Conforme o disco se movimenta, diferentes
padr oes de luz s ao captados, o que possibilita a indica c ao do angulo do disco e
do eixo do encoder. J a nos encoders incrementais, que s ao os mais usados j a
que s ao mais simples e baratos, apenas dois crculos com igual n umero de setores
tranparentes e n ao transparentes s ao impressos no disco do encoder. O angulo
do disco e obtido atraves do n umero de pulsos de luz em um intervalo de tempo
que alcan cam os sensores. Os setores transparentes e n ao transparentes est ao
mutuamente em quadratura, o que permite tambem a determina c ao da dire c ao
da rota c ao.
Os Resolvers s ao dispositivos que geram dois sinais de sada, um do seno da
posi c ao angular do eixo e outro do coseno. O angulo do eixo e determinado pela
magnitude relativa entre os dois sinais. A resolu c ao e uma fun c ao da qualidade
do resolver e da quantidade de rudo nos circuitos eletr onicos e cabos. Resolvers
podem ser mais con aveis que encoders opticos, mas a resolu c ao e, em geral,
11
menor.
Um sensor mais limitado devido ` as n ao-linearidades, baixa resolu c ao e alto nvel
de rudo e o potenci ometro. Conectados em congura c ao de ponte, eles pro-
duzem uma voltagem proporcional ` a posi c ao do seu eixo.
Os Tac ometros, que fornecem tens ao proporcional ` a velocidade, s ao muitas vezes
utilizados para determinar a velocidade da junta. Na falta dos mesmos a veloci-
dade pode ser calculada de diferencia c ao numerica das posi c oes, o que pode in-
troduzir rudo no sistema, assim como atraso de tempo. Apesar disso, a maioria
dos manipuladores n ao usam sensores de velocidade.
Classica cao de rob os pelo tipo de articula cao
Um manipulador, gra cas ` as caractersticas fsicas do bra co, pode ser classicado
em:
Congura c ao articulada (g. 5), chamada tambem de RRR devido aos 3 primeiros
tipos de junta a partir da base (as 3 rotacionais). Outros nomes para esta con-
gura c ao s ao manipulador articulado, e manipulador antropom orco.
Congura c ao esferica (g. 7), ou RRP. Entende-se R como junta rotacional e P
como junta prism atica. Esferica e dado como nome devido ao fato de a posi c ao
do efetuador poder ser denida em coordenadas esfericas diretamente atraves da
posi c ao das tres primeiras juntas.
Congura c ao SCARA (g. 9): SCARA vem do ingles Selective Compliant Ar-
ticulated Robot for Assembly. A principal vantagem desta congura c ao e que os
atuadores das duas primeiras juntas n ao precisam suportar os pesos das outras
juntas e da carga.

E usdao principalmente em tarefas de montagem.
Congura c ao cilndrica ou RPP (g. 11): A junta da base fornece rota c ao, en-
quanto as outras duas promovem movimentos lineares, resultando em um espa co
de trabalho cilndrico.
Congura c ao cartesiana ou PPP (g. 13): Bra co sem nenhum tipo de movimento
de rota c ao.
12
Os espa cos de trabalho dos rob os mostrados nas guras 5, 7, 9, 11 e 13 podem ser
vistos respectivamente nas guras 6, 8, 10, 12 e 14.
Figura 5: Manipulador com congura c ao
articulada.
Figura 6: Espa co de trabalho.
Figura 7: Manipulador com congura c ao
esferica.
Figura 8: Espa co de trabalho.
13
Figura 9: Manipulador com congura c ao
SCARA.
Figura 10: Espa co de trabalho.
Figura 11: Rob o com congura c ao
cilndrica.
Figura 12: Espa co de trabalho.
14
Figura 13: Rob o com congura c ao carte-
siana.
Figura 14: Espa co de trabalho.
15
Outros tipos de classica cao
Outras caractersticas do rob o tambem podem ser utilizadas para classic a-los, entre
elas fonte de energia, area de aplica c ao e metodo de controle:
Fonte de energia: Tipicamente rob os s ao alimentados por sistemas hidr aulicos,
pneum aticos ou eletricos, este ultimo o mais utilizado. Ver se c ao sobre atuadores
para maiores informa c oes sobre cada um desses tipos de fonte de energia para os
rob os.


Area de aplica c ao: manipuladores podem ser classicados em rob os de montagem
ou rob os de n ao-montagem. Os rob os de montagem tendem a ser pequenos,
r apidos, movidos por motores eletricos e na congura c ao SCARA ou articulada.
Os de n ao-montagem geralmente s ao utilizados para pintura, soldagem, manip-
ula c ao de materiais e carga e descarga de ferramentas.
Metodo de controle: s ao divididos em rob os do tipo servo e do tipo n ao-servo. Os
rob os n ao-servos s ao essencialmente de malha-aberta, com movimento limitado
a paradas pre-determinadas, sendo util ent ao para a transferencia de materiais.
S ao pouco utilizados e raramente s ao classicados como rob os. Os rob os servos
s ao de malha-fechada, controlados por computador e s ao de fato m aquinas multi-
funcionais e reprogram aveis. A classica c ao detalhada dos rob os servos pode ser
encontrada na se c ao sobre controladores.
Parte II
Sistema de controle de rob os
16
17
Introdu cao
O projeto de controle de manipuladores rob oticos consiste em determinar a hist oria
temporal de entradas nas juntas exigidas para fazer com que o efetuador execute um
determinado movimento comandado, [SPONG & VIDYASAGAR (1989)]. As entradas
nas juntas podem ser for cas ou torques, ou podem ainda ser entradas para os atuadores,
como por exemplo, voltagens para o motor. O movimento comandado e tipicamente
especicado como uma seq uencia de posi c oes e orienta c oes do efetuador, ou como uma
trajet oria contnua do mesmo.
Existem muitas tecnicas e metodologias que podem ser aplicadas no controle de ma-
nipuladores. O metodo de controle escolhido e a maneira como e feita a implementa c ao
podem ter um impacto signicante no desempenho do manipulador e conseq uentemente
na faixa de possveis aplica c oes. Por exemplo, trajet orias contnuas exigem uma imple-
menta c ao diferente em termos de hardware e software da interface computacional do
que o controle ponto a ponto.
O projeto mec anico do pr oprio manipulador pode inuenciar o tipo de controle
exigido. Por exemplo, os problemas de controle encontrados em manipuladores carte-
sianos s ao fundamentalmente diferentes daqueles encontrados em manipuladores com
juntas rotacionais.
Desenvolvimentos tecnol ogicos est ao continuamente sendo feitos no projeto mec anico
de rob os, o que melhora seu potencial desempenho e aumenta sua faixa de aplica c oes.
Atingir este aumento de desempenho, no entanto, requer abordagens de controle mais
sosticadas. Como ilustra c ao do efeito do projeto mec anico no problema de controle,
compara-se um rob o acionado por motores CC com redutores com um rob o acionado
diretamente por motores de alto torque sem redu c ao. No primeiro caso, as din amicas
do motor s ao lineares e bem conhecidas e o efeito da redu c ao e desacoplar o sistema
reduzindo o acoplamento n ao-linear entre as juntas. No entanto, a presen ca dos redu-
tores introduz fric c ao, e rec uo (backlash). De maneira a se atingir alto desempenho,
o projetista de controle deve prestar aten c ao a estes efeitos indesejados. No caso do
rob o acionado diretamente, os problemas de rec uo e fric c ao devido aos redutores s ao
eliminados. No entanto, o acoplamento n ao-linear entre os elos agora e signicativo e
a din amica do sistema e mais complexa. O resultado e que para se atingir alto desem-
18
Figura 15: Estrutura b asica de um sistema de controle realimentado.
penho neste tipo de manipulador, um conjunto diferente de problemas de controle deve
ser resolvido.
A estrutura b asica de um sistema de controle realimentado e mostrado na gura 15.
O objetivo de projeto e escolher o controlador de maneira que a sada da planta siga
uma sada desejada dada pelo sinal de referencia. O sinal de controle, no entanto, n ao
e a unica entrada agindo no sistema. Dist urbios, que s ao entradas que n ao podem ser
controladas, tambem inuenciam o comportamento da sada. Portanto, o controlador
deve ser projetado para que os efeitos dos dist urbios na planta sejam reduzidos. Se
isto e conseguido, diz-se que a planta rejeita esses dist urbios. Os dois objetivos
de seguimento de referencia e rejei c ao de dist urbios s ao centrais em qualquer
metodologia de controle.
A seguir abordaremos com mais detalhes alguns componentes do sistema de controle
de um manipulador rob otico.
Controlador
O dispositivo respons avel por receber informa c oes dos sensores, analis a-las em
rela c ao ` a sua tarefa e enviar comandos para os atuadores e chamado de controlador.
Composto por hardware e software, podemos analisar o controlador para ns did aticos
em: nveis de controle, classica c ao da programa c ao e tipos de software para o contro-
lador.
Nveis de controle: composto basicamente por 3, sendo o mais baixo o controle do
acionador, que consiste em controlar cada junta do rob o separadamente. Um nvel
acima est a o controle de trajet oria, que coordena todos as juntas de uma vez am de se
19
executar a trajet oria desejada. Enm temos o controle de coordena c ao com o ambiente,
o nvel mais alto, que controla o bra co em coordena c ao com o ambiente.
Acionadores s ao os dispositivos que promovem o movimento nas juntas do rob o. Eles
recebem um sinal do computador na forma digital, que deve ser ent ao transformado
para a forma anal ogica atraves de um conversor digital/anal ogico. Como um rob o
exerce esfor cos fsicos, esse sinal anal ogico deve tambem ser amplicado para acionar,
por exemplo, um motor eletrico.
O controle de trajet oria e dividido em 2 metodos. O primeiro e o controle ponto
a ponto, no qual indica-se uma serie de pontos para o rob o de acordo com a ordem
de passos na serie. O outro metodo e o controle de trajet oria contnua. Nela, as
instru c oes de posi c ao e velocidade desejados s ao enviadas a todo momento, de modo a
se assemelhar ao m aximo com a trajet oria programada. Para isso, o controlador pode
utilizar dois metodos: no primeiro, pode-se mover o rob o manualmente e o computador
vai gravando os pontos da trajet oria, ou denir o movimento como uma forma denida,
seja uma linha reta, um arco, etc.
Uma outra classica c ao comum de controladores e quanto ` a programa c ao, que
pode ser o-line (o controlador simplesmente segue uma serie de pontos previamente
denidos) e em tempo real, onde o controlador recebe informa c oes do ambiente e dene
novas instru c oes ao controlador no mesmo momento do processo de movimenta c ao do
rob o.
Por ultimo temos a classica c ao quanto ao tipo de software do controlador, podendo
ser software de usu ario, que e uma cole c ao de pontos e opera c oes escritas em linguagem
de alto nvel, e software de controlador, que e o software do rob o escrito pelo fabricante
e que recebe os comandos do software de usu ario convertendo-os para comandos do
rob o.
Treinamento
Para o rob o cumprir a tarefa desejada e preciso ensin a-lo, ou seja, dar-lhe uma serie
de instru c oes sobre o movimento que dever a realizar. Tal treinamento pode ser feito
de diversas formas, que s ao divididas em 2 grupos principais: metodos de ensino e de
programa c ao.
20
1. Ensino: quando durante o aprendizado existe um movimento fsico no bra co do
rob o. Pode ser feito de v arias maneiras, sendo a mais comum delas o teach-in,
ou ensino por meio de chaves: o rob o e movimentado manualmente por controle
remoto, e quando se atinge uma posi c ao-chave a mesma e salva. Uma forma mais
avan cada e se utilizar um rob o escravo para posicionar o rob o ao inves de um
controle remoto. Ainda podemos posicionar o rob o movimentando suas partes
manualmente, o que se torna extremamente difcil em rob os de grande porte.
N ao muito desenvolvido, mas muito mais confort avel ao operador, e a utiliza c ao
de rob os com sensor de for ca, no qual o sistema percebe uma for ca sendo aplicada
e fornece o torque nos atuadores no sentido provocado por esta for ca, exigindo
muito menos esfor co do operador que est a treinando.
2. Programa c ao: o treinamento n ao envolve movimento fsico do rob o. A mais
utilizada e a por coordenadas denidas pelo computador, no qual um conjunto de
pontos e fornecido via programa o-line. Para situa c oes em que o bra co pratica
a mesma tarefa em v arios lugares, existem fun c oes para deslocar um conjunto de
movimentos para outro lugar. Por exemplo, se o rob o pega a pe ca em (1,1,1),
na qual os n umeros indicam respectivamente as coordenadas cartesianas x, y,
z, e solta em (2,3,1), e existir uma pe ca igual em (6,6,1), basta transladar o
conjunto programado para pegar a pe ca em (6,6,1) e soltar em (2+6,3+6,1+1).
Existem ainda programa c oes que envolvem a interpreta c ao de sensores, dando
muito mais poder ` a automa c ao (como enxergar uma pe ca sem localiza c ao denida
e retornar sua coordenadas). Com um software avan cado e computadores de alto
desempenho, e possvel realizar ainda a modelagem de mundo, onde o sistema
de controle tem capacidade suciente para interpretar comandos e sensores, e
executar pedidos do usu ario como pegue a pe ca A e traga para local X.
Comparando as duas maneiras de ensinar o rob o e suas possveis aplica c oes, pode-
mos indicar alguns fatores que facilitam a sua escolha. No metodo de ensino pode-se
ter certeza que o efetuador vai estar no ponto desejado perfeitamente, mesmo que haja
ex oes no ligamento do rob o devido ` as cargas. J a o metodo de programa c ao permite
treinar o rob o sem tir a-lo da linha de produ c ao, e ainda pode-se copiar o treino para
outros rob os, mesmo com estruturas diferentes. Apesar de mais complexa, v arios es-
for cos de pesquisa tem sido feitos no metodo por programa c ao, fazendo deste o metodo
21
mais utilizado hoje, e possivelmente o unico no futuro.
Parte III
Movimento de corpos rgidos e
transforma c oes homogeneas
22
23
Introdu cao
A geometria do espa co tridimensional e o movimento de corpos rgidos desempen-
ham um papel central em todos os aspectos do estudo de manipuladores. Grande parte
da cinem atica de rob os est a relacionada com o estabelecimento de sistemas de coorde-
nadas para representar as posi c oes e orienta c oes de objetos rgidos e com transforma c oes
entre estes sistemas de coordenadas, [SPONG & VIDYASAGAR (1989); SCIAVICCO
& SICILIANO (1996)].
Rota cao
A gura 16 mostra um objeto S para o qual um sistema de coordenadas Ox
1
y
1
z
1
est a denido, [SPONG & VIDYASAGAR (1989)]. Seja p o vetor ligando a origem
ao ponto P em S. Desejamos relacionar as coordenadas de p no sistema Ox
1
y
1
z
1
com
as coordenadas de p num sistema de coordenadas xo (n ao rotacionado) Ox
0
y
0
z
0
.
Seja i
0
, j
0
, k
0
a base ortonormal de Ox
0
y
0
z
0
. Similarmente, seja i
1
, j
1
, k
1
a base
ortonormal de Ox
1
y
1
z
1
. Assim o vetor p pode ser representado tanto com respeito a
Ox
0
y
0
z
0
,
p
0
= p
0x
i
0
+p
0y
j
0
+p
0z
k
0
(1)
como com respeito a Ox
1
y
1
z
1
,
p
1
= p
1x
i
1
+p
1y
j
1
+p
1z
k
1
. (2)
Como p
0
e p
1
s ao representa c oes do mesmo vetor p, a rela c ao entre os componentes
de p nos dois sistemas de coordenadas pode ser obtida da seguinte maneira
p
0x
= p
0
.i
0
= p
1
.i
0
= p
1x
i
1
.i
0
+p
1y
j
1
.i
0
+p
1z
k
1
.i
0
(3)
ma qual a.b representa o produto interno entre os vetores a e b.
As formulas para p
0y
e p
0z
s ao similares,
p
0y
= p
1x
i
1
.j
0
+p
1y
j
1
.j
0
+p
1z
k
1
.j
0
(4)
24
x0
y1
y0
x1
z1
z0
P
S
Figura 16: Sistemas de coordenadas xos a um corpo rgido.
p
0z
= p
1x
i
1
.k
0
+p
1y
j
1
.k
0
+p
1z
k
1
.k
0
. (5)
Podemos reescrever essas tres equa c oes juntas como
p
0
= R
1
0
p
1
(6)
sendo
R
1
0
=
_

_
i
1
.i
0
j
1
.i
0
k
1
.i
0
i
1
.j
0
j
1
.j
0
k
1
.j
0
i
1
.k
0
j
1
.k
0
k
1
.k
0
_

_
. (7)
A matriz 3 3 representa a matriz de transforma c ao das coordenadas de p com
respeito ao sistema Ox
1
y
1
z
1
para as coordenadas com respeito ao sistema Ox
0
y
0
z
0
.
Similarmente podemos escrever
p
1
= R
0
1
p
0
(8)
sendo
R
0
1
=
_

_
i
0
.i
1
j
0
.i
1
k
0
.i
1
i
0
.j
1
j
0
.j
1
k
0
.j
1
i
0
.k
1
j
0
.k
1
k
0
.k
1
_

_
(9)
Observe que a matriz R
0
1
representa a inversa da matriz R
1
0
. Como o produto interno
25
e comutativo, isto e, i
0
.j
0
= j
0
.i
0
, temos que
R
0
1
= (R
1
0
)
1
= (R
1
0
)
T
. (10)
A matriz cuja inversa e igual a sua transposta e dita ortogonal.
Exemplo 3.1: Suponha que o sistema Ox
1
y
1
z
1
seja rotacionado de um angulo em
torno do eixo z
0
, e se deseja encontrar a matriz de transforma c ao resultante R
1
0
.
Da gura 17 vemos que
i
1
.i
0
= cos (11)
j
1
.j
0
= cos (12)
j
1
.i
0
= sin (13)
i
1
.j
0
= sin (14)
k
1
.k
0
= 1 (15)
k
1
.i
0
= 0 (16)
k
1
.j
0
= 0 (17)
i
1
.k
0
= 0 (18)
j
1
.k
0
= 0 (19)
x
0
x
1
y
0
y
1
i
0
i
1
j
0
j
1
k
0
k
1
z
0
z
1
q
q
Figura 17: Rota c ao em torno do eixo z
0
.
26
Portanto a transforma c ao R
0
1
tem a seguinte forma particular
R
1
0
=
_

_
cos sin 0
sin cos 0
0 0 1
_

_
. (20)
Esta transforma c ao e chamada de matriz de rota c ao b asica (em torno do eixo
z). Neste caso e mais util usar a nota c ao R
z,
para designar essa matriz. A matriz de
rota c ao R
z,
apresenta as seguintes propriedades
R
z,0
= I (21)
R
z,
R
z,
= R
z,+
(22)
R
T
z,
= R
z,
. (23)
Similarmente as matrizes de rota c ao representando rota c oes em torno dos eixos x e
y s ao dadas por
R
x,
=
_

_
1 0 0
0 cos sin
0 sin cos
_

_
(24)
R
y,
=
_

_
cos 0 sin
0 1 0
sin 0 cos
_

_
. (25)
Podemos ainda interpretar uma dada matriz de rota c ao como especicando a ori-
enta cao do sistema de coordenada Ox
1
y
1
z
1
em rela c ao ao sistema Ox
0
y
0
z
0
.
Composi cao de rota c oes
Nesta se c ao discutimos a composi c ao de rota c oes. Lembrando que a matriz R
1
0
na equa c ao 7 representa uma transforma c ao rotacional entre os sistemas Ox
0
y
0
z
0
e
Ox
1
y
1
z
1
. Suponha que adicionamos um terceiro sistema de coordenadas Ox
2
y
2
z
2
rela-
cionado aos outros sistemas por transforma c oes rotacionais. Um dado vetor p pode
ent ao ser representado de tres maneiras: p
0
, p
1
e p
2
nos respectivos sistemas de coor-
27
denadas. A rela c ao entre estas representa c oes de p e
p
0
= R
1
0
p
1
(26)
p
0
= R
2
0
p
2
(27)
p
1
= R
2
1
p
2
(28)
sendo R
j
i
a matriz de transforma c ao do sistema de coordenadas Ox
j
y
j
z
j
para Ox
i
y
i
z
i
.
Substituindo (28) em (26) fornece
p
0
= R
1
0
R
2
1
p
2
. (29)
Comparando (27) e (29) n os temos a rela c ao
R
2
0
= R
1
0
R
2
1
. (30)
A equa c ao (30) e a lei de composi c ao para transforma c oes rotacionais. Ela arma
que, para transformar as coordenadas do vetor p de sua representa c ao no sistema
0x
2
y
2
z
2
, p
2
, para sua representa c ao no sistema Ox
0
y
0
z
0
, p
0
, deve-se antes transform a-
las para sua representa c ao no sistema Ox
1
y
1
z
1
, p
1
, usando R
2
1
e depois transformar p
1
para p
0
usando R
1
0
.
Rota cao em torno de um eixo arbitrario
Os movimentos de rota c ao nem sempre s ao feitos em torno dos eixos de coordenadas
principais. Estamos interessados tambem em um movimento de rota c ao em torno de
um eixo arbitr ario no espa co como mostrado na gura 18. Seja k = (k
x
, k
y
, k
z
)
T
um
vetor unit ario que dene um eixo arbitr ario expresso no sistema Ox
0
y
0
z
0
. Desejamos
calcular a matriz de rota c ao R
k,
representando uma rota c ao de graus em torno desse
eixo.
Existem v arias maneiras pelas quais essa matriz pode ser calculada. A mais simples
e rotacionar o vetor k ate que este coincida com um dos eixos coordenados, por exemplo
z
0
, e ent ao rotacionar z
0
de e nalmente rotacionar k de volta a sua posi c ao original.
De acordo com a gura 18, podemos rotacionar k para z
0
primeiramente rotacionando
28
x
0
y
0
z
0
k
k
x
k
y
k
z
q
a
b
Figura 18: Rota c ao em torno de um eixo arbitr ario.
o sistemas de coordenadas em torno de z
0
por , e depois rotacionando-o em torno de
y
0
por . Desde que todas as rota c oes s ao feitas relativas ao sistema de coordenadas
xo Ox
0
y
0
z
0
, a matriz R
k,
e obtida como
R
k,
= R
z
0
,
R
y
0
,
R
z
0
,
R
y
0
,
R
z
0
,
. (31)
Da gura 18, como k e um vetor unit ario, temos que
sin =
k
y
_
k
2
x
+k
2
y
(32)
cos =
k
x
_
k
2
x
+k
2
y
(33)
sin =
_
k
2
x
+k
2
y
(34)
cos = k
z
. (35)
Substituindo essas equa c oes em (31) obtemos
R
k,
=
_

_
k
2
x
v

+c

k
x
k
y
v

k
z
s

k
x
k
z
v

+k
y
s

k
x
k
y
v

+k
z
s

k
2
y
v

+c

k
y
k
z
v

k
x
s

k
x
k
z
v

k
y
s

k
y
k
z
v

+k
x
s

k
2
z
v

+c

_
(36)
29
sendo v

= 1 c

, c

= cos , s

= sin .
Representa cao eixo/angulo
Seja R uma matriz de rota c ao arbitr aria com componentes (r
ij
), equa c ao 37.
R =
_

_
r
11
r
12
r
13
r
21
r
22
r
23
r
31
r
32
r
33
_

_
(37)
Esta matriz de rota c ao pode ser sempre representada por uma rota c ao simples em torno
de um eixo como
R = R
k,
(38)
sendo k um vetor unit ario representado no sistema Ox
0
y
0
z
0
que dene o eixo de rota c ao,
e o angulo de rota c ao em torno de k. A equa c ao (38) e chamada representa c ao
eixo/ angulo de R. Dada a matriz de rota c ao arbitr aria R, o angulo equivalente e o
eixo equivalente k s ao dados pelas express oes
= cos
1
_
Tr(R) 1
2
_
= cos
1
_
r
11
+r
22
+r
33
1
2
_
(39)
sendo Tr(R) o tra co de R, e
k =
1
2 sin
_

_
r
32
r
23
r
13
r
31
r
21
r
12
_

_
. (40)
A representa c ao eixo/ angulo n ao e unica desde que uma rota c ao de em torno
de k fornece a mesma matriz de rota c ao R.
Um corpo rgido possui no m aximo tres graus de liberdade rotacionais e portanto
no m aximo tres vari aveis independentes s ao necess arias para especicar sua orienta c ao.
Os nove elementos de uma matriz de rota c ao geral R como em (37) n ao s ao vari aveis
independentes. Seis restri c oes entre as colunas de R podem ser expressas pelas pro-
priedades de ortogonalidade dos sistemas de coordenadas. A representa c ao eixo/ angulo
e realizada utilizando-se quatro vari aveis: as tres coordenadas do vetor k e o angulo
30
. Entretanto, como o vetor k e unit ario, suas coordenadas satisfazem a restri c ao
k
2
x
+ k
2
y
+ k
2
z
= 1. Nas pr oximas se c oes vamos mostrar duas maneiras de representar
uma rota c ao arbitr aria usando somente tres vari aveis independentes. A primeira e a
representa c ao por angulos de Euler e a segunda e a representa c ao Roll-Pitch-Yaw.

Angulos de Euler
Uma maneira de se especicar uma matriz de rota c ao em termos de tres vari aveis
independentes e utilizar os angulos de Euler, gura 19. Considerando novamente
os sistema de coordenadas xo Ox
0
y
0
z
0
e o sistema rotacionado Ox
1
y
1
z
1
, podemos
especicar a orienta c ao do sistema Ox
1
y
1
z
1
relativo ao sistema Ox
0
y
0
z
0
por tres angulos
(, , ) conhecidos como angulos de Euler, e obtidos por tres rota c oes sucessivas como
segue:
1. rota c ao em torno do eixo z
0
pelo angulo ;
2. rota c ao em torno do eixo y

0
pelo angulo ;
3. rota c ao em torno do eixo z

0
pelo angulo .
Figura 19:

Angulos de Euler.
Em termos das matrizes de rota c ao b asicas a transforma c ao rotacional resultante
R
1
0
pode ser gerada pelo produto
R
1
0
= R
z
0
,
R
y

0
,
R
z

0
,
(41)
31
R
1
0
=
_

_
c

0
s

0
0 0 1
_

_
_

_
c

0 s

0 1 0
s

0 c

_
_

_
c

0
s

0
0 0 1
_

_
(42)
=
_

_
c

_
.
Analogamente ao caso da representa c ao eixo/ angulo, pode-se determinar uma rep-
resenta c ao por angulos de Euler a partir de uma matriz de rota c ao arbitr aria, equa c ao
37. Comparando as matrizes 42 e 37 e assumindo que r
13
,= 0 e r
23
,= 0, podemos
calcular os angulos de Euler como [SCIAVICCO & SICILIANO (1996)]:
= atan2(r
23
, r
13
)
= atan2(
_
r
2
13
+r
2
23
, r
33
) (43)
= atan2(r
32
, r
31
)
sendo atan2(y, x) a fun c ao arco tangente 2 que considera os sinais dos argumentos na
determina c ao do angulo. Neste caso, o angulo e limitado a (0, ). Se sen = 0, ou
seja, = 0 ou , e possvel determinar somente a soma ou diferen ca entre os angulos
e .

Angulos de Roll, Pitch e Yaw


Uma matriz de rota c ao R tambem pode ser descrita como o produto de sucessivas
rota c oes em torno dos principais eixos coordenados x
0
, y
0
, z
0
tomados numa determi-
nada ordem. Estas rota c oes denem os angulos de roll, pitch e yaw, os quais tambem
denotaremos por , , e s ao mostrados na gura 20.
A ordem das rota c oes eespecicada como x y z, ou seja:
1. movimento de yaw (guinada) em torno do eixo x
0
atraves de um angulo ;
2. movimento de pitch (inclina c ao) em torno do eixo y
0
por um angulo ;
32
x
0
y
0
z
0
Guinar
Inclinar
Rolar
Figura 20:

Angulos de roll, pitch e yaw.
3. movimento de roll (rolagem) em torno do eixo z
0
por um angulo .
Desde que as sucessivas rota c oes s ao relativas ao sistema de coordenadas xo, a matriz
de transforma c ao resultante e dada por
R
1
0
= R
z
0
,
R
y
0
,
R
x
0
,
. (44)
R
1
0
=
_

_
c

0
s

0
0 0 1
_

_
_

_
c

0 s

0 1 0
s

0 c

_
_

_
1 0 0
0 c

0 s

_
(45)
=
_

_
c

+c

+c

+s

+s

_
Poderamos, ao inves da sequencia de movimentos yaw-pitch-roll relativos ao sis-
tema de coordenadas xo, interpretar a transforma c ao acima como uma sequencia de
movimentos roll-pitch-yaw, sendo cada movimento realizado com respeito ao novo sis-
tema de coordenadas obtido. O resultado seria o mesmo.
Uma representa c ao por angulos de roll, pitch e yaw determinados a partir de uma
33
matriz de rota c ao arbitr aria e dada por [SCIAVICCO & SICILIANO (1996)]:
= atan2(r
21
, r
11
)
= atan2(r
31
,
_
r
2
32
+r
2
23
) (46)
= atan2(r
32
, r
33
)
Neste caso, o angulo e limitado a (/2, /2). Se cos = 0, ou seja, = /2
ou /2, e possvel determinar somente a soma ou diferen ca entre os angulos e .
Transforma c oes homogeneas
Considere agora um sistema de coordenadas O
1
x
1
y
1
z
1
obtido de O
0
x
0
y
0
z
0
por uma
transla c ao como mostrado na gura 21. Assim, i
0
, j
0
, k
0
s ao paralelos a i
1
, j
1
, k
1
, re-
spectivamente. O vetor d
1
0
liga a origem O
0
` a origem O
1
e e expresso no sistema de
coordenadas O
0
x
0
y
0
z
0
.
Assim qualquer ponto p tem representa c ao p
0
e p
1
como anteriormente. Desde que
os respectivos eixos de coordenadas dos dois sistemas s ao paralelos, os vetores p
0
e p
1
s ao relacionados por
p
0
= p
1
+d
1
0
(47)
ou
p
0x
= p
1x
+d
1
0x
(48)
p
0y
= p
1y
+d
1
0y
(49)
p
0z
= p
1z
+d
1
0z
. (50)
A rela c ao mais geral entre dois sistemas de referencia O
0
x
0
y
0
z
0
e O
1
x
1
y
1
z
1
pode ser
expressa como uma combina c ao de uma rota c ao pura e uma transla c ao pura, referido
como movimento rgido.
Deni c ao: A transforma c ao
p
0
= R
1
0
p
1
+d
1
0
(51)
34
x
0
y
0
z
0
x
1
y
1
z
1
d
0
1
Figura 21: Sistema transladado.
dene um movimento rgido se R
1
0
for ortogonal.
Se tivermos os dois movimentos rgidos
p
0
= R
1
0
p
1
+d
1
0
(52)
e
p
1
= R
2
1
p
2
+d
2
1
(53)
ent ao a composi c ao destes dene um terceiro movimento rgido, o qual podemos descre-
ver substituindo a express ao para p
1
de (53) em (52)
p
0
= R
1
0
R
2
1
p
2
+R
1
0
d
2
1
+d
1
0
. (54)
Desde que a rela c ao entre p
0
e p
2
tambem e um movimento rgido, podemos da
mesma forma descreve-la como
p
0
= R
2
0
p
2
+d
2
0
. (55)
Comparando as equa c oes (54) e (55) temos as identidades
R
2
0
= R
1
0
R
2
1
(56)
d
2
0
= d
1
0
+R
1
0
d
2
1
. (57)
35
A equa c ao (57) mostra que as transforma c oes de orienta c ao podem simplesmente
ser multiplicadas e a equa c ao (57) mostra que o vetor da origem O
0
ate a origem O
2
e
o vetor soma dos vetores d
1
0
de O
0
ate O
1
e do vetor R
1
0
d
2
1
de O
1
ate O
2
expresso no
sistema de coordenadas O
0
x
0
y
0
z
0
.
Uma compara c ao com a identidade matricial
_
_
R
1
0
d
1
0
0 1
_
_
_
_
R
2
1
d
2
1
0 1
_
_
=
_
_
R
1
0
R
2
1
R
1
0
d
2
1
+d
1
0
0 1
_
_
(58)
no qual 0 denota (0, 0, 0), mostra que os movimentos rgidos podem ser representados
pelo conjunto de matrizes da forma
H =
_
_
R d
0 1
_
_
. (59)
Usando o fato de R ser ortogonal, pode-se mostrar que a transforma c ao inversa
H
1
e dada por
H
1
=
_
_
R
T
R
T
d
0 1
_
_
. (60)
Matrizes de transforma c ao do tipo (59) s ao chamadas transforma c oes homogeneas.
De maneira a representar a transforma c ao (51) por uma multiplica c ao matricial, e
necess ario aumentar os vetores p
0
e p
1
pela adi c ao de um quarto componente 1
como segue
P
0
=
_
_
p
0
1
_
_
(61)
P
1
=
_
_
p
1
1
_
_
. (62)
Os vetores P
0
e P
1
s ao conhecidos como representa c oes homogeneas dos vetores
p
0
e p
1
, respectivamente. A transforma c ao (51) e equivalente a equa c ao matricial
P
0
= H
1
0
P
1
=
_
_
R
1
0
d
1
0
0 1
_
_
P
1
. (63)
36
A representa c ao homogenea (59) e um caso especial de transforma c oes homogeneas,
visto que a forma geral e dada por
H =
_
_
R
33
d
31
f
13
s
11
_
_
=
_
_
Rotacao Translacao
perspectiva fator de escala
_
_
. (64)
Para os prop ositos deste curso sempre tomamos a ultima linha de H como (0, 0, 0, 1),
apesar da forma mais geral dada por (64) ser util para a interface de um sistema de
vis ao no sistema rob otico total ou para simula c ao gr aca.
Exemplo 3.2:
A matriz de transforma c ao homogenea H
1
0
que representa a sequencia de movimentos:
1. rota c ao de graus em torno do eixo x
0
;
2. transla c ao de a unidades ao longo do eixo x
0
;
3. transla c ao de d unidades ao longo do eixo z
0
;
4. rota c ao de graus em torno do eixo z
0
,
e dada por
H
1
0
= Rot
z
0
,
Trans
z
0
,d
Trans
x
0
,a
Rot
x
0
,
(65)
_

_
c

0 0
s

0 0
0 0 1 0
0 0 0 1
_

_
_

_
1 0 0 0
0 1 0 0
0 0 1 d
0 0 0 1
_

_
_

_
1 0 0 a
0 1 0 0
0 0 1 0
0 0 0 1
_

_
_

_
1 0 0 0
0 c

0
0 s

0
0 0 0 1
_

_
=
_

_
c

0 b
c

d
s

d
0 0 0 1
_

_
.
Parte IV
Cinematica direta e inversa
37
38
Introdu cao
O problema da cinem atica direta pode ser enunciado da seguinte maneira: dadas
os valores das vari aveis das juntas de um rob o, determinar a posi c ao e orienta c ao
do efetuador. As vari aveis das juntas s ao os angulos entre os elos no caso de juntas
rotat orias, e o deslocamento linear do elo no caso de juntas prism aticas ou deslizantes.
O problema da cinem atica direta est a em oposi c ao ao da cinem atica inversa, que
pode ser formulado da seguinte maneira: dados uma posi c ao e orienta c ao desejados
para o efetuador do rob o, determinar um conjunto de vari aveis das juntas do rob o que
possibilitem essa posi c ao e orienta c ao [SCIAVICCO & SICILIANO (1996); SPONG &
VIDYASAGAR (1989); KOIVO (1989); CRAIG (1986)].
Cadeias cinematicas
Para o prop osito de an alise cinem atica, pode-se pensar em um rob o como um con-
junto de elos rgidos conectados por juntas. Essas juntas podem ser simples, como uma
junta rotativa ou uma junta prism atica, ou pode ser mais complexa como uma junta
esferica. A diferen ca entre essas duas situa c oes e que na primeira a junta tem somente
um grau e liberdade: o angulo de rota c ao no caso da junta rotat oria, ou o deslocamento
linear no caso da junta prism atica. No caso da junta esferica temos tres graus de liber-
dade. Aqui assumiremos que todas as juntas tem somente um grau de liberdade. Essa
aproxima c ao n ao envolve perda de generalidade, uma vez que juntas do tipo esferico
podem sempre ser imaginadas como uma sucess ao de juntas de um grau de liberdade
com elos de comprimento zero entre elas.
O objetivo da an alise de cinem atica direta e determinar o efeito acumulativo do
conjunto de vari aveis das juntas. Para fazer isso de uma maneira sistem atica deve-se
introduzir algumas conven c oes. Suponha que um rob o tenha n + 1 elos numerados de
0 a n come cando pela base, a qual e numerada como elo 0. As juntas s ao numeradas
de 1 a n, e a i-esima junta e o ponto no espa co onde os elos i 1 e i est ao conectados.
A i-esima vari avel da junta e denotada por q
i
. No caso de uma junta rotativa, q
i
e o
angulo de rota c ao, e no caso de uma junta prism atica, q
i
e o deslocamento linear. A
seguir, um sistema de coordenadas e xado a cada elo. Um referencial inercial e xado
a base e chamado referencial 0. Ent ao escolhemos sistemas de referencia de 1 ate n de
39
modo que o sistema i esteja rigidamente xado ao elo i. Isto signica que, qualquer
que seja o movimento que o rob o execute, as coordenadas de cada ponto no elo i s ao
constantes quando expressos no i-esimo sistema de coordenadas. A gura ? ilustra a
ideia de atachar sistemas de referencia rigidamente aos elos no caso de um manipulador
espacial.
Agora suponha que H
i
i1
seja a matriz homogenea que transforma as coordenadas
de um ponto no sistema i para o sistema i 1. A matriz H
i
i1
n ao e constante, mas
varia a medida que a congura c ao do rob o e alterada. No entanto, a suposi c ao que
todas as juntas s ao ou rotativas ou prism aticas signica que H
i
i1
e uma fun c ao de
somente uma vari avel, q
i
. Em outras palavras,
H
i
i1
= H
i
i1
(q
i
) . (66)
A matriz homogenea que transforma as coordenadas de um ponto de um sistema j
para um sistema i e chamada de matriz de transforma c ao, e e geralmente denotada
por T
j
i
. Do captulo anterior,
T
j
i
= H
i+1
i
H
i+2
i+1
H
j1
j2
H
j
j1
se i < j (67)
T
j
i
= I se i = j (68)
T
j
i
= (T
j
i
)

1 se i > j . (69)
Cada transforma c ao homogenea H
i
i1
e da forma
H
i
i1
=
_
_
R
i
i1
d
i
i1
0 1
_
_
. (70)
Portanto
T
j
i
= H
i+1
i
H
j
j1
=
_
_
R
j
i
d
j
i
0 1
_
_
. (71)
A matriz R
j
i
expressa a orienta c ao do sistema j relativo ao sistema i e e dado pelas
partes rotacionais das matrizes H como
R
j
i
= R
i+1
i
R
j
j1
. (72)
40
x
0
y
0
z
0
o
0
Joint 1
z
1
x
1
y
1
Joint 2
z
2
x
2
y
2
z
3
x
3
y
3
q
1
q
2
q
3
Joint 3
Link 1
Link 2
Link 3
Figura 22: Sistemas de coordenadas xos ao manipulador espacial.
Os vetores d
j
i
s ao dados recursivamente pela formula
d
j
i
= d
j1
i
+R
j1
i
d
j
j1
. (73)
Pela maneira na qual xamos rigidamente os v arios sistemas de referencia aos cor-
respondentes elos, segue que a posi c ao e orienta c ao de qualquer ponto no efetuador,
quando expresso no sistema n, e uma constante independente da congura c ao do rob o.
Denotando a posi c ao e orienta c ao do efetuador com respeito ao sistema inercial ou da
base por um vetor d
n
0
e uma matriz de rota c ao 3 3 R
n
0
, respectivamente, e denindo
a matriz homogenea
T
n
0
=
_
_
R
n
0
d
n
0
0 1
_
_
. (74)
Ent ao a posi c ao e orienta c ao do efetuador no sistema inercial s ao dados por
T
n
0
= H
1
0
(q
1
) H
n
n1
(q
n
) . (75)
A transforma c ao homogenea (74) pode ser escrita como
41
T
1
0
=
_

_
n
x
s
x
a
x
d
x
n
y
s
y
a
y
d
y
n
z
s
z
a
z
d
z
0 0 0 1
_

_
=
_
_
n
0
s
0
a
0
d
1
0
0 0 0 1
_
_
(76)
Na equa c ao acima n
0
= (n
x
, n
y
, n
z
)
T
e um vetor que representa a dire c ao do eixo
x
n
representado no sistema O
0
x
0
y
0
z
0
, s
0
= (s
x
, s
y
, s
z
)
T
representa a dire c ao do eixo
y
n
, e a
0
= (a
x
, a
y
, a
z
)
T
representa a dire c ao do eixo z
n
.
Representa cao de Denavit-Hartenberg
Apesar de ser possvel desenvolver a an alise de cinem atica direta usando um sis-
tema de referencia arbitr ario para cada elo, e muito util a escolha sistem atica desses
sistemas. Uma conven c ao comumente usada para selecionar sistemas de referencia em
aplica c oes de rob otica e a representa c ao Denavit-Hartenberg, ou D-H. Nesta conven c ao,
cada transforma c ao homogenea H
i
i1
e representada como um produto de quatro trans-
forma c oes b asicas
H
i
i1
= Rot
z
i1
,
i
Trans
z
i1
,d
i
Trans
x
i
,a
i
Rot
x
i
,
i
(77)
=
_

_
c

i
s

i
0 0
s

i
c

i
0 0
0 0 1 0
0 0 0 1
_

_
_

_
1 0 0 0
0 1 0 0
0 0 1 d
i
0 0 0 1
_

_
_

_
1 0 0 a
i
0 1 0 0
0 0 1 0
0 0 0 1
_

_
_

_
1 0 0 0
0 c

i
s

i
0
0 s

i
c

i
0
0 0 0 1
_

_
=
_

_
c

i
s

i
c

i
s

i
s

i
a
i
c

i
s

i
c

i
c

i
c

i
s

i
a
i
s

i
0 s

i
c

i
d
i
0 0 0 1
_

_
sendo
i
, a
i
, d
i
,
i
par ametros do elo i e junta i. Esses par ametros recebem os seguintes
nomes: a
i
e chamado comprimento,
i
e chamado tor c ao, d
i
e chamado desloca-
mento e
i
e chamado angulo. Como a matriz A
i
e uma fun c ao de uma unica vari avel,
tres das quatro vari aveis acima s ao constantes para um dado elo, enquanto que o quarto
42
par ametro,
i
para uma junta rotat oria e d
i
para uma junta prism atica, e a vari avel da
junta.
Do captulo anterior vemos que uma matriz homogenea arbitr aria pode ser caracter-
izada por seis vari aveis, tais como, o vetor das tres componentes de deslocamento, d e
os tres angulos de Euler correspondentes a matriz de rota c ao R. Na representa c ao D-H,
em contraste, existem somente quatro par ametros. Isso e possvel porque enquanto o
sistema de referencia i deve estar rigidamente xado ao elo i, temos uma consider avel
liberdade de escolha da origem e dos eixos coordenados do sistema. Por exemplo, n ao e
necess ario que a origem O
i
do sistema i deva corresponder a junta i ou a junta i +1, ou
seja, as extremidades do elo i. Portanto, atraves de uma escolha adequada da origem
e dos eixos coordenados e possvel cortar o n umero de par ametros necess arios de seis
para quatro (ou ate menos em alguns casos).
Come camos determinando quais transforma c oes homogeneas podem ser expressas
na forma (77), [SPONG & VIDYASAGAR (1989)]. Suponha que temos dois sistemas
de referencia, denotados por 0 e 1, respectivamente. Ent ao existe uma unica matriz de
transforma c ao homogenea H que relacionam as coordenadas do sistema 1 e do sistema
0. Agora suponha que os dois sistemas tenham duas propriedades adicionais:
1. O eixo x
1
e perpendicular ao eixo z
0
2. O eixo x
1
intercepta o eixo z
0
Sob estas condi c oes, podemos armar que existem valores unicos de a, d, , tais que
H = Rot
z,
Trans
z,d
Trans
x,a
Rot
x,
. (78)

E claro que, desde que e s ao angulos, a unicidade destes est a contida em um


conjunto de m ultiplos de 2.
Para mostrar que a matriz H pode ser dada dessa forma, escrevemos H como
H =
_
_
R d
0 1
_
_
(79)
e fazemos r
i
denotar a i-esima coluna da matriz de rota c ao R. Referindo ` a gura ?
observamos que a suposi c ao (1) signica que o vetor r
1
(que e a representa c ao do vetor
43
unit ario i
1
no sistema de referencia 0) e ortogonal a k
0
= [0 0 1]
T
, ou seja, r
31
= 0.
A partir da podemos armar que existem valores unicos dos angulos e tais que
R = R
z,
R
x,
=
_

_
c

0 s

_
. (80)
A unica informa c ao que temos e que r
31
= 0. Mas isto e suciente, pois, desde que
cada linha e cada coluna de R devem ter comprimento unit ario, r
31
= 0 implica que
r
2
11
+r
2
21
= 1, r
2
32
+r
2
33
= 1 . (81)
Portanto existem valores unicos de e tais que
(r
11
, r
21
) = (c

, s

), (r
33
, r
32
) = (c

, s

) . (82)
Encontrando os valores de e , e rotineiro mostrar que os elementos restantes de
R devem ter a forma mostrada em 80, usando o fato que R e uma atriz de rota c ao.
Em seguida, a suposi c ao (2) signica que o vetor d = d
1
0
(que e o vetor da origem
do sistema 1 em termos do sistema 0) e uma combina c ao linear de k
0
e Ri
1
. Portanto,
desde que r
31
= 0, podemos expressar d
1
0
unicamente como
d
1
0
= dk
0
+aRi
1
(83)
= dk
0
+ar
1
=
_

_
ac

as

d
_

_
.
Substituindo R de (80) e d de (83) em (79) obtemos (77), conforme armado
[SPONG & VIDYASAGAR (1989)].
Agora que estabelecemos que cada matriz homogenea que satisfaz as condi c oes (1)
e (2)pode ser representada na forma (77), podemos dar uma interpreta c ao fsica para
cada uma das quatro vari aveis em (77). O par ametro a e a dist ancia entre os eixos z
0
e z
1
, e e medida ao longo do eixo x
1
. O angulo e o angulo entre os eixos z
0
e z
1
,
44
medidos num plano normal a x
1
. O par ametro d e a dist ancia entre a origem O
0
e a
intersec c ao do eixo x
1
com o eixo z
0
medido ao longo de z
0
. Finalmente, e o angulo
entre os eixos x
0
e x
1
medidos num plano normal ao eixo z
0
.
Para um manipulador, pode-se sempre escolher os sistemas de coordenadas 0, , n
de maneira que as duas condi c oes s ao satisfeitas, desde que se aceite a possibilidade
de que a origem O
i
do sistema i n ao precisa estar na junta i. Lembrando as duas
condi c oes: (1) x
i
e perpendicular a z
i1
e (2) x
i
intersecta z
i1
.

E importante manter
em mente que as escolhas dos v arios sistemas de coordenadas n ao s ao unicas, mesmo
quando restringidas pelas condi c oes acima.
Algoritmo para a representa cao D-H de manipuladores
Podemos resumir o procedimento baseado na conven c ao D-H no seguinte algoritmo
para calcular a cinem atica direta para qualquer manipulador [SCIAVICCO & SICIL-
IANO (1996)].
Passo 1: Dena o eixo z
i
ao longo dao eixo da junta i + 1. O eixo z
n
e denido na
dire c ao do eixo z
n1
se a junta n e rotacional.
Passo 2: Posicionar a origem O
0
em qualquer ponto do eixo z
0
. O eixo x
0
e escolhido
convenientemente.
Para i = 1, , n 1, fazer os passos 3 e 4.
Passo 3: Posicionar a origem O
i
onde a normal comum a z
i
e z
i1
intersecta z
i
. Se
z
i
intersecta z
i1
posicionar O
i
nesta intersec c ao. Se z
i
e z
i1
s ao paralelos,
posicionar O
i
na junta i + 1.
Passo 4: Estabelecer x
i
ao longo da normal comum entre x
i
e z
i
com dire c ao da junta
i para i + 1, ou na dire c ao normal ao plano z
i1
z
i
se z
i1
e z
i
se intersectam.
Passo 5: Estabele ca a origem O
n
convenientemente ao longo de z
n
, preferencialmente
no centro da garra ou na extremidade da ferramenta que o manipulador esteja
carregando. Estabele ca x
n
normal ao eixo z
n
1.
Passo 6: Estabelecer y
i
para completar a regra da m ao direita.
Passo 7: Criar uma tabela dos par ametros dos elos, a
i
, d
i
,
i
e
i
.
45
a
i
= dist ancia ao longo de x
i
de O
i
ate a intersec c ao dos eixos x
i
e z
i1
.
d
i
= dist ancia ao longo z
i1
de O
i1
ate a intersec c ao dos eixos x
i
e z
i1
. d
i
e
vari avel se a junta i e prism atica.

i
= o angulo entre z
i1
e z
i
medido em torno de x
i
.

i
= o angulo entre x
i1
e x
i
medido em torno de z
i1
.
i
e vari avel se a junta i
e rotativa.
Passo 8: Formar as matrizes de transforma c ao homogeneas H
i
i1
substituindo os par ametros
acima em (77).
Passo 9: Formar T
n
0
= H
1
0
H
n
n1
. Isto fornece a posi c ao e orienta c ao do sistema de
referencia da ferramenta expresso nas coordenadas do sistema de referencia base.
Exemplo 4.1: Considere o manipulador planar de dois elos da gura 23. Os eixos
das juntas z
0
e z
1
s ao normais ` a p agina. Dene-se o sistema da base O
0
x
0
y
0
z
0
como mostrado. A origem e escolhida no ponto de intersec c ao do eixo z
0
com a
p agina. Uma vez que o sistema de referencia da base est a determinado, o sistema
O
1
x
1
y
1
z
1
e xado conforme a conven c ao D-H, onde a origem O
1
e posicionada na
intersec c ao de z
1
com a p agina. O sistema de referencia nal O
2
x
2
y
2
z
2
e xado
escolhendo a origem O
2
na extremidade do elo 2 como mostrado. Os par ametros
s ao mostrados na Tabela 1. Pela conven c ao D-H o unico angulo vari avel e
i
,
ent ao simplicamos a nota c ao escrevendo c
i
para cos
i
, etc. Tambem denotamos

1
+
2
por
12
, e cos(
1
+
2
) por c
12
e assim por diante. As seguinte rela c oes
trigonometricas s ao utilizadas: cos(
1
+
2
) = cos(
1
) cos(
2
) sen (
1
) sen (
2
) e
sen (
1
+
2
) = sen (
1
) cos(
2
) + sen (
2
) cos(
1
).
Elo a
i
d
i

i

i
1 a
1
0 0
1
2 a
2
0 0
2
Tabela 1: Par ametros de D-H
As matrizes H
i
i1
s ao determinadas de (77) como
46
Figura 23: Manipulador planar de dois elos.
H
1
0
=
_

_
c
1
s
1
0 a
1
c
1
s
1
c
1
0 a
1
s
1
0 0 1 0
0 0 0 1
_

_
(84)
H
2
1
=
_

_
c
2
s
2
0 a
2
c
2
s
2
c
2
0 a
2
s
2
0 0 1 0
0 0 0 1
_

_
. (85)
A matrize T
2
0
e dada por
T
2
0
= H
1
0
H
2
1
=
_

_
c
12
s
12
0 a
1
c
1
+a
2
c
12
s
12
c
12
0 a
1
s
1
+a
2
s
12
0 0 1 0
0 0 0 1
_

_
. (86)
Note que os dois primeiros elementos da ultima coluna de T
2
0
s ao os componentes
d
x
e d
y
do vetor ligando a origem O
0
` a origem O
2
representado no sistema de
referencia da base, ou seja,
d
x
= a
1
c
1
+a
2
c
12
(87)
d
y
= a
1
s
1
+a
2
s
12
. (88)
47
s ao as coordenadas do efetuador no sistema da base. A parte rotacional de T
2
0
fornece a orienta c ao do sistema O
2
x
2
y
2
z
2
relativo ` a base. Esta orienta c ao pode ser
representada como uma rota c ao em torno do eixo z
0
por um angulo de orienta c ao
dado por:
=
1
+
2
. (89)
Cinematica Inversa
As equa c oes cinem aticas, em geral, s ao n ao lineares e, assim, nem sempre e
possvel achar uma solu c ao fechada.
M ultiplas solu c oes podem existir.
Podem n ao existir solu c oes admissveis.
Existem duas formas de se calcular a cinem atica inversa, com suas vantagens e
desvantagens:
1. Solu c oes analticas
+ pouco tempo de c alculo
aplic aveis para um unico tipo de rob o
n ao existe procedimento padr ao
2. Solu c oes numericas iterativas (via matriz Jacobiana)
+ aplic aveis para rob os diferentes
n ao apropriadas para aplica c oes em tempo real
problemas de convergencia nas proximidades de singularidades
Exemplo 4.2: Considere o manipulador de dois elos da gura 23. Do Exemplo 4.1,
temos:
d
x
= a
1
c
1
+a
2
c
12
d
y
= a
1
s
1
+a
2
s
12
48
Elevando ao quadrado as duas equa c oes e somando
d
2
x
+d
2
y
= a
2
1
+a
2
2
+ 2a
1
a
2
c
2
Ent ao
c
2
=
d
2
x
+d
2
y
a
2
1
a
2
2
2a
1
a
2
Existencia de solu c ao: 1 c
2
1 fora do espa co de trabalho. Temos
s
2
=
_
1 c
2
2
O sinal da solu c ao acima est a relacionado com as duas possibilidades de valor
para
2
. Portanto:

2
= atan2(s
2
, c
2
)
A fun c ao arco tangente 2 leva em conta o sinal do numerador e do denominador
no c alculo do angulo:
= atan2(n, d) =
_

_
indefinido para n = d = 0
90

para n > 0 e d = 0
90

para n < 0 e d = 0
0

< 90

para n 0 e d > 0
90

< 180

para n 0 e d < 0
180

< 90

para n 0 e d < 0
90

< 0

para n 0 e d > 0
Substituindo
2
nas equa c oes
s
1
=
(a
1
+a
2
c
2
)d
y
a
2
s
2
d
x
d
2
x
+d
2
y
c
1
=
(a
1
+a
2
c
2
)d
x
+a
2
s
2
d
y
d
2
x
+d
2
y
Portanto

1
= atan2(s
1
, c
1
)
Se a orienta c ao, =
1
+
2
, e dada temos solu c ao unica.
49
Manipuladores de 6 gdls com punho esferico
Podemos desacoplar os problemas de cinem atica inversa de posi c ao e orienta c ao
quando eixos do punho se intersectam num unico ponto [SCIAVICCO & SICILIANO
(1996)]. Considere que a posi c ao e a orienta c ao s ao dados, respectivamente, por: d
n
0
e
R = [n
0
s
0
a
0
]. A solu c ao pode ser encontrada realizando-se os seguintes passos:
Calcule a posi c ao do punho: dp
0
Resolva a cinem atica inversa para (q
1
, q
2
, q
3
)
Calcule R
3
0
Calcule R
6
3
= (R
3
0
)
T
R
Resolva a cinem atica inversa para a orienta c ao, (q
4
, q
5
, q
6
), determinando os
angulos de Euler com rela c ao ao sistema de coordenadas O
3
x
3
y
3
z
3
, Eq. 43.
Exemplo 4.2: Considere o manipulador esferico da gura 24. Seja a posi c ao do punho
dada por:
dp
0
=
_

_
dp
x
dp
y
dp
z
_

_
.
Figura 24: Manipulador esferico.
50
Se dp
x
,= 0 e dp
y
,= 0

1
= atan2(dp
x
, dp
y
).
Se dp
x
= 0 e dp
y
= 0: innitas solu c oes para
1
. Sendo r
2
= dp
2
x
+ dp
2
y
e
s = dp
z
d
1

2
= atan2(r, s).
A vari avel d
3
e dada por:
d
3
=
_
r
2
+s
2
a
2
=
_
dp
2
x
+dp
2
y
+ (dp
z
d
1
)
2
a
2
.
Parte V
Cinematica da velocidade
51
52
Introdu cao
Nos captulos anteriores foram mostradas as equa c oes que relacionam a posi c ao
e orienta c ao do efetuador e as posi c oes angulares das juntas. Neste captulo ser ao
mostradas as equa c oes de velocidade, relacionando as velocidades lineares e angulares
do efetuador (ou qualquer outro ponto do manipulador) com as velocidades das juntas
[SCIAVICCO & SICILIANO (1996)].
Matematicamente, as equa c oes da cinem atica direta denem uma fun c ao entre o
espa co das posi c oes e orienta c oes cartesianas e o espa co das posi c oes das juntas. As
rela c oes de velocidade s ao ent ao determinadas pela Jacobiana dessa fun c ao. A Jaco-
biana e uma matriz de fun c oes e pode ser vista como uma vers ao vetorial da derivada
ordin aria de uma fun c ao escalar. Esta matriz e uma das mais importantes na an alise
e controle de rob os manipuladores. Ela aparece em quase todos os aspectos do estudo
de manipuladores: no planejamento e execu c ao de trajet orias suaves, na determina c ao
de congura c oes singulares, na execu c ao de movimento coordenado, no c alculo das
equa c oes din amicas do movimento e na transforma c ao de for cas e torques do efetuador
para as juntas do manipulador.
Matriz Jacobiana geometrica
Lembrando
T
n
0
(q) =
_
_
R
n
0
(q) d
n
0
(q)
0 1
_
_
(90)
sendo q = [q
1
q
2
q
n
]
T
as coordenadas generalizadas das juntas.
A velocidade linear da origem do sistema de coordenadas do efetuador com rela c ao
ao sistema de coordenadas da base (

d
n
0
) e a velocidade angular do sistema do efetuador
com rela c ao ao sistema da base (w
n
0
) podem ser dadas por

d
n
0
= J
d
(q) q (91)
w
n
0
= J
w
(q) q (92)
53
sendo J
d
(q) e J
w
(q) matrizes 3 n. Ainda
v =
_
_

d
n
0
w
n
0
_
_
=
_
_
J
d
(q)
J
w
(q)
_
_
q = J(q) q (93)
na qual J(q) e uma matriz 6 n chamada Jacobiana geometrica.
Derivada da Matriz de Rota cao
Lembrando que
R(t)R
T
(t) = I (94)
e derivando com rela c ao ao tempo, temos:

R(t)R
T
(t) +R(t)

R
T
(t) = 0 (95)
Seja
S(t) =

R(t)R
T
(t). (96)
Ent ao S(t) e uma matriz anti-simetrica 3 3, pois
S(t) +S
T
(t) = 0. (97)
P os multiplicando 96 por R(t)

R(t) = S(t)R(t). (98)


Seja p(t) = R(t)p
c
, sendo p
c
um vetor constante. Ent ao
p(t) =

R(t)p
c
= S(t)R(t)p
c
. (99)
e sendo w(t) a velocidade angular,
p(t) = w(t) R(t)p
c
. (100)
Assim, da eq. acima, observa-se que a matriz S(t) descreve o produto vetorial entre
54
w(t) e R(t)p
c
. Como w(t) = [w
x
(t) w
y
(t) w
z
(t)]
T
, pode-se escrever que
S(w) =
_

_
0 w
z
w
y
w
z
0 w
x
w
y
w
x
0
_

_
(101)
o que justica escrevermos que S(t) = S(w). Assim, pode-se provar que
RS(w)R
T
= S(Rw). (102)
Velocidade linear
Sejam d
i1
0
e d
i
0
os vetores posi c ao das origens dos sistemas i 1 e i, expressos no
sistema de coordenadas da base. O vetor posi c ao da origem do sistema i com respeito ao
sistema i 1, expresso no sistema i 1, e denotado por r
i
i1
. Das equa c oes cinem aticas,
d
i
0
= d
i1
0
+R
i1
0
r
i
i1
. (103)
Derivando em rela c ao ao tempo

d
i
0
=

d
i1
0
+R
i1
0
r
i
i1
+

R
i1
0
r
i
i1
. (104)
Usando a eq. 98, temos

d
i
0
=

d
i1
0
+R
i1
0
r
i
i1
+S(w
i1
0
)R
i1
0
r
i
i1
. (105)
Chamando r
i
i1,0
= R
i1
0
r
i
i1
, ent ao

d
i
0
=

d
i1
0
+R
i1
0
r
i
i1
+S(w
i1
0
)r
i
i1,0
(106)
e pela equa c ao de S(w)

d
i
0
=

d
i1
0
+R
i1
0
r
i
i1
+w
i1
0
r
i
i1,0
. (107)
Denindo v
i
i1,0
= R
i1
0
r
i
i1
(velocidade da origem do sistema i com respeito ` a origem
55
do sistema i 1, expresso no sistema da base), ent ao

d
i
0
=

d
i1
0
+v
i
i1,0
+w
i1
0
r
i
i1,0
(108)
que fornece a express ao da velocidade linear do elo i como fun c ao das velocidades de
transla c ao e rota c ao do elo i 1.
Velocidade Angular
Fazendo R
i
0
= R
i1
0
R
i
i1
, ent ao da eq. 98, sua derivada ca
S(w
i
0
)R
i
= S(w
i1
0
)R
i
0
+R
i1
0
S(w
i
i1
)R
i1
0
T
R
i1
0
R
i
i1
. (109)
Como RS(w)R
T
= S(Rw), temos
S(w
i
0
)R
i
0
= S(w
i1
0
)R
i
0
+S(R
i1
0
w
i
i1
)R
i
0
(110)
o que leva a
w
i
0
= w
i1
0
+R
i1
0
w
i
i1
(111)
w
i
0
= w
i1
0
+w
i
i1,0
. (112)
Portanto, obtivemos a express ao da velocidade angular do elo i como uma fun c ao da
velocidade angular do elo i 1 e da velocidade angular do elo i com respeito ao elo
i 1, expressa na sistema de coordenada da base (w
i
i1,0
).
As velocidade relativas, v
i
i1,0
e w
i
i1,0
, assumem valores especcos quando a junta
i e prism atica ou rotacional, simplicando as express oes 108 e 112.
1. Junta i e prism atica
Velocidade linear : v
i
i1,0
=

d
i
z
i1
Velocidade angular: w
i
i1,0
= 0
2. Junta i e rotacional
56
Velocidade linear: v
i
i1,0
= w
i
i1,0
r
i
i1,0
Velocidade angular: w
i
i1,0
=

i
z
i1
Computa cao da Matriz Jacobiana
Lembrando que
v =
_
_

d
n
0
w
n
0
_
_
=
_
_
J
d
(q)
J
w
(q)
_
_
q = J(q) q (113)
pode-se escrever que
J(q) =
_
_
j
d1
j
dn
j
w1
j
wn
_
_
(114)
na qual j
di
e j
wi
s ao vetores 3 1.
Utilizando 108 e 112, calcula-se de forma recursiva os vetores

d
n
0
e w
n
0
e determina-se
a contribui c ao da derivada da coordenada generalizada q
i
no calculo destes.
1. Contribui c ao para a velocidade angular, w
n
0
:
Junta i e prism atica: q
i
j
wi
= 0 j
wi
= 0
Junta i e rotacional:
q
i
j
wi
=

i
z
i1
j
wi
= z
i1
2. Contribui c ao para a velocidade linear,

d
n
0
:
Junta i e prism atica:
q
i
j
di
=

d
i
z
i1
j
di
= z
i1
Junta i e rotacional:
q
i
j
di
= w
i
i1,0
r
n
i1,0
=

i
z
i1
(d
n
0
d
i1
0
) j
di
= z
i1
(d
n
0
d
i1
0
)
57
Resumindo
_
_
j
di
j
wi
_
_
_
_
z
i1
0
_
_
(115)
se a junta i e prism atica.
_
_
j
di
j
wi
_
_
_
_
z
i1
(d
n
0
d
i1
0
)
z
i1
_
_
(116)
se a junta i e rotacional.
Os elementos de J(q) podem ser calculados como
z
i1
= R
1
0
(q
1
) R
i1
i2
(q
i1
)
_

_
0
0
1
_

_
(117)
_
_
d
n
0
1
_
_
= H
1
0
(q
1
) H
n
n1
(q
n
)
_

_
0
0
0
1
_

_
(118)
_
_
d
i1
0
1
_
_
= H
1
0
(q
1
) H
i1
i2
(q
i1
)
_

_
0
0
0
1
_

_
(119)
Exemplo 5.1: Considere o manipulador planar de dois elos da gura 23. Como o
manipulador possui duas juntas rotacionais a matriz Jacobiana geometrica e dada
por:
J(q) =
_
_
z
0
(d
2
0
d
0
0
) z
1
(d
2
0
d
1
0
)
z
0
z
1
_
_
58
Considerando as matrizes de transforma c ao encontradas no Exemplo 4.1, temos:
z
0
= z
1
=
_

_
0
0
1
_

_
d
0
0
=
_

_
0
0
0
_

_
d
1
0
=
_

_
a
1
c
1
a
1
s
1
0
_

_
d
2
0
=
_

_
a
1
c
1
+a
2
c
12
a
1
s
1
+a
2
s
12
0
_

_
Ent ao
J(q) =
_
_
J
d
(q)
J
w
(q)
_
_
=
_

_
a
1
s
1
a
2
s
12
a
2
s
12
a
1
c
1
+a
2
c
12
a
2
c
12
0 0
0 0
0 0
1 1
_

_
Exerccio: Determine a Matriz Jacobiana Geometrica do manipulador Stanford/JPL.
Matriz Jacobiana Analtica

d
n
0
= J
d
(q) q =
d
n
0
q
(120)

= J

(q) q =

q
q (121)
sendo J
d
e J

matrizes 3 n. Ainda
x =
_
_

d
n
0

_
_
=
_
_
J
d
(q)
J

(q)
_
_
q = J
A
(q) q (122)
Exemplo 5.2: Considere o manipulador planar de dois elos da gura 23. Do Exemplo
4.1, temos:
x =
_

_
d
x
d
y

_
=
_

_
a
1
c
1
+a
2
c
12
a
1
s
1
+a
2
s
12

1
+
2
_

_
59
Derivando com rela c ao ao tempo:
x =
_

d
x

d
y

_
=
_

_
a
1
s
1

1
a
2
s
12
(

1
+

2
)
a
1
c
1

1
+a
2
c
12
(

1
+

2
)

1
+

2
_

_
Portanto, a matriz Jacobiana analtica e dada por:
J
A
(q) =
_
_
J
d
(q)
J

(q)
_
_
=
_

_
a
1
s
1
a
2
s
12
a
2
s
12
a
1
c
1
+a
2
c
12
a
2
c
12
1 1
_

_
Note que a matriz Jacobiana analtica acima e identica ` a matriz Jacobiana geometrica
dada no Exemplo 5.1, eliminando-se nesta as tres linhas de zeros que n ao acrescentam
informa c ao. Isto e possvel porque os eixos z dos sistemas de coordenadas s ao paralelos,
o que n ao acontece na maioria dos casos. Portanto, as matrizes Jacobianas geometrica
e analtica s ao, geralmente, diferentes.
Rela cao entre Jacobiana Geometrica e Jacobiana Analtica
Considerando que o vetor de orienta c ao e dado em termos dos angulos de Euler
ZYZ, pode-se calcular a contribui c ao da derivada destes angulos no c alculo da veloci-
dade angular w
n
0
:
_

_
w
x
w
y
w
z
_

_
=
_

_
0
0
1
_

(123)
_

_
w
x
w
y
w
z
_

_
=
_

_
s

0
_

(124)
60
_

_
w
x
w
y
w
z
_

_
=
_

_
c

(125)
Somando as contribui c oes das derivadas dos angulos de Euler, temos:
_

_
w
x
w
y
w
z
_

_
=
_

_
0 s

0 c

1 0 c

_
_

_
(126)
Dene-se T() como a matriz Jacobina que relaciona as derivadas dos angulos de
orienta c ao com a velocidade angular do efetuador.
w
n
0
= T()

(127)
O determinante de T() neste caso e igual a s

, o que implica que a rela c ao n ao


pode ser invertida para = 0 ou = .
Assim
v =
_
_
I 0
0 T()
_
_
x = T
A
() x (128)
J(q) = T
A
()J
A
(q) (129)
Singularidades Cinematicas
Congura c oes nas quais a mobilidade ca reduzida
Innitas solu c oes podem existir para o problema da cinem atica inversa
Pequenas velocidades no espa co operacional podem causar grandes velocidades
no espa co das juntas
Correspondem, na maioria dos casos, a pontos nos limites do espa co de trabalho
61
Determina c ao de singularidade:
det(J(q)) = 0.
Exemplo 5.3: Considere o manipulador planar de dois elos da gura 23. Determine
as congura c oes em que ocorrem singularidades.
J(q) =
_
_
a
1
s
1
a
2
s
12
a
2
s
12
a
1
c
1
+a
2
c
12
a
2
c
12
_
_
C alculo do determinante
det(J(q)) = a
1
a
2
s
2
Singularidade:
s
2
= 0
_
_
_

2
= 0

2
=
Estas congura c oes representam pontos nos limites do espa co de trabalho do
manipulador.
Estatica
Rela c ao entre for cas e momentos aplicados no efetuador ( = [f
T

T
]
T
) e torques
aplicados nas juntas ().
Trabalho elementar dos torques aplicados nas juntas:
dW

=
T
dq.
Trabalho elementar das for cas e dos momentos aplicados no efetuador:
dW

= f
T
dd
n
0
+
T
dw
n
0
= f
T
J
p
(q)dq +
T
J
w
(q)dq
62
=
T
J(q)dq.
Deslocamentos elementares coincidem com deslocamentos virtuais. Pelo Princpio
dos trabalhos virtuais:
W

= 0 q
Rela c ao entre for cas e momentos aplicados no efetuador e torques aplicados nas
juntas
= J(q)
T
.
Cinematica Inversa: Solu cao via Matriz Jacobiana
Lembrando que
q = J(q)
1
v (130)
q =
_
t
T=0
q(T)dT +q
0
(131)
Usando a integra c ao de Euler
q(t
k+1
) = q(t
k
) + q(t
k
)t (132)
q(t
k+1
) = q(t
k
) +J(q(t
k
))
1
v(t
k
)t (133)
para isso, a matriz Jacobiana precisa ser invertvel e q
0
precisa ser conhecido. Note
que a inversa da matrix Jacobiana deve ser calculada para cada valor de q do processo
iterativo, o que torna o c alculo da cinem atica inversa oneroso computacionalmente.
Parte VI
Dinamica de manipuladores
63
64
Introdu cao
O objetivo dessa se c ao e introduzir o leitor em um metodo de mec anica analtica que
vai permitir a dedu c ao das equa c oes din amicas que descrevem a evolu c ao temporal da
maioria dos manipuladores convencionais [SPONG & VIDYASAGAR (1989); LEWIS
et al. (1993)]. Para isso s ao introduzidas as Equa c oes de Euler-Lagrange, que
descrevem a evolu c ao de um sistema mec anico sujeito a restri c oes holon omicas (este
termo ser a denido posteriormente). De maneira a determinar as equa c oes din amicas
em uma situa c ao especca, deve-se encontrar o Lagrangiano do sistema, que e a
diferen ca entre as energias cinetica e potencial; alguns exemplos de como fazer isso em
algumas situa c oes comumente encontradas ser ao mostrados. A seguir ser ao deduzidas
a equa c oes din amicas de alguns tipos de manipuladores, incluindo um manipulador
rotacional de dois ligamentos e um manipulador rotacional planar de tres ligamentos.
Uma abordagem alternativa para a formula c ao das equa c oes din amicas pode ser feita
atraves do Metodo de Newton-Euler. Este e outro metodo bastante utilizado dev-
ido, principalmente, ` a facilidade de implementa c ao atraves de metodos computacionais.
Equa c oes de Euler-Lagrange
Existem pelo menos duas maneiras distintas de deduzir essas equa c oes [SPONG &
VIDYASAGAR (1989)]. Aquela apresentada aqui e baseada no metodo dos deslocamen-
tos virtuais. Considere um sistema consistindo de k partculas, com correspondentes
coordenadas r
1
, , r
k
. Se estas partculas est ao livres para se mover sem qualquer
restri c ao, ent ao e um problema simples descrever seu movimento, notando que a taxa
de varia c ao do momento de cada massa iguala o somat orio de for cas externas aplicadas
a ela. No entanto, se o movimento das partculas est a restrito de alguma forma, ent ao
deve-se levar em conta n ao somente as for cas externas aplicadas, mas tambem as for cas
de restri c ao, ou seja as for cas exigidas para as restri c oes se manterem. Como ilustra c ao,
suponha que o sistema consista de duas partculas conectadas por um o rgido sem
massa de comprimento l. Ent ao as duas coordenadas r
1
e r
2
devem satisfazer a seguinte
restri c ao:
|r
1
r
2
| = l (134)
no qual |.| representa a norma Euclidiana.
65
Se forem aplicadas for cas externas ` a cada partcula, ent ao as partculas estar ao
sujeitas a uma for ca resultante provocada pela soma das for cas externas e das for cas
exercidas pelo o. Portanto, para analisar o movimento das duas partculas n os temos
duas op c oes. Primeiro, podemos calcular, para cada conjunto de for cas externas, qual
a correspondente for ca de restri c ao para que a equa c ao acima se mantenha. Segundo,
podemos procurar um metodo de an alise que n ao exija que saibamos a for ca de restri c ao.
Claramente a segunda alternativa e prefervel uma vez que e uma tarefa trabalhosa
calcular as for cas de restri c ao. O conte udo dessa parte do curso visa atingir esse segundo
objetivo.
Uma restri c ao nas k coordenadas r
1
, , r
k
e chamada holon omica se e uma re-
stri c ao de igualdade da forma
g
i
(r
1
, , r
k
) = 0, i = 1, , l (135)
e n ao-holon omica do contr ario.
Se um sistema est a sujeito a l restri c oes holon omicas, ent ao pode-se pensar no
sistema restrito tendo l graus de liberdade a menos que o irrestrito. Neste caso e possvel
expressar as coordenadas das k partculas em termos de n coordenadas generalizadas
q
1
, , q
n
. Em outras palavras, assumimos que as coordenadas das v arias partculas,
sujeitas ao conjunto de restri c oes 135, podem ser expressas da forma
r
i
= r
i
(q
1
, , q
n
), i = 1, , k (136)
sendo q
1
, , q
n
todas independentes. De fato, a ideia de coordenadas generalizadas
pode ser usada mesmo quando existem uma innidade de partculas. Tipicamente,
coordenadas generalizadas s ao posi c oes, angulos, etc. De fato, a partir daqui, de-
notaremos as vari aveis das juntas pelos smbolos q
1
, , q
n
precisamente porque estas
vari aveis formam um conjunto de coordenadas generalizadas para um rob o manipulador
de n-ligamentos.
Agora podemos falar de deslocamentos virtuais, que s ao qualquer conjunto
r
1
, , r
k
de deslocamentos innitesimais consistentes com as restri c oes. Qualquer
66
par de vetores r
1
, r
2
que satisfa cam
(r
1
r
2
)
T
(r
1
r
2
) = 0 (137)
constitui um conjunto de deslocamentos virtuais para o problema.
A seguir discutiremos sistemas sujeitos a restri c oes em equilbrio. Suponha que cada
partcula est a em equilbrio. Ent ao o somat orio das for cas em cada partcula e zero,
o que implica que o trabalho realizado por cada conjunto de deslocamentos virtuais e
zero, ou seja
k

i=1
F
T
i
r
i
= 0 (138)
sendo F
i
a for ca total na partcula i. Como mencionado anteriormente, a for ca F
i
e a
soma de duas quantidades, (i) a for ca externa aplicada f
i
, e (ii) a for ca de restri c ao f
(a)
i
.
Agora suponha que o trabalho total realizado pelas for cas de restri c ao correspondentes
a qualquer conjunto de deslocamentos virtuais e zero,
k

i=1
(f
(a)
i
)
T
r
i
= 0. (139)
Isto vale quando a for ca de restri c ao entre um par de partculas est a na dire c ao ao
longo do vetor radial conectando duas partculas. Substituindo (139) em (138) resulta
em
k

i=1
f
T
i
r
i
= 0. (140)
A beleza desta equa c ao reside no fato de que ela n ao envolve as for cas de restri c ao,
que s ao desconhecidas, mas somente as for cas externas conhecidas. Esta equa c ao ex-
pressa o princpio do trabalho virtual, que pode ser resumido da seguinte maneira:
O trabalho realizado pelas for cas externas correspondentes a qualquer conjunto de
deslocamentos virtuais e zero. Note que este princpio n ao e universalmente aplic avel,
pois requer que (139) se mantenha, ou seja, que as for cas de restri c ao n ao realizem
trabalho. Portanto, se o princpio do trabalho virtual se aplica, ent ao pode-se analisar
a din amica de um sistema sem ter que calcular as for cas de restri c ao.
Em (140) os deslocamentos virtuais r
i
n ao s ao independentes. Ent ao n ao pode-
mos concluir dessa equa c ao que cada coeciente f
i
individualmente se iguala a zero.
67
Para aplicar este raciocnio, devemos transformar para coordenadas generalizadas e
considerar sistemas que n ao est ao necessariamente em equilbrio. Para tais sistemas,
o Princpio DAlembert arma que, se introduzirmos uma for ca ctcia adicional
p
i
na partcula i, onde p
i
e o momento da partcula i, ent ao cada partcula estar a em
equilbrio. Portanto, modicando (138) substituindo F
i
por F
i
p
i
, ent ao a equa c ao re-
sultante e v alida para sistemas arbitr arios. Pode-se ent ao remover as for cas de restri c ao
como antes usando o princpio do trabalho virtual. Isto resulta na equa c ao,
k

i=1
f
T
i
r
i

i=1
p
T
i
r
i
= 0. (141)
A equa c ao acima n ao signica que cada coeciente de r
i
e zero. Para este prop osito,
expressamos cada r
i
em termos dos correspondentes deslocamentos virtuais das coor-
denadas generalizadas. Assim o trabalho virtual realizado pelas for cas f
i
e dado por
k

i=1
f
T
i
r
i
=
k

i=1
n

j=1
f
T
i
r
i
q
j
q
j
=
n

j=1

j
q
j
(142)
sendo

j
=
k

i=1
f
T
i
r
i
q
j
(143)
a j-esima for ca generalizada. Note que
j
n ao necessita ter dimens oes de for ca,
como q
j
n ao necessita ter dimens oes de comprimento; no entanto,
j
q
j
deve sempre
ter dimens oes de trabalho.
Agora vamos estudar o segundo somat orio em (141). Desde que p
i
= m
i
r
i
, segue
que
k

i=1
p
T
i
r
i
=
k

i=1
m
i
r
T
i
r
i
=
k

i=1
n

j=1
m
i
r
T
i
r
i
q
j
q
j
. (144)
A seguir usando a regra do produto da diferencia c ao,vemos que
k

i=1
m
i
r
T
i
r
i
q
j
=
k

i=1
_
d
dt
_
m
i
r
T
i
r
i
q
j
_
m
i
r
T
i
d
dt
_
r
i
q
j
__
. (145)
68
Usando a regra da cadeia,
v
i
= r
i
=
n

j=1
r
i
q
j
q
j
. (146)
Observe da equa c ao acima que
v
i
q
j
=
r
i
q
j
(147)
em seguida,
d
dt
_
r
i
q
j
_
=
n

l=1

2
r
i
q
j
q
l
q
l
=
v
i
q
j
(148)
no qual a ultima equa c ao segue de (146). Substituindo de (147) e (148) em (145) e
notando que r
i
= v
i
d a
k

i=1
m
i
r
T
i
r
i
q
j
=
k

i=1
_
d
dt
_
m
i
v
T
i
v
i
q
j
_
m
i
v
T
i
v
i
q
j
_
. (149)
Se denirmos a energia cinetica K como
K =
k

i=1
1
2
m
i
v
T
i
v
i
(150)
ent ao a soma acima pode ser expressa como
k

i=1
m
i
r
T
i
r
i
q
j
=
d
dt
K
q
j

K
q
j
. (151)
Agora, substituindo (151) em (144) mostra que a segunda soma em (141) e
k

i=1
p
T
i
r
i
=
n

j=1
_
d
dt
K
q
j

K
q
j
_
q
j
. (152)
Finalmente, combinando (152) e (142) nos d a
n

j=1
_
d
dt
K
q
j

K
q
j

j
_
q
j
= 0. (153)
Desde que os deslocamentos virtuais q
j
s ao independentes, podemos concluir que
69
cada coeciente em (153) e zero, ou seja,
d
dt
K
q
j

K
q
j
=
j
, j = 1, , n. (154)
Se a for ca generalizada
j
e a soma de uma for ca externa generalizada aplicada
e uma outra devido a um campo potencial, ent ao uma outra modica c ao e possvel.
Suponha que existem fun c oes
i
e P(q) tal que

j
=
P
q
j
+
j
. (155)
Ent ao (154) pode ser escrita na forma
d
dt
L
q
j

L
q
j
=
j
(156)
onde L = K P e o Lagrangiano. A fun c ao P(q) e chamada energia potencial.
Portanto, a Equa c ao de Lagrange ou Equa c ao de Euler-Lagrange do movi-
mento para um conjunto de partculas ou corpos rgidos e dada por:
d
dt
L
q

L
q
= (157)
sendo q o vetor contendo as coordenadas generalizadas do sistema.
Equa c oes de Movimento de Manipuladores
Considere um corpo rgido de massa m e centro de massa, r
c
, dado por:
r
c
=
1
m
_
B
rdm
sendo r o vetor de coordenadas de um ponto do corpo em rela c ao ao sistema de coor-
denadas inercial e B a regi ao do espa co tridimensional ocupada pelo corpo, [SPONG
& VIDYASAGAR (1989)] . Considere que um sistema de coordenadas e xo ao corpo,
com origem no centro de massa.
70
A energia cinetica do corpo e dada por:
K =
1
2
_
B
v
T
vdm (158)
sendo v a velocidade de um ponto do corpo expressa no sistema de coordenadas xo
ao corpo. Esta velocidade pode ser dada por:
v = v
c
+wr
ou
v = v
c
+S(w)r.
Substituindo a equa c ao acima em (158), temos:
K =
1
2
_
B
(v
c
+S(w)r)
T
(v
c
+S(w)r)dm
Considerando a expans ao do produto dentro da integral, temos quatro termos:
K
1
=
1
2
_
B
v
T
c
v
c
dm =
1
2
mv
T
c
v
c
,
K
2
=
1
2
_
B
v
T
c
S(w)rdm =
1
2
v
T
c
S(w)
_
B
rdm = 0
pois,
_
B
rdm = 0 (note que a origem do sistema de coordenadas este no centro de massa
do corpo),
K
3
=
1
2
_
B
r
T
S
T
(w)v
c
dm = 0
e
K
4
=
1
2
_
B
r
T
S
T
(w)S(w)rdm.
Considere as seguintes propriedades: TrAB = TrBA, sendo Tr o tra co (soma dos
elementos da diagonal) de uma matriz e a
T
b = Tr ab
T
. Utilizando estas identidades,
o termo K
4
ca:
K
4
=
1
2
_
B
r
T
S
T
(w)S(w)rdm
=
1
2
_
B
TrS(w)rr
T
S
T
(w)dm
71
=
1
2
TrS(w)
_
B
rr
T
dmS
T
(w) =
1
2
TrS(w)JS
T
(w)
sendo
J =
_

_
_
x
2
dm
_
xydm
_
xzdm
_
xydm
_
y
2
dm
_
yzdm
_
xzdm
_
yzdm
_
z
2
dm
_

_
.
Lembrando que a matriz S(w) e dada pelos componentes da velocidade angular w
como:
S(w) =
_

_
0 w
z
w
y
w
z
0 w
x
w
y
w
x
0
_

_
,
a express ao nal do termo K
4
ca:
K
4
=
1
2
w
T
Iw
sendo
I =
_

_
_
(y
2
+z
2
)dm
_
xydm
_
xzdm

_
xydm
_
(x
2
+z
2
)dm
_
yzdm

_
xzdm
_
yzdm
_
(x
2
+y
2
)dm
_

_
A matriz I da equa c ao acima e denominada tensor de inercia. Tal matriz fornece
informa c oes sobre a distribui c ao de massa ao longo do corpo e possui forma geral dada
por:
I =
_

_
I
xx
I
xy
I
xz
I
xy
I
yy
I
yz
I
xz
I
yz
I
zz
_

_
sendo I
xx
, I
yy
e I
zz
os momentos de inercia, e I
xy
, I
xz
e I
yz
os produtos de inercia.
O c alculo dos momentos e produtos de inercia dependem da posi c ao e orienta c ao do
sistema de coordenadas. Entretanto, a soma dos momentos de inercia permanece con-
stante, independentemente do sistema de coordenadas considerado.
Se I
xy
= I
xz
= I
yz
= 0 os eixos do sistema de coordenadas s ao os eixos principais
de inercia do copro e I
xx
, I
yy
, I
zz
s ao os momentos principais de inercia. Alem disso,
os autovalores do tensor s ao os momentos principais de inercia e os autovetores s ao os
eixos principais.
72
Considere que o elo i possui massa m
i
, e tensor de inercia I
i
calculado no sistema
de coordenadas com origem no centro de massa e paralelo ao sistema de coordenadas
i. A velocidade angular expressa no sistema de coordenadas xo ao corpo e dada por:
w
i
0,i
= (R
i
0
)
T
w
i
0
= (R
i
0
)
T
J
w
i
0
(q) q
sendo J
w
i
0
a Jacobiana entre as velocidades das coordenadas das juntas e a velocidade
angular do elo i. A velocidade do centro de massa do elo i e dada por:
v
ci
= J
v
ci
(q) q
sendo J
v
ci
a Jacobiana entre as velocidades das coordenadas das juntas e a velocidade
do centro de massa do elo i. Esta Jacobiana pode ser calculada pelas equa c oes (115)
ou (115), substituindo d
n
0
pelo centro de massa do elo i, r
ci
.
A energia cinetica de um manipulador serial de n elos e dada pela somas das energias
cineticas de cada elo. Portanto, temos:
K =
1
2
q
T
n

i=1
_
m
i
J
v
ci
(q)
T
J
v
ci
(q) +J
w
i
0
(q)
T
R
i
0
I
i
(R
i
0
)
T
J
w
i
0
(q)
_
q
ou, de forma simplicada,
K =
1
2
q
T
M(q) q.
A energia potencial devido ` a gravidade do elo i e dada por:
P
i
=
_
B
g
T
rdm = mg
T
r
c
sendo g o vetor da acelera c ao da gravidade e r
c
o vetor de posi c ao do centro de massa
do elo i, expressos no sistema de coordenadas inercial. A energia potencial de um
manipulador serial de n elos e dada pela soma das energias potenciais de cada elo e e
fun c ao apenas da posi c ao q, ou seja:
P(q) =
n

i=1
P
i
.
73
Portanto, o Lagrangeano de um manipulador e dado por:
L =
1
2
q
T
M(q) q P(q).
Temos que:
L
q
=
K
q
= M(q) q,
d
dt
L
q
= M(q) q +

M(q) q
e
L
q
=
1
2

q
q
T
M(q) q
P(q)
q
.
Substiuindo estas derivadas na Equa c ao de Lagrange (156), obtemos a Equa c ao
Din amica do Manipulador, [LEWIS et al. (1993)]:
M(q) q +

M(q) q
1
2

q
q
T
M(q) q +
P(q)
q
= ,
ou, de forma mais compacta,
M(q) q +V (q, q) +G(q) = .
A matriz simetrica denida positiva M(q) e denominada matriz de inercia. O vetor
V (q, q) e composto pelas das for cas de Coriolis e centrpetas e o vetor G(q) expressa
as for cas gravitacionais. As coordenadas generalizadas das juntas q podem ser angulos
(
i
, no caso de junta rotacional), ou deslocamentos (d
i
, no caso de junta prism atica).
As for cas generalizadas s ao os torques e for cas aplicados nas juntas.
Pode-se escrever o vetor das for cas de Coriolis e centrpetas como: V (q, q) =
C(q, q) q sendo que a matriz
N(q, q) =

M(q) 2C(q, q)
e anti-simetrica [LEWIS et al. (1993)].
Uma propriedade importante para controle de manipuladores e a parametriza c ao
linear da equa c ao din amica, ou seja, e possvel encontrar uma matriz Y (q, q, q), chamada
matriz de regress ao, tal que, [LEWIS et al. (1993)]:
74
M(q) q +V (q, q) +G(q) = Y (q, q, q)
sendo o vetor contendo os par ametros do manipulador.
Exemplo: Determine a equa c ao din amica de um rob o manipulador planar de dois
ligamentos com juntas rotacionais como mostrado na Figura 25.
Figura 25: Manipulador planar de dois ligamentos.
Solu c ao: Posi c ao do centro de massa do elo 1
r
c1
=
_
_
a
c1
cos(q
1
)
a
c1
sen(q
1
)
_
_
.
Velocidade do centro de massa do elo 1
v
c1
=
_
_
a
c1
sen(q
1
) q
1
a
c1
cos(q
1
) q
1
_
_
=
_
_
a
c1
sen(q
1
) 0
a
c1
cos(q
1
) 0
_
_
q = J
v
c1
(q) q.
Posi c ao do centro de massa do elo 2:
r
c2
=
_
_
a
1
cos(q
1
) +a
c2
cos(q
1
+q
2
)
a
1
sen(q
1
) +a
c2
sen(q
1
+q
2
)
_
_
.
Velocidade do centro de massa do elo 2:
v
c2
=
_
_
a
1
sen(q
1
) q
1
a
c2
sen(q
1
+q
2
)( q
1
+ q
2
)
a
1
cos(q
1
) q
1
+a
c2
cos(q
1
+q
2
)( q
1
+ q
2
)
_
_
75
v
c2
=
_
_
a
1
sen(q
1
) a
c2
sen(q
1
+q
2
) a
c2
sen(q
1
+q
2
)
a
c1
cos(q
1
) +a
c2
cos(q
1
+q
2
) a
c2
cos(q
1
+q
2
)
_
_
q = J
v
c2
(q) q.
Energia cinetica de transla c ao:
K
T
=
1
2
m
1
v
T
c1
v
c1
+
1
2
m
2
v
T
c2
v
c2
=
1
2
q
T
_
m
1
J
v
c1
(q)
T
J
v
c1
(q) +m
2
J
v
c2
(q)
T
J
v
c2
(q)

q.
Velocidades angulares:
w
1
= q
1
k
w
2
= ( q
1
+ q
2
)k.
Energia cinetica de rota c ao:
K
R
=
1
2
w
T
1
I
1
w
1
+
1
2
w
T
2
I
2
w
2
=
1
2
q
T
_
_
I
1
+I
2
I
1
I
2
I
2
_
_
q.
A matriz de inercia, portanto, e dada por:
M(q) = m
1
J
v
c1
(q)
T
J
v
c1
(q) +m
2
J
v
c2
(q)
T
J
v
c2
(q) +
_
_
I
1
+I
2
I
1
I
2
I
2
_
_
.
Elementos da matriz de inercia, M(q):
M
11
(q) = m
1
a
2
c1
+m
2
(a
2
1
+a
2
c2
+ 2a
1
a
c2
cos(q
2
)) +I
1
+I
2
,
M
12
(q) = M
21
(q) = m
2
(a
2
c2
+a
1
a
c2
cos(q
2
)) +I
2
,
M
22
(q) = m
2
a
2
c2
+I
2
.
Vetor dos torques de Coriolis e centrpetos
V (q, q) =
_
_
V
1
(q, q)
V
2
(q, q)
_
_
=
_
_
2m
2
a
1
a
c2
sen(q
2
) q
1
q
2
+m
2
a
1
a
c2
sen(q
2
) q
2
2
m
2
a
1
a
c2
sen(q
2
) q
2
1
_
_
.
76
Sendo h = m
2
a
1
a
c2
sen(q
2
), a matriz C(q, q) q pode ser dada por:
C(q, q) q =
_
_
h q
2
h q
1
+h q
2
h q
1
0
_
_
.
Calculo da energia potencial dos elos:
P
1
(q) = m
1
ga
c1
sen(q
1
),
P
2
(q) = m
2
g(a
1
sen(q
1
) +a
c2
sen(q
1
+q
2
)).
Portanto:
P(q) = P
1
(q) +P
2
(q)
= (m
1
ga
c1
+m
2
ga
1
)sen(q
1
) +m
2
ga
c2
sen(q
1
+q
2
)).
Vetor dos torques n ao inerciais:
G(q) =
_
_
G
1
(q)
G
2
(q)
_
_
=
_

_
P(q)
q
1
P(q)
q
2
_

_
G(q) =
_
_
(m
1
ga
c1
+m
2
ga
1
)cos(q
1
) +m
2
ga
c2
cos(q
1
+q
2
))
m
2
ga
c2
cos(q
1
+q
2
))
_
_
.
Assim, obtemos o modelo din amico composto por duas equa c oes diferenciais n ao
lineares acopladas, que pode ser escrito na seguinte forma matricial:
_
_

1

2
_
_
= M(q)
_
_
q
1
q
2
_
_
+V (q, q) +G(q).
Exerccio 1: Determine a equa c ao din amica de um rob o manipulador planar de tres
ligamentos com juntas rotacionais (UArm II), como mostrado na Figura 26.
77
Figura 26: manipulador planar de tres ligamentos.
Parte VII
Controle de Manipuladores
78
79
Introdu cao
O projeto de controle de manipuladores rob oticos consiste em determinar as for cas
generalizadas que devem ser aplicadas nas juntas de tal forma que o efetuador execute o
movimento desejado [LEWIS et al. (1993); SPONG & VIDYASAGAR (1989); SCIAV-
ICCO & SICILIANO (1996); KOIVO (1989); CRAIG (1986)]. Existem muitas tecnicas
e metodologias que podem ser aplicadas no controle de manipuladores. O metodo de
controle escolhido e a maneira como e feita a implementa c ao podem ter um impacto
signicante no desempenho do manipulador e conseq uentemente na faixa de possveis
aplica c oes. Por exemplo, trajet orias contnuas exigem uma implementa c ao da in-
terface computacional diferente em termos de hardware e software do que o controle
ponto a ponto.
Outras caractersticas devem ser consideradas na escolha da tecnica a ser utilizada:
Tipo do manipulador,
Tipo de aplica c ao,
Atuadores e sensores utilizados,
Tipo de transmiss ao entre atuadores e juntas,
Presen ca de erros de modelagem e dist urbios.
Planejamento de trajet oria
Trajet oria contnua no espa co cartesiano. Planejamento no espa co operacional:
Controle cartesiano cinem atica direta na realimenta c ao, gura 27.
Controle das coordenadas das juntas cinem atica inversa de toda trajet oria,
gura 28.
Controle ponto a ponto. Planejamento no espa co das juntas: Cinem atica inversa
apenas em dois pontos, gura 29.
80
Figura 27: Controle cartesiano
Figura 28: Controle das coordenadas das juntas
Trajet oria desejada: polin omio do 3

grau
Dados, [LEWIS et al. (1993); SPONG & VIDYASAGAR (1989)]: q
d
i
(t
0
), q
d
i
(t
0
),
q
d
i
(t
f
) e q
d
i
(t
f
).
Polin omio:
q
d
i
(t) = a
i
+b
i
(t t
0
) +c
i
(t t
0
)
2
+d
i
(t t
0
)
3
q
d
i
(t) = b
i
+ 2c
i
(t t
0
) + 3d
i
(t t
0
)
2
Substituindo:
q
d
i
(t
0
) = a
i
q
d
i
(t
0
) = b
i
q
d
i
(t
f
) = a
i
+b
i
(t
f
t
0
) +c
i
(t
f
t
0
)
2
+d
i
(t
f
t
0
)
3
= a
i
+b
i
T +c
i
T
2
+d
i
T
3
q
d
i
(t
f
) = b
i
+ 2c
i
T + 3d
i
T
2
81
Figura 29: Planejamento no espa co das juntas
De forma matricial:
_

_
q
d
i
(t
0
)
q
d
i
(t
0
)
q
d
i
(t
f
)
q
d
i
(t
f
)
_

_
=
_

_
1 0 0 0
0 1 0 0
1 T T
2
T
3
0 1 2T 3T
2
_

_
_

_
a
i
b
i
c
i
d
i
_

_
Solu c ao:
_

_
a
i
b
i
c
i
d
i
_

_
=
_

_
1 0 0 0
0 1 0 0
1 T T
2
T
3
0 1 2T 3T
2
_

_
1
_

_
q
d
i
(t
0
)
q
d
i
(t
0
)
q
d
i
(t
f
)
q
d
i
(t
f
)
_

_
.
Trajet oria desejada: fun cao linear com extremidades parab olicas
Dados, [LEWIS et al. (1993); SPONG & VIDYASAGAR (1989)]: q
d
i
(t
0
), q
d
i
(t
0
),
q
d
i
(t
f
), q
d
i
(t
f
), v
i
, velocidade m axima permitida para a junta i, e t
b
, tempo da trajet oria
parab olica. O valor de t
b
pode ser denido como o tempo necess ario para alcan car a
velocidade v
i
, considerando acelera c ao m axima para a junta i.
Trajet oria:
q
d
i
(t) =
_

_
a
i
+b
i
(t t
0
) +c
i
(t t
0
)
2
, t
0
t t
0
+t
b
d
i
+v
i
t, t
0
+t
b
t t
f
t
b
e
i
+f
i
(t t
f
) +g
i
(t t
f
)
2
, t
f
t
b
t t
f
82
Solu c ao:
a
i
= q
d
i
(t
0
), b
i
= q
d
i
(t
0
), c
i
=
v
i
q
d
i
(t
0
)
2t
b
,
d
i
=
q
d
i
(t
0
) +q
d
i
(t
f
) v
i
t
f
2
, e
i
= q
d
i
(t
f
), f
i
= q
d
i
(t
f
)
e
g
i
=
v
i
t
f
+q
d
i
(t
0
) q
d
i
(t
f
) 2t
b
[ q
d
i
(t
f
) v
i
t
f
]
2t
2
b
.
Controle independente de juntas
Considere que seja denida uma trajet oria desejada no espa co das juntas, q
d
(t).
Dene-se o erro de acompanhamento de trajet oria como:
e(t) = q
d
(t) q(t).
Note que alem da fun c ao erro, e(t), tambem s ao denidas as fun c oes erro de velocidade,
e(t) = q
d
(t) q(t), e erro de acelera c ao, e(t) = q
d
(t) q(t).
No controle independente das juntas, o manipulador de n elos e considerado como
n sistemas SISO (Single Input Single Output) independentes. Neste caso, os efeitos de
acoplamento entre as juntas s ao considerados como dist urbios. O controlador utilizado
e do tipo proporcional-derivativo (PD), [LEWIS et al. (1993)], ou seja,
= K
v
e +K
p
e
sendo K
v
e K
p
matrizes diagonais. Para alcan car os requisitos de rejei c ao de dist urbios
os ganhos, na maioria dos casos, devem possuir valores elevados. Alem disso, o controle
PD apresenta erro de regime devido aos torques gravitacionais. Para contornar este
problema, pode-se utilizador um controlador proporcional-integral-derivativo (PID):
= K
v
e +K
p
e +K
i
_
edt
ou compensar os efeitos das for cas gravitacionas como:
= K
v
e +K
p
e +G(q).
83
Este controlador e denominado PD com compensa c ao gravitacional.
Lineariza cao por realimenta cao
Nesta parte discutimos a no c ao de lineariza c ao por realimenta c ao de sistemas
n ao-lineares. A ideia b asica da lineariza c ao por realimenta c ao e construir uma lei de
controle n ao-linear como um la co de controle interno que, no caso ideal, lineariza o sis-
tema n ao-linear depois de uma adequada mudan ca de coordenadas no espa co de estados.
O projetista pode ent ao projetar um segundo est agio ou la co externo de controle nas
novas coordenadas para satisfazer as especica c oes de desempenho tradicionais, como
seguimento de trajet oria, rejei c ao de dist urbios, e assim por diante.
No caso de manipuladores rgidos o controle por din amica inversa e a lineariza c ao
por realimenta c ao s ao a mesma coisa. Para introduzir a ideia de lineariza c ao por
realimenta c ao considere o seguinte sistema,
x
1
= a sen (x
2
) (159)
x
2
= x
2
1
+u (160)
Note que n ao podemos simplesmente escolher u no sistema acima para cancelar o
termo n ao-linear a sen (x
2
). No entanto, se primeiro alterarmos as vari aveis por,
y
1
= x
1
(161)
y
2
= a sen (x
2
) = x
1
(162)
ent ao, pela regra da cadeia, y
1
e y
2
satisfazem
y
1
= y
2
(163)
y
2
= a cos(x
2
)(x
2
1
+u) (164)
Podemos observar que as n ao-linearidades podem agora ser canceladas pela entrada
u =
1
a cos(x
2
)
v +x
2
1
(165)
84
que resulta no sistema linear nas coordenadas (y
1
, y
2
)
y
1
= y
2
(166)
y
2
= v (167)
O termo v pode ser interpretado como um sinal de um la co externo de controle e
pode ser projetado para posicionar os p olos de sistema linear de segunda ordem (166)
nas coordenadas (y
1
, y
2
). Por exemplo o la co externo de controle
v = k
1
y
1
k
2
y
2
(168)
aplicado em (166) resulta no sistema de malha fechada
y
1
= y
2
(169)
y
2
= k
1
y
1
k
2
y
2
(170)
que tem polin omio caracterstico
p(s) = s
2
+k
2
s +k
1
(171)
e portanto os p olos de malha fechada do sistema com respeito as coordenadas (y
1
, y
2
)s ao
completamente especicados pela escolha de k
1
e k
2
. A gura ? ilustra os la cos internos
e externos da implementa c ao da estrategia de controle acima. A resposta nas vari aveis
y e f acil de determinar. A resposta correspondente do sistema nas coordenadas originais
(x
1
, x
2
) podem ser encontradas invertendo a transforma c ao (161), neste caso
x
1
= y
1
(172)
x
2
= sen
1
(y
2
/a) a < y
2
< +a (173)
Este exemplo ilustra importantes propriedades da lineariza c ao por realimenta c ao. O
primeiro fato a se notar e a natureza local do resultado. Podemos observar de (1) e (2)
que a transforma c ao e o controle fazem sentido na regi ao < x
1
< ,

2
< x
2
<

2
.
Segundo, para se controlar o sistema linear (166), as coordenadas (y
1
, y
2
) devem estar
disponveis para realimenta c ao. Isto pode ser feito medindo estas vari aveis diretamente
85
se elas tem signicado fsico, or calculando a partir das coordenadas medidas (x
1
, x
2
)
usando a transforma c ao (161). No ultimo caso o par ametro a deve ser conhecido com
precis ao.
Lineariza cao por realimenta cao para manipuladores: Torque
Calculado
No caso geral de um manipulador de n-elos as equa c oes din amicas representam
um sistema n ao-linear de m ultiplas entradas. As condi c oes para lineariza c ao por reali-
menta c ao de sistemas de m ultiplas entradas s ao mais difceis de se denir, mas a ideia
conceitual e a mesma do caso de entrada simples. Ou seja, procura-se um sistema de
coordenadas no qual as n ao-linearidades podem ser canceladas exatamente por uma
ou mais das entradas. No caso de sistemas de m ultiplas entradas podemos tambem
desacoplar o sistema, ou seja, linearizar o sistema de maneira que o sistema linear re-
sultante seja composto de subsistemas, cada qual afetado por apenas uma das entradas
do la co de controle externo. Desde que estamos interessados somente com as aplica c oes
dessas ideias para o controle de manipuladores n ao vamos necessitar dos resultados mais
gerais da lineariza c ao por realimenta c ao de sistemas de m ultiplas entradas, [SPONG &
VIDYASAGAR (1989)].
Considere a din amica do manipulador:
M(q) q +b(q, q) = (174)
Derivando o erro de acompanhamento de trajet oria, temos:
e = q
d
q
e
e = q
d
q
sendo q
d
e q
d
os vetores das velocidades e acelera c oes desejadas, respectivamente.
86
Obtendo-se q da equa c ao (174) e substituindo na equa c ao acima, temos:
e = q
d
M(q)
1
[ b(q, q)]
Denindo o estado do sistema como: mathbfx = [e e]
T
, podemos represent a-lo
pela equa c ao:
_
_
e
e
_
_
=
_
_
0 I
0 0
_
_
_
_
e
e
_
_
+
_
_
0
I
_
_
_
q
d
M(q)
1
[ b(q, q)]
_
.
O sistema acima e n ao linear pois a matriz M(q) e o vetor b(q, q) s ao compostos de
fun c oes n ao lineares. A entrada de controle e dada pelo torque aplicado, . Denindo
uma nova vari avel de controle como [LEWIS et al. (1993)]:
u = q
d
M(q)
1
[ b(q, q)] (175)
o sistema n ao linear se torna linear pelo procedimento de lineariza c ao por realimenta c ao,
dado por:
_
_
e
e
_
_
=
_
_
0 I
0 0
_
_
_
_
e
e
_
_
+
_
_
0
I
_
_
u
A transforma c ao de lineariza c ao por realimenta c ao (175) pode ser invertida para
fornecer o torque aplicado:
= M(q)( q
d
u) +b(q, q) (176)
A equa c ao acima e denominada Torque Calculado, [LEWIS et al. (1993)]. Se n os
denirmos uma entrada de controle u que estabiliza o sistema linear, ou seja, e tenda
a zero, ent ao o entrada n ao linear denida por (176) far a com que o manipulador
acompanhe a trajet oria desejada. De fato, substituindo (176) na equa c ao din amica do
manipulador (174), temos:
M(q) q +b(q, q) = M(q)( q
d
u) +b(q, q)
87
Figura 30: Lineariza c ao por realimenta c ao: torque calculado
Como a matriz M(q) e invertvel, temos:
e = u.
O diagrama de blocos do controle por torque calculado e dado pelo gura 30.
Torque calculado + PD
Uma forma de selecionar o controle auxiliar e como uma relimenta c ao porporcional-
derivativa (PD):
u = K
v
e K
p
e.
Portanto, o torque aplicado ca:
= M(q)( q
d
+K
v
e +K
p
e) +b(q. q)
A equa c ao din amica do erro e dada por:
e +K
v
e +K
p
e = 0.
Analogamente ao controle independente das juntas, o controle PD apresenta erro de
regime se dist urbios e incertezas estiverem presentes. Portanto, pode-se tambem denir
um controlador torque calculado com uma entrada auxilaira como uma realimenta c ao
88
proporcional-integral-derivativa (PID):
u = K
v
e K
p
e K
i
_
edt.
O torque aplicado ca:
= M(q)( q
d
+K
v
e +K
p
e +K
i
_
edt) +b(q, q).
Torque Calculado com Valores Estimados
Nos controladores denidos acima, n os consideramos que a matriz M(q) e o vetor
b(q, q) s ao exatamente conhecidos. Entretanto, na maioria dos casos, estes valores
n ao est ao disponveis ou s ao calculados considerando valores estimados dos par ametros
din amicos do manipulador, como massa e centro de massa, [LEWIS et al. (1993)].
Considerando valores estimados de M(q) e b(q, q) a equa c ao do torque calculado ca:
=

M(q)( q
d
u) +

b(q, q). (177)


Substituindo (177) na equa c ao din amica do manipulador (174), temos:
M(q) q +b(q, q) =

M(q)( q
d
u) +

b(q, q).
Somando [M(q) q M(q) q] e [M(q)u M(q)u], a equa c ao din amica do erro ca:
e = u M(q)
1
_
M(q)

M(q)
_
(u q) +M(q)
1
_
b(q, q)

b(q, q)
_
.
Considerando que a entrada auxilair e um controlador PD, temos:
=

M(q)( q
d
+K
v
e +K
p
e) +

b(q, q).
89
Figura 31: Torque calculado com valores estimados + PD
A equa c ao din amica do erro ca:
e +K
v
e +K
p
e = (K
v
e +K
p
e) +d
sendo
= M(q)
1
[M(q)

M(q)]
d = q +M(q)
1
[b(q, q)

b(q, q)].
O comportamento de tal sistema n ao e bem denido, mesmo se K
v
e K
p
s ao se-
lecionados de tal forma que o lado esquerdo da equa c ao acima seja est avel, pois ele
tambem e denido pelo dist urbio d e pela fun c ao dependente do erro e de sua derivada,
(K
v
e + K
p
e). O diagrama de blocos do torque calculado com valores estimados +
PD e dado pela gura 31.
Controle combinado: Torque Calculado + PD + Controle
robusto
O objetivo desta se c ao e apresentar uma metodologia de controle em que um con-
trolador robusto pode compensar o efeito de din amicas n ao-modeladas e varia c oes
parametricas no modelo do rob o. A utiliza c ao de um controlador robusto diminui
a inuencia das incertezas parametricas e dist urbios externos, melhorando o desem-
penho do manipulador. A quest ao e: como acrescentar o controle robusto ao sistema
de controle de um manipulador?
90
Figura 32: Estrutura do controlador combinado.
A metodologia proposta consiste em adicionar ` a planta (rob o), controlada via
metodo do torque computado + PD, um controlador robusto para suprimir, em certo
grau, os efeitos decorrentes entre a planta real e a modelada. Como pode ser veri-
cado em [KANG et al. (1999)], controladores robustos para manipuladores tem sido
projetados em conjunto com controladores convencionais.
O controlador combinado, mostrado na gura 32 possui basicamente a estrutura
do controlador robusto para um sistema linear. W
e
e uma fun c ao peso utilizada para
moldar o desempenho do sistema no domnio da frequencia, e W

modela incertezas
n ao estruturadas multiplicativas na entrada da planta, representando possveis erros
nos atuadores do manipulador, din amicas desprezadas de alta frequencia, e zeros in-
certos no semiplano direito. A por c ao da gura 32 delimitada pela linha tracejada
(que compreende as por c oes relativas ao torque calculado, representa c ao de incertezas
parametricas e pondera c ao de desempenho) e chamada de planta aumentada,

P, uti-
lizada no c alculo dos controladores lineares H
2
, H

e H
2
/H

, [NAKASHIMA (2001)].
91
Portanto, o torque aplicado e dado por:
=

M(q)( q
d
+K
v
e +K
p
e +u
R
) +

b(q, q)
A equa c ao no espa co de estados do erro, considerando que as incertezas parametricas
e os dist urbios externos est ao agrupados no sinal de entrada w, e dada por:
_
_
e
e
_
_
=
_
_
0 I
K
p
K
v
_
_
_
_
e
e
_
_
+
_
_
0
I
_
_
u
R
+
_
_
0
I
_
_
w
y = e = [I 0]x
De forma simplicada, temos:
x = Ax +B
1
u
R
+B
2
w
y = C
2
x.
Na representa c ao acima n ao esta sendo consideradas as din amicas das fun c oes pesos
W
e
e W

. Estas din amicas devem ser acrescentadas, calculando-se ent ao a planta


aumentada, utilizada no projeto do controlador robusto.
Parte VIII
Projeto de controle H
2
, H

e
H
2
/H

92
93
Controles H
2
, H

e H
2
/H

Este captulo contem os conceitos essenciais das teorias de controle H


2
, H

e
H
2
/H

. Para maiores detalhes, recomenda-se a leitura de [CHIANG & SAFONOV


(1992); DOYLE et al. (1989); SAFONOV et al. (1989); ZHOU & DOYLE (1998);
ZHOU et al. (1995); BERNSTEIN & HADDAD (1989); ZHOU et al. (1994); ZHOU
et al. (1994b)].
O sistema considerado aqui e descrito pelo seguinte diagrama de blocos padr ao
mostrado na gura 33.
Figura 33: Diagrama de blocos dos sistemas de controle H
2
, H

e H
2
/H

O diagrama contem dois blocos principais, a planta P(s) e o controlador K(s). A


planta possui dois conjuntos de sinais de entrada e dois conjuntos de sinais de sada.
As entradas da planta s ao classicadas como entradas de controle e entradas exter-
nas. A entrada de controle, u, e a sada do controlador. A entrada externa, w, e na
verdade um conjunto de entradas, tais como dist urbios externos e sinais de referencia.
A principal distin c ao entre w e u e que o controlador n ao exerce inuencia sobre as
entradas externas. As sadas da planta tambem s ao caracterizadas em dois grupos. O
primeiro grupo, y, s ao sinais medidos e realimentados. O segundo grupo, z, s ao as
sadas reguladas. A realiza c ao da matriz de transferencia P e dada por:
P(s) =
_
_
P
11
P
12
P
21
P
22
_
_
=
_

_
A B
1
B
2
C
1
D
11
D
12
C
2
D
21
D
22
_

_
. (178)
Uma representa c ao do sistema da gura 33 por fun c oes de transferencia e:
z = P
11
w +P
12
u (179)
94
y = P
21
w +P
22
u (180)
u = Ky . (181)
Combinando as equa c oes (179), (180) e (181), obtemos a fun c ao transferencia de malha
fechada T
zw
entre as sadas reguladas z e entradas externas w, chamada transforma c ao
fracional linear, e dada por
T
zw
= P
11
+P
12
K(I P
22
K)
1
P
21
. (182)
Antes de prosseguir com a apresenta c ao dos resultados e oportuno esclarecer a
nota c ao relativa ` as Equa c oes Algebricas de Riccati.
Equa c oes Algebricas de Riccati
Equa c oes algebricas de Riccati (EARs) desempenham um papel importante na
sntese de controladores H
2
, H

e H
2
/H

. A forma fundamental de uma EAR e


descrita por:
E
T
X +XE +XRX +Q = 0 , (183)
sendo E R
nn
, Q R
nn
e R R
nn
, com Q e R simetricas. Esta equa c ao de
Riccati est a associada ` a matriz Hamiltoniana
H =
_
_
E R
Q E
T
_
_
R
2n2n
. (184)
Assumindo que H n ao possua autovalores no eixo imagin ario, ent ao deve haver n
autovalores em Re(s)<0 e n em Re(s)>0. Considere os dois subespa cos espectrais n-
dimensionais, A

(H) e A
+
(H): o primeiro e o subespa co invariante correspondente aos
autovalores em Re(s)<0 e o ultimo corresponde aos autovalores em Re(s)>0. Encon-
trando uma base para A

(H), dispondo os vetores desta base de modo a formar uma


matriz, e particionando esta matriz, temos
A

(H) = Im
_
_
X
1
X
2
_
_
(185)
95
com X
1
,X
2
C
nn
. Se X
1
e n ao singular, ou, equivalentemente, se os dois subespa cos
A

(H), Im
_
_
0
I
_
_
(186)
s ao complementares, podemos fazer X := X
2
X
1
1
. Ent ao X e unicamente determinada
por H, i.e., H X e uma fun c ao, que ser a denotada por Ric. Seja dom(Ric) a
nota c ao utilizada para o domnio de Ric, que consiste de matrizes Hamiltonianas que
possuem duas propriedades: H n ao possui autovalores no eixo imagin ario e os dois
subespa cos em (186) s ao complementares. Ent ao, X = Ric(H) e chamada solu c ao
estabilizante, e
Ric : dom(Ric) R
2n2n
R
nn
.
Se H dom(Ric), X = Ric(H) possui as seguintes propriedades:
(i) X e real e simetrica;
(ii) X satisfaz a equa c ao algebrica de Riccati E
T
X +XE +XRX +Q = 0;
(iii) E +RX e est avel.
O controle H
2
Nesta se c ao, a realiza c ao da matriz P da equa c ao (178) e dada por:
P(s) =
_

_
A B
1
B
2
C
1
0 D
12
C
2
D
21
0
_

_
, (187)
sendo a matriz D
22
e considerada zero para que P
22
seja estritamente pr opria. N ao h a
perda de generalidade nesta suposi c ao, pois o controlador para o caso D
22
,= 0 pode ser
recuperado do caso D
22
= 0 [ZHOU et al. (1995)]. D
11
e assumida como sendo zero
para garantir que o problema seja bem denido. O caso D
11
,= 0 ser a discutido mais
adiante. As seguintes hip oteses adicionais s ao feitas para esta se c ao:
(i) (A,B
2
) e estabiliz avel e (C
2
,A) e detect avel;
(ii) D
12
tem posto coluna pleno e D
21
tem posto linha pleno;
96
(iii)
_
_
A jI B
2
C
1
D
12
_
_
tem posto coluna pleno para todo ;
(iv)
_
_
A jI B
1
C
2
D
21
_
_
tem posto linha pleno para todo .
A hip otese (i) serve para garantir a estabilizabilidade de P, e as hip oteses (iii) e (iv),
juntamente com (i), garantem que as duas matrizes Hamiltonianas associadas ao prob-
lema H
2
pertencem ao dom(Ric). A hip otese (ii) garante que o problema de controle
otimo H
2
e n ao singular.
O problema de controle H
2
e encontrar um controlador K pr oprio, real e racional,
que estabilize internamente P e minimize a norma H
2
da matriz de transferencia T
zw
.
A solu c ao do controle H
2
envolve a resolu c ao de duas EARs associadas ` as matrizes
Hamiltonianas dadas pelas equa c oes (188) e (189).
H
2
:=
_
_
A 0
C

1
C
1
A

_
_

_
_
B
2
C

1
D
12
_
_
_
D

12
C
1
B

2
_
(188)
J
2
:=
_
_
A

0
B
1
B

1
A
_
_

_
_
C

2
B
1
D

21
_
_
_
D
21
B

1
C
2
_
(189)
Denindo:
F
2
:= (B

2
X
2
+D

12
C
1
) , (190)
L
2
:= (Y
2
C

2
+B
1
D

21
) (191)
e

A
2
:= A+B
2
F
2
+L
2
C
2
, (192)
com X
2
:= Ric(H
2
) e Y
2
:= Ric(J
2
), existe um unico controlador, otimo, dado por
K
opt
(s) :=
_
_

A
2
L
2
F
2
0
_
_
. (193)
97
Considerando a estrutura do sistema generalizado, agora com D
11
n ao necessaria-
mente sendo igual a zero:
P(s) =
_

_
A B
1
B
2
C
1
D
11
D
12
C
2
D
21
0
_

_
, (194)
[ZHOU et al. (1995)] mostram que o controlador K para este tipo de sistema e dado
por:
K
opt
(s) :=
_
_

A
2
B
2
D
K
C
2
(L
2
B
2
D
K
)
F
2
D
K
C
2
D
K
_
_
, (195)
com D
K
:= D

12
D
11
D

21
.
O controle H

Existem dois tipos de controle H

, o controle otimo e sub- otimo. Controle H

otimo signica encontrar todos os controladores admissveis K(s) tal que a norma H

da fun c ao de transferencia T
zw
e minimizada. Um controlador e dito admissvel quando
estabiliza internamente o sistema. Deve-se notar que os controladores H

otimos
denidos acima geralmente n ao s ao unicos para sistemas MIMO (Multiple Input,
Multiple Output - M ultiplas Entradas, M ultiplas Sadas). O problema de controle
H

sub- otimo pode ser denido da seguinte maneira: dado > 0, encontrar todos os
controladores admissveis K(s), se existirem, tal que a norma H

da fun c ao de trans-
ferencia de malha fechada T
zw
esteja abaixo de um certo nvel de desempenho , ou
seja, |T
zw
|

< . Seja
opt
:= min|T
zw
|

: K(s) admiss

ivel, i.e., o nvel otimo.


Ent ao, deve ser maior que
opt
para a existencia de controladores H

sub- otimos. Se
os erros de modelagem ou os dist urbios estiverem abaixo de
1
, o sistema em malha
fechada possuir a robustez de estabilidade, de acordo com o teorema de pequenos ganhos
(small-gain theorem, [MACIEJOWSKY (1989)]).
Encontrar um controlador H

otimo e na maioria das vezes uma tarefa complicada,


tanto numericamente quanto teoricamente. Conhecer a norma H

otima (mnima)
pode ser util teoricamente, pois indica um limite para o que se pode alcan car. Porem,
na pr atica, geralmente n ao e necess ario e algumas vezes ate indesej avel projetar um
controlador otimo, pois e muito mais barato (numericamente falando, por exemplo)
98
Figura 34: Todas as solu c oes K
obter controladores sub- otimos, que s ao muito pr oximos (no sentido de norma) dos
otimos. A solu c ao utilizada neste trabalho e a do controle H

sub- otimo.
A solu c ao do controle H

descrita aqui e um resultado obtido por [DOYLE et al.


(1989)]. Esta solu c ao faz uso da resolu c ao de duas equa c oes de Riccati e projeta um
controlador com o mesmo n umero de estados da planta aumentada.
Dado um sistema P bloco 2x2 e um limite superior para o ganho de malha
fechada, a solu c ao retorna um compensador parametrizado K = T(J, Q) de todos os
controladores que estabilizam o sistema (gura 34) tal que
[[T(P, K)[[

. (196)
Qualquer fun c ao de transferencia est avel Q que satisfa ca [[Q[[

< estabiliza o
sistema e satisfaz a inequa c ao (196). Inversamente, qualquer Q inst avel ou [[Q[[

>
desestabiliza o sistema ou causa [[T(P, K)[[

> , ou ambos. O resultado que se segue


faz certas restri c oes ` a matriz D da matriz de transferencia da planta aumentada P (a
matriz D de P e a matriz formada por D
11
, D
12
, D
21
, D
22
que aparece na equa c ao
178). Mais adiante essas restri c oes podem deixar de existir aplicando-se os resultados de
[SAFONOV et al. (1989)]. Seja a realiza c ao P dada pela equa c ao (178). Os resultados
de [DOYLE et al. (1989)] assumem o seguinte para P:
(i) (A,B
1
) e (A,B
2
) s ao estabiliz aveis ;
99
(ii) (C
1
,A) e (C
2
,A) s ao detect aveis ;
(iii) D
T
12
D
12
= I ;
(iv) D
21
D
T
21
= I ;
(v) D
11
= D
22
= 0 .
A solu c ao do controle H

envolve a resolu c ao de duas EARs associadas ` as matrizes


Hamiltonianas dadas pelas equa c oes (197) e (198):
H

=
_
_
AB
2
D
T
12
C
1

2
B
1
B
T
1
B
2
B
T
2

C
T
1

C
1
(AB
2
D
T
12
C
1
)
T
_
_
, (197)
sendo

C
1
= (I D
12
D
T
12
)C
1
e
J

=
_
_
(AB
1
D
T
21
C
2
)
T

2
C
T
1
C
1
C
T
2
C
2

B
T
1

B
1
(A B
1
D
T
21
C
2
)
_
_
, (198)
sendo

B
1
= B
1
(I D
T
21
D
21
) .
Denindo:
F = (B
T
2
X

+D
T
12
C
1
) , (199)
H = (Y

C
T
2
+B
1
D
T
21
) , (200)
Z = (I
2
Y

)
1
. (201)
A solu c ao e v alida se as seguintes condi c oes s ao obedecidas:
(i) H

dom(Ric) e X = Ric(H

) 0;
(ii) J

dom(Ric) e Y = Ric(J

) 0;
(iii) (X

)
2
,
sendo (X

) = max
i
[
i
(X

)[ o raio espectral de X

. Se alguma destas
tres condi c oes falha, ent ao e muito pequeno e n ao existe solu c ao, portanto deve
100
ser aumentado. Assumindo que e grande o suciente para passar em todos os
tres testes, ent ao a famlia de todos os controladores estabilizantes K que satisfazem
[[T(P, K)[[

e dado por K = T(J, Q) sendo Q qualquer fun c ao de transferencia


est avel com [[Q[[

< , e
J =
_
_
J
11
J
12
J
21
J
22
_
_
, (202)
sendo
J
11
= A +B
2
F +
2
B
1
B
T
1
X +ZH(C
2
+
2
D
21
B
T
1
X) ,
J
12
=
_
ZH Z(B
2
+
2
TC
T
1
D
12
_
,
J
21
=
_
_
F
(C
2
+
2
D
12
B
T
1
X)
_
_
,
J
22
=
_
_
0 I
I 0
_
_
.
Os resultados anteriores (equa c oes 197 a 202) assumiram que D
11
= D
22
= 0,
D
T
12
D
12
= I e D
21
D
T
21
= I. Dada uma matriz D geral e um limite superior desejado
, a serie de passos mostrada a seguir transforma o sistema para a forma desejada. O
conhecimento de e necess ario para que se possa zerar a matriz D
11
, e estas trans-
forma c oes devem ser repetidas cada vez que mudar. A maioria das transforma c oes
envolvem simplesmente multiplica c ao de sinais por matrizes ortogonais, que preservam
a norma e assim n ao mudam a norma H

do sistema. A transforma c ao que zera


D
11
, n ao preserva a norma H

do sistema, mas preserva o seu limite superior . Em


outras palavras, embora a norma H

do sistema transformado possa diferir da norma


do sistema original, a norma H

do sistema transformado e menor do que , se e


somente se, a norma H

do sistema original for menor que . Pode-se transformar as


matrizes D
12
, D
21
, D
11
e D
22
para que se possa calcular a solu c ao do problema para
qualquer tipo de matriz D. Estas transforma c oes s ao resultados obtidos por Safonov
et al. [SAFONOV et al. (1989)], e est ao descritas nos seguintes cinco passos.
1. Usar a decomposi c ao em valores singulares para fatorar D
12
e D
21
:
D
12
= U
1
_
_
0

1
_
_
V
T
1
(203)
101
D
21
= U
2
_
0
2
_
V
2
(204)
2. Transformar D
11
e particion a-la em uma matriz bloco 2 2 onde D
1122
tem as
mesmas dimens oes de D
T
22
:
U
T
1
D
11
V
2
=
_
_
D
1111
D
1112
D
1121
D
1122
_
_
(205)
3. Calcular K

:
K

= [D
1122
+D
1121
(
2
I D
T
1111
D
1111
)
1
D
T
1111
D
1112
] (206)
4. Calcular N e a matriz de transforma c ao tal que
N = U
T
1
D
11
V
2
+
_
_
0 0
0 K

_
_
=
_
_
D
1111
D
1112
D
1121
D
1122
+K

_
_
(207)
=
_
_

11

12

21

22
_
_
=
_
_
N (I
2
NN
T
)
1
2
(I
2
N
T
N)
1
2

2
N
T
_
_
(208)
Neste ponto, a matriz

D
11
do sistema transformado e zero. As outras tres partes
da matriz

D s ao dadas por:

D
12
= (I
2
NN
T
)

1
2
_
_
0
I
_
_
, (209)

D
21
=
_
0 I
_
(I
2
NN
T
)

1
2
, (210)

D
22
=
_
0 I
_

2
N
T
(I
2
NN
T
)

1
2
_
_
0
I
_
_
. (211)
5. Usar a decomposi c ao de valores singulares para calcular

D
12
e

D
21
:

D
12
= U
3
_
_
0

3
_
_
V
T
3
, (212)

D
21
= U
4
_
0
4
_
V
T
4
. (213)
102
A matriz

D do sistema transformado tem agora os componentes

D
11
= 0,

D
22
= 0,

D
12
= [ 0 I ]
T
e

D
21
= [ 0 I ]. Uma vez que o controlador

K e calculado para o
sistema transformado

P, ele deve ser transformado novamente para o sistema original
P, fazendo
K = T(T,

K) , (214)
sendo a matriz de transforma c ao T dada por
T =
_
_
T
11
T
12
T
21
T
22
_
_
, (215)
com
T
11
= V
1

1
1
K

1
2
U
T
2
(I L
1
)
1
,
T
12
= V
1

1
1
(I L
2
)
1
V
3

1
3
,
T
21
=
1
4
U
T
4

1
2
U
T
2
(I L
1
)
1
,
T
22
=
1
4
U
T
4
[
1
2
U
T
2
D
22
V
1

1
1
(I L
2
)
1


D
22
]V
3

1
3
,
L
1
= D
22
V
1

1
1
K

1
2
U
T
2
,
L
2
= K

1
2
U
T
2
D
22
V
1

1
1
.
O Robust Control Toolbox do MATLAB [CHIANG & SAFONOV (1992)], atraves
do comando hinfsyn, implementa esta solu c ao do controle H

.
O controle H
2
/H

O controle H
2
/H

consiste no controle em malha fechada H


2
com restri c ao H

para atenua c ao dos dist urbios de entrada. Para mais detalhes, recomenda-se a leitura
de [BERNSTEIN & HADDAD (1989); DOYLE et al. (1994); DOYLE et al. (1994b)].
O problema de controle H
2
com restri c ao H

pode ser enunciado da seguinte


maneira: dada a realiza c ao da matriz P da equa c ao (178) de ordem n, estabiliz avel
e detect avel, com D
22
= 0, determinar a din amica do compensador de dimens ao n
x
k
= A
k
x
k
+B
k
y (216)
u = C
k
x
k
, (217)
103
que satisfa ca os seguintes criterios de projeto:
(i) O sistema em malha fechada e assintoticamente est avel;
(ii) A fun c ao de transferencia T
zw
satisfaz a restri c ao [[T
zw
[[

, para > 0;
(iii) O funcional
J(A
k
, B
k
, C
k
) = lim
t
E[x(t)
T
R
1
x(t) +u(t)
T
R
2
u(t)] (218)
e minimizado, sendo R
1
= E
T
1
E
1
e R
2
= E
T
2
E
2
. Uma express ao mais familiar do
funcional (218) e
J(A
k
, B
k
, C
k
) = lim
t
1
t
_
t
0
[x(v)
T
R
1
x(v) +u(v)
T
R
2
u(v)]dv . (219)
Se o sistema em malha fechada e assintoticamente est avel para o compensador (A
k
,
B
k
, C
k
), ent ao a fun c ao desempenho (218) e dada por
J(A
k
, B
k
, C
k
) = tr(

E
T

E) , (220)
com

E = [ E
1
E
2
C
k
] e em regime a covari ancia dos estados e denida como

Q = lim
t
E( x(t)
T
x(t)) (221)
e satisfaz a equa c ao de Lyapunov

Q+

Q

A
T
+

V = 0 (222)
sendo

V = diag[ V
1
B
k
V
2
B
T
k
].
O passo chave para se fazer respeitar [[T
zw
[[

consiste em trocar a equa c ao de


Lyapunov (222) por uma EAR que limita a covari ancia da malha fechada em regime.
Dada a realiza c ao no espa co de estados (A
k
, B
k
, C
k
), e assumindo que Q R
n n
satisfazendo

AQ+Q

A
T
+
2
Q

Q+

V = 0 . (223)
104
ent ao (

A,

D) e estabiliz avel se e somente se

A e assintoticamente est avel, sendo

A R
n n
=
_
_
A B
2
C
k
B
k
C
2
A
k
_
_
(224)
e

D =
_
_
B
1
B
k
D
21
_
_
. (225)
Assim, [[T
zw
[[

e

Q Q, e consequentemente
J(A
k
, B
k
, C
k
) (A
k
, B
k
, C
k
, Q) (226)
sendo = tr(Q

E
T

E). A prova deste resultado encontra-se em [BERNSTEIN & HAD-
DAD (1989)].
Este resultado mostra que a restri c ao H

` a atenua c ao do dist urbio e automatica-


mente respeitada quando uma solu c ao semi-denida positiva Q para (223) e conhecida
e

A e assintoticamente est avel. Alem disso, todas as solu c oes fornecem um limite su-
perior para a covari ancia

Q dos estados em malha fechada de acordo com o criterio
L
2
.
Assim, e necess ario determinar (A
k
, B
k
, C
k
) que minimize J(A
k
, B
k
, C
k
) sujeito ` a
(223) e com solu c ao semi-positiva denida. Uma condi c ao necess aria para este problema
de minimiza c ao e que (A
k
, B
k
, C
k
, Q) perten ca ao conjunto
A = (A
k
, B
k
, C
k
, Q) : Q n n definida positiva T
n
,

A +
2
Q

e assintoticamente est avel,


e (A
k
, B
k
, C
k
) e control avel e observ avel .
Se (A
k
, B
k
, C
k
, Q) A resolve o problema de minimiza c ao, ent ao existem Q, P,

Q
n n semi-denidas positivas tal que
A
k
= A Q (B
2
R
1
2
B
T
2
)PS +
2
QC
T
1
C
1
; (227)
B
k
= QC
T
2
V
1
2
; (228)
C
k
= R
1
2
B
T
2
PS ; (229)
105
com
S = (I
n
+
2

QP)
1
; (230)
= C
T
2
V
1
2
C
2
; (231)
= B
2
R
1
2
B
T
2
; (232)
V
1
= B
1
B
T
1
; (233)
V
2
= D
21
D
T
21
; (234)
e Q, P,

Q satisfazem
AQ+QA
T
+V
1
+
2
QC
T
1
C
1
QQQ = 0 ; (235)
[A+
2
(Q +

Q)C
T
1
C
1
]
T
P+P[A+
2
(Q+

Q)C
T
1
C
1
] +R
1
S

PPS = 0 ; (236)
(APS +
2
QC
T
1
C
1
)

Q+

Q(A PS +
2
QC
T
1
C
1
)
T
+
2

Q(C
T
1
C
1
+
2
S
T
PPS)

Q+QQ = 0 .
(237)
A demonstra c ao deste resultado encontra-se em [BERNSTEIN & HADDAD (1989)].
A equa c ao (235) e desacoplada das equa c oes (236) e (237), e pode portanto ser
resolvida independentemente. Porem, como (236) est a acoplada a (237), necessita-
mos utilizar um processo iterativo para encontrar estas solu c oes, dado pelo seguinte
algoritmo:
1. Inicializar > 0
2. Resolver Q
3. k = 0,

Q
0
= 0
4. Resolver P para P
k+1
= P com

Q =

Q
k
5. Resolver

Q para

Q
k+1
=

Q com P = P
k+1
6. Se k 1 e [[P
k+1
P
k
[[ < e [[

Q
k+1


Q
k
[[ <
7. Se n-o houve convergencia k = k + 1 e voltar ao passo 4.
106
Pondera cao de desempenho
Os objetivos de desempenho de um sistema realimentado podem ser geralmente
especicados em termos de certas caractersticas desejadas a respeito das fun c oes de
sensibilidade S e/ou de sensibilidade complemetar T, ou em termos de alguma outra
fun c ao de transferencia de malha fechada. No projeto de sistemas multivari aveis, e
conveniente reetir os objetivos de desempenho do sistema escolhendo fun c oes peso
apropriadas, como mostrado em [ZHOU & DOYLE (1998)]. As fun c oes peso do dia-
grama mostrado na gura 35 s ao escolhidas de maneira a reetir o comportamento dos
dist urbios d e d
i
, no domnio da frequencia. A matriz peso W
n
e utilizada para mode-
lar o rudo de sensores na frequencia. W
e
reete os requisitos no formato da fun c ao de
transferencia de malha fechada do sistema. W
u
e usada para reetir restri c oes nos sinais
de controle dos atuadores. O pre-compensador tracejado W
r
e um elemento opcional,
utilizado para formatar deliberadamente o sinal de comando ou para representar um
sistema de realimenta c ao n ao unit ario.
Figura 35: Congura c ao padr ao do sistema com pesos realimentado
Representa c oes de incertezas nao-estruturadas
Existem duas maneiras de se representar incertezas n ao-estruturadas: o modelo
aditivo e o modelo multiplicativo. Seja G
0
a fun c ao de transferencia nominal que e o
modelo escolhido para representar o comportamento da planta, e seja G
r
a fun c ao de
transferencia real da planta. Ent ao,
G
r
= G
0
+
A
, (238)
107
ou
G
r
= [1 +
M
]G
0
. (239)
Estes dois modelos (aditivo e multiplicativo) de representa c ao de incertezas podem
ser utilizados na entrada e/ou na sada da planta, isoladamente ou em conjunto, como
mostrado em [ZHOU & DOYLE (1998)]. Dependendo da congura c ao utilizada, as
incertezas do sistema tais como erros nos sensores, din amicas de alta frequencia n ao
modeladas, erros parametricos, entre outras, podem ser representadas, obtendo assim
um modelo mais condizente com a planta real.
Figura 36: Incertezas n ao-estruturadas
Procedimento de Projeto
Para a sntese dos controladores, e necess ario calcular a planta aumentada

P mostrada
na gura (32). Para isso, e preciso escolher os valores de K
p
, K
v
, W
e
e W

.
Primeiramente, denem-se os valores de K
p
e K
v
do metodo do torque computado,
e obtem-se o sistema linearizado, o que chamaremos de planta nominal. As seguintes
equa c oes de estado denem este sistema:
x = A
g
x +B
g
u (240)
y = C
g
x +D
g
u . (241)
108
O vetor x R
6
representa os estados da planta, e denido como:
x =
_
_
e
e
_
_
=
_
_
q
d
q
q
d
q
_
_
, (242)
e as matrizes A
g
R
66
, B
g
R
63
, C
g
R
36
e D
g
R
33
como:
A
g
=
_
_
0
3
I
3
Kp Kv
_
_
, B
g
=
_
_
0
3
I
3
_
_
, C
g
=
_
I
3
0
3
_
, D
g
= 0
3
, (243)
sendo 0
3
uma matriz de zeros 3x3 e I
3
a matriz identidade 3x3.
Sele cao de K
p
e K
v
Os ganhos est aticos K
p
e K
v
foram ajustados iterativamente, observando-se os
resultados obtidos em simula c ao e implementa c ao, utilizando um criterio heurstico.
Sele cao de W
e
e W

A sele c ao da fun c ao peso W


e
e da matriz de pondera c ao W

utilizada na repre-
senta c ao de incertezas n ao estruturadas multiplicativas na entrada da planta foi real-
izada seguindo as indica c oes dadas por [ZHOU & DOYLE (1998)]. Deve-se ressaltar
que a escolha de matrizes que reitam especica c oes de desempenho do sistema n ao
e trivial, pois n ao h a uma regra geral para a escolha destas fun c oes. O processo de
escolha das duas matrizes e bastante similar, e e descrito a seguir.
A matriz W
e
e escolhida como sendo uma matriz de fun c oes de transferencia diag-
onal, e com dimens ao coerente com o n umero de graus de liberdade do sistema, sendo
que os elementos da diagonal s ao dados por:
W
e
(i, i) =
s
Ms
+
b
s +
b

, (244)
sendo M
s
o pico da magnitude do maior valor singular da fun c ao de sensibilidade de
sada do sistema, S = (I +PK)
1
,
b
a mnima frequencia de largura de banda, e o
m aximo erro de rastreamento de estado estacion ario. Estes valores devem ser escolhidos
de modo que o maior valor singular da fun c ao sensibilidade do sistema, S, seja menor
109
que o menor valor singular de W
1
e
em toda a faixa de frequencia, ou seja, utilizando
o conceito de norma H

,
[[W
e
S[[

1 [[S[[

[[W
1
e
[[

, (245)
o que signica que o maior valor singular da fun c ao de sensibilidade S deve ser menor
que o menor valor singular de W
1
e
em toda a faixa de frequencia.
A matriz W

e uma matriz diagonal com dimens ao coerente com o n umero de graus


de liberdade do sistema, sendo que os elementos da diagonal s ao dados por:
W

(i, i) =
s +

bc
Mu

1
s +
bc
. (246)
A fun c ao W

deve obedecer a
[[TW

[[

1 [[T[[

[[W
1

[[

, (247)
ou seja, o maior valor singular da fun c ao de sensibilidade complementar T = KP(I +
KP)
1
deve ser menor que o menor valor singular de W
1

em toda a faixa de frequencia.


Para a congura c ao AAA, W
e
e W

s ao matrizes 3 3, para a congura c ao AAP,


s ao matrizes 2 2 e para a congura c ao PAP, s ao fun c oes de transferencia.
O procedimento de escolha segue os seguintes passos:
1. Denir os ganhos K
p
e K
v
e calcular a planta nominal (A
g
, B
g
, C
g
e D
g
);
2. Escolher valores para os elementos M
s
,
b
e de W
e
e para os elementos M
u
,
bc
e
1
de W

;
3. Calcular a planta aumentada;
4. Obter a fun c ao sensibilidade S e a fun c ao sensibilidade complementar T, desenhar
os gr acos de S e W
1
e
, e de T e W
1

, e observar se [[S[[

[[W
1
e
[[

e se
[[T[[

[[W
1

[[

.
5. Se as condi c oes do item 4 n ao se vericam, voltar ao passo 1.
110
Determina cao da planta aumentada e sntese H
2
, H

e H
2
/H

Para obtermos a planta aumentada, utilizada no c alculo dos controladores H


2
, H

e H
2
/H

, utiliza-se o comando sysic do software Matlab. Para a sntese do controlador


H
2
, utiliza-se a formula c ao dada por [ZHOU et al. (1995)], para a sntese H

utiliza-
se o comando hinfsyn (Matlab). Para o c alculo do controlador H
2
/H

, utiliza-se o
algoritmo desenvolvido por [BERNSTEIN & HADDAD (1989)], sendo que a escolha
de e feita de maneira iterativa, ate atingir o limite mnimo. As instru c oes executadas
pelos comandos sysic, h2syn e hinfsyn podem ser encontradas em maiores detalhes em
[BALAS et al. (1994); CHIANG & SAFONOV (1992)]. Estes comandos implementam
as solu c oes descritas em VIII.
Parte IX
Controle H

nao linear de
manipuladores
111
112
Controle H

nao linear
Um importante objetivo no estudo de sistemas de controle e projetar controladores
que atenuam os efeitos de dist urbios externos. Um dos mais populares procedimentos
para obter este objetivo e o controle H

, sendo que o controlador e projetado de tal


forma que o sistema em malha fechada tenha ganho L
2
limitado, ou seja, a rela c ao entre
as normas induzidas L
2
dos sinais de entrada (dist urbios) e sada seja limitada por um
nvel de atenua c ao [DOYLE et al. (1992); FRANCIS (1987)]. A solu c ao em espa co
de estados para o controle H

de sistemas lineares foi demonstrada em [DOYLE et al.


(1989)], onde equa c oes algebricas de Riccati s ao utilizadas para o c alculo do controlador.
Este trabalho foi estendido para sistemas lineares variantes no tempo (com horizonte
de tempo nito) em [LIMEBEER et al. (1992)].
A generaliza c ao do controle H

para sistemas n ao lineares invariantes no tempo (ou


com horizonte innito) foi primeiramente apresentada por [SCHAFT (1991); SCHAFT
(1992)]. V arios trabalhos foram realizados posteriormente [BALL et al. (1991); HEL-
TON & ZHAN (1994); HUANG & JADBABAIE (1998); ISIDORI (1994); ISIDORI
(1994b); ISIDORI & ASTOLFI (1992); ISIDORI & KANG (1995); JADBABAIE et al.
(1998); JAMES & BARAS (1995); LU (1995); LU (1996); LU & DOYLE (1993); LU
& DOYLE (1993b); LU & DOYLE (1994); LU & DOYLE (1995); PRIMBS et al.
(1998); SHAKED & SOUZA (1995); SU et al. (1999)]. Basicamente, na general-
iza c ao para sistemas n ao lineares, as condi c oes necess arias e sucientes para que o
problema de controle H

tenha solu c ao consistem em resolver equa c oes (inequa c oes)


de Hamilton-Jacobi. Em particular, [SCHAFT (1991)] mostrou que no caso de in-
forma c ao completa do estado (realimenta c ao do estado), ou seja, quando as vari aveis
de medida contem todos os estados da planta sendo controlada, a solu c ao do problema
pode ser determinada pela solu c ao de uma equa c ao (ou inequa c ao, como em [SCHAFT
(1992)]) de Hamilton-Jacobi. Esta equa c ao e a vers ao n ao linear da equa c ao de Riccati
considerada em [DOYLE et al. (1989)] para o correspondente problema de controle
sub- otimo H

para sistemas lineares. Em [BALL et al. (1991); ISIDORI (1994);


ISIDORI & ASTOLFI (1992); ISIDORI & KANG (1995); LU & DOYLE (1993); LU &
DOYLE (1993b), o problema de atenua c ao de dist urbios e estendido para o caso de real-
imenta c ao da sada, ou seja, quando as vari aveis de medida s ao fun c oes ou contem parte
dos estados da planta. Os autores de [BALL et al. (1991)] estabeleceram condi c oes
113
necess arias para a solu c ao do problema de atenua c ao via realimenta c ao da sada. Mais
precisamente, eles provaram, sob certas condi c oes, a necessidade de solu c ao para a in-
equa c ao de Hamilton-Jacobi introduzida em [SCHAFT (1992)] e para uma inequa c ao de
Hamilton-Jacobi dual, que e a vers ao n ao linear da equa c ao de Riccati associada com o
correspondente problema de estimativa de estado sub otimo H

para sistemas lineares.


As solu c oes destas duas inequa c oes de Hamilton-Jacobi desacopladas devem obedecer
uma condi c ao de acoplamento que, novamente, e an aloga ` a condi c ao de acoplamento
existente entre as solu c oes das equa c oes de Riccati correspondentes no caso de sistemas
lineares. Portanto, [BALL et al. (1991)] verica o princpio da separa c ao para sistemas
n ao lineares. Em [LU (1996); ORLOV et al. (1999)], o problema de controle H

para
sistemas n ao lineares variantes no tempo e considerado.
V arias ferramentas foram desenvolvidas com o objetivo de obter solu c oes globais
para as inequa c oes de Hamilton-Jacobi [HELTON & ZHAN (1994); ISIDORI (1994b);
SCHAFT (1992)]. Entretanto, n ao h a algoritmos ecientes para resolver tais inequa c oes
para sistemas com grande n umero de estados. Um procedimento alternativo com pro-
priedades computacionais interessantes e proposto em [LU & DOYLE (1993); LU &
DOYLE (1995)]. Baseado na possibilidade do problema de controle H

linear ser car-


acterizado como um problema convexo, ou seja, utilizando-se desigualdades matriciais
lineares (DML) [PACKARD & DOYLE (1993)], os autores analisaram a convexidade
do problema de controle H

n ao linear e caracterizaram as solu c oes em termos de de-


sigualdades matriciais n ao lineares, sendo na realidade DMLs dependentes do estado.
A solu c ao de DMLs e encontrada utilizando o metodo recentemente desenvolvido do
ponto interior [NESTEROV & NEMIROVSKI (1994)].
Por outro lado, tecnicas semelhantes foram desenvolvidas para sistemas lineares com
par ametros variantes (LPV) [APKARIAN (1997); APKARIAN & ADAMS (1998); AP-
KARIAN & BIANNIC (1995); APKARIAN & GAHINET (1995); APKARIAN et al.
(1995); BECKER & PACKARD (1994); WU (1995); WU et al. (1996); WU et al.
(2000)] fornecendo controladores dependentes dos par ametros, tambem chamados de
ganhos escalonados, que satisfazem a condi c ao de ganho L
2
menor que . Alguns
destes autores, [APKARIAN & BIANNIC (1995); APKARIAN et al. (1995); BECKER
& PACKARD (1994)], utilizaram fun c oes de Lyapunov quadr aticas xas para garantir
a estabilidade e desempenho. Entretanto, tais procedimentos s ao conservadores, pois
114
permitem que os par ametros tenham taxa de varia c ao arbitr aria, e alem disso, alguns
sistemas n ao s ao sempre estabilizados quando uma fun c ao de Lyapunov simples e uti-
lizada [WU et al. (1996)]. Esta limita c ao pode ser eliminada utilizando fun c oes de
Lyapunov dependentes dos par ametros [APKARIAN & ADAMS (1998); WU (1995);
WU et al. (1996); WU et al. (2000)], que permitem incorporar o conhecimento da
taxa de varia c ao na an alise e sntese dos controladores. Procedimentos computacionais
utilizando fun c oes base e dividindo o espa co de par ametros foram desenvolvidos em
[APKARIAN & ADAMS (1998); APKARIAN & BIANNIC (1995); APKARIAN et al.
(1995); WU (1995); WU et al. (1996)] para obter a solu c ao das DMLs de dimens ao
innita geradas por estas tecnicas.
Para a classe de sistemas n ao lineares com entradas ans, v arias tecnicas de projeto
fornecem representa c oes lineares dependentes de par ametros (ou dos estados) para as
din amicas n ao lineares. O procedimento de Equa c ao de Riccati Congelada (do ingles
Frozen, ERC) [CLOUTIER et al. (1996)], no qual os par ametros variantes do sistema
s ao xados em valores especcos, e o mais simples em termos de complexidade com-
putacional e implementa c ao, embora n ao haja garantia de estabilidade, e diferentes
representa c oes utilizadas no projeto por ERC apresentaram desempenhos diferentes
para uma mesma planta n ao linear [HUANG & JADBABAIE (1998); HUANG & LU
(1996)]. Quando a tecnica LPV e aplicada em sistemas n ao lineares, os par ametros vari-
antes s ao fun c oes do estado ao inves de vari aveis livres. Este tipo de representa c ao
dos sistemas n ao lineares e denominada quase-LPV (quase linear com par ametros vari-
antes).
Controle H

nao linear via representa cao quase-LPV


Considere um sistema n ao linear variante no tempo com entradas ans w '
p
e
vari aveis de sada z '
q
:
x = f(x, t) +g(x, t)w
z = h(x, t) +k(x, t)w
(248)
sendo f(0, t) = 0 e h(0, t) = 0 para todo t [0, T], e x '
n
as vari aveis de estados.
Assume-se que f, g e h s ao fun c oes continuamente diferenci aveis em rela c ao a x e
contnuas em t.
115
O sistema (248) possui um ganho L
2
no intervalo [0, T] se:
_
T
0
|z(t)|
2
dt
2
_
T
0
|w(t)|
2
dt (249)
para todo T 0 e todo w L
2
(0, T) com o sistema iniciando de x(0) = 0.
Considere o problema de sntese do controle via realimenta c ao do estado sendo u a
vari avel de controle e z
1
e z
2
as vari aveis de sada:
_

_
x(t)
z
1
(t)
z
2
(t)
_

_
=
_

_
A((t)) B
1
((t)) B
2
((t))
C
1
((t)) 0 0
C
2
((t)) 0 I
_

_
_

_
x(t)
w(t)
u(t)
_

_
. (250)
Dene-se o conjunto no qual os par ametros podem variar como:
F

P
=
_
(
1
('
+
, '
m
) : (t) P, [
i
[
i
, i = 1, . . . , m
_
sendo P '
m
um conjunto compacto (veja Apendice ??), e = [
1

m
]
T
com

i
0.
Por simplicidade, algumas suposi c oes s ao feitas sobre o modelo acima. O termo
D
11
e assumido como sendo zero e o termo D
22
e assumido como sendo identidade.
Resultados mais complexos podem ser derivados se estas suposi c oes forem relaxadas.
O objetivo e encontrar uma fun c ao contnua em (t), F((t)), tal que o sistema em
malha fechada possua ganho L
2
menor que com lei de realimenta c ao do estado igual
a u(t) = F((t))x(t).
Lema 1 (WU et al. (1996)) Se existe uma fun c ao matricial contnua diferenci avel
X() > 0 para todo P que satisfaz
_

m
i=1

i
X

i
_
+

A()X() +X()

A()
T
B
2
()B
T
2
() X()C
T
1
() B
1
()
C
1
()X() I 0
B
T
1
() 0
2
I
_

_
< 0
(251)
sendo

A() = A() B
2
()C
2
(), ent ao, com lei de realimenta c ao do estado
u(t) = (B
2
((t))X
1
((t)) +C
2
((t)))x(t)
116
o sistema em malha fechada possui ganho L
2
para toda trajet oria parametrica
(t) F

P
.
O resultado acima e uma generaliza c ao natural da teoria de controle H

para sis-
temas lineares. Novamente uma fun c ao de Lyapunov parametrica na forma V (x, t) =
x
T
(t)X
1
((t))x(t) e assumida. Como resultado, temos que resolver a DML parametrica
(251), que e um problema de otimiza c ao convexo com dimens ao innita.
Um esquema computacional pr atico [HUANG & JADBABAIE (1998); WU (1995);
WU et al. (1996)] pode ser utilizado para resolver as desigualdades matriciais lineares
presentes na an alise e sntese dos problemas LPV e quase-LPV. Por simplicidade, con-
sidere o problema de encontrar X() na Equa c ao (251). Primeiro, escolha um conjunto
de fun c oes (
1
, f
i
()
M
i=1
, como base para X(), ou seja,
X() =
M

i=1
f
i
()X
i
(252)
sendo X
i
S
nn
a matriz coeciente para f
i
(). Se X() em (251) e substituda por
(252), o problema de realimenta c ao do estado transforma-se na seguinte otimiza c ao:
min
{X
i
}
M
i=1

2
sujeito a
_

_
E

()

M
j=1
f
j
()X
j
C
T
1
() B
1
()
C
1
()

M
j=1
f
j
()X
j
I 0
B
T
1
() 0
2
I
_

_
< 0
M

j=1
f
j
()X
j
> 0 (253)
sendo
E

=
m

i=1

_
_

i
M

j=1
f
j

i
X
j
_
_
+
M

j=1
f
j
()(

A()X
j
+X
j

A()
T
) B
2
()B
T
2
().
Note que (253) s ao DMLs em termos das vari aveis matriciais X
i

M
i=1
quando o
par ametro e xado. Para resolver este problema de otimiza c ao de dimens ao innita,
divide-se o conjunto de par ametros P em L pontos
k

L
k=1
em cada dimens ao. Ent ao
117
calcula-se as DMLs acima para estes pontos. Desde que (251) consiste de 2
m
vnculos,
um total de (2
m
+ 1)L
m
desigualdades matriciais ans em termos das M vari aveis
matriciais X
i
devem ser resolvidas. Uma aproxima c ao da densidade de pontos par-
ticionados, L, que garante uma solu c ao global das DMLs e dada em [WU (1995); WU
et al. (1996)].
Tratando as din amicas n ao lineares como sistemas lineares dependentes do estado,
pode-se aplicar a tecnica LPV para uma classe de sistemas n ao lineares.
Lema 2 (HUANG & JADBABAIE (1998)) Suponha uma fun c ao f : '
n
'
n
continuamente diferenci avel com f(0) = 0. Ent ao, uma fun c ao contnua matricial
estimada A(x) : '
n
'
nn
pode sempre ser encontrada tal que f(x) = A(x)x.
Note que A(x) no lema acima n ao e uma lineariza c ao de f(x). De fato, temos um
n umero innito de possveis representa c oes matriciais A(x) para uma dada f(x). A
din amica n ao linear (248) pode ser transformada para:
x = A(x)x +g(x)w
que assemelha-se a um sistema linear exceto que as matrizes de estado dependem das
vari aveis de estado ao inves de serem constantes como no caso linear. Para manter o
n umero de par ametros variantes nas matrizes de estado A(x) e g(x) a um mnimo, a de-
pendencia destas matrizes nas vari aveis de estado ser a mudada para (x) (
1
('
m
, '
n
)
com m < n, isto e, A(x) e g(x) torna-se A((x)) e g((x)), respectivamente. Por
enquanto, (x) pode simplesmente representar parte das vari aveis de estado.
A seguinte representa c ao quase-LPV do sistema n ao linear com entradas ans ser a
usada para o problema de sntese do controlador via realimenta c ao do estado:
_

_
x
z
1
z
2
_

_
=
_

_
A((x)) B
1
((x)) B
2
((x))
C
1
((x)) 0 0
C
2
((x)) 0 I
_

_
_

_
x
w
u
_

_
. (254)
Esta representa c ao e diferente do modelo LPV (250), apenas pelo fato que os
par ametros
i
s ao agora fun c oes das vari aveis de estado, isto e, = (x). Visando
atenuar os efeitos das entradas externas para todas as trajet orias parametricas permi-
118
tidas, o tratamento LPV inevitavelmente introduzir a algum conservadorismo devido ` a
conec c ao entre os par ametros e as vari aveis.
Uma das diculdades quando o lema 1 e aplicado, e determinar o limite da taxa de
varia c ao de , pois este n ao e conhecido a priori. Um meio de resolver este problema e
restringir X no lema 1 a ser constante. Desde que a taxa de varia c ao n ao inuencie
neste caso, o ganho L
2
e garantido para todas as trajet orias de estado. Entretanto,
e muito conservador restringir nossa busca por fun c oes de Lyapunov quadr aticas com
matriz constante. Um procedimento mais pr atico e usar a melhor estimativa do lim-
ite de opera c ao dos par ametros variantes escolhidos e uma aproxima c ao nas taxas de
varia c ao dos par ametros. Esta aproxima c ao deve ser vericada ap os a aplica c ao do
controlador no sistema quase-LPV.
Representa cao quase-LPV de um manipulador
A equa c ao din amica de um rob o manipulador pode ser formulada pela teoria de
Lagrange como:
+ = M
0
(q) q +C
0
(q, q) q +F
0
( q) +G
0
(q) (255)
com
= (M(q) q + C(q, q) q + F( q) + G(q) w).
sendo q '
n
as posi c oes angulares das juntas, M
0
(q) '
nn
a matriz de inercia
nominal (simetrica e denida positiva), C
0
(q, q) '
nn
a matriz de Coriolis nominal,
F
0
( q) '
n
os torques de fric c ao nominais, G
0
(q) '
n
os torques gravitacionais nom-
inais, '
n
os torques aplicados, M(q), C(q, q), F( q) e G(q) as incertezas
parametricas e w um dist urbio externo de energia nita.
O erro de acompanhamento do estado e denido como:
x =
_
_
q q
d
q q
d
_
_
=
_
_

q
q
_
_
(256)
sendo q
d
e q
d
'
n
a trajet oria de referencia desejada e sua correspondente velocidade,
respectivamente. A equa c ao din amica para o erro de acompanhamento do estado e
119
encontrada utilizando (255) e (256)

x = A( x, t) x +Bu +B

(257)
com
A( x, t) =
_
_
M
1
0
(q)C
0
(q, q) 0
I
n
0
_
_
B =
_
_
I
n
0
_
_

= M
1
0
(q)
u = M
1
0
(q)( M
0
(q) q
d
C
0
(q, q) q
d

F
0
( q) G
0
(q)).
Embora a matriz M
0
dependa explicitamente das posi c oes, pode-se consider a-la
como fun c ao do erro de acompanhamento de posi c ao e do tempo JOHANSSON (1990).
Tal arma c ao pode ser visualizada pela seguinte observa c ao: M
0
(q) = M
0
( q +q
d
(t)) =
M
0
( x, t). O mesmo pode ser dito para C
0
. Portanto, a Eq. (257) pode ser considerada
uma representa c ao quase-LPV para o rob o manipulador, ou seja, com A( x, t).
Controle H

nao linear via teoria dos jogos


Em [JOHANSSON (1990)], um controle de movimento otimo com minimiza c ao dos
torques aplicados e um controle adaptativo s ao apresentados. A equa c ao do erro de
acompanhamento do estado, proposta naquele trabalho, e utilizada em [CHEN et al.
(1994)] para resolver o problema de controle H

para um manipulador totalmente


atuado. Uma solu c ao explcita global para este problema, formulado como um jogo
minimax (lder-seguidor), e desenvolvida utilizando teoria din amica dos jogos [BASAR
& BERNHARD (1990); BASAR & OLSDER (1982)]. Baseado nesta teoria, deve-se
resolver uma equa c ao minimax de Bellman-Isaacs, que, ap os algumas modica c oes, e a
equa c ao de Hamilton-Jacobi encontrada em [LU (1996)] para o problema de controle de
realimenta c ao do estado. Utilizando a equa c ao do erro de acompanhamento do estado
e uma escolha apropriada da fun c ao de Lyapunov, a equa c ao minimax de Bellman-
Isaacs e ent ao transformada para uma equa c ao algebrica de Ricatti, cuja solu c ao pode
ser facilmente encontrada a partir de propriedades dos rob os manipuladores. O resul-
120
tado de [CHEN et al. (1994)] e um tipo de lineariza c ao por realimenta c ao de estados
com um termo n ao linear introduzido na acelera c ao de controle. Utilizando a mesma
metodologia, resultados semelhantes podem ser encontrados para o problema de cont-
role misto H
2
/H

n ao linear de rob os manipuladores [CHEN & CHANG (1997)]. Neste


caso, duas equa c oes algebricas de Ricatti s ao derivadas buscando satisfazer ndices de
desempenho H
2
e H

.
Nos trabalhos [CHEN et al. (1994)] e [CHEN & CHANG (1997)], os par ametros
nominais do rob o manipulador s ao assumidos conhecidos, o que muitas vezes n ao se
verica na pr atica. Em [CHEN et al. (1997)], os autores prop oem um algoritmo de con-
trole adaptativo que garante desempenho H

para sistemas rob oticos com par ametros


incertos (ou desconhecidos) e dist urbios externos. Neste caso, os par ametros do manip-
ulador s ao estimados atraves de uma lei de controle que utiliza a matriz de regress ao
resultante de uma parametriza c ao linear. Porem, existem diculdades neste metodo:
os par ametros podem variar rapidamente, o c alculo da matriz de regress ao pode con-
sumir muito tempo e incertezas no modelo n ao s ao consideradas. Para eliminar estas
limita c oes, redes neurais s ao utilizadas para representar a fun c ao descritiva do modelo
em [CHANG & CHEN (1997)]. A atualiza c ao dos par ametros das redes neurais e feita
atraves de um algoritmo adaptativo com desempenho H

. Neste metodo, n ao s ao
necess arios o conhecimento do modelo din amico do rob o manipulador e o c alculo da
matriz de regress ao.
De acordo com [SAGE et al. (1999)], outros trabalhos tratam de H

n ao linear
para rob os manipuladores, embora somente [POSTLETHWAITE & BARTOSZEWICZ
(1998)] possua resultados experimentais utilizando uma metodologia semelhante a [CHEN
et al. (1994)].
Controle H

nao linear via teoria dos jogos


Nesta se c ao, a teoria dos jogos diferenciais ser a utilizada para resolver o problema
de controle H

para rob os manipuladores. Para denirmos este problema, uma tran-


forma c ao de estados e aplicada na Eq. (257), CHEN et al. (1994); JOHANSSON
(1990):
z =
_
_
z
1
z
2
_
_
= T
0
x =
_
_
T
11
T
12
0 I
_
_
_
_

q
q
_
_
(258)
121
sendo T
1
= [T
11
T
12
] com T
11
, T
12
'
nn
matrizes constantes a serem determinadas.
Assume-se que a matriz T
11
e diagonal, ou seja, T
11
= t
11
I
n
. Selecionando a entrada
de controle como
u =
_
M
0
(q) C
0
(q, q)
_
_
_

z
1
z
1
_
_
= M
0
(q)T
1

x +C
0
(q. q)T
1
x, (259)
a equa c ao din amica para o erro de acompanhamento do estado (257) ca

x = A
T
( x, t) x +B
T
( x, t)T
11
(F(x
e
) +) +B
T
( x, t)w (260)
com
A
T
( x, t) = T
1
0
_
_
M
1
0
(q)C
0
(q, q) 0
T
1
11
T
1
11
T
12
_
_
T
0
B
T
( x, t) = T
1
0
_
_
M
1
0
(q)
0
_
_
w = T
11

x
e
=
_
q
T
q
T
(q
d
)
T
( q
d
)
T
( q
d
)
T

e
F(x
e
) = M
0
(q)( q
d
T
1
11
T
12

q) +C
0
(q, q)( q
d
T
1
11
T
12
q) +F
0
( q) +G
0
(q). (261)
A entrada de controle selecionada, u = T
11
(F(x
e
) + ), e um torque aplicado
seletivo, pois afeta somente a energia cinetica. N ao e necess ario otimizar os torques
gravitacionais durante o movimento [JOHANSSON (1990)]. Quando os valores das
matrizes parametricas M
0
(q), C
0
(q, q), F
0
( q) e G
0
(q) s ao conhecidos, podemos calcular
exatamente o termo F(x
e
) e usar a lei de controle, = F(x
e
) +T
1
11
u.
A rela c ao entre os torques aplicados e a entrada de controle tambem pode ser dada
por:
= M
0
(q) q
c
+C
0
(q, q) q +F
0
( q) +G
0
(q) (262)
com
q
c
= q
d
T
1
11
T
12

q T
1
11
M
1
0
(q)
_
C
0
(q, q)B
T
T
0
x u
_
(263)
As equa c oes acima representam uma tipo de lineariza c ao por realimenta c ao de es-
122
tados, gerada a partir da Equa c ao (259), contendo um termo n ao linear na acelera c ao
de controle (263).
Considere que o termo F(x
e
) est a disponvel para o controle. A aplica c ao do con-
trole H

n ao linear requer que os efeitos do dist urbio combinado w no sistema sejam


minimizados pela estrategia de controle. Com esta inten c ao, e sujeito ` a din amica do
erro de acompanhamento, o seguinte criterio de desempenho, incluindo um nvel de
atenua c ao de dist urbio desejado , e proposto:
min
u()L
2
max
0=w()L
2
_

0
_
1
2
x
T
(t)Q x(t) +
1
2
u
T
(t)Ru(t)
_
dt
_

0
_
1
2
w
T
(t)w(t)
_
dt

2
(264)
sendo Q e R matrizes de peso e x(0) = 0 . Este criterio de desempenho e semel-
hante ao apresentado pela Equa c ao (249), sendo que neste caso matrizes de peso s ao
acrescentadas nos estados e na entrada.
De acordo com a teoria dos jogos diferenciais, a solu c ao deste problema minimax
e encontrada se existe uma fun c ao de Lyapunov continuamente diferenci avel V que
satisfaz a seguinte equa c ao minimax de Bellman-Isaac

V ( x, t)
t
= min
u()
max
d()

L( x, u, d) +

V ( x, t)
x

T
x

com condi c ao nal V ( x(), ) = 0 e L( x, u, d) =


1
2
x
T
(t)Q x(t)+
1
2
u
T
(t)Ru(t)
1
2

2
d
T
(t)d(t).
Escolhendo a fun c ao de Lyapunov da forma
V ( x, t) =
1
2
x
T
P( x, t) x
sendo P( x, t) uma matriz simetrica denida positiva para todo t, a equa c ao de Belman-
Isaac fornece a seguinte equa c ao n ao de Riccati com par ametros variantes no tempo:

P( x, t) +P( x, t)A
T
( x, t) +A
T
( x, t)P( x, t) +Q+
P( x, t)B
T
( x, t)
_
R
1

2
I
_
B
T
( x, t)P( x, t) = 0.
(265)
Com uma escolha apropriada da matriz P e sendo a matriz C
0
(q, q)
1
2

M
0
(q, q) anti-
simetrica CHEN et al. (1994), a Eq. (265) pode ser simplicada para uma equa c ao
matricial algebrica. A matriz P escolhida por CHEN et al. (1994); JOHANSSON
123
(1990) e:
P( x, t) = T
T
0
_
_
M
0
( x, t) 0
0 K
_
_
T
0
sendo K uma matriz simetrica denida positiva. A equa c ao algebrica simplicada e
dada por:
_
_
0 K
K 0
_
_
T
T
0
B
_
R
1

2
I
_
B
T
T
0
+Q = 0. (266)
O controle otimo e dado por:
u

= R
1
B
T
T
0
x. (267)
A condi c ao nal e satisfeita para esta escolha de P CHEN et al. (1994). Ent ao,
para solucionar o problema de controle H

, deve-se encontrar matrizes K e T


0
que
satisfa cam a equa c ao algebrica (266). Tais matrizes s ao dadas por:
T
0
=
_
_
R
T
1
Q
1
R
T
1
Q
2
0 I
_
_
e
K =
1
2
_
Q
T
1
Q
2
+Q
T
2
Q
1
_

1
2
_
Q
T
21
+Q
12
_
com as condi c oes: K > 0 e R <
2
I. A matriz R
1
e o resultado da fatora c ao de
Cholesky:
R
T
1
R
1
=
_
R
1

2
I
_
1
e a matriz simetrica denida positiva Q e fatorada como:
Q =
_
_
Q
T
1
Q
1
Q
12
Q
T
12
Q
T
2
Q
2
_
_
.
Controle adaptativo H

nao linear
Os controladores descritos acima assumem que os valores das matrizes M
0
(q),
C
0
(q, q), F
0
( q) e G
0
(q) est ao disponveis para o c alculo do termo F(x
e
), Equa c ao 261.
Porem, em sistemas rob oticos reais incertezas parametricas s ao inevit aveis, o que torna
124
impreciso o valor de F(x
e
). Nesta se c ao, a suposi c ao de parametriza c ao linear de F(x
e
)
ser a utilizada na obten c ao de uma lei de controle adaptativa para estimar os valores dos
par ametros incertos, [CHEN et al. (1997)]. Assim, o termo F(x
e
) pode ser expresso
como sendo:
F(x
e
) = Y (q, q, q
d
T
11
T
12
x
2
, q
d
T
1
11
T
12

x
2
) (268)
sendo Y '
np
uma matriz de fun c oes conhecidas e o par ametro '
p
um vetor de
componentes que dependem do par ametros incertos do manipulador. Nesta se c ao, uma
lei adaptativa de atualiza c ao dos par ametros e proposta, com a inten c ao de aprender o
comportamento dos par ametros incertos
Ent ao, um problema de controle adaptativo H

para sistemas rob oticos pode ser


formulado como segue: dado um nvel de atenua c ao , o problema de controle adapta-
tivo H

tem solu c ao se existir um controlador din amico de realimenta c ao do estado

= (t, x), (269)


= (t,

, x), (270)
tal que a malha fechada satisfa ca o seguinte criterio, para qualquer condi c ao inicial:
_
T
0
_
x
T
Q x +u
T
Ru
_
dt x
T
(0)P
0
x(0)
+

T
(0)S
0

(0) +
2
_
T
0
(w
T
w)dt, (271)
para matrizes Q = Q
T
> 0, R = R
T
, P
0
= P
T
0
> 0, e S
0
= S
T
0
> 0, sendo

=

o
erro de estimativa dos par ametros.
Se escolhermos a fun c ao Lyapunov da forma:
V ( x, t) =
1
2
x
T
P( x, t) x +
1
2

T
S

sendo P( x, t) a solu c ao simetrica denida positiva da equa c ao de Riccati, a solu c ao do


problema de controle adaptativo [CHEN et al. (1997)], para qualquer matriz simetrica
denida positiva S, e dada por:

= S
1
Y
T
T
11
B
T
T
( x, t)P( x, t) x, (272)
125
= Y

T
1
11
R
1
B
T
T
( x, t)P( x, t) x, (273)
Analogamente ` a se c ao anterior, uma solu c ao simplicada pode ser dada para as
equa c oes (272-273) como fun c ao das matrizes solu c oes da equa c ao algebrica (266):

= S
1
Y
T
T
11
B
T
T
0
x, (274)
= Y

T
1
11
R
1
B
T
T
0
x. (275)
Controle adaptativo H

nao linear com redes neurais


Para calcular a matriz de regress ao Y (), o modelo din amico do sistema rob otico
deve represent a-lo perfeitamente. Entretanto, diculdades na modelagem podem in-
troduzir incertezas na parametriza c ao linear utilizada. Alem disso, o procedimento
descrito na se c ao anterior considera que os par ametros din amicos variam lentamente,
o que n ao e v alido para alguns casos, [CHANG & CHEN (1997)].
Nesta se c ao, um conjunto de redes neurais, F(x
e
, ), sendo o vetor contendo
os par ametros ajust aveis da rede, e utilizado para aproximar o termo desconhecido
F(x
e
)
d
. O conjunto de redes e denido por:
F(x
e
, ) =
_

_
F
1
(x
e
,
1
)
.
.
.
F
n
(x
e
,
n
)
_

_
.
As redes neurais F
k
(x
e
,
k
), para k = 1, , n s ao compostas de neur onios n ao
lineares na camada escondida e neur onios lineares nas camadas de entrada e sada. Por
simplicidade, os pesos ajust aveis
k
para k = 1, , n s ao colocados entre as camadas
escondida e de sada. Tais redes neurais s ao da forma:
F
k
(x
e
,
k
) =
p
k

i=1
H
_
_
5n

j=1
w
k
ij
x
ej
+m
k
i
_
_

ki
=
T
k

k
(276)
126
com

k
=
_

k1
.
.
.

kp
k
_

_
e

k
=
_

_
H
_

5n
j=1
w
k
1j
x
ej
+m
k
1
_
.
.
.
H
_

5n
j=1
w
k
p
k
j
x
ej
+m
k
p
k
_
_

_
sendo p
k
o n umero de neur onios nas camadas escondidas. Os pesos w
k
ij
e os limiares
m
k
i
para 1 i p
k
, 1 j 5n s ao constantes denidas pelo projetista e H e a fun c ao
tangente hiperb olica:
H(z) =
e
z
e
z
e
z
+e
z
.
Portanto, o sistema de redes neurais completo pode ser descrito como:
F(x
e
, ) =
_

_
F
1
(x
e
,
1
)
.
.
.
F
n
(x
e
,
n
)
_

_
=
_

T
1

1
.
.
.

T
n

n
_

_
=
_

T
1
0 . . . 0
0
T
2
.
.
. 0
.
.
.
.
.
.
.
.
.
.
.
.
0 0 . . .
T
n
_

_
_

2
.
.
.

n
_

_
= (277)
Dene-se a constante otima de aproxima c ao dos par ametros como:

= arg min

max
xee
|F(x
e
, ) (F(x
e
)
d
)|
2
(278)
sendo |x|
2
=

x
T
x. Aqui a rede neural parametrizada linearmente e utilizada para a
aproxima c ao da din amica desconhecida. E utilizando-se o algoritmo adaptativo n ao e
necess ario o conhecimento da equa c ao explcita de

para seu c alculo.


Se escolhermos da seguinte forma:
= F(x
e
, ) +u
127
sendo u a entrada de controle, a equa c ao do erro de acompanhamento, (260), ca:

x = A
T
( x, t) x +B
T
( x, t)T
11
(F(x
e
, ) F(x
e
,

) +F(x
e
,

) F(x
e
) +
d
+u)
= A
T
( x, t) x +B
T
( x, t)T
11
(F(x
e
, ) F(x
e
,

) +u) B
T
( x, t)w (279)
sendo
w = T
11
(F(x
e
,

) F(x
e
) +
d
).
Tendo em vista que o erro de aproxima c ao w n ao e conhecido exatamente, n ao e
possvel uma estrategia de controle que ir a anular completamente esse efeito. Com a
introdu c ao de um criterio de performance neural adaptativo H

e esperado que esse


erro se torne o menor possvel ou pelo menos dentro de um nvel de atenua c ao pre
estabelecido.
O problema de rastreamento adaptativo H

baseado em redes neurais pode ser


resolvido se, para uma dada trajet oria de referencia desejada q
d
(t) e um nvel prescrito
de atenua c ao de dist urbio > 0, existir um controlador din amico via realimenta c ao do
estado da seguinte forma:

= (t, x), (280)


= F(x
e
, ) +u(t, x), (281)
tal que o sistema em malha fechada satisfa ca as seguintes exigencias para qualquer
condi c ao inicial CHANG & CHEN (1997):
1) Limites: Se o erro de aproxima c ao tiver energia nita, isto e, w L
2
[0, t] para
todo t 0, ent ao todas as vari aveis x(t), (t), e (t) s ao limitadas.
2) Atenua c ao: Para qualquer condi c ao inicial, o seguinte ndice quadr atico e
alcan cado:
_
T
0
_
x
T
Q x +u
T
Ru
_
dt x
T
(0)P
0
x(0)
+

T
(0)Z
0

(0) +
2
_
T
0
(w
T
w)dt, (282)
sendo Q = Q
T
> 0, P
0
= P
T
0
> 0, Z
0
= Z
T
0
> 0 e

=

o erro de estimativa do
par ametro neural.
128
Se escolhermos a fun c ao de Lyapunov da forma:
V ( x, t) =
1
2
x
T
P( x, t) x +
1
2

T
Z

sendo P( x, t) a matriz solu c ao, simetrica denida positiva da equa c ao de Riccati, ent ao
a lei de controle adaptativa se torna:

= Z
1

T
T
11
B
T
T
( x, t)P( x, t) x, (283)
= T
1
11
R
1
B
T
T
( x, t)P( x, t) x, (284)
para qualquer matriz simetrica denida positiva Z. As equa c oes acima s ao a solu c ao
do problema de rastreamento adaptativo H

baseado em redes neurais [CHANG &


CHEN (1997)].
A solu c ao simplicada ca:

= Z
T

T
T
11
B
T
T
0
x (285)
= T
1
11
R
1
B
T
T
0
x. (286)
Resultados
Com o objetivo de validar as tecnicas apresentadas acima, experimentos foram
realizados utilizando-se o manipulador subatuado UArm II.
Para esta congura c ao, seis tipos de controles foram projetados: quase-LPV via
realimenta c ao do estado, quase-LPV via realimenta c ao da sada, H

n ao linear, misto
H
2
/H

n ao linear, adaptativo H

n ao linear e adaptativo H

n ao linear com redes


neurais. Sendo que os resultados simulados s ao praticamente iguais para todos os
controles, somente resultados experimentais s ao apresentados nesta se c ao.
O experimento foi realizado para posi c ao inicial q(0) = [0

]
T
e posi c ao nal
desejada q(T
aaa
) = [20

30

30

]
T
, sendo que o vetor T
AAA
= [4.0 4.0 4.0]s contem
os tempos de dura c ao da trajet oria de referencia para cada junta. Este vetor e ade-
quadamente escolhido levando em conta a diferen ca entre a posi c ao inicial e a posi c ao
nal de cada junta. A trajet oria de referencia, q
d
, e um polin omio de quinto grau.
129
Para vericar a robustez dos controladores na presen ca de dist urbios externos, um
dist urbio no torque w do tipo sen oide amortecida, iniciando em t = 1.5 s, foi intro-
duzido nas juntas. Os dist urbios s ao dados por:
w =
_

_
1.5e
2t
sin(2t)
0.5e
2t
sin(2t)
0.25e
2t
sin(2t)
_

_
.
A Figure 37 mostra os dist urbios utilizados. Os valores m aximos destes dist urbios
representam aproximadamente 50 % dos valores m aximos dos torques observados nos
experimentos sem a introdu c ao deste dist urbio.
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
0.03
0.02
0.01
0
0.01
0.02
0.03
0.04
0.05
0.06
Tempo (s)
D
i
s
t
u
r
b
i
o

(
N
.
m
)
Figura 37: Dist urbio, congura c ao AAA.
Controle quase-LPV via realimenta cao do estado
Para aplicar o algoritmo quase-LPV, o sistema de controle do rob o manipulador
deve ser representado pela Equa c ao (254). Portanto, escolhe-se como par ametros os
estados representando os erros de posi c ao das juntas 2 e 3, ou seja, m = 2 e
( x) =
_
q
2
q
3
_
T
sendo q
2
e q
3
os erros de posi c ao das juntas 2 e 3, respectivamente. Esta escolha e
baseada no fato que a matriz de inercia, M(q), e a matriz de Coriolis, C(q, q), s ao
fun c oes da posi c ao das juntas 2 e 3, e como visto anteriormente, s ao dependentes do
130
erro de posi c ao destas juntas. A matriz C(q, q) tambem dependente das velocidades
angulares das juntas 1, 2 e 3. Entretanto, uma escolha de que tambem considere os
erros de velocidade das juntas, ou seja, contendo 5 elementos, faz com que n umero
de desigualdades matriciais a serem resolvidas cres ca absurdamente.
Consideram-se como sadas do sistema, z
1
e z
2
, os erros de posi c ao e velocidade
representados pelo estado e a vari avel de controle u, respectivamente. Portanto o
sistema pode ser descrito pela Equa c ao (254) com:
A((x)) = A(( x))
B
1
((x)) = B
B
2
((x)) = B
C
1
((x)) = I
6
C
2
((x)) = 0
sendo as matrizes A(( x)) e B obtidas da Equa c ao (257).
Os possveis valores para os par ametros est ao contidos no conjunto compacto, P,
denido por [30, 30]

[30, 30]

. A taxa de varia c ao dos par ametros e limi-


tada por [ [ 50

/s. Como foi visto anteriormente, uma alternativa para a escolha


das fun c oes utilizadas como base para X(), consiste em utilizar fun c oes contidas nas
matrizes de estado. A fun c ao trigonometrica cosseno est a presente nas matrizes M(q)
e C(q, q) que comp oem a matriz de estado A, e portanto, as fun c oes escolhidas foram:
f
1
(( x)) = 1
f
2
(( x)) = cos( q
2
)
f
3
(( x)) = cos( q
3
).
O espa co dos par ametros foi dividido em 5 pontos (L = 5). Cada um dos 25 sistemas
lineares, L
m
, gerados pela combina c ao dos par ametros fornece 5 DMLs, 1 + 2
m
. Ou
seja, 125 DMLs devem ser resolvidas simultaneamente para as vari aveis X
i
(veja Se c ao
??). Para resolver este problema foi utilizado o toolbox LMI do MatLab
c _
[GAHINET
et al. (1995)]. O valor de atenua c ao mnimo encontrado foi = 1.2.
Inicialmente, considera-se o manipulador livre das inuencias de dist urbios externos.
Os resultados experimentais: posi c ao angular, velocidade angular e torque aplicado, s ao
131
mostrados nas Figuras 38, 39 e 40, respectivamente.
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
40
30
20
10
0
10
20
30
40
Tempo (s)
P
o
s
i

o

a
n
g
u
l
a
r

(
g
r
a
u
s
)
Junta 1
Junta 2
Junta 3
Figura 38: Posi c ao angular das juntas, congura c ao AAA, sem dist urbio, controle
quase-LPV via realimenta c ao do estado.
O controle quase-LPV apresentou bom desempenho, alcan cando a posi c ao nal
desejada no tempo pre-estabelecido e acompanhando a trajet oria desejada. Nota-se
que as curvas de posi c ao angular e velocidade angular apresentam um comportamento
suave ao longo da trajet oria, sendo esta uma caracterstica desejada. Entretanto, as
curvas de torque apresentam oscila c oes, principalmente na parte nal da trajet oria, o
que pode comprometer a integridade dos atuadores quando estes forem acionados por
um longo perodo.
Os resultados experimentais com a aplica c ao do dist urbio e considerando as mesmas
condi c oes anteriores, s ao mostrados nas Figuras 41 a 43.
Verica-se, a partir dos gr acos obtidos, que o controlador projetado utilizando uma
representa c ao quase-LPV para o rob o experimental UArm II apresentou bom desem-
penho, mesmo na presen ca de dist urbios externos nos torques. Nota-se o aparecimento
de oscila c oes nos gr acos de posi c ao e velocidade. Ap os a introdu c ao dos dist urbios,
houve um aumento dos valores dos torques (em compara c ao com a Figura 40) visando
atenuar os efeitos destes dist urbios.
132
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
60
40
20
0
20
40
60
Tempo (s)
V
e
l
o
c
i
d
a
d
e

a
n
g
u
l
a
r

(
g
r
a
u
s
/
s
)
Junta 1
Junta 2
Junta 3
Figura 39: Velocidade angular das juntas, congura c ao AAA, sem dist urbio, controle
quase-LPV via realimenta c ao do estado.
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
0.12
0.1
0.08
0.06
0.04
0.02
0
0.02
0.04
0.06
0.08
Tempo (s)
T
o
r
q
u
e

(
N
.
m
)
Junta 1
Junta 2
Junta 3
Figura 40: Torque aplicado, congura c ao AAA, sem dist urbio, controle quase-LPV via
realimenta c ao do estado.
133
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
40
30
20
10
0
10
20
30
40
Tempo (s)
P
o
s
i

o

a
n
g
u
l
a
r

(
g
r
a
u
s
)
Junta 1
Junta 2
Junta 3
Figura 41: Posi c ao angular das juntas, congura c ao AAA, com dist urbio, controle
quase-LPV via realimenta c ao do estado.
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
60
40
20
0
20
40
60
Tempo (s)
V
e
l
o
c
i
d
a
d
e

a
n
g
u
l
a
r

(
g
r
a
u
s
/
s
)
Junta 1
Junta 2
Junta 3
Figura 42: Velocidade angular das juntas, congura c ao AAA, com dist urbio, controle
quase-LPV via realimenta c ao do estado.
134
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
0.1
0.05
0
0.05
0.1
Tempo (s)
T
o
r
q
u
e

(
N
.
m
)
Junta 1
Junta 2
Junta 3
Figura 43: Torque aplicado, congura c ao AAA, com dist urbio, controle quase-LPV via
realimenta c ao do estado.
Controle H

nao linear via teoria dos jogos


Quando aplicada a metodologia de projeto do controle H

n ao linear via teoria dos


jogos para rob os manipuladores, o nvel de atenua c ao encontrado para o caso totalmente
atuado foi = 3.0. As matrizes de peso utilizadas foram:
Q
1
= I
3
, Q
2
= 2I
3
, Q
12
= 0 e R = 5I
3
,
sendo I
k
uma matriz identidade de ordem k. Aplicando o algoritmo de projeto, veri-
cando que todas as condi c oes s ao satisfeitas, obtem-se:
T
0
=
_

_
3.35 0 0 6.71 0 0
0 3.35 0 0 6.71 0
0 0 3.35 0 0 6.17
0 0 0 1 0 0
0 0 0 0 1 0
0 0 0 0 0 1
_

_
.
135
Esta metodologia tambem foi aplicada no rob o manipulador UArm II. Os par ametros
do manipulador, as posi c oes iniciais e nais s ao os mesmos utilizados nas se c oes ante-
riores. Os dist urbios externos n ao foram introduzidos neste primeiro experimento. Os
resultados experimentais: posi c ao angular, velocidade angular e torque aplicado, s ao
mostrados nas Figuras 44, 45 e 46, respectivamente.
O controlador H

n ao linear via teoria dos jogos tambem apresentou bom de-


sempenho. Os resultados s ao semelhantes aos apresentados pelo controle LPV via
realimenta c ao da sada.
Os resultados experimentais com a aplica c ao do dist urbio e considerando as mesmas
condi c oes anteriores, s ao mostrados nas Figuras 47 a 49, respectivamente.
Embora o desempenho do sistema tenha sido afetado pela introdu c ao dos dist urbios,
verica-se que as juntas alcan caram a posi c ao nal desejada no tempo pre-estabelecido.
Controle adaptativo H

nao linear
Para o controle adaptativo H

n ao linear, os par ametros podem ser denidos


por qualquer combina c ao dos par ametros din amicos (massa, momento de inercia, etc.)
para obter a parametriza c ao linear de F(x
e
),dada por Y . Neste trabalho os par ametros
usados s ao:

1
= m
1
lc
2
1
= m
2
lc
2
2

2
= m
2
l
2
1

3
= m
2
l
1
lc
2

4
= m
3
l
2
1
= m
3
l
2
2
= m
3
l
1
l
2

5
= m
3
lc
2
3

6
= m
3
l
1
lc
3
= m
3
l
2
lc
3

7
= I
1
= I
2

8
= I
3

9
= f
1

10
= f
2

11
= f
3
O nvel de atenua c ao e as matrizes de peso s ao os mesmos utilizados no controle
136
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
40
30
20
10
0
10
20
30
40
Tempo (s)
P
o
s
i

o

a
n
g
u
l
a
r

(
g
r
a
u
s
)
Junta 1
Junta 2
Junta 3
Figura 44: Posi c ao angular das juntas, congura c ao AAA, sem dist urbio, controle H

n ao linear via teoria dos jogos .


0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
60
40
20
0
20
40
60
Tempo (s)
V
e
l
o
c
i
d
a
d
e

a
n
g
u
l
a
r

(
g
r
a
u
s
/
s
)
Junta 1
Junta 2
Junta 3
Figura 45: Velocidade angular das juntas, congura c ao AAA, sem dist urbio, controle
H

n ao linear via teoria dos jogos.


137
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
0.12
0.1
0.08
0.06
0.04
0.02
0
0.02
0.04
0.06
0.08
Tempo (s)
T
o
r
q
u
e

(
N
.
m
)
Junta 1
Junta 2
Junta 3
Figura 46: Torque aplicado, congura c ao AAA, sem dist urbio, controle H

n ao linear
via teoria dos jogos.
n ao linear, Se c ao IX, ou seja, = 3.0 e Q
1
= I
3
, Q
2
= 2I
3
, Q
12
= 0 e R = 5I
3
.
As Figuras 50 a 52 mostram os resultados experimentais para o controle adaptativo
H

n ao-linear, considerando S = 10I


11
e os valores iniciais de como mostrados na
tabela 2. O valores nais de tambem est ao sendo mostrados na mesma tabela.
Os resultados experimentais com a aplica c ao do dist urbio e considerando as mesmas
condi c oes anteriores, s ao mostrados nas Figuras 53 a 55.
Controle adaptativo H

nao linear com redes neurais


Para o calculo da rede neural F
k
(x
e
,
k
) no controle adaptativo H

com redes
neurais, denimos as seguinte vari aveis auxiliares:
xx = q
1
+q
2
+q
3
+ q
1
+ q
2
+ q
3
q
d
1
q
d
2
q
d
3
q
d
1
q
d
2
q
d
3
Ent ao podemos calcular a matriz como sendo:
138
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
40
30
20
10
0
10
20
30
40
Tempo (s)
P
o
s
i

o

a
n
g
u
l
a
r

(
g
r
a
u
s
)
Junta 1
Junta 2
Junta 3
Figura 47: Posi c ao angular das juntas, congura c ao AAA, com dist urbio, controle H

n ao linear via teoria dos jogos.


0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
60
40
20
0
20
40
60
Tempo (s)
V
e
l
o
c
i
d
a
d
e

a
n
g
u
l
a
r

(
g
r
a
u
s
/
s
)
Junta 1
Junta 2
Junta 3
Figura 48: Velocidade angular das juntas, congura c ao AAA, com dist urbio, controle
H

n ao linear via teoria dos jogos.


139
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
0.1
0.08
0.06
0.04
0.02
0
0.02
0.04
0.06
0.08
0.1
Tempo (s)
T
o
r
q
u
e

(
N
.
m
)
Junta 1
Junta 2
Junta 3
Figura 49: Torque aplicado, congura c ao AAA, com dist urbio, controle via H

n ao
linear via teoria dos jogos.
=
_

T
1
0 0
0
T
2
0
0 0
T
3
_

_
com

1
= [
11
, ,
17
]
T
,

2
= [
21
, ,
27
]
T
,

3
= [
31
, ,
37
]
T
e

11
=
21
=
31
=
e
xx3
e
xx+3
e
xx3
+e
xx+3

12
=
22
=
32
=
e
xx2
e
xx+2
e
xx2
+e
xx+2

13
=
23
=
33
=
e
xx1
e
xx+1
e
xx1
+e
xx+1

14
=
24
=
34
=
e
xx
e
xx
e
xx
+e
xx

15
=
25
=
35
=
e
xx+1
e
xx1
e
xx+1
+e
xx1

16
=
26
=
36
=
e
xx+2
e
xx2
e
xx+2
+e
xx2

17
=
27
=
37
=
e
xx+3
e
xx3
e
xx+3
+e
xx3
Note que, com essa deni c ao, foram escolhidas 7 camadas escondidas para a rede
140
(initial) (final)

1
= 0.0078
1
= 0.0140

2
= 0.0350
2
= 0.0378

3
= 0.0166
3
= 0.0152

4
= 0.0258
4
= 0.0306

5
= 0.0037
5
= 0.0149

6
= 0.0098
6
= 0.0195

7
= 0.0075
7
= 0.0137

8
= 0.0060
8
= 0.0172

9
= 0.3500
9
= 0.3429

10
= 0.2500
10
= 0.2338

11
= 0.2000
11
= 0.1930
Tabela 2: Valores iniciais e nais de .
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
40
30
20
10
0
10
20
30
40
Tempo (s)
P
o
s
i

o

a
n
g
u
l
a
r

(
g
r
a
u
s
)
Junta 1
Junta 2
Junta 3
Figura 50: Posi c ao das juntas, congura c ao AAA, sem dist urbio, controle adaptativo
H

n ao linear.
141
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
60
40
20
0
20
40
60
Tempo (s)
V
e
l
o
c
i
d
a
d
e

a
n
g
u
l
a
r

(
g
r
a
u
s
/
s
)
Junta 1
Junta 2
Junta 3
Figura 51: Velocidade angular das juntas, congura c ao AAA, sem dist urbio, controle
adaptativo H

n ao linear.
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
0.12
0.1
0.08
0.06
0.04
0.02
0
0.02
0.04
0.06
0.08
Tempo (s)
T
o
r
q
u
e

(
N
.
m
)
Junta 1
Junta 2
Junta 3
Figura 52: Torque, congura c ao AAA, sem dist urbio, controle adaptativo H

n ao
linear.
142
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
40
30
20
10
0
10
20
30
40
Tempo (s)
P
o
s
i

o

a
n
g
u
l
a
r

(
g
r
a
u
s
)
Junta 1
Junta 2
Junta 3
Figura 53: Posi c ao das juntas, congura c ao AAA, com dist urbio, controle adaptativo
H

n ao linear.
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
60
40
20
0
20
40
60
Tempo (s)
V
e
l
o
c
i
d
a
d
e

a
n
g
u
l
a
r

(
g
r
a
u
s
/
s
)
Junta 1
Junta 2
Junta 3
Figura 54: Velocidade angular das juntas, congura c ao AAA, com dist urbio, controle
adaptativo H

n ao linear .
143
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
0.12
0.1
0.08
0.06
0.04
0.02
0
0.02
0.04
0.06
0.08
Tempo (s)
T
o
r
q
u
e

(
N
.
m
)
Junta 1
Junta 2
Junta 3
Figura 55: Torque, congura c ao AAA, com dist urbio, controle adaptativo H

n ao
linear.
neural com os pesos w
k
ij
assumindo os valores 1 ou 1 e os limiares m
i
os valores 3,
2, 1, 0, 1, 2, 3. Os par ametros da rede s ao:
=
_

3
_

_
com

1
= [
11

12

13

14

15

16

17
]
T

2
= [
21

22

23

24

25

26

27
]
T

3
= [
31

32

33

34

35

36

37
]
T
O nvel de atenua c ao e as matrizes de peso s ao os mesmos utilizados no controle
n ao linear, Se c ao IX, ou seja, = 3.0 e Q
1
= I
3
, Q
2
= 2I
3
, Q
12
= 0 e R = 5I
3
.
Os resultados para o controle adaptativo H

com redes neurais, com Z = 10I


21
e
(0) = [0 0]
T
211
, s ao mostrados nas guras 56 a 58.
Os resultados experimentais com a aplica c ao do dist urbio s ao mostrados nas Figuras
59 a 61. Quanto ` a rejei c ao a dist urbios externos, notamos que o controle adaptativo
H

n ao linear com redes neurais obteve o melhor resultado, saindo muito pouco da
trajet oria desejada.
144
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
40
30
20
10
0
10
20
30
40
Tempo (s)
P
o
s
i

o

a
n
g
u
l
a
r

(
g
r
a
u
s
)
Junta 1
Junta 2
Junta 3
Figura 56: Posi c ao das juntas, congura c ao AAA, sem dist urbio, controle adaptativo
H

n ao linear com redes neurais.


Nota-se que os efeitos das incertezas parametricas presentes no rob o experimental
UArm II, foram absorvidos pelos controladores projetados. Os testes com introdu c ao
de dist urbio demonstram a robustez destes controladores em rela c ao aos dist urbios
externos.
145
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
60
40
20
0
20
40
60
Tempo (s)
V
e
l
o
c
i
d
a
d
e

a
n
g
u
l
a
r

(
g
r
a
u
s
/
s
)
Junta 1
Junta 2
Junta 3
Figura 57: Velocidade angular das juntas, congura c ao AAA, sem dist urbio, controle
adaptativo H

n ao linear com redes neurais.


0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
0.15
0.1
0.05
0
0.05
0.1
Tempo (s)
T
o
r
q
u
e

(
N
.
m
)
Junta 1
Junta 2
Junta 3
Figura 58: Torque, congura c ao AAA, sem dist urbio, controle adaptativo H

n ao
linear com redes neurais.
146
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
40
30
20
10
0
10
20
30
40
Tempo (s)
P
o
s
i

o

a
n
g
u
l
a
r

(
g
r
a
u
s
)
Junta 1
Junta 2
Junta 3
Figura 59: Posi c ao das juntas, congura c ao AAA, com dist urbio, controle adaptativo
H

n ao linear com redes neurais.


0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
50
40
30
20
10
0
10
20
30
40
50
Tempo (s)
V
e
l
o
c
i
d
a
d
e

a
n
g
u
l
a
r

(
g
r
a
u
s
/
s
)
Junta 1
Junta 2
Junta 3
Figura 60: Velocidade angular das juntas, congura c ao AAA, com dist urbio, controle
adaptativo H

n ao linear com redes neurais.


147
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
0.15
0.1
0.05
0
0.05
0.1
Tempo (s)
T
o
r
q
u
e

(
N
.
m
)
Junta 1
Junta 2
Junta 3
Figura 61: Torque, congura c ao AAA, com dist urbio, controle adaptativo H

n ao
linear com redes neurais.
Parte X
Manipuladores Subatuados
148
149
Introdu cao
Recentemente, pesquisadores tem voltado sua aten c ao para os chamados sistemas
subatuados. Alguns exemplos de sistemas subatuados s ao rob os manipuladores com
juntas falhas; rob os espaciais utuantes livres, onde a base pode ser considerada como
um ligamento passivo no espa co inercial; pernas rob oticas com juntas passivas; rob os
hiper-redundantes (em forma de cobra) com juntas passivas, etc.
Manipuladores subatuados diferem dos totalmente atuados pois s ao equipados com
um n umero de atuadores que e sempre menor que o n umero de graus de liberdade
(GDL). Portanto, nem todos os GDL podem ser controlados ativamente ao mesmo
tempo. Por exemplo, considere um manipulador planar de 3 juntas equipado com dois
atuadores, ou seja, duas juntas ativas e uma passiva, gura 62. Neste caso, pode-se con-
trolar ao mesmo tempo duas das juntas, mas n ao todas. Para controlar todas as juntas
de um manipulador subatuado, deve-se usar um controle sequencial. Este princpio foi
provado pela primeira vez por [ARAI & TACHI (1991)] usando argumentos din amicos
linearizados, e e a base para a modelagem no espa co das juntas e no espa co Cartesiano.
Devido ao fato de que no m aximo n
a
coordenadas generalizadas ( angulos das juntas ou
vari aveis cartesianas) podem ser controladas num dado instante, o vetor de coordenadas
generalizadas e dividido em duas partes, representando as coordenadas generalizadas
ativas e as coordenadas generalizadas passivas. Uma equa c ao diferencial de segunda
ordem relaciona as acelera c oes das coordenadas generalizadas ativa e passiva, e ser a
explicitada conforme os modelos din amicos forem desenvolvidos.
Modelo dinamico de manipuladores subatuados
As equa c oes din amicas de um manipulador totalmente atuado pode ser apresentada
da seguinte forma:
= M(q) q +b(q, q)
Para distinguir entre os movimentos e torques das juntas passivas e ativas, divide-se
150
Figura 62: Representa c ao gr aca de um manipulador subatuado
essa equa c ao em:
_
_

a

p
_
_
=
_
_
M
aa
M
ap
M
pa
M
pp
_
_
_
_
q
a
q
p
_
_
+
_
_
b
a
b
p
_
_
(287)
sendo os ndices a e p valores relativos ` as juntas ativas e passivas, respectivamente.
A unica diferen ca entre este manipulador e um estruturalmente identico, totalmente
atuado, e que os elementos de
p
correspondentes aos torques das juntas passivas n ao
podem ser diretamente controlados. De fato, estes elementos podem assumir apenas os
valores 0 ou
l,i
, sendo
l,i
o torque de freio nominal da i-esima junta, assumido como
sendo exatamente o torque necess ario para manter a junta passiva i travada apesar do
movimento de todas as outras juntas. Para se distinguir as juntas passivas que est ao
travadas ou destravadas em um certo instante, divide-se a equa c ao (287) em:
_

l
_

_
=
_

_
M
aa
M
au
M
al
M
ua
M
uu
M
ul
M
la
M
lu
M
ll
_

_
_

_
q
a
q
u
q
l
_

_
+
_

_
b
a
b
u
b
l
_

_
(288)
sendo
u
= 0, porque nenhum torque e aplicado nas juntas passivas destravadas, e q
l
= 0
, porque as juntas passivas travadas n ao se movem quando seus freios est ao ativados.
Os torques nas juntas travadas
l
compensam os torques inerciais e n ao-inerciais no
151
lado direito da terceira linha da equa c ao din amica (288). Portanto, esta linha pode ser
eliminada da equa c ao.
Uma importante equa c ao a ser considerada e a segunda linha de (288):
M
ua
q
a
+M
uu
q
u
+b
u
= 0. (289)
Esta equa c ao diferencial de segunda ordem representa as restri c oes impostas ao
sistema pelas juntas passivas destravadas.

E uma restri c ao n ao holon omica que, em
geral, n ao pode ser integrada para obter a rela c ao entre as velocidades e posi c oes das
juntas ativas e passivas [ORIOLO & NAKAMURA (1991)].
No m aximo, n
a
juntas podem ser controladas em um dado instante. Estas jun-
tas podem ser as ativas, um subconjunto de n
a
passivas (quando n
p
n
a
), ou uma
combina c ao de algumas juntas ativas e passivas. Para o prop osito de controle, e util
reescrever a equa c ao din amica (288) numa forma onde se pode distinguir as juntas que
est ao sendo controladas das restantes.
As juntas controladas num dado instante ser ao agrupadas em um vetor q
c
, n
a
1.
As posi c oes das juntas em q
c
s ao controladas ao custo de todas as outras juntas n ao
serem controladas diretamente. As juntas restantes s ao agrupadas em um vetor q
r
.
As juntas passivas travadas q
l
n ao s ao includas no vetor q
r
porque n ao contribuem
no movimento do sistema. Portanto, a dimens ao de q
r
e, no m aximo, igual a n
p
. A
equa c ao din amica do manipulador subatuado pode ser reescrita em termos de q
c
e q
r
como:
_
_

a
0
_
_
=
_
_
M
ac
M
ar
M
uc
M
ur
_
_
_
_
q
c
q
r
_
_
+
_
_
b
a
b
u
_
_
(290)
e as restri c oes n ao holon omicas como:
M
uc
q
c
+M
ur
q
r
+b
u
= 0. (291)
Considerando a equa c ao 290, existem tres maneiras possveis de compor o vetor q
c
(n
a
1), cada uma levando a uma estrategia de controle diferente para o manipulador
subatuado. Primeiro, q
c
pode conter apenas as juntas ativas. Quando este e o caso,
escolhe-se manter todas as outras juntas (i.e., as juntas passivas) travadas. Esta escolha
152
nos permite controlar as juntas ativas como se o manipulador fosse totalmente atuado.
Segundo, q
c
pode conter apenas as juntas passivas (que s o e possvel quando o n umero
de juntas passivas e pelo menos igual a n
a
). Neste caso, escolhe-se manter todas as
outras juntas passivas, se existir mais alguma, travadas enquanto q
c
e controlado. Esta
escolha garante que as juntas passivas que n ao est ao sendo controladas n ao se movam e
n ao introduzam dist urbios din amicos nas juntas que est ao sendo controladas. Terceiro,
o vetor q
c
pode conter tanto as juntas ativas quanto as passivas. Neste caso, tambem,
pode-se manter todas as outras juntas passivas, se existir mais alguma, travadas, para
garantir que elas n ao se movam.
Referir-se- a ao primeiro caso como estrategia de controle A, porque apenas as juntas
ativas est ao sendo controladas. Neste caso, q
c
= q
a
, a dimens ao de q
r
e zero, e a equa c ao
din amica (288) se reduz a:

a
= M
aa
q
a
+b
a
. (292)
Durante um movimento A, movimento do manipulador subatuado no espa co das
juntas quando a estrategia A e executada, as restri c oes n ao holon omicas desaparecem
porque a dimens ao de q
u
e zero.
O segundo caso e denominado uma estrategia de controle P, porque apenas as juntas
passivas est ao sendo controladas. Neste caso q
c
= q
u
, q
r
= q
a
, e a equa c ao din amica
(290) pode ser escrita como:
_
_

a
0
_
_
=
_
_
M
au
M
aa
M
uu
M
ua
_
_
_
_
q
u
q
a
_
_
+
_
_
b
a
b
u
_
_
. (293)
Quando a estrategia de controle P e utilizada, diz-se que o manipulador realiza
um movimento P. Durante um movimento P as restri c oes n ao holon omicas ditam o
comportamento do movimento das juntas ativas.
Isolando q
a
na segunda linha da eq. (293) temos:
q
a
= M
1
ua
(M
uu
q
u
+b
u
) (294)
substituindo esse resultado de volta na primeira linha, obtem-se a rela c ao de malha
153
Figura 63: Diagrama do metodo de controle sequencial
aberta entre q
u
e
a
:

a
= (M
au
M
aa
M
1
ua
M
uu
) q
u
M
aa
M
1
ua
b
u
+b
a
. (295)
As equa c oes (294) e (295) requerem a invers ao da matriz M
ua
. Neste ponto faremos
uma simplica c ao e assumiremos que as dimens oes de q
u
e q
a
s ao iguais, isto e, que a
matriz M
ua
e quadrada. Posteriormente, na se c ao sobre controle otimo local, discutire-
mos o caso em que essa matriz n ao e quadrada e desse modo precisamos calcular a sua
pseudoinversa e desse modo as equa c oes (294) e (295) sofrem algumas altera c oes.
O terceiro caso e denominado de estrategia de controle AP (movimento AP), porque
tanto as juntas ativas quanto as passivas est ao sendo controladas. O vetor q
c
conter a
todos os elementos de q
u
e alguns elementos de q
a
, enquanto q
r
conter a os elementos
restantes de q
a
que n ao est ao em q
c
. Uma rela c ao de malha aberta similar a (295) pode
ser obtida neste caso como:

a
= (M
ac
M
ar
M
1
ur
M
uc
) q
c
M
ar
M
1
ur
b
u
+b
a
. (296)
Com esta organiza c ao das possveis estrategias de controle de manipuladores sub-
atuados, um metodo de controle seq uencial pode ser descrito da seguinte maneira:
primeiro, um movimento P ou AP e executado de maneira que todas as juntas passivas
(e talvez algumas juntas ativas, quando n
a
> n
p
) s ao controladas ate suas posi c oes
nais desejadas. Ent ao, um movimento A e executado para trazer as juntas ativas
remanescentes para as posi c oes desejadas, gura 63. Assim, manipuladores subatuados
com mais juntas ativas que passivas podem ser controlados a um ponto de equilbrio
em duas etapas de duas maneiras distintas, P-A ou AP-A, desde que, e claro, as juntas
passivas sejam control aveis via seu acoplamento din amico com as juntas ativas.
154
Todas as tres estrategias de controle acima levam a rela c oes de malha aberta entre
q
c
e
a
na forma:

a
= M
ac
q
c
+b
a
. (297)
A tabela abaixo mostra as express oes de M
ac
e b
a
para as tres estrategias de controle.
Tabela 3: M
ac
e b
a
para as estrategias de controle.
Estrategia de controle M
ac
b
a
A M
aa
b
a
P M
au
M
aa
M
1
ua
M
uu
M
aa
M
1
ua
b
u
+b
a
AP M
ac
M
ar
M
1
ur
M
uc
M
ar
M
1
ur
b
u
+b
a
Representa cao quase-LPV para manipuladores subatuados
A Equa c ao (255) pode ser particionada como:
_
_

a
0
_
_
+
_
_

a
(q, q, q,
d
)

u
(q, q, q,
d
)
_
_
=
_
_
M
ar
(q) M
ac
(q)
M
ur
(q) M
uc
(q)
_
_
_
_
q
r
q
c
_
_
+
_
_
C
ar
(q, q) C
ac
(q, q)
C
ur
(q, q) C
uc
(q, q)
_
_
_
_
q
r
q
c
_
_
+
_
_
F
a
( q)
F
u
( q)
_
_
+
_
_
G
a
(q)
G
u
(q)
_
_
(298)
na qual os ndices a e u representam as juntas ativas e passivas livres (freios n ao aciona-
dos), respectivamente. Isolando o vetor q
r
na segunda linha de (298) e substituindo na
primeira linha, obtem-se:

a
+(q, q, q,
d
) = M
0
(q) q
c
+C
0
(q, q) q
c
+D
0
(q, q) q
r
+F
0
(q, q) +G
0
(q) (299)
com
M
0
(q) = M
ac
(q) M
ar
(q)M
1
ur
(q)M
uc
(q)
C
0
(q, q) = C
ac
(q, q) M
ar
(q)M
1
ur
(q)C
uc
(q, q)
D
0
(q, q) = C
ar
(q, q) M
ar
(q)M
1
ur
(q)C
ur
(q, q)
F
0
(q, q) = F
a
( q) M
ar
(q)M
1
ur
(q)F
u
( q)
G
0
(q) = G
a
(q) M
ar
(q)M
1
ur
(q)G
u
(q)
(q, q, q,
d
) =
a
(q, q, q,
d
) M
ar
(q)M
1
ur
(q)
u
(q, q, q,
d
).
155
Notando-se a similaridade entre as equa c oes (299) e (255), a menos do termo
D
0
(q, q) q
r
, o desenvolvimento de uma representa c ao em espa cos de estados para o
manipulador subatuado e feito naturalmente. Dene-se o erro de acompanhamento
como:
x
c
=
_
_
q
c
q
d
c
q
c
q
d
c
_
_
=
_
_

q
c
q
c
_
_
.
Portanto, uma representa c ao quase-LPV do manipulador subatuado pode ser dada
por:

x
c
= A(q, q) x
c
+Bu +Bw (300)
com
A(q, q) =
_
_
M
1
0
(q)C
0
(q, q) 0
I
na
0
_
_
B =
_
_
I
na
0
_
_
w = M
1
0
(q)(q, q, q,
d
)
u = M
1
0
(q)(
a
M
0
(q) q
d
c
C
0
(q, q) q
d
c
D
0
(q, q) q
r
F
0
(q, q) G
0
(q)).
Pela equa c ao acima, o torque aplicado nas juntas ativas pode ser dado por:

a
= M
0
(q)( q
d
c
+u) +C
0
(q, q) q
d
c
+D
0
(q, q) q
r
+F
0
(q, q) +G
0
(q).
As mesmas considera c oes de dependencia das matrizes M(q) e C(q, q) podem ser
observadas para as matrizes M(q) e C(q, q) em rela c ao aos erros de posi c ao e de veloci-
dade das juntas controladas. Assim, podemos representar o manipulador subatuado na
forma quase-LPV sendo A( x
c
, q
r
, q
r
, t).
156
Controle H

nao linear via teoria dos jogos para manipu-


ladores subatuados
Para aplicar as metodologias H

n ao linear via teoria dos jogos em manipuladores


subatuados deve-se alterar a Equa c ao (300) pois, escolhendo a matriz P como
P( x, t) = T
T
0
_
_
M( x, t) 0
0 K
_
_
T
0
,
esta e n ao simetrica e indenida, devido ao fato de M ser n ao simetrica e indenida.
Portanto, deve-se particionar a Equa c ao (255) de tal forma que a matriz de inercia
relacionada ` as juntas controladas seja simetrica e denida positiva.
Assim, a Equa c ao (255) pode ser particionada como:
_
_

r

c
_
_
+
_
_

r

c
_
_
=
_
_
M
rr
M
rc
M
cr
M
cc
_
_
_
_
q
r
q
c
_
_
+
_
_
C
rr
C
rc
C
cr
C
cc
_
_
_
_
q
r
q
c
_
_
+
_
_
F
r
F
c
_
_
+
_
_
G
r
G
c
_
_
(301)
sendo
r
os torques nas juntas restantes e
c
os torques nas juntas controladas. Por
simplicidade de nota c ao, o ndice 0 representando o sistema nominal e retirado das
equa c oes. Se a possibilidade escolhida para o controle for 1, o vetor
c
= 0, pois o torque
nas juntas passivas e nulo. Se a possibilidade for 2, o vetor e da forma
c
= [
ac
0],
sendo
ac
o torque nas juntas ativas sendo controladas. A segunda linha de (301) e:

c
+
c
= M
cr
q
r
+M
cc
q
c
+C
cr
q
r
+C
cc
q
c
+F
c
+G
c
.
Isolando as acelera c oes das juntas controladas, obtem-se:
q
c
= M
1
cc
(M
cr
q
r
+C
cr
q
r
+C
cc
q
c
+F
c
+G
c

c
) . (302)
Introduzindo uma trajet oria de referencia desejada para as juntas controladas, a
Equa c ao (302) ca:

q
c
= M
1
cc
_
C
cc

q
c
+M
cc
q
d
c
+C
cc
q
d
c
+M
cr
q
r
+C
cr
q
r
+F
c
+G
c

c

c
_
(303)
157
com

q
c
= q
c
q
d
c
e

q
c
= q
c
q
d
c
.
Na forma de espa co de estados, escolhendo o vetor de estados como:
x
c
=
_
_
q
c
q
d
c
q
c
q
d
c
_
_
=
_
_

q
c
q
c
_
_
,
a Equa c ao (303) ca

x
c
= A(q, q) x
c
+B
0
(q, q, q
d
c
, q
d
c
) +BM
1
cc

c
+BM
1
cc

c
(304)
com
A(q, q) =
_
_
M
1
cc
C
cc
0
I
na
0
_
_
B
0
(q, q, q
d
c
, q
d
c
) =
_
_
M
1
cc
_
M
cc
q
d
c
+C
cc
q
d
c
+M
cr
q
r
+C
cr
q
r
+F
c
+G
c
_
0
_
_
B =
_
_
I
na
0
_
_
.
Utilizando uma transforma c ao similar a (258), a entrada de controle e escolhida
como
u =
_
M
cc
C
cc
_
_
_

z
1
z
1
_
_
= M
cc
T
1

x
c
+C
cc
T
1
x
c
. (305)
A equa c ao din amica do erro de acompanhamento do estado e dada por:

x
c
= A
T
( x
c
, t) x
c
+B
T
( x
c
, t)u +B
T
( x
c
, t)w (306)
com
A
T
( x
c
, t) = T
1
0
_
_
M
1
cc
C
cc
0
T
1
11
T
1
11
T
12
_
_
T
0
B
T
( x
c
, t) = T
1
0
_
_
M
1
cc
0
_
_
w = T
11

c
.
A Equa c ao (305) pode ser manipulada de tal forma que a acelera c ao de controle e
158
dada por:
q
c
= q
d
c
T
1
11
T
12

q
c
T
1
11
M
1
cc
_
C
cc
B
T
T
0
x
c
u
_
.
A equa c ao acima fornece a acelera c ao necess aria para as juntas controladas acom-
panharem a trajet oria de referencia desejada. Os torques nas juntas ativas podem
ser calculados utilizando esta acelera c ao de controle. Para isso, a Equa c ao (255) e
particionada como [BERGERMAN (1996)]:
_
_

a
0
_
_
=
_
_
M
ar
M
ac
M
ur
M
uc
_
_
_
_
q
r
q
c
_
_
+
_
_
b
a
b
u
_
_
(307)
sendo que os ndices a e u representam juntas ativas e juntas passivas freadas, respec-
tivamente, e b(q, q) = C(q, q) +F( q) +G(q) . Isolando o vetor q
r
na segunda linha
de (307) e substituindo na primeira linha, obtem-se:

a
=
_
M
ac
M
ar
M
1
ur
M
uc
_
q
c
+b
a
M
ar
M
1
ur
b
u
.
Para o caso subatuado, o mesmo criterio de desempenho considerado para ma-
nipuladores totalmente atuados e aplicado para promover a atenua c ao dos dist urbios.
Considerando a equa c ao do erro de acompanhamento do estado para o caso subatuado
(306), a matriz P( x
c
, t) pode ser escolhida como
P( x
c
, t) = T
T
0
_
_
M
cc
( x
c
, t) 0
0 K
_
_
T
0
pois a matriz M
cc
(q, q) e simetrica positiva denida. A matriz (C
cc
(q, q)
1
2

M
cc
(q, q))
e anti-simetrica e, portanto, o mesmo algoritmo de projeto do controle H

n ao linear
via teoria dos jogos pode ser aplicado para o caso subatuado.
Resultados
Congura cao APA
A primeira congura c ao subatuada utilizada para validar as tecnicas descritas e
denominada APA, ou seja, a junta 2 e passiva e as juntas 1 e 3 s ao ativas. Sendo que
159
a congura c ao APA possui n
a
= 2, duas juntas podem ser controladas em cada fase.
Na primeira fase, o vetor de juntas controladas, q
c
, e escolhido como q
c
= [q
2
q
3
]
T
,
i.e., uma junta passiva, 2, e uma ativa, 3, s ao selecionadas (possibilidade 2 descrita
na Se c ao ??). Na segunda fase, as juntas ativas s ao selecionadas para formar o vetor
de juntas controladas, q
c
= [q
1
q
3
]
T
(possibilidade 3). Nesta fase a junta passiva, 2, e
mantida freada, desde que ela j a alcan cou a posi c ao nal desejada. Portanto, duas fases
de controle s ao necess arias para controlar todas as juntas ate a posi c ao nal desejada.
As posi c oes inicial e nal consideradas foram, respectivamente, q(0) = [0

]
T
e q(T
APA1
, T
APA2
) = [20

20

20

]
T
. Os vetores T
APA1
= [1.0 1.0]s e T
APA2
=
[5.0 5.0]s referem-se aos tempos das trajet orias desejadas para as fases 1 e 2, respecti-
vamente. Para vericar a robustez do controlador com rela c ao a dist urbios externos,
um dist urbio no torque w do tipo sen oide amortecida, iniciando em t = 0.3 s, foi
introduzido nas juntas ativas 1 e 3. Os dist urbios utilizados foram:
w
1
= 0.5e
4t
sin(4t)
w
3
= 0.05e
6t
sin(4t),
Os valores m aximos destes dist urbios representam aproximadamente 40 % dos valores
dos torques obtidos no instante em que o dist urbio foi introduzido. A Figura 64 mostra
os dist urbios utilizados durante o experimento.
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
0.04
0.02
0
0.02
0.04
0.06
0.08
0.1
0.12
Tempo (s)
D
i
s
t
u
r
b
i
o

(
N
.
m
)
Junta 1
Junta 2
Junta 3
Figura 64: Dist urbio, congura c ao APA, experimento.
160
Controle quase-LPV via realimenta c ao do estado
Nesta se c ao, s ao apresentados os resultados obtidos da implementa c ao do controle
quase-LPV via realimenta c ao do estado. Uma an alise da inuencia das fun c oes base
para X e realizada considerando quatro conjuntos de fun c oes para cada fase.
Para a primeira fase, escolhe-se como par ametros os estados representando os erros
de posi c ao das juntas 2 e 3, ou seja,
( x
c
) =
_
q
2
q
3
_
T
sendo q
2
e q
3
os erros de posi c ao das juntas 2 e 3, respectivamente. Considera-se como
sadas do sistema, z
1
e z
2
, os erros de posi c ao e velocidade representados pelo estado
e a vari avel de controle u, respectivamente. Portanto, o sistema pode ser descrito pela
Equa c ao (254) com:
A((x)) = A(( x
c
))
B
1
((x)) = B
B
2
((x)) = B
C
1
((x)) = I
4
C
2
((x)) = 0
(308)
sendo as matrizes A(( x
c
)) e B obtidas da Equa c ao (300).
Os possveis valores para os par ametros est ao contidos no conjunto compacto, P,
denido por [30, 30]

[30, 30]

. A taxa de varia c ao dos par ametros e limitada


por [ [ 50

/s. O espa co dos par ametros foi dividido em 5 pontos, ou seja L = 5.


Os conjuntos de fun c oes base utilizados e os valores de atenua c ao mnimos encontrados
para cada conjunto s ao mostrados na Tabela 4.
Para a segunda fase, os par ametros escolhidos e que comp oem o vetor de estados
foram:
( x
c
) =
_
q
3

q
3
_
T
sendo q
3
e

q
3
os erros de posi c ao e velocidade da junta 3, respectivamente. As sadas
do sistema s ao as mesmas consideradas na primeira fase, portanto, o sistema possui a
mesma estrutura descrita na Equa c ao (308).
Os possveis valores para os par ametros est ao contidos no conjunto compacto, P,
161
Conjunto Fun c oes base
f
1
(( x
c
)) = 1
1 f
2
(( x
c
)) = q
2
= 1.20
f
3
(( x
c
)) = q
3
f
1
(( x
c
)) = 1
2 f
2
(( x
c
)) = cos( q
2
) = 1.35
f
3
(( x
c
)) = cos( q
3
)
f
1
(( x
c
)) = 1
3 f
2
(( x
c
)) =
2

q
2
= 1.35
f
3
(( x
c
)) = (
3
2
(
2

q
2
)
2

1
2
)
f
1
(( x
c
)) = 1
4 f
2
(( x
c
)) =
2

q
3
= 1.35
f
3
(( x
c
)) = (
3
2
(
2

q
3
)
2

1
2
)
Tabela 4: Fun c oes base e , fase 1.
denido por [30, 30]

[50, 50]

/s. A taxa de varia c ao dos par ametros e limitada


por [ [ [50

/s 30

/s
2
]. O espa co dos par ametros foi dividido em 5 pontos, ou seja
L = 5. Os conjuntos de fun c oes base utilizados e os valores de atenua c ao mnimos
encontrados para cada conjunto s ao mostrados na Tabela 5.
Para a primeira fase, o desempenho dos quatro controladores projetados, referentes
aos quatro conjuntos de fun c oes base, foram similares. Entretanto, para a segunda fase,
o controlador projetado considerando o terceiro conjunto de fun c oes apresentou o pior
desempenho, e foi necess ario aumentar o valor de (de = 1.80 para = 2.50) para
melhorar o desempenho. Portanto, podemos ajustar adequadamente para obter de-
sempenho equivalentes entre os controladores projetados com fun c oes diferentes, mesmo
na presen ca de dist urbios. Neste trabalho, ser ao apresentados somente os resultados
obtidos considerando o conjunto 1 (menor valor de encontrado) para ambas as fases
de controle.
A seguir ser ao apresentados os resultados experimentais. Os gr acos de posi c ao
angular, velocidade angular e torque s ao mostrados nas Figuras 65 a 67.
162
Conjunto Fun c oes base
f
1
(( x
c
)) = 1
1 f
2
(( x
c
)) = q
3
= 1.5
f
3
(( x
c
)) =

q
3
f
1
(( x
c
)) = 1
2 f
2
(( x
c
)) = cos( q
3
) = 1.8
f
3
(( x
c
)) = cos(

q
3
)
f
1
(( x
c
)) = 1
3 f
2
(( x
c
)) =
2

q
3
= 2.5
f
3
(( x
c
)) = (
3
2
(
2

q
3
)
2

1
2
)
f
1
(( x
c
)) = 1
4 f
2
(( x
c
)) =
2

q
3
= 1.8
f
3
(( x
c
)) = (
3
2
(
2

q
3
)
2

1
2
)
Tabela 5: Fun c oes base e , fase 2.
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
30
20
10
0
10
20
Tempo (s)
P
o
s
i

o

a
n
g
u
l
a
r

(
g
r
a
u
s
)
Junta 1
Junta 2
Junta 3
Figura 65: Posi c ao angular das juntas, experimento, congura c ao APA, controle quase-
LPV via realimenta c ao do estado.
163
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
60
40
20
0
20
40
60
Tempo (s)
V
e
l
o
c
i
d
a
d
e

a
n
g
u
l
a
r

(
g
r
a
u
s
/
s
)
Junta 1
Junta 2
Junta 3
Figura 66: Velocidade angular das juntas, experimento, congura c ao APA, controle
quase-LPV via realimenta c ao do estado .
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
0.8
0.6
0.4
0.2
0
0.2
0.4
0.6
0.8
Tempo (s)
T
o
r
q
u
e

(
N
.
m
)
Junta 1
Junta 2
Junta 3
Figura 67: Torque aplicado, experimento, congura c ao APA, controle quase-LPV via
realimenta c ao do estado.
164
Controle H

n ao linear via teoria dos jogos


Para a metodologia de projeto via teoria dos jogos, dois controladores foram proje-
tados, alterando-se os valores de e das matrizes de peso. Para o primeiro controlador,
denominado controlador 1, o nvel de atenua c ao encontrado para a primeira fase de
controle da congura c ao APA foi = 4.0. As matrizes de peso utilizadas foram:
Q
1
= I
2
, Q
2
= 4I
2
, Q
12
= 0 e R = 5I
2
.
Aplicando o algoritmo de projeto descrito na Se c ao ??, vericando que todas as
condi c oes s ao satisfeitas, obtem-se:
T
0
=
_

_
2.69 0 10.79 0
0 2.69 0 10.79
0 0 1 0
0 0 0 1
_

_
.
Para a segunda fase de controle, o nvel de atenua c ao foi = 4.5. As matrizes de
peso utilizadas foram:
Q
1
= I
2
, Q
2
= 4I
2
, Q
12
= 0 e R = 5I
2
.
Aplicando o algoritmo de projeto descrito na Se c ao ??, vericando que todas as
condi c oes s ao satisfeitas, obtem-se:
T
0
=
_

_
2.58 0 10.31 0
0 2.58 0 10.31
0 0 1 0
0 0 0 1
_

_
.
A seguir ser ao apresentados os resultados experimentais. Os dist urbios descritos
na se c ao anterior tambem foram utilizados no experimento. Os gr acos de posi c ao
angular, velocidade angular e torque s ao mostrados nas Figuras 68 a 70.
Para o segundo controlador, denominado controlador 2, o nvel de atenua c ao encon-
165
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
40
30
20
10
0
10
20
Tempo (s)
P
o
s
i

o

a
n
g
u
l
a
r

(
g
r
a
u
s
)
Junta 1
Junta 2
Junta 3
Figura 68: Posi c ao angular das juntas, experimento, congura c ao APA, controle H

n ao linear via teoria dos jogos, controlador 1.


0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
50
40
30
20
10
0
10
20
30
40
50
60
Tempo (s)
V
e
l
o
c
i
d
a
d
e

a
n
g
u
l
a
r

(
g
r
a
u
s
/
s
)
Junta 1
Junta 2
Junta 3
Figura 69: Velocidade angular das juntas, experimento, congura c ao APA, controle
H

n ao linear via teoria dos jogos, controlador 1.


166
trado para a primeira fase de controle da congura c ao APA foi = 2.0. As matrizes
de peso utilizadas foram:
Q
1
=
_
_
1 0
0 3
_
_
, Q
2
=
_
_
4 0
0 3
_
_
, Q
12
= 0 e R = 3.5I
2
.
Aplicando o algoritmo de projeto descrito na Se c ao ??, vericando que todas as
condi c oes s ao satisfeitas, obtem-se:
T
0
=
_

_
5.29 0 21.17 0
0 15.87 0 15.87
0 0 1 0
0 0 0 1
_

_
.
Para a segunda fase de controle, o nvel de atenua c ao foi = 2.0. As matrizes de
peso utilizadas foram:
Q
1
= I
2
, Q
2
= 4I
2
, Q
12
= 0 e R = 3.5I
2
.
Aplicando o algoritmo de projeto descrito na Se c ao ??, vericando que todas as
condi c oes s ao satisfeitas, obtem-se:
T
0
=
_

_
5.29 0 21.17 0
0 5.29 0 21.17
0 0 1 0
0 0 0 1
_

_
.
Nas Figuras 71, 72 e 73 a seguir, ser ao apresentados os resultados experimentais para
este controlador. Os dist urbios descritos anteriormente tambem foram considerados
neste experimento.
Note que, para o controle H

n ao linear via teoria dos jogos, controlador 2 (quando


se diminuiu o valor de para nveis pr oximos aos do controle quase-LPV), h a uma
deteriora c ao no posicionamento de junta 3, Figura 71, e um aumento no torque aplicado,
Figura 73, em compara c ao com o controlador 1. Portanto, um melhor desempenho para
167
o controle H

n ao linear via teoria dos jogos e encontrado com valores de superiores


ao controle quase-LPV. Assim, o controle quase-LPV e considerado mais robusto.
Verica-se, a partir dos gr acos apresentados, que as duas tecnicas utilizadas, con-
trole quase-LPV via realimenta c ao do estado e controle H

n ao linear via teoria dos


jogos, mostraram-se capazes de controlar as juntas do rob o manipulador quando este
se encontra na congura c ao subatuada APA.
Os resultados experimentais apresentaram algumas diferen cas, principalmente nos
gr acos de posi c ao e torque aplicado. Nos gr acos de posi c ao do controle H

n ao
linear via teoria dos jogos, controlador 1, Figura 68, verica-se que a terceira junta
sobre uma oscila c ao nos instantes nais de seu posicionamento, o que n ao ocorreu com
o controle quase-LPV. Tal comportamento para o controle H

n ao linear via teoria dos


jogos pode ser justicado pela utiliza c ao de um tipo de lineariza c ao por realimenta c ao
do estado e de uma entrada de controle linear, Equa c ao (26). No controle quase-LPV,
a entrada de controle e n ao linear (veja Lema 1). Nos gr acos de torque, os picos de
torque alcan cados quando se utilizou o controle H

n ao linear via teoria dos jogos,


controlador 1, Figura 70, foram menores aos do controle quase-LPV, Figura 67, sendo,
portanto, menor o gasto de energia naqueles casos.
Considerando os resultados obtidos e as an alises feitas, conclui-se que o controle
quase-LPV mostrou-se mais robusto em compara c ao com os demais controles projetados
para a congura c ao APA.
Congura cao PAP
Uma outra congura c ao subatuada utilizada para validar as tecnicas descritas e
denominada PAP. Neste caso as juntas 1 e 3 s ao passivas e a junta 2 e ativa. Sendo que
a congura c ao PAP possui n
a
= 1, uma unica junta pode ser controlada em cada fase.
Na primeira fase, o vetor de juntas controladas, q
c
, e escolhido como q
c
= [q
3
], i.e., a
junta passiva 3, e selecionada (possibilidade 1 descrita na Se c ao ??). Nesta fase a junta
passiva 1, e mantida freada, desde que ela ser a controlada em seguida. Portanto, na
segunda fase, a junta passiva 1 e selecionada e q
c
= [q
1
] (possibilidade 1 novamente).
Nesta fase a junta passiva, 3, e mantida freada, desde que ela j a alcan cou a posi c ao nal
desejada. Finalmente, a junta ativa, 2, e controlada para sua posi c ao nal desejada,
sendo q
c
= [q
2
] (possibilidade 3).
168
A princpio tres fases de controle s ao necess arias para controlar todas as juntas ate
a posi c ao nal desejada. Entretanto, uma fase auxiliar pode ser necess aria entre as
fases 1 e 2, se, ao nal da fase 1, a junta ativa 2 estiver posicionada de tal forma que ao
realizar a fase 2, ela se desloque fora do espa co de trabalho dela. Nesta fase auxiliar, a
junta ativa 2 e controlada para retornar ` a posi c ao inicial, sendo o controlador o mesmo
utilizado na fase 3. Os componentes do vetor T
PAP
= [T
1
T
a
T
2
T
3
] referem-se aos
tempos das trajet orias desejadas para as fases 1, auxiliar (quando necess aria), 2 e 3,
respectivamente.
As posi c oes inicial e nal consideradas foram, respectivamente, q(0) = [0

]
T
e q(T
PAP
) = [20

20

20

]
T
, sendo T
PAP
= [1.0 4.0 0.7 3.0]s. Os componentes
do vetor T
PAP
referem-se aos tempos das trajet orias desejadas para as fases 1, auxiliar
(quando necess aria), 2 e 3, respectivamente. Neste caso, uma fase auxiliar deve ser
realizada entre as fases 1 e 2, para evitar que a junta 2 se desloque fora do espa co de
trabalho desta quando estiver realizando o controle na segunda fase. Para vericar a
robustez do controlador com rela c ao a dist urbios externos, um dist urbio no torque w
do tipo sen oide amortecida, iniciando em t = 0.3 s, foi introduzido na junta ativa 2.
Os dist urbios utilizados foram:
w
2
= e
6t
sin(4t)
Os valores m aximos destes dist urbios representam aproximadamente 25 % dos valores
dos torques obtidos no instante em que o dist urbio foi introduzido. A Figura 74 mostra
os dist urbios utilizados durante o experimento.
Controle quase-LPV via realimenta c ao do estado
Para a primeira fase, controle da junta passiva 3, escolhe-se como par ametros os
estados do sistema, ou seja, os erros de posi c ao e velocidade da junta 3. Portanto:
( x
c
) =
_
q
3

q
3
_
T
sendo q
3
e

q
3
os erros de posi c ao e de velocidade da junta 3, respectivamente. Considera-
se como sadas do sistema, z
1
e z
2
, os erros de posi c ao e de velocidade representados
pelo estado e a vari avel de controle u, respectivamente. Portanto, o sistema pode ser
169
descrito pela Equa c ao (254) com:
A((x)) = A(( x
c
))
B
1
((x)) = B
B
2
((x)) = B
C
1
((x)) = I
2
C
2
((x)) = 0
(309)
sendo as matrizes A(( x
c
)) e B obtidas da Equa c ao (300).
Os possveis valores para os par ametros est ao contidos no conjunto compacto, P,
denido por [30, 30]

[50, 50]

. A taxa de varia c ao dos par ametros e limitada


por [ [ [50

/s 30

/s
2
]. As fun c oes utilizadas como base foram:
f
1
(( x
c
)) = 1
f
2
(( x
c
)) = cos( q
3
)
f
3
(( x
c
)) = cos(

q
3
).
O espa co dos par ametros foi dividido em 5 pontos, ou seja L = 5. O valor de
atenua c ao mnimo encontrado foi = 2.0. Os valores das matrizes X
i
s ao mostrados
no Apendice ??.
Para a segunda fase, controle da junta passiva 1, os par ametros escolhidos foram:
=
_
q
2

q
1
_
T
sendo q
2
e

q
1
os erros de posi c ao da junta 2 e de velocidade da junta 1, respectivamente.
Note que o primeiro par ametro, q
2
, n ao faz parte do vetor de estados do sistema pois,
x
c
= [ q
1

q
1
]
T
. A escolha do estado q
1
como par ametro n ao acrescentaria varia c ao ` as
matrizes A, B
1
e B
2
, pois estas n ao s ao fun c ao deste estado. As sadas do sistema, z
1
e z
2
, s ao os erros de posi c ao e de velocidade representados pelo estado e a vari avel de
controle u, respectivamente..
Os possveis valores para os par ametros est ao contidos no conjunto compacto, P,
denido por [30, 30]

[50, 50]

/s. A taxa de varia c ao dos par ametros e limitada


por [ [ [50

/s 30

/s
2
]. As fun c oes base utilizadas foram:
170
f
1
(( x
c
)) = 1
f
2
(( x
c
)) = cos( q
2
)
f
3
(( x
c
)) = cos(

q
1
).
O valor de atenua c ao mnimo encontrado, para L = 5 foi = 1.5. Os valores das
matrizes X
i
s ao mostrados no Apendice ??.
Para a ultima fase, controle da junta ativa 2, os par ametros escolhidos foram:
=
_
q
3

q
3
_
T
sendo q
3
e

q
3
os erros de posi c ao e de velocidade da junta 3, respectivamente. Note
que neste caso os par ametros n ao fazem parte do vetor de estados do sistema pois,
x
c
= [ q
2

q
2
]
T
. A escolha dos estados como par ametros n ao acrescentaria varia c ao ` as
matrizes A, B
1
e B
2
, pois estas n ao s ao fun c ao dos estados. Portanto, a representa c ao
do sistema para esta fase e somente LPV, e n ao quase-LPV como as anteriores. Assim,
nesta fase o projeto do controlador e realizado considerando o lema 1. As sadas do
sistema, z
1
e z
2
, os erros de posi c ao e de velocidade representados pelo estado e a
vari avel de controle u, respectivamente..
Os possveis valores para os par ametros est ao contidos no conjunto compacto, P,
denido por [30, 30]

[50, 50]

/s. A taxa de varia c ao dos par ametros e limitada


por [ [ [50

/s 30

/s
2
]. As fun c oes base utilizadas foram:
f
1
(( x
c
)) = 1
f
2
(( x
c
)) = cos( q
3
)
f
3
(( x
c
)) = cos(

q
3
).
O valor de atenua c ao mnimo encontrado, para L = 5, foi = 1.8. Os valores das
matrizes X
i
s ao mostrados no Apendice ??.
A seguir ser ao apresentados os resultados simulados e experimentais. Os gr acos
de posi c ao angular, velocidade angular e torque s ao mostrados nas Figuras 75 a 77.
171
Controle H

n ao linear via teoria dos jogos


Quando aplicada a metodologia de projeto via teoria dos jogos, o nvel de atenua c ao
encontrado para a primeira fase de controle da congura c ao PAP foi = 5.0. As
matrizes de peso utilizadas foram:
Q
1
= 0.8, Q
2
= 1.5, Q
12
= 0 e R = 5.
Aplicando o algoritmo de projeto descrito na Se c ao ??, vericando que todas as
condi c oes s ao satisfeitas, obtem-se:
T
0
=
_
_
2.0 3.75
0 1.0
_
_
.
Para a segunda fase de controle, o nvel de atenua c ao foi = 5.0. As matrizes de
peso utilizadas foram:
Q
1
= 0.5, Q
2
= 3, Q
12
= 0 e R = 5.
Aplicando o algoritmo de projeto descrito na Se c ao ??, vericando que todas as
condi c oes s ao satisfeitas, obtem-se:
T
0
=
_
_
1.25 7.50
0 1.0
_
_
.
Para a terceira e ultima fase de controle, o nvel de atenua c ao foi = 3.0. As
matrizes de peso utilizadas foram:
Q
1
= 1, Q
2
= 2.2, Q
12
= 0 e R = 5.
Aplicando o algoritmo de projeto descrito na Se c ao ??, vericando que todas as
condi c oes s ao satisfeitas, obtem-se:
T
0
=
_
_
3, 35 7, 38
0 1.0
_
_
.
172
A seguir ser ao apresentados os resultados experimentais. Os dist urbios descritos
na se c ao anterior tambem foram utilizados no experimento. Os gr acos de posi c ao
angular, velocidade angular e torque s ao mostrados nas Figuras 78 a 80.
As duas tecnicas apresentaram resultados experimentais semelhantes. Os picos de
torque obtidos com o controle quase-LPV foram ligeiramente superiores aos do controle
H

n ao linear via teoria dos jogos.


173
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
0.6
0.4
0.2
0
0.2
0.4
0.6
0.8
Tempo (s)
T
o
r
q
u
e

(
N
.
m
)
Junta 1
Junta 2
Junta 3
Figura 70: Torque aplicado, experimento, congura c ao APA, controle H

n ao linear
via teoria dos jogos, controlador 1.
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
40
30
20
10
0
10
20
Tempo (s)
P
o
s
i

o

a
n
g
u
l
a
r

(
g
r
a
u
s
)
Junta 1
Junta 2
Junta 3
Figura 71: Posi c ao angular das juntas, experimento, congura c ao APA, controle H

n ao linear via teoria dos jogos, controlador 2.


174
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
40
20
0
20
40
60
Tempo (s)
V
e
l
o
c
i
d
a
d
e

a
n
g
u
l
a
r

(
g
r
a
u
s
/
s
)
Junta 1
Junta 2
Junta 3
Figura 72: Velocidade angular das juntas, experimento, congura c ao APA, controle
H

n ao linear via teoria dos jogos, controlador 2.


0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
0.6
0.4
0.2
0
0.2
0.4
0.6
0.8
Tempo (s)
T
o
r
q
u
e

(
N
.
m
)
Junta 1
Junta 2
Junta 3
Figura 73: Torque aplicado, experimento, congura c ao APA, controle H

n ao linear
via teoria dos jogos, controlador 2.
175
0 1 2 3 4 5 6 7 8 9 10
0.12
0.1
0.08
0.06
0.04
0.02
0
0.02
0.04
Tempo (s)
D
i
s
t
u
r
b
i
o

(
N
.
m
)
Junta 1
Junta 2
Junta 3
Figura 74: Dist urbio, congura c ao PAP, experimento.
0 1 2 3 4 5 6 7 8 9 10
60
50
40
30
20
10
0
10
20
Tempo (s)
P
o
s
i

o

a
n
g
u
l
a
r

(
g
r
a
u
s
)
Junta 1
Junta 2
Junta 3
Figura 75: Posi c ao angular das juntas, experimento, congura c ao PAP, controle quase-
LPV.
176
0 1 2 3 4 5 6 7 8 9 10
100
80
60
40
20
0
20
40
60
Tempo (s)
V
e
l
o
c
i
d
a
d
e

a
n
g
u
l
a
r

(
g
r
a
u
s
/
s
)
Junta 1
Junta 2
Junta 3
Figura 76: Velocidade angular das juntas, experimento, congura c ao PAP, controle
quase-LPV.
0 1 2 3 4 5 6 7 8 9 10
0.8
0.6
0.4
0.2
0
0.2
0.4
0.6
0.8
Tempo (s)
T
o
r
q
u
e

(
N
.
m
)
Junta 1
Junta 2
Junta 3
Figura 77: Torque aplicado, experimento, congura c ao PAP, controle quase-LPV.
177
0 2 4 6 8 10 12
80
70
60
50
40
30
20
10
0
10
20
Tempo (s)
P
o
s
i

o

a
n
g
u
l
a
r

(
g
r
a
u
s
)
Junta 1
Junta 2
Junta 3
Figura 78: Posi c ao angular das juntas, experimento, congura c ao PAP, controle H

n ao linear via teoria dos jogos.


0 2 4 6 8 10 12
100
80
60
40
20
0
20
40
60
Tempo (s)
V
e
l
o
c
i
d
a
d
e

a
n
g
u
l
a
r

(
g
r
a
u
s
/
s
)
Junta 1
Junta 2
Junta 3
Figura 79: Velocidade angular das juntas, experimento, congura c ao PAP, controle
H

n ao linear via teoria dos jogos.


178
0 2 4 6 8 10 12
0.8
0.6
0.4
0.2
0
0.2
0.4
0.6
0.8
Tempo (s)
T
o
r
q
u
e

(
N
.
m
)
Junta 1
Junta 2
Junta 3
Figura 80: Torque aplicado, experimento, congura c ao PAP, controle H

n ao linear
via teoria dos jogos.
Parte XI
Controle Markoviano
179
180
Neste captulo e apresentada a aplica c ao dos controles Markovianos H
2
, H

e misto
H
2
/ H

no rob o manipulador UArm II. Tais controladores garantem que a estabilidade


do sistema ser a mantida mesmo com a ocorrencia de uma falha do tipo junta livre, sem a
necessidade de utiliza c ao de freios no perodo de recongura c ao p os falha. Esta garantia
n ao e alcan cada quando se utiliza os controladores apresentados anteriormente. Este
trabalho e uma extens ao dos resultados obtidos em [FARFAN (2000)].
0.1 Introdu cao
Sistemas Markovianos discretos s ao uma classe particular de sistemas que variam no
tempo de uma maneira aleat oria [HOEL et al. (1987)]. Consideremos que no instante
de tempo k um sistema desconhecido se encontra na congura c ao i, e desejamos saber
qual e a probabilidade de, no instante k + 1, o sistema estar na congura c ao j. A
principal caracterstica dos sistemas Markovianos e que a probabilidade do sistema
estar na congura c ao j no instante seguinte depende apenas da congura c ao em que
o sistema se encontra, independentemente do instante de tempo considerado. Sempre
que o sistema estiver na congura c ao i, a probabilidade dele estar na congura c ao j no
instante seguinte e p
ij
.
Admitamos que o sistema considerado contem ao todo N congura c oes agrupadas
em um conjunto S. Se N = 3 o sistema pode ser representado de forma esquem atica
pela Figura 81, e podemos coletar todas as probabilidades p
ij
para i, j 1, 2, 3 em
uma matriz P denominada matriz de probabilidades
P =
_

_
p
11
p
12
p
13
p
21
p
22
p
23
p
31
p
32
p
33
_

_
, (310)
e observe que a soma de cada uma das linhas de P deve ser igual a 1.
As mudan cas de congura c ao (ou estado) de um sistema com tais caractersticas
s ao chamados saltos Markovianos. O registro dos estados pelos quais o sistema passou
origina o que se denomina cadeia de Markov, e e representada pela letra . Um exemplo
181
Figura 81: Conjunto de Congura c oes
de cadeia de Markov para o sistema representado na Figura 81 poderia ser
= [1, 1, 3, 2, 2, 1, 3, 3, 2, ] (311)
Alguns controladores foram desenvolvidos para garantir estabilidade e performance
de sistemas Markovianos, dos quais destacam-se os controladores H
2
, H

e H
2
/H

, de-
senvolvidos em [COSTA & MARQUES (2000)], [COSTA & DO VAL (1996)] e [COSTA
& MARQUES (1998)], respectivamente.
Em [FARFAN (2000)], um modelo Markoviano foi utilizado para representar o rob o
manipulador subatuado UArm II, considerando as mudan cas de pontos de opera c ao do
sistema linearizado e a ocorrencia de falhas do tipo junta livre como saltos Markovianos.
Entretanto, somente resultados simulados foram apresentados naquele trabalho.
Quando ocorre uma falha do tipo junta livre em um rob o manipulador, este muda
sua congura c ao de totalmente atuado para subatuado. Com isso, as juntas livres,
denominadas passivas, s ao controladas a partir do acoplamento din amico entre estas e
as juntas com os atuadores funcionando normalmente, denominadas ativas.
Embora alguns controladores determinsticos, como por exemplo o controlador H

n ao linear, j a tenham sido projetados para as duas fases de controle (totalmente atuado
e subatuado), eles n ao garantem a estabilidade do manipulador ao ocorrer uma falha.
Para utilizar tais controladores, e necess ario frear todas as juntas ap os a detec c ao
da falha, recongurar o sistema para subatuado e reiniciar o movimento a partir da
velocidade zero.
182
Neste trabalho, resultados experimentais obtidos da implementa c ao da tecnica de-
scrita em [FARFAN (2000)] no rob o manipulador subatuado UArm II s ao apresentados.
Verica-se que o sistema mantem a estabilidade sem a utiliza c ao de freios no perodo
de recongura c ao p os falha. Parte destes resultados, juntamente com outros resulta-
dos do controle H

n ao linear, foram agrupados no artigo Nonlinear and Markovian


H

Controls of Underactuated Manipulators aceito para publica c ao na revista IEEE


Transactions on Control Systems Technology.
0.2 O rob o UArm II como um sistema Markoviano
A Equa c ao (255) pode ser particionada como:
_
_

a
0
_
_
=
_
_
M
ac
M
ar
M
uc
M
ur
_
_
_
_
q
c
q
r
_
_
+
_
_
b
a
b
u
_
_
, (312)
sendo que os ndices a e u representam juntas ativas e juntas passivas livres, respecti-
vamente, e b(q, q, q,
d
) = C(q, q) + F( q) + G(q) (q, q, q,
d
). Isolando o vetor q
r
na
segunda linha de (312) e substituindo na primeira linha, obtem-se:

a
= M(q) q
c
+b(q, q) (313)
sendo
M(q) = M
ac
M
ar
M
1
ur
M
uc
b(q, q) = b
a
M
ar
M
1
ur
b
u
.
Na realidade, o manipulador totalmente atuado pode ser representado pela Equa c ao
(313), considerando M(q) = M(q) e b(q, q) = b(q, q).
A lineariza c ao da din amica de um manipulador totalmente atuado ou subatuado,
representados pela Equa c ao (313), em torno de um ponto de opera c ao com posi c ao q
0
e velocidade q
0
, fornece um sistema linear na forma:
x =

Ax +

B
z =

Cx +

D,
(314)
183
sendo

A =
_
_
0 I
M
1
b
q
M
1
b
q
_
_

(q
0
, q
0
)
,

B =
_
_
0
M
1
_
_

(q
0
)
,
x =
_
_
q
d
q
q
d
q
_
_
e q
d
a trajet oria desejada. Um controlador proporcional derivativo (PD) preliminar
pode ser introduzido no torque aplicado na forma = [K
P
K
D
]x + u, sendo u a
entrada de controle, para compensar incertezas no modelo. As sadas do sistema s ao
denidas como pondera c oes dos erros de posi c ao, (q
d
q), e da entrada de controle,
u. Portanto, o sistema ca
x =

Ax +

Bu
z =

Cx +

Du,
(315)
sendo

A =
_
_
0 I
M
1
_
b
q
K
P
_
M
1
_
b
q
K
D
_
_
_

(q
0
, q
0
)
,

B =
_
_
0
M
1
_
_

(q
0
)
,

C =
_
_
I 0
0 0
_
_
,

D =
_
_
0
I
_
_
,
x =
_
_
q
d
q
q
d
q
_
_
,
sendo e constantes denidas pelo projetista. O projeto do controlador Markoviano
utilizado neste trabalho e baseado em sistemas discretos. Portanto, o sistema acima
deve ser discretizado, fornecendo o seguinte sistema:
x(k + 1) = Ax(k) +Bu(k)
z(k) = Cx(k) +Du(k).
(316)
184
A taxa de amostragem utilizada para discretizar o sistema contnuo deve ser es-
colhida pequena o suciente para satisfazer as restri c oes impostas pelos controladores
Markovianos nas matrizes C e D.
O modelo Markoviano do manipulador subatuado desenvolvido neste trabalho des-
creve as mudan cas de pontos de opera c ao da planta e a ocorrencia de falhas do tipo
junta livre. Por simplicidade e sem perda de generalidade, considera-se que a falha
pode ocorrer somente na segunda junta. Ent ao, a congura c ao ap os a falha e APA.
Como visto anteriormente, duas fases de controle s ao necess arias para esta congura c ao.
Dene-se a primeira fase como APA
u
e a segunda fase APA
l
.
O espa co de trabalho de cada junta e dividido em setores, denominados . Para cada
combina c ao de /2, de cada junta, dene-se um ponto de opera c ao para o manipulador.
A escolha destes setores deve ser feita de forma a garantir a representatividade do
modelo Markoviano para o espa co de trabalho considerado. Em nosso caso, o espa co
de trabalho de cada junta foi dividido em dois setores, com = 10

(o experimento
realizado busca posicionar cada junta em 20

, iniciando na posi c ao 0

). Para cada
setor, um ponto foi denido, sendo, 5

para a primeiro setor e 15

para o segundo.
Todas as possibilidades de posicionamento das tres juntas, q
1
, q
2
, q
3
, nestes dois
pontos s ao usadas para mapear o espa co de trabalho do manipulador. Portanto, oito
pontos de lineariza c ao, com as velocidades consideradas nulas, foram obtidos. Este
pontos s ao mostrados na lado direito da Tabela (6).
Para cada ponto de lineariza c ao, tem-se tres conjuntos de matrizes A, B, C e D. O
primeiro conjunto dene opera c ao normal, AAA, sendo que todas as juntas s ao ativas; o
segundo conjunto, APA
u
, dene uma falha e a segunda junta e destravada; e o terceiro
conjunto, APA
l
, dene uma falha e a segunda junta e travada.
As dimens oes das matrizes A, B, C e D para as congura c oes APA
u
e APA
l
s ao
menores que para a congura c ao AAA. Entretanto, na teoria de Markov, todos os
sistemas devem possuir a mesma dimens ao. Para resolver este problema, linhas e
colunas de zeros s ao introduzidas nas matrizes de forma apropriada.
De acordo com o modelo Markoviano tem-se 24 pontos de opera c ao. Pela teoria
de Markov, deve-se agrup a-los em uma matriz P de dimens ao 24 24 contendo as
probabilidades de transi c ao entre eles. Esta matriz ser a utilizada durante o projeto.
A matriz P foi particionada em 9 submatrizes de dimens ao 8 8, mostrada na gura
185
Pontos de Opera c ao Pontos de Lineariza c ao
AAA AAP
u
AAP
l
q
1
q
2
q
3
q
1
q
2
q
3
1 9 17 5 5 5 0 0 0
2 10 18 15 5 5 0 0 0
3 11 19 5 15 5 0 0 0
4 12 20 15 15 5 0 0 0
5 13 21 5 5 15 0 0 0
6 14 22 15 5 15 0 0 0
7 15 23 5 15 15 0 0 0
8 16 24 15 15 15 0 0 0
Tabela 6: Pontos de Opera c ao e Lineariza c ao
(317). Pode-se, independentemente, modelar a opera c ao normal, a opera c ao com falhas
e a possibilidade de ocorrencia de falha, ajustando as submatrizes de P.
P =
_

_
P
AAA
P
f
P
0
P
0
P
APAu
P
s
P
0
P
s
P
APA
l
_

_
(317)
O elemento p
ij
da matriz P representa a probabilidade do sistema, estando no
ponto de opera c ao i, ir para o ponto j no pr oximo instante de tempo. Isto implica que

j
p
ij
= 1 para toda linha i de P.
A submatriz P
AAA
agrupa as rela c oes entre pontos de opera c ao da condi c ao normal
(as tres juntas ativas) e a submatriz diagonal P
f
agrupa as probabilidades de uma falha
ocorrer quando o sistema estiver em opera c ao normal. Quando uma falha ocorrer, o
ponto de opera c ao do sistema somente mudar a do conjunto AAA para o conjunto APA
u
.
Esta caracterstica e representada pela submatriz nula P
0
na primeira linha bloco de
P.
Depois da ocorrencia da falha, o sistema est a no conjunto APA
u
ou APA
l
, e
considera-se a segunda e a terceira linha bloco de P. A submatriz P
APAu
agrupa as
probabilidades entre os pontos de opera c ao no conjunto APA
u
, P
APA
l
agrupa as prob-
abilidades entre os pontos de opera c ao no conjunto APA
l
, P
0
representa que o junta
defeituosa n ao pode ser reparada, e a matriz P
s
representa a probabilidade do ponto
de opera c ao do sistema mudar do conjunto APA
u
para o conjunto APA
l
e vice-versa,
186
veja Figura 82.
Figura 82: Modelo Markoviano do rob o manipulador.
Os valores das submatrizes de P utilizadas no projeto s ao dadas por:
P
AAA
=
_

_
0.89 0.10 0 0 0 0 0 0
0.10 0.79 0.10 0 0 0 0 0
0 0.10 0.79 0.10 0 0 0 0
0 0 0.10 0.79 0.10 0 0 0
0 0 0 0.10 0.79 0.10 0 0
0 0 0 0 0.10 0.79 0.10 0
0 0 0 0 0 0.10 0.79 0.10
0 0 0 0 0 0 0.10 0.89
_

_
,
P
f
=
_

_
0.01 0 0 0 0 0 0 0
0 0.01 0 0 0 0 0 0
0 0 0.01 0 0 0 0 0
0 0 0 0.01 0 0 0 0
0 0 0 0 0.01 0 0 0
0 0 0 0 0 0.01 0 0
0 0 0 0 0 0 0.01 0
0 0 0 0 0 0 0 0.01
_

_
,
187
P
0
=
_

_
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
_

_
,
P
APAu
=
_

_
0.78 0.20 0 0 0 0 0 0
0.10 0.78 0.10 0 0 0 0 0
0 0.10 0.78 0.10 0 0 0 0
0 0 0.10 0.78 0.10 0 0 0
0 0 0 0.10 0.78 0.10 0 0
0 0 0 0 0.10 0.78 0.10 0
0 0 0 0 0 0.10 0.78 0.10
0 0 0 0 0 0 0.20 0.78
_

_
,
P
APA
l
= P
APAu
e P
s
= 2P
f
.
0.3 Controle Markoviano H
2
Nesta se c ao, a formula c ao do problema de controle H
2
para o caso Markoviano
e apresentada, juntamente com as equa c oes para o c alculo de um controlador que
estabiliza o sistema no sentido da media quadr atica. Note que a teoria aqui apresentada
somente se aplica a sistemas lineares a tempo discreto sujeitos a saltos Markovianos.
Nesta tecnica de controle busca-se minimizar o seguinte funcional:
J(x, , u) =
1
2

k=0
E
_
_
_
_
x

(k) u

(k)
_
_
_
Q
(k)
L
(k)
L

(k)
R
(k)
_
_
_
_
x(k)
u(k)
_
_
_
_
_
(318)
188
sujeito a
x(k + 1) = A
(k)
x(k) +B
(k)
u(k)
x(0) = x
0
(0) =
0
(319)
com A
(k)
= (A
1
, . . . , A
N
) H
n
, B
(k)
= (B
1
, . . . , B
N
) H
m,n
, L
(k)
= (L
1
, . . . , L
N
)
H
m,n
, Q
(k)
= (Q
1
, . . . , Q
N
) H
n

, e R
(k)
= (R
1
, . . . , R
N
) H
m

. (k) representa
uma cadeia de Markov assumindo valores no conjunto 1, . . . , N. Com rela c ao a Q e
R, apenas assume-se que elas sejam hermitianas.
Considere o sistema (319). Pode-se mostrar COSTA & MARQUES (2000) que a lei
de controle que minimiza o funcional (318) e obtida a partir das Equa c oes Algebricas
de Riccati Acopladas (EARA) abaixo, para i o
X
i
+A

i
c
i
(X)A
i
+Q
i

_
A

i
c
i
(X)B
i
+L
i
_
_
B

i
c
i
(X)B
i
+R
i
_
1
_
B

i
c
i
(X)A
i
+L

i
_
= 0. (320)
X = (X
1
, . . . , X
N
) H
n

ser a denominada uma solu c ao hermitiana das EARA se


B

i
c
i
(X)B
i
+R
i
for invertvel e X satiszer ` as equa c oes (320).
Para
F
i
=
_
B

i
c
i
(X)B
i
+R
i
_
1
_
B

i
c
i
(X)A
i
+L

i
_
, (321)
a lei de controle que minimiza o funcional (318) e dada por
u(k) = F
(k)
x(k).
0.4 Controle Markoviano H

Nesta se c ao s ao apresentadas a formula c ao do problema de controle H

para sis-
temas Markoviano e sua solu c ao. Considere o seguinte sistema linear discreto no tempo
189
sujeito a saltos Markovianos:
x(k + 1) = A
(k)
x(k) +B
(k)
u(k) +W
(k)
w(k)
z(k) = C
(k)
x(k) +D
(k)
u(k)
x(0) = x
0
(0) =
0
(322)
com A
(k)
= (A
1
, . . . , A
N
) H
n
, B
(k)
= (B
1
, . . . , B
N
) H
m,n
, W
(k)
= (W
1
, . . . , W
N
)
H
r,n
, w = (w(0), w(1), . . .) l
r
2
, C
(k)
= (C
1
, . . . , C
N
) H
n,s
, e D
(k)
= (D
1
, . . . , D
N
)
H
m,s
com D

i
D
i
> 0 para i. (k) representa uma cadeia de Markov assumindo valores
no conjunto 1, . . . , N.
Denota-se por l
r
2
o espa co de Hilbert formado pela seq uencia de vari aveis aleat orias
de segunda ordem w = (w(0), w(1), . . . ) com w(k) R
r
tais que
|w|
2
2
=

k=0
|w(k)|
2
2
< ,
onde
|w(k)|
2
2
= E(|w(k)|
2
).
Por simplicidade, e sem perda de generalidade [COSTA & DO VAL (1996)], assume-
se que D

i
D
i
= I e que C

i
D
i
= 0.
0
e um vetor usado para escolher a congura c ao
inicial, cujos elementos s ao p
j
, j = 1, . . . , N. Por exemplo,
0
(3) = p
3
e a probabilidade
do sistema estar na congura c ao 3 no instante inicial. Vemos que

N
j=1
p
j
= 1.

E
bastante comum escolhermos de forma determinstica a congura c ao inicial desejada,
fazendo p
i
= 1 e p
j
= 0 para j ,= i.
Dene-se Z(
0
, w) = (z(0), z(1), . . .) como sendo o conjunto de todas as sadas do
sistema (322), e dene-se a seguinte norma
|Z(
0
, .)| = sup
wl
r
2
|Z(
0
, w)|
2
|w|
2
. (323)
Considere o sistema (322). Desejamos obter um conjunto de ganhos F
(k)
tais que
quando zermos u(k) = F
(k)
x(k) (sistema em malha fechada), o sistema Markoviano
seja est avel. Assume-se que o estado do sistema em todas as suas componentes e
conhecido, bem como o valor da cadeia de Markov (k) no instante de tempo k.
190
Seja Q
i
= C

i
C
i
, i = 1, . . . , N, e suponha-se que (C, A) seja detect avel na media
quadr atica e seja > 0 xado. Ent ao existe F = (F
1
, . . . , F
N
) H
n,m
que estabiliza
(A, B) na media quadr atica e tal que |Z
F
(
0
, .)| < para todo
0
se e somente se
existir X = (X
1
, . . . , X
N
) H
n+
satisfazendo as seguintes condi c oes:
i) I
1

2
W

i
c
i
(X)W
i
> 0 para i = 1, . . . , N. (324)
ii) X
i
= Q
i
+A

i
c
i
(X)A
i
A

i
c
i
(X)
_
B
i
1

W
i
_
_
_
_
_
I 0
0 I
_
_
+
_
_
B

i
1

i
_
_
c
i
(X)
_
B
i
1

W
i
_
_
_
1
_
_
B

i
1

i
_
_
c
i
(X)A
i
= Q
i
+F

i
F
i
G

i
G
i
+
_
A
i
+B
i
F
i
+
1

W
i
_

c
i
(X)
_
A
i
+B
i
F
i
+
1

W
i
G
i
_
(325)
para i = 1, . . . , N, sendo que
F
i
=
_
I +B

i
c
i
(X)B
i
+
1

2
B

i
c
i
(X)W
i
_
I
1

2
W

i
c
i
(X)W
i
_
1
W

i
c
i
(X)B
i
_
1
B

i
_
I +
1

2
c
i
(X)W
i
_
I
1

2
W

i
c
i
(X)W
i
_
1
W

i
_
c
i
(X)A
i
= (I +B

i
c
i
(X)B
i
)
1
B

i
c
i
(X)
_
A
i
+
1

W
i
G
i
_
(326)
G
i
=
_
I
1

2
W

i
c
i
(X)W
i
+
1

2
W

i
c
i
(X)B
i
(I +B

i
c
i
(X)B
i
)
1
B

i
c
i
(X)W
i
_
1
_
1

2
W

i
(I c
i
(X)B
i
(I +B

i
c
i
(X)B
i
)
1
B

i
)c
i
(X)A
i
_
=
_
I
1

2
W

i
c
i
(X)W
i
_
1
1

i
c
i
(X)(A
i
+B
i
F
i
). (327)
iii) r

(L) < 1, onde L(.) = (L


1
(.), . . . , L
N
(.)) e denido como
L
i
(.) =
_
A
i
+B
i
F
i
+
1

W
i
G
i
_

c
i
(.)
_
A
i
+B
i
F
i
+
1

W
i
G
i
_
(328)
para i = 1, . . . , N.
As equa c oes (324) a (328) fornecem condi c oes necess arias e sucientes [COSTA &
DO VAL (1996)] para a existencia de solu c ao para o problema de controle H

.
A condi c ao de que (C, A) seja detect avel na media quadr atica, juntamente com a
estabilizabilidade de (A, B), e usada apenas para garantir a existencia de uma solu c ao
estabilizante no sentido da media quadr atica para as equa c oes algebricas de Riccati
191
acopladas dadas por
X
i
= Q
i
+A

i
c
i
(X)A
i
A

i
c
i
(X)B
i
(B

i
c
i
(X)B
i
+I)
1
B

i
c
i
(X)A
i
para i = 1, . . . , N.
0.5 Controle Markoviano Misto H
2
/H

Nesta se c ao se considera o problema de controle misto H


2
/H

para sistemas lineares


discretos sujeitos a saltos Markovianos. O problema aqui consiste em se obter um
controlador estabilizante no sentido da media quadr atica tal que um limite superior
para a norma H
2
do sistema seja minimizado, porem garantindo-se que a norma H

do sistema seja menor que um valor pre-especicado .


Nesta abordagem pode-se assumir que a matriz de probabilidades de transi c ao da
cadeia de Markov P n ao e exatamente conhecida. Tal condi c ao e substituda pela
hip otese mais fraca de que ela apenas perten ca a um conjunto convexo apropriado.
Neste caso, o controlador estabilizante e denido como aquele que estabiliza o sistema
Markoviano para todas as matrizes de probabilidades de transi c ao dentro do conjunto.
Este conceito de matriz de probabilidades de transi c ao n ao conhecida foi inicialmente
introduzido em [RAMI & EL GHAOUI (1994)] para sistemas lineares a tempo contnuo
sujeitos a saltos Markovianos.
Considere o seguinte sistema linear discreto sujeito a saltos Markovianos:
=
_

_
x(k + 1) = A
(k)
x(k) +B
(k)
u(k) +Ww(k)
z(k) = C
(k)
x(k) +D
(k)
u(k)
x(0) = x
0
(0) =
0
.
(329)
O sistema acima difere do sistema 322 pelo fato de agora W B(C
r
, C
n
) ser uma
matriz constante para todas as congura c oes. Ser ao feitas as seguintes hip oteses:
D

i
D
i
> 0 (330)
C

i
D
i
= 0. (331)
192
Quando fecha-se a malha do sistema, fazendo-se u(k) = F
(k)
x(k) no sistema 329, com
F = (F
1
, . . . , F
N
), obtem-se o sistema em malha fechada
F
.
O problema de controle H
2
/H

que se deseja resolver e o seguinte: Dado


> 0, encontrar F que estabilize robustamente (A, B) e que minimize
sujeito a |
F
|
2
e |
F
|

.
Utiliza-se o seguinte resultado para resolver o problema nesta se c ao: Suponha que
(C, A) seja detect avel na media quadr atica e que > 0 seja um n umero real xado. Se
existirem X = (X
1
, . . . , X
N
) 0 e F = (F
1
, . . . , F
N
) H
n,m
tais que,
X
i
+ (A
i
+B
i
F
i
)

c
i
(X)(A
i
+B
i
F
i
)+
(C
i
+D
i
F
i
)

(C
i
+D
i
F
i
) +
1

2
X
i
WW

X
i
0 (332)
para i o, ent ao F = (F
1
, . . . , F
N
) estabiliza (A, B) na media quadr atica [COSTA &
MARQUES (1998)], e
|
F
|
2


2
(1 )
2
(333)
|
F
|
2
2

N

i=1
trW

X
i
W (334)
sendo que,

_
0,
1

2
N

i=1
trW

X
i
W
_
. (335)
Utiliza-se a seguinte aproxima c ao para resolver o problema de controle misto: Para
> 0 xado, encontrar X = (X
1
, . . . , X
N
) 0 e F = (F
1
, . . . , F
N
) tais que
tr
_
N

i=1
W

X
i
W
_
(336)
seja minimizado e esteja sujeito ` a restri c ao 332.
Aqui se assumir a que a matriz P n ao e exatamente conhecida, mas que pertence a
um conjunto convexo P denido como
P =
_
P; P =
q

t=1

t
P
t
, com
t
0,
q

t=1

t
= 1
_
, (337)
193
sendo P
t
= [p
t
ij
], t = 1, . . . , q, s ao matrizes de probabilidades de transi c ao conhecidas.
Na seq uencia se mostrar a que uma aproxima c ao para esse problema pode ser obtida
atraves de um problema de otimiza c ao convexo sujeito a DMLs.
Seja,
t
i
=
_
_
p
t
i1
I
_
p
t
iN
I
_
B(C
Nn
, C
n
) para i = 1, . . . , N e t = 1, . . . , q.
Dene-se o seguinte problema de otimiza c ao:
Seja =
2
, obtenha X = (X
1
, . . . , X
N
) G
n
,Q = (Q
1
, . . . , Q
N
) G
n
, L =
(L
1
, . . . , L
N
) G
n
, e Y = (Y
1
, . . . , Y
N
) G
n,m
tais que
= mintr
_
N

i=1
D

X
i
D
_
, (338)
sujeito a
_

_
Q
i
Q
i
A

i
+Y

i
B

i
Q
i
M

i
Y

i
J

i
D
A
i
Q
i
+B
i
Y
i
L
i
0 0 0
M
i
Q
i
0 I
n
0 0
J
i
Y
i
0 0 I
n
0
D

0 0 0 I
r
_

_
0 (339)
_
_
L
i
L
i

t
i

t
i
L
i
diagQ
_
_
0 (340)
_
_
X
i
I
I Q
i
_
_
0 (341)
X
i
= X

i
> 0 (342)
Q
i
= Q

i
> 0 (343)
L
i
= L

i
> 0 (344)
sendo diagQ B(R
Nn
) a matriz formada por Q
1
, . . . , Q
N
na diagonal e zero nas
posi c oes restantes.
Admite-se que o problema acima tenha uma solu c ao X, Q, L e Y , e F = (F
1
, . . . , F
N
)
seja dado por F
i
= Y
i
Q
1
i
, e =

N
i=1
trW

X
i
W. Ent ao F estabiliza robustamente
(A, B) e |
F
|
2
e |
F
|

para todo P P [COSTA & MARQUES (1998)].


194
0.6 Resultados Experimentais
Nesta se c ao s ao apresentados os resultados obtidos da implementa c ao dos contro-
ladores Markovianos no rob o experimental UArm II. Tais controladores foram calcula-
dos de acordo com as se c oes 0.4, 0.3 e 0.5, e usando o toolbox Discrete Time Markovian
Jump Linear Systems (DTMJLS), desenvolvido por Ricardo P. Marques, veja [MAR-
QUES (1997)] para mais detalhes.
As posi c oes inicial e nal consideradas foram, respectivamente, q(0) = [0

]
T
e q(T) = [20

20

20

], sendo T = [ 4.0 4.0 4.0] s. A congura c ao inicial foi AAA,


com ponto de opera c ao iniciando em 1. As mudan cas de um ponto de opera c ao para
outra s ao denidas de acordo com a posi c ao real das juntas do manipulador em rela c ao
aos setores delimitados pelo angulo de 10

, como denido na Se c ao 0.2. Para validar


o controlador tolerante a falha proposto, uma falha articial foi introduzida em t
f
=
2.8 s, alterando o ponto de opera c ao da congura c ao AAA para a congura c ao APA
u
,
mantendo sua posi c ao com rela c ao ao posicionamento das juntas. Um dist urbio de
torque foi introduzido para vericar a robustez dos controladores:

d
=
_

_
0.1e
2(tt
f
)
2
sin(4t)
0.05e
2(tt
f
)
2
sin(5t)
0.03e
2(tt
f
)
2
sin(6t)
_

_
. (345)
Este dist urbio consiste de fun c oes normais com oscila c oes senoidais, Figura 83. O
dist urbio na junta passiva e retirado quando ocorre a falha.
Para estes experimentos, o controlador preliminar PD foi denido como:
K
P
AAA
=
_

_
0.2 0 0
0 0.15 0
0 0 0.12
_

_
, K
D
AAA
=
_

_
0.02 0 0
0 0.02 0
0 0 0.02
_

_
,
K
P
APAu
=
_
_
0.66 0.03
0.04 0.33
_
_
, K
D
APAu
=
_
_
0.07 0.01
0.04 0.06
_
_
,
K
P
APA
l
=
_
_
1.25 0.19
0.06 0.29
_
_
e K
D
APA
l
=
_
_
0.27 0.02
0.01 0.01
_
_
195
0 1 2 3 4 5 6
0.03
0.02
0.01
0
0.01
0.02
0.03
Time (sec)
T
o
r
q
u
e

d
i
s
t
u
r
b
a
n
c
e

(
N
m
)
Figura 83: Dist urbio, controle Markoviano.
Os controladores Markovianos foram calculados considerando = 20 e = 1,
Equa c ao (315). Note que as condi c oes

C
T

D = 0 e

D
T

D = I s ao satisfeitas para estas
matrizes. Para o controlador Markoviano H
2
, as matrizes de pondera c ao s ao Q =

C
T

C
e R = I. O melhor valor de encontrado para os controladores Markovianos H

e
misto H
2
/H

foi = 10.
Os resultados experimentais, posi c ao das juntas, cadeia de Markov, velocidade e
torque, para os tres controles, H
2
, H

e H
2
/H

, s ao mostrados nas Figuras 84 a 92.


As juntas s ao representadas por:
Linha trcejada - junta 1;
Linha s olida - junta 2;
Linha pontilhada - junta 3.
Mesmo depois da introdu c ao da falha articial, o sistema manteve a estabilidade
para todos os controladores Markovianos. Embora os resultados sejam pr oximos, a
inuencia dos controladores Markovianos no torque aplicado indica a caracterstica
de robustez de cada um. Para medir esta inuencia, calcula-se a porcentagem de
energia gasta pelo controlador Markoviano com rela c ao ` a energia total. A Tabela 7
mostra a porcentagem do controlador Markoviano,
M
= u, e do controlador PD,

PD
= [K
P
K
D
]x.
196
Tabela 7: Porcentagem de
M
e
PD
no torque aplicado .
Controladores H
2
H H
2
/H
Markovianos e PD

M
49, 5 % 52, 1 % 55, 4 %

PD
50, 5 % 47, 9 % 44, 6 %
0 1 2 3 4 5 6
5
0
5
10
15
20
25
Time (s)
J
o
i
n
t

P
o
s
i
t
i
o
n
(

)
0 1 2 3 4 5 6
0
5
10
15
20
25
Time (s)
O
p
e
r
a
t
i
o
n

P
o
i
n
t
s
Figura 84: Posi c ao angular, controle Markoviano H
2
.
197
0 1 2 3 4 5 6
30
20
10
0
10
20
30
40
50
60
70
Time (sec)
J
o
i
n
t

V
e
l
o
c
i
t
y

(

/
s
e
c
)
Figura 85: Velocidade angular, controle Markoviano H
2
.
0 1 2 3 4 5 6
0.25
0.2
0.15
0.1
0.05
0
0.05
0.1
0.15
0.2
0.25
Time (sec)
T
o
r
q
u
e

(
N
m
)
Figura 86: Torque, controle Markoviano H
2
.
198
0 1 2 3 4 5 6
5
0
5
10
15
20
25
Time (s)
J
o
i
n
t

P
o
s
i
t
i
o
n
(

)
0 1 2 3 4 5 6
0
5
10
15
20
25
Time (s)
O
p
e
r
a
t
i
o
n

P
o
i
n
t
s
Figura 87: Posi c ao angular, controle Markoviano H

.
0 1 2 3 4 5 6
30
20
10
0
10
20
30
40
50
60
70
Time (sec)
J
o
i
n
t

V
e
l
o
c
i
t
y

(

/
s
e
c
)
Figura 88: Velocidade angular, controle Markoviano H

.
199
0 1 2 3 4 5 6
0.25
0.2
0.15
0.1
0.05
0
0.05
0.1
0.15
0.2
0.25
Time (sec)
T
o
r
q
u
e

(
N
m
)
Figura 89: Torque, controle Markoviano H

.
0 1 2 3 4 5 6
5
0
5
10
15
20
25
Time (s)
J
o
i
n
t

P
o
s
i
t
i
o
n
(

)
0 1 2 3 4 5 6
0
5
10
15
20
25
Time (s)
O
p
e
r
a
t
i
o
n

P
o
i
n
t
s
Figura 90: Posi c ao angular, controle Markoviano misto H
2
/H

.
200
0 1 2 3 4 5 6
30
20
10
0
10
20
30
40
50
60
70
Time (sec)
J
o
i
n
t

V
e
l
o
c
i
t
y

(

/
s
e
c
)
Figura 91: Velocidade angular, controle Markoviano misto H
2
/H

.
0 1 2 3 4 5 6
0.25
0.2
0.15
0.1
0.05
0
0.05
0.1
0.15
0.2
0.25
Time (sec)
T
o
r
q
u
e

(
N
m
)
Figura 92: Torque, controle Markoviano misto H
2
/H

.
Parte XII
O rob o UArm II
201
202
Neste captulo, uma descri c ao completa do rob o manipulador UArm II, construdo
com caractersticas especiais de subatua c ao, ser a apresentada. O acionamento e real-
izado diretamente a partir de um ambiente de controle que foi desenvolvido, em lin-
guagem MatLab
c _
, no Laborat orio de Sistemas Inteligentes (LASI) do Departamento
de Engenharia Eletrica da USP em S ao Carlos.
UArm II
O rob o manipulador subatuado UArm II (Underactuated Arm II), projetado e con-
strudo por H. Ben Brown, Jr. da Universidade Carnegie Mellon de Pittsburgh, PA,
USA (Figura 93), e um manipulador planar de tres ligamentos que possui uma carac-
terstica especial em suas juntas. Cada junta contem um atuador e um freio, sendo
que pode-se congur a-las como juntas ativas ou passivas, habilitando ou n ao o motor
DC de cada junta. Utilizando-se desta propriedade, todas as possveis congura c oes,
de acordo com a localiza c ao das juntas ativas (A) e Passivas (P), s ao aceitas: AAA,
AAP, APA, PAA, APP, PAP e PPA. Por exemplo, a congura c ao AAP representa que
as juntas 1 e 2 s ao ativas e a junta 3 e passiva.
Figura 93: Underactuated Arm II.
O manipulador e disposto sobre uma mesa de m armore, sendo seu movimento pro-
porcionado por um colch ao de ar gerado a partir da libera c ao de ar comprimido na
parte inferior das juntas. Os freios s ao constitudos por diafragmas cujo acionamento
pelo ar comprimido provoca o travamento das juntas.
203
Dispositivos de leitura de posi c ao opticos (encoders) com decodica c ao em quadratura
s ao utilizados para medir a posi c ao real das juntas. As velocidades angulares s ao obti-
das por diferencia c ao numerica das posi c oes e posteriormente ltradas, sendo esta uma
medida indireta e imprecisa. A realimenta c ao do estado (erro de posi c ao e de veloci-
dade) pode n ao ser satisfat oria devido a esta imprecis ao da velocidade. Para eliminar
esta deciencia, utiliza-se, na literatura, a realimenta c ao da sada, sendo a sada so-
mente erro de posi c ao. Trabalhos com este objetivo ser ao realizados posteriormente
(captulo ??).
A tens ao de alimenta c ao e fornecida por uma fonte de 48V/20A e 24V/1A. Por
motivo de precau c ao, um bot ao de emergencia (Kill Switch) corta a alimenta c ao da
fonte quando acionado. Os demais componentes do sistema est ao dispostos na placa
de controle do manipulador: amplicadores de corrente, sistema de controle da press ao
do ar, v alvulas solen oides dos ferios. Na gura 94, s ao mostrados o rob o manipulador,
a placa de controle, fonte de tens ao e computador.
Figura 94: UArm II, fonte de tens ao, placa de controle e computador.
A interface entre o computador e a placa de controle do manipulador e realizada
utilizando-se uma placa de entrada-sada Servo-To-Go
c _
, capaz de controlar ate 8 mo-
tores simultaneamente, ou seja 8 juntas, sendo usada para outros ns alem de manip-
uladores, como, controle de c ameras, controle de instrumentos medicos e ferramentas
mec anicas. Suas caractersticas s ao as seguintes:
- entradas para sinais de encoders (somando 8 canais);
204
- sadas anal ogicas (8 canais , 13 bits de resolu c ao, + 10 V a -10 V de amplitude);
- entradas e sadas digitais (32 bits, congurado em v arias combina c oes de entrada
e sada);
- entradas anal ogicas (somando 8 canais , 13 bits , congurado para +/- 10 V ou
+/- 5 V de amplitude);
- intervalo de tempo (capacidade de interrup c ao do PC);
- detector da base de endere co com IRQ software (usado para determinar a base
de endere co automaticamente);
- 5 jumpers - estruturas onde s ao selecionadas caractersticas desejadas ` a placa,
como base de endere co, amplitude de sada anal ogica, etc.
O driver utilizado, virtual device driver (VxD), e compatvel com o sistema opera-
cional utilizado (Windows 95) e acessado por dll s (dynamically linked libraries) geradas
a partir da compila c ao, no espa co de trabalho do MatLab
c _
, de programas em C++
contendo fun c oes de tipo mex. Foram geradas 4 fun c oes de controle, mostradas na
Tabela 8.
Fun c oes dll Descri c ao
SET-DAC-ALL-STG envia tens oes aos 3 motores
GET-POSITION le os angulos das juntas
SET-ENCODER-ONE-STG referencia o encoder de um eixo para um valor dado
SET-BRAKE-MOTOR aciona/libera os freios e habilita/desabilita os motores
Tabela 8: Fun c oes dll s utilizadas.
Especica c oes do sistema:
1. Bra co
Comprimento do ligamento: 31.5 cm
Comprimento total: 76.5 cm
Medidas da junta: 76 mm de di ametro e 86 mm de altura
Massa da junta: 670 g
205
Massa do efetuador: 220 g
Massa do ligamento: 30 g (excluindo os, conectores)
2. Motores das juntas
Modelo: Kollmorgen RBE - brushless DC
Voltagem nominal: 48 V DC
Resistencia de giro: 2.4 Ohm
Torque constante: 0.14 Nm/Amp
Torque de pico: 2.8 Nm
Massa do motor: 344g
Inercia do rotor: 0.0000148 kg m
2
3. Amplicadores de corrente
Modelo: Elmo SBA - 10/100H-4
Corrente de pico: 20 A
Corrente contnua: 10 A
Tens ao: 20-90 V DC
4. Freios
Tipo: diafragma acionado por ar
Press ao: 100 PSI (700 KPa) m ax.
Torque: 2.8 Nm
5. Encoders oticos
Modelo: Hewlett Packard HEDS - 9040-T00
Disco: modelo HEDS - 6140-T08
Linhas: 2000/rev
Contagem ap os decodica c ao em quadratura: 8000/rev
6. Flutuadores de ar
Di ametro dos orifcios: 0.36 mm
206
Altura da camada de ar: 0.08 mm aproximadamente
Press ao do ar: 100 PSI (700 KPa) m ax.
7. Sistema de controle da press ao do ar
v alvulas solen oides (bobinas): modelo Clippard Evo-3M, 24 V DC, 0.67 W
V alvulas reguladoras de press ao
8. Sistema computacional
Computador: Pentium PC com entrada disponvel para placa STG
Placa: modelo Servo To Go S8, I/O 8 eixos
Calculo dos parametros do manipulador
Figura 95: Esquema das juntas e elos.
Na gura 95 e mostrada um desenho esquem atico das juntas e elos do manipulador.
Estes angulos assumem valores positivos no sentido anti-hor ario e valores negativos no
sentido hor ario. A partir dos dados anteriores e desse esquema podemos calcular os
par ametros cinem aticos e din amicos utilizados na modelagem do manipulador, usando
as seguintes f ormulas:
m
i
= m
s
+m
l
+m
j
i
+m
m
(346)
lc
i
=
m
s
lc
s
+m
l
lc
l
+m
j
i
lc
j
i
+m
m
lc
m
m
s
+m
l
+m
j
i
+m
m
(347)
I
0
= I
j
i
+m
j
i
lc
j
i
2
+I
l
+m
l
lc
l
2
+I
s
+m
s
lc
s
2
+I
m
+m
m
lc
l
2
(348)
I
i
= I
0
m
i
lc
i
2
(349)
207
sendo,
m
i
= massa do segmento i.
m
s
= 0.030 kg, massa do suporte em L do link.
m
l
= 0.030 kg, massa do link de bra de vidro.
m
j
i
= 0.670 kg, massa da junta i.
m
m
= 0.344 kg, massa do motor da junta i 1.
lc
i
= centro de massa do segmento i.
lc
s
= 0.03 m, centro de massa do suporte.
lc
l
= 0.1 m, centro de massa do link.
lc
j
i
= 0.203 m, centro de massa da junta i.
lc
m
= 0, centro de massa do motor.
I
0
= momento de inercia em rela c ao ao eixo da junta i 1.
I
i
= momento de inercia em rela c ao ao centro de massa do segmento.
I
s
= desprezado, momento de inercia do suporte.
I
l
= 0.00005625 kg m
2
, momento de inercia do link.
I
j
i
= 0.0003918 kg m
2
, momento de inercia.
I
m
= 0.000062 kg m
2
, momento de inercia do motor.
Um termo de fric c ao ,F( q), dependente da velocidade tambem pode ser considerado
como:
F( q) =
_

_
f
1
q
1
f
2
q
2
f
3
q
3
_

_
sendo os valores f
1
, f
2
e f
3
escolhidos ap os testes empricos.
Assim construmos a seguinte tabela com os par ametros:
i m
i
(kg) I
i
(kgm
2
) L
i
(m) lc
i
(m) f
i
(kgm
2
/s)
1 0.850 0.0153 0.203 0.096 0.28
2 0.850 0.0100 0.203 0.096 0.18
3 0.625 0.0100 0.203 0.077 0.10
Tabela 9: Par ametros do rob o.
208
Modelo Dinamico do UArmII
A equa c ao din amica do manipulador UArm II e dada por:
_

3
_

_
=
_

_
M
11
M
12
M
13
M
12
M
22
M
23
M
13
M
23
M
33
_

_
_

_
q
1
q
2
q
3
_

_
+
_

_
b
1
b
2
b
3
_

_
. (350)
Cada elemento M
ij
da matriz de inercia depende das posi c oes moment aneas das
juntas (vetor q), das massas (m
i
), dos momentos de inercia (I
i
), dos comprimentos (l
i
)
e dos centros de massa dos elos (l
ci
). Os termos independentes b
i
tambem s ao calculados
atraves de express oes que dependem desses par ametros e das velocidades moment aneas
das juntas (vetor q).
Express oes Algebricas do Modelo
M
11
= I
1
+I
2
+I
3
+m
1
l
2
c1
+m
2
(l
2
1
+l
2
c2
+ 2l
1
l
c2
cos(
2
)) +
m
3
(l
2
1
+l
2
2
+l
2
c3
+ 2l
1
l
2
cos(
2
) + 2l
1
l
c3
cos(
2
+
3
) + 2l
2
l
c3
cos(
3
))
M
12
= I
2
+I
3
+m
2
(l
2
c2
+ 2l
1
l
c2
cos(
2
)) +
m
3
(l
2
2
+l
2
c3
+l
1
l
2
cos(
2
) +l
1
l
c3
cos(
2
+
3
) + 2l
2
l
c3
cos(
3
))
M
13
= I
3
+m
3
(l
2
c3
+l
1
l
c3
cos(
2
+
3
) +l
2
l
c3
cos(
3
))
M
22
= I
2
+I
3
+m
2
(l
2
c2
) +m
3
(l
2
2
+l
2
c3
+ 2l
2
l
c3
cos(
3
))
M
23
= I
3
+m
3
(l
2
c3
+l
2
l
c3
cos(
3
))
M
33
= I
3
+m
3
(l
2
c3
)
M
21
= M
12
M
31
= M
13
M
32
= M
23
b
1
= (m
2
l
1
l
c2
sen (
2
) +m
3
(l
1
l
2
sen (
2
) l
1
l
c3
sen (
2
+
3
)))
(

2
2
+ 2

2
) +m
3
(l
1
l
c3
sen (
2
+
3
) l
2
l
c3
sen (
3
))
209
(

2
3
+ 2

3
+ 2

3
) +m
1
gl
c1
cos(
1
) +
m
2
g(l
1
cos(
1
) +l
c2
cos(
1
+
2
)) +m
3
g(l
1
cos(
1
) +
l
2
cos(
1
+
2
) +l
c3
cos(
1
+
2
+
3
)) +f
1

1
b
2
= (m
2
l
1
l
c2
sen (
2
) +m
3
(l
1
l
2
sen (
2
) +l
1
l
c3
sen(
2
+
3
)))

2
1

m
3
l
2
l
c3
sen (
3
)(

2
3
+ 2

3
+ 2

3
) +
m
2
g(l
c2
cos(
1
+
2
)) +m
3
g(l
2
cos(
1
+
2
) +l
c3
cos(
1
+
2
+
3
)) +f
2

2
b
3
= m
3
(l
1
l
c3
sen (
2
+
3
) +l
2
l
c3
sen (
3
))

2
1
+
m
3
l
2
l
c3
sen (
3
)(

2
2
+ 2

2
) +m
3
g(l
c3
cos(
1
+
2
+
3
)) +f
3

3
.
Ambiente de controle
Um ambiente de controle foi desenvolvido de tal forma que todas as altera c oes de
congura c ao e o acionamento do rob o possam ser feitas amigavelmente [SIQUEIRA
et al. (1999); SOARES et al. (1999)]. O UMCE (Underactuated Manipulator Control
Environment) foi desenvolvido na linguagem MatLab
c _
e possui duas caractersticas
que se destacam: o acionamento do rob o manipulador UArm II e feito diretamente na
interface gr aca (Figura 96) ao toque de um bot ao e o movimento do rob o e reproduzido
em tempo real nesta interface gr aca.
Figura 96: Interface gr aca do UMCE.
O acesso ao ambiente de controle e feito no espa co de trabalho do MatLab
c _
.
210
Conforme podemos observar na Figura 96, a interface gr aca e dividida em duas areas
denominadas: msg-frame, contendo bot oes de comando e prompts para entrada de
dados; e movie-axis, na qual o movimento real do rob o e representado.
A area msg-frame e subdividida nas seguintes sub- areas:
1. USER COMMANDS: os bot oes desta area (Figura 97) realizam as seguintes
tarefas:
Figura 97: Comandos de acionamento.
Start Simulation: Inicia a simula c ao. O bot ao se torna invisvel durante o
processamento da simula c ao e volta a se tornar visvel com o termino da
simula c ao ou quando e pressionado o bot ao Stop. Se algo errado ocorre
durante a simula c ao (uma invers ao de matriz mal sucedida, por exemplo),
este bot ao n ao ca no seu estado visvel. Quando isto ocorre e necess ario que
o usu ario pressione o bot ao Stop para que ele retorne ao seu estado inicial.
Start UArmII : Inicia o manipulador real e apresenta as mesmas carac-
tersticas do bot ao anterior.
Stop: Para a simula c ao ou o movimento real em qualquer instante e retorna
os bot oes Start Simulation e Start UArmII para seus estados visveis.
Restart: Reinicia a interface gr aca desligando e carregando novamente todo
programa. Para ser utilizado quando alguma altera c ao e feita em um dos
bot oes, mensagens, eixos, etc.
Close: Fecha a interface gr aca e limpa todas as vari aveis do workspace do
MatLab
c _
.
Set DAC=0: Faz com que todas as sadas anal ogicas dos amplicadores
quem com 0 Volt. Esta op c ao e utilizada como medida de seguran ca nos
casos em que o bot ao de emergencia e acionado, pois resduos de tens ao nas
sadas podem provocar um movimento inesperado do manipulador.
211
Reference: Adquire as posi c oes atuais das juntas com a nalidade de gerar
referencias para os encoders das juntas.
Brake On: Aciona os freios de todas as juntas. Este comando e utilizado
ap os o manipulador ser posicionado na posi c ao especca para se gerar a
referencia.
Brake O : Libera todos os freios do rob o UArm II. Quando as juntas al-
can cam o seu set-point os freios s ao acionados.
2. SIMULATION PARAMETERS: Esta area mostra os par ametros que podem ser
denidos para a simula c ao e controle em tempo real. Os seguintes dados s ao
mostrados e podem ser alterados, Figura 98:
Figura 98: Par ametros do experimento.
Conguration: Dene a congura c ao para o rob o manipulador conforme a
posi c ao das juntas ativas e passivas. Ex.: 3PAP representa um manipulador
de 3 juntas, com a primeira e a terceira passivas e segunda ativa.
Controller: Dene o controlador a ser utilizado.
Initial angles: Dene os angulos iniciais do manipulador. Para a con-
gura c ao padr ao de angulos inicias o usu ario deve escolher a op c ao De-
fault. Para escolher angulos iniciais aleat orios a op c ao Random deve ser
selecionada. Caso o usu ario queira entrar com os angulos iniciais o seguinte
procedimento deve ser realizado: no campo de entrada de dados digite os
angulos iniciais em graus como um vetor (Ex., [ 30 30 45 ]), clique na op c ao
Initial angles e depois escolha a op c ao User dened.
Set-point: Dene a posi c ao nal desejada para as juntas. Pode ser alterado
utilizando o mesmo procedimento descrito acima.
Fault: Dene a junta na qual a falha ocorrer a. Pode-se escolher: none, joint
1, joint 2 ou joint 3. O tempo inicial e nal da falha tambem podem ser
212
denidos.

E necess ario denir o tempo nal pois se a falha n ao for detectada,
o rob o manipulador UArm II ser a controlado ap os o perodo em que ocorrer
a falha, evitando que o sistema que inst avel.
Um coment ario adicional pode ser feito a respeito do procedimento de entrada
para os valores iniciais e nais dos angulos das juntas. Um clique com o bot ao
esquerdo do mouse no espa co dos eixos cartesianos (movie-axis) dene a posi c ao
inicial e um segundo clique com o bot ao direito do mouse dene a posi c ao nal
desejada.
3. DYNAMIC PARAMETERS: Esta area mostra os par ametros que denem o ma-
nipulador, Figura 99. Os par ametros padr oes s ao os mostrados na Tabela 9.
Esses dados podem ser alterados utilizando o mesmo procedimento descrito para
a posi c ao inicial.
Figura 99: Par ametros din amicos.
Dynamic uncertainty: Dene o grau de incerteza nos par ametros din amicos
e cinem aticos. Quando este valor e igual a 1 o modelo e assumido como
sendo perfeitamente conhecido. Quando apresenta um valor diferente todos
os par ametros din amicos e cinem aticos s ao multiplicados por este valor e
estes valores estimados s ao utilizados pelo controlador. Note que o modelo
din amico ainda e calculado utilizando os par ametros din amicos e cinem aticos
nominais. Esta op c ao e utilizada para testar a robustez das leis de controle
em rela c ao ` a incertezas parametricas.
4. CHANGE PARAMETERS: Fornece um prompt para a entrada numerica de da-
dos, Figura 100. A mensagem Make sure to use correct dimensions aparecer a
no prompt. Quando um dado inv alido e fornecido, a mensagem Invalid data!
Default values set aparecer a.
213
Figura 100: Altera c ao de par ametros e gr acos.
5. GRAPHICS: Este menu pull-down (Figura 100) apresenta os controladores disponveis.
Quando uma op c ao e selecionada uma nova janela chamada Graphics e aberta
contendo os gr acos de posi c ao, velocidade e torque das juntas para o controlador
selecionado, Figura 101, resultantes da simula c ao e tambem adquiridos durante
o movimento experimental.
Figura 101: Janela de gr acos.
Os seguintes dados tambem s ao exibidos e n ao podem ser alterados:
Simulation time: Mostra o progresso do tempo de simula c ao. Esta mesma in-
forma c ao e exibida no workspace do MatLab
c _
ao termino da simula c ao.
Real time: Exibe o progresso do tempo real de simula c ao ou execu c ao de uma
trajet oria para o rob o UArm II.
Fault time: Mostra os tempos inicial e nal de ocorrencia da falha.
Referencias Bibliogracas
APKARIAN (1997) Apkarian, P. On the discretization of LMI-synthesized linear
parameter-varying controllers. Automatica, 33(4):655661, 1997.
APKARIAN & ADAMS (1998) Apkarian, P. e Adams, R. J. Advanced gain-scheduling
techniques for uncertain systems. IEEE Transactions on Control Systems Tech-
nology, 6(1):2132, 1998.
APKARIAN & BIANNIC (1995) Apkarian, P. e Biannic, J. M. Self-scheduled H

con-
trol via linear matrix inequalities. Journal of Guidance, Control and Dynamics,
18(3):532538, 1995.
APKARIAN & GAHINET (1995) Apkarian, P. e Gahinet, P. A convex characterization
of gain-scheduled H

controllers. IEEE Transactions on Automatic Control,


40(5):853864, 1995.
APKARIAN et al. (1995) Apkarian, P., Gahinet, P., e Becker, G. Self-scheduled H

control
of linear parameter-varying systems: a design example. Automatica, 31(9):1251
1261, 1995.
ARAI & TACHI (1991) Arai, H. e Tachi, S. Position control of a manipulator with passive
joints using dynamic coupling. IEEE Transactions on Robotics and Automation,
7(4):528534, 1991.
BALAS et al. (1994) Balas, G. J., Doyle, J. C., Glover, K., Packard, A., e Smith, R. -
Analysis and Synthesis Toolbox. The MathWorks, 1994.
BALL et al. (1991) Ball, J. A., Helton, J. W., e Walker, M. L. H

control for nonlin-


ear systems with output feedback. IEEE Transactions on Automatic Control,
38(4):546559, 1991.
214
Referencias Bibliogr acas 215
BASAR & BERNHARD (1990) Basar, T. e Bernhard, P. H

-Optimal Control and Related


Minimax Problems. Birkhauser, Berlin, Germany, 1990.
BASAR & OLSDER (1982) Basar, T. e Olsder, J. Dynamic Noncooperative Game Theory.
Academic Press, New York, 1982.
BECKER & PACKARD (1994) Becker, G. e Packard, A. Robust performance of linear
parametrically varying systems using parametrically-dependent linear feedback.
System & Control Letters, 23:205215, 1994.
BERGERMAN (1996) Bergerman, M. Dynamics and control of underactuated manipula-
tors, PhD Thesis. Carnegie Mellon University, Pittsburgh, 1996.
BERNSTEIN & HADDAD (1989) Bernstein, D. S. e Haddad, W. M. LQG control with
an H

performance boud: a Riccati equation approach. IEEE Transactions on


Automatic Control, 34(3):293305, 1989.
CHANG & CHEN (1997) Chang, Y. C. e Chen, B. S. A Nonlinear Adaptive H

Tracking
Control Design in Robotic Systems via Neural Networks. IEEE Transactions on
Control Systems Technology, 5(1):1329, 1997.
CHEN & CHANG (1997) Chen, B. S. e Chang, Y. C. Nonlinear mixed H
2
/H

control
for robust tracking design of robotic systems. International Journal of Control,
67(6):837857, 1997.
CHEN et al. (1997) Chen, B. S., Chang, Y. C., e Lee, T. C. Adaptive control in robotic
systems with H

tracking performance. Automatica, 33(2):227234, 1997.


CHEN et al. (1994) Chen, B. S., Lee, T. S., e Feng, J. H. A nonlinear H

control de-
sign in robotic systems under parameter perturbation and external disturbance.
International Journal of Control, 59(2):439461, 1994.
CHIANG & SAFONOV (1992) Chiang, R. Y. e Safonov, M. G. Robust Control Toolbox.
The MathWorks, New York, 1992.
CLOUTIER et al. (1996) Cloutier, J. R., DSouza, C. N., e Marcek, C. P. Nonlinear regula-
tion and nonlinear H

control via the state-dependent Riccati equation technique.


In Proceedings of the 1st International Conference on Nonlinear Problems in Avi-
ation and Aerospace, Daytona Beach, Florida, USA, 1996.
Referencias Bibliogr acas 216
COSTA & DO VAL (1996) Costa, O. L. V. e do Val, J. B. R. Full Information H

-Control
for Discrete-Time Innite Markov Jump Parameter Systems. Journal of Mathe-
matical Analysis and Applications, 202:578603, 1996.
COSTA & MARQUES (1998) Costa, O. L. V. e Marques, R. P. Mixed H
2
/H

Control of
DiscreteTime Markovian Jump Linear Systems. IEEE Transactions on Automatic
Control, 43(1):95100, 1998.
COSTA & MARQUES (2000) Costa, O. L. V. e Marques, R. P. Robust H
2
Control for
DiscreteTime Markovian Jump Linear Systems. International Journal of Control,
73(1):1121, 2000.
CRAIG (1986) Craig, J. J. Introduction to Robotics: Mechanics and Control. Addison-
Wesley, 1986.
DOYLE et al. (1994) Doyle, J., Zhou, K., Glover, K., e Bodenheimer, B. Mixed H
2
and
H

Performance Objectives I: Robust Performance Analysis. IEEE Transactions


on Automatic Control, 39(8):15641574, 1994.
DOYLE et al. (1994b) Doyle, J., Zhou, K., Glover, K., e Bodenheimer, B. Mixed H
2
and
H

Performance Objectives II: Optimal Control. IEEE Transactions on Auto-


matic Control, 39(8):15751586, 1994.
DOYLE et al. (1992) Doyle, J. C., Francis, B. A., e Tannembaum, A. R. Feedback control
theory. Maxwell Macmillan, New York, 1992.
DOYLE et al. (1989) Doyle, J. C., Glover, K., Khargonekar, P. P., e Francis, B. A. State
space solutions to standard H
2
and H

problems. IEEE Transactions on Auto-


matic Control, 34(8):831847, 1989.
FARFAN (2000) Farfan, D. V. Controladores Markovianos Aplicados a um Rob o Manip-
ulador Subatuado. S ao Carlos. Disserta c ao (Mestrado)- Escola de Engenharia de
S ao Carlos, Universidade de S ao Paulo, 2000.
FRANCIS (1987) Francis, B. A. A Course in H

Theory. Springer, New York, 1987.


GAHINET et al. (1995) Gahinet, P., Nemiroviski, A., Laub, A. J., e Chilali, M. LMI Con-
trol Toolbox. The MathWorks Inc., 1995.
Referencias Bibliogr acas 217
HELTON & ZHAN (1994) Helton, J. W. e Zhan, W. An inequality governing nonlinear
H

control. System & Control Letters, 22:157165, 1994.


HOEL et al. (1987) Hoel, P., Port, S., e Stone, C. Introduction to Stochastic Processes.
Waveland Press Inc, 1987.
HUANG & JADBABAIE (1998) Huang, Y. e Jadbabaie, A. Nonlinear H

Control: An
Enhanced Quasi-LPV Approach. In Workshop in H

nonlinear control by J. C.
Doyle, Caltech, IEEE International Conference on Decision and Control, Tampa,
Florida, USA, 1998.
HUANG & LU (1996) Huang, Y. e Lu, W. M. Nonlinear optimal control: Alternatives
to Hamilton-Jacobi equation. In IEEE International Conference on Decision and
Control, Kobe, Japan, 1996.
ISIDORI (1994) Isidori, A. H

-control via measurement feedback for ane nonlinear sys-


tems. International Journal of Robust and Nonlinear Control, 4:553574, 1994.
ISIDORI (1994b) Isidori, A. A necessary condition for nonlinear H

-control via measure-


ment feedback. System & Control Letters, 23:169177, 1994.
ISIDORI & ASTOLFI (1992) Isidori, A. e Astol, A. Disturbance attenuation and H

-
control via measurement feedback in nonlinear systems. IEEE Transactions on
Automatic Control, 37(9):12831293, 1992.
ISIDORI & KANG (1995) Isidori, A. e Kang, W. H

-control via measurement feedback for


general nonlinear systems. IEEE Transactions on Automatic Control, 40(3):466
472, 1995.
JADBABAIE et al. (1998) Jadbabaie, A., Yu, J., e Hauser, J. Stabilizing Receding Hori-
zon Control of Nonlinear Systems: A Control Lyapunov Function Approach. In
Workshop in H

nonlinear control by J. C. Doyle, Caltech, IEEE International


Conference on Decision and Control, Tampa, Florida, USA, 1998.
JAMES & BARAS (1995) James, M. R. e Baras, J. S. Robust H

output feedback con-


trol for general nonlinear systems. IEEE Transactions on Automatic Control,
40(6):10071017, 1995.
Referencias Bibliogr acas 218
JOHANSSON (1990) Johansson, R. Quadratic optimization of motion coordination and
control. IEEE Transactions on Automatic Control, 35(11):11971208, 1990.
KANG et al. (1999) Kang, B. S., Kim, S. H., Kwak, Y. K., e Smith, C. C. Robust Tracking
Control of a Direct Drive Robot. Journal of Dynamic Systems, Measurement, and
Control, 121(6):261269, 1999.
KOIVO (1989) Koivo, A. J. Fundamentals for control of robotic manipulators. John Wiley
and Sons, Inc., 1989.
LEWIS et al. (1993) Lewis, F. L., Abdallah, C. T., e Dawson, D. M. Control of robot
manipulators. Macmillan., New York, 1993.
LIMEBEER et al. (1992) Limebeer, D. J. N., Anderson, B. D., Khargonekar, P. P., e Green,
M. A game theoric approach to H

control for time-varying systems. SIAM


Journal of Control and Optimization, 30(2):262283, 1992.
LU (1995) Lu, W. M. A state-space approach to parameterization of stabilizing controllers
for nonlinear systems. IEEE Transactions on Automatic Control, 40(9):15761588,
1995.
LU (1996) Lu, W. M. H

control of nonlinear time-varying systems with nite-time horizon.


International Journal of Control, 64(2):241262, 1996.
LU & DOYLE (1993) Lu, W. M. e Doyle, J. C. H

control of nonlinear systems: a convex


characterization. In Caltech CDS Technical Memo CIT-CDS-93-020, 1993.
LU & DOYLE (1993b) Lu, W. M. e Doyle, J. C. H

control of nonlinear systems via output


feedback: a class of controllers. In Caltech CDS Technical Memo CIT-CDS-93-008,
1993.
LU & DOYLE (1994) Lu, W. M. e Doyle, J. C. H

control of nonlinear systems via output


feedback: controller parametrization. IEEE Transactions on Automatic Control,
39(12):25172521, 1994.
LU & DOYLE (1995) Lu, W. M. e Doyle, J. C. H

control of nonlinear systems: a con-


vex characterization. IEEE Transactions on Automatic Control, 40(9):16681675,
1995.
Referencias Bibliogr acas 219
MACIEJOWSKY (1989) Maciejowsky, J. M. Multivariable Feedback Design. Addison-
Wesley, Workingham, 1989.
MARQUES (1997) Marques, R. Algoritmos de controle para sistemas sujeitos a saltos
Markovianos. Tese de Doutoramento, Escola Politecnica da Universidade de S ao
Paulo, 1997.
NAKASHIMA (2001) Nakashima, P. H. Controle H
2
, H

e misto H
2
/H

aplicados a ma-
nipuladores subatuados. S ao Carlos. Disserta c ao (Mestrado)- Escola de Engenharia
de S ao Carlos, Universidade de S ao Paulo, 2001.
NESTEROV & NEMIROVSKI (1994) Nesterov, Y. E. e Nemirovski, A. S. Interior point
polynomial methods in convex programming: Theory and Applications. vol. 13 of
SIAM Studies in Applied Mathematics. Philadelphia, PA, 1994.
ORIOLO & NAKAMURA (1991) ORIOLO, G. e NAKAMURA, Y. Free-joint manipula-
tors: motion control under second order nonholonomic constraints. In IEEE Int.
Workshop on Intelligent Robots and Systems, pages 12481253, 1991.
ORLOV et al. (1999) Orlov, Y., Acho, L., e Solis, V. Nonlinear H

-control of time-varying
systems. In IEEE International Conference on Decision and Control, Phoenix,
Arizona, USA, 1999.
PACKARD & DOYLE (1993) Packard, A. e Doyle, J. C. The complex structure singular
value. Automatica, 29:71109, 1993.
POSTLETHWAITE & BARTOSZEWICZ (1998) Postlethwaite, I. e Bartoszewicz, A. Ap-
plication of non-linear H

control to the Tetrabot robot manipulator. Proceedings


of the Institution of Mechanical Engineers - Part I - Journal of Systems and Con-
trol Engineering, 212(16):459465, 1998.
PRIMBS et al. (1998) Primbs, J. A., Nevistic, V., e Doyle, J. C. On Receding Horizon Ex-
tensions and Control Lyapunov Functions. In Workshop in H

nonlinear control
by J. C. Doyle, Caltech, IEEE International Conference on Decision and Control,
Tampa, Florida, USA, 1998.
RAMI & EL GHAOUI (1994) Rami, M. A. e El Ghaoui, L. Robust Stabilization of Jump
Linear Systems Using Linear Matrix Inequalities. In IFAC Symposium on Robust
Control Design, pages 148151, Rio de Janeiro, 1994.
Referencias Bibliogr acas 220
SAFONOV et al. (1989) Safonov, M. G., Limebeer, D. J. N., e Chiang, R. Y. Simplifying the
H

theory via loop shifting, matrix pencil and descriptor concepts. International
Journal of Control, 50(6):24672488, 1989.
SAGE et al. (1999) Sage, H. G., de Mathelin, M. F., e Ostertag, E. Robust control of robot
manipulators: a survey. International Journal of Control, 72(16):14981522, 1999.
SCIAVICCO & SICILIANO (1996) Sciavicco, L. e Siciliano, B. Modeling and control of
robot manipulators. McGraw-Hill, 1996.
SHAKED & SOUZA (1995) Shaked, U. e de Souza, C. E. Continuous-time tracking prob-
lem in an H

setting: a game theory approach. IEEE Transactions on Automatic


Control, 40(5):841852, 1995.
SIQUEIRA et al. (1999) Siqueira, A. A. G., Bergerman, M., e Terra, M. H. Underactu-
ated manipulator control system development environment. In Proceedings of the
15th International Conference on CAD/CAM Robotics & Factories of the Future
CARS&FOF99, volume 2, Brazil, 1999.
SOARES et al. (1999) Soares, M. R., Terra, M. H., Bergerman, M., e Tin os, R. A simu-
lation environment for fault detection and isolation and control of underactuated
manipulators. In Proceedings of the 15th International Conference on CAD/CAM
Robotics & Factories of the Future CARS&FOF99, volume 2, Brazil, 1999.
SPONG & VIDYASAGAR (1989) Spong, M. W. e Vidyasagar, M. Robot Dynamics and
Control. John Wiley and Sons, Inc., 1989.
SU et al. (1999) Su, W., de Souza, C. E., e Xie, L. H

control for asymptotically stable


nonlinear systems. IEEE Transactions on Automatic Control, 44(5):989993, 1999.
SCHAFT (1991) van der Schaft, A. J. On a state space approach to nonlinear H

control.
System & Control Letters, 16:18, 1991.
SCHAFT (1992) van der Schaft, A. J. L
2
-gain analysis of nonlinear systems and nonlinear
state feedback H

control. IEEE Transactions on Automatic Control, 37(6):770


784, 1992.
WU (1995) Wu, F. Control of linear parameter-varying systems, PhD Thesis. , Department
of Mechanical Engineering, University of California at Berkeley, CA, 1995.
Referencias Bibliogr acas 221
WU et al. (2000) Wu, F., Grigoriadis, K. M., e Packard, A. Anti-windup controller design
using linear parameter-varying control methods. International Journal of Control,
73(12):11041114, 2000.
WU et al. (1996) Wu, F., Yang, X. H., Packard, A., e Becker, G. Induced L
2
-norm control
for LPV systems with bounded parameter variation rates. International Journal
of Robust and Nonlinear Control, 6:983998, 1996.
ZHOU & DOYLE (1998) Zhou, K. e Doyle, J. C. Essentials of Robust Control. Prentice
Hall, 1998.
ZHOU et al. (1995) Zhou, K., Doyle, J. C., e Glover, K. Robust and Optimal Control.
Prentice Hall, 1995.
ZHOU et al. (1994) Zhou, K., Glover, K., Bodenheimer, B., e Doyle, J. Mixed H
2
and
H

performance objectives I: robust performance analysis. IEEE Transactions on


Automatic Control, 39(8):15641574, 1994.
ZHOU et al. (1994b) Zhou, K., Glover, K., Bodenheimer, B., e Doyle, J. Mixed H
2
and
H

performance objectives II: optimal control. IEEE Transactions on Automatic


Control, 39(8):15751586, 1994.