(Silvia e Walter)
Tem uma medida continua da qualidade dos estados uma medida de desempenho mais geral deve permitir uma comparao entre os diferentes estados do mundo de acordo com o grau exato de felicidade que proporcionariam ao agente se fossem adotadas.
2
ESCOPO
Para julgar o que se deve fazer para obter um bem ou evitar um mal, necessrio considerar no apenas o bem e o mal em si, mas tambm a probabilidade de ele acontecer ou no acontecer, e ainda visualizar geometricamente a proporo que todos esses itens tm em conjunto."
Funes de utilidade
associam um valor a um estado
U(s1) = 10 U(s2) = 5
6
Uma ao no determinstica A ter estados resultantes possveis Resultadoi(A) onde i varia sobre os diferentes resultados. Para cada sada possvel est associada uma probabilidade
ou seja:
- O agente usa um modelo do mundo em conjunto com a funo utilidade (que mede suas preferncias entre os estados do mundo), em seguida escolhe a ao que leva melhor utilidade esperada.
8
AGENTES RACIONAIS
Para cada sequncia de percepes possvel, um
agente racional deve selecionar uma ao que venha a maximizar sua medida de desempenho, dada a evidncia fornecida pela sequncia de percepes e por qualquer conhecimento interno do agente.
9
10
Os axiomas da teoria da utilizade versam sobre preferncias.... ... porem so consequncias desses axiomas os seguintes teoremas:
existncia da funo de utilidade; utilidade esperada de uma loteria.
11
Se as preferncias de um agente obedecem aos axiomas de utilidade ento existe uma funo de valores reais U que opera sobre estados tais que U(A) > U(B) se e somente se A preferivel em relao a B, e U(A) = U(B) se e somente se o agente est indiferente entre A e B.
Utilidade esperada de uma loteria: a soma das probabilidades de cada possibilidade vezes a sua utilizade
12
preferir um corcel surrado 73 ao invs de um Mercedes novo preferir saldos de conta bancaria apenas em nmeros primos, abrindo mo do excedente Porm, em geral as preferncias de agentes reais so mais sistemticas
13
14
Utilidade do dinheiro
agentes preferem mais dinheiro do que menos (mantidas todas as condies iguais); agentes racionais possuem uma preferncia monotnica para mais dinheiro; porm no uma funo de utilidade pois no diz nada sobre preferncias a respeito de loterias envolvendo dinheiro.
15
Supondo que a moeda justa o Valor Monetrio Esperado (VME) de aceitar proposta :
VME = 0.5 (R$ 0) + 0.5 (R$ 3.000.000) = R$ 1.500.000 O Valor Monetrio Esperado de recusar a proposta de R$ 1.000.000 (menor)
16
Sk = 5 Sk+3.000.000 = 9 Sk+1.000.000 = 8
Utilidade esperada: EU(aceitar) = 0.5x5 + 0.5x8 = 7.5 < 8 Ao racional: rejeitar ! Calculando a Utilidade Esperada (EU) para cada uma das duas aes temos que a deciso depende do estado de riqueza atual do jogador, uma vez que a utilidade (mudana no estilo de vida) para o primeiro R$ 1.000.000 muito alta.
17
Portanto a utilidade no diretamente proporcional ao valor monetrio (pois a utilidade do seu primeiro milho maior do que a do seu segundo milho).
Utilidade do Dinheiro
No uma funo linear: conforme aumenta a quantidade de dinheiro, a taxa de crescimento da utilidade diminui.
ou seja, as pessoas ficam mais avessas a risco conforme aumentam os valores
18
18
Utilidade do dinheiro
Grayson (1960) deduziu que a utilidade do dinheiro proporcional ao logaritmo da quantia
19
A utilidade do dinheiro proporcional ao logaritmo da quantia entre -$150.000 e 800.000 (Mr. Beard)
U(L) < U(Seml(L)) Risk-adverso
Algum que j deve 10.000 pode muito bem aceitar um lanamento de moeda justo para um ganho de $10.000 (caras) e uma perda de $20000 para coroas. Tal comportamento poderia ser chamado de desesperado, mas racional se algum j est em uma situao desesperada.
20
21
No incio os Sistemas Especialistas concentravam-se em responder perguntas e no em tomadas de deciso; Hoje temos que os Sistemas Especialistas envolvem um Processo de Engenharia do Conhecimento com etapas definidas e que fornecem as seguintes capacidades: tomar decises; usar valor da informao para decidir se deve adquirir algo; calcular a sensibilidade de suas decises.
22
1) Determinar ( sintomas, doenas, tratamentos e resultados ); 2) Desenhar arcos ( que doen as causam cada sintoma ); 3) Desenhar arcos ( que tratamentos aliviam os sintomas de cada doena) Remover variveis no esto envolvidas em decises de tratamento 1) Pode vir de Banco de Dados de Pacientes; 2) Estudos de Literatura; 3) Avaliao de Especialistas Criar escala do melhor ao pior resultado: Recuperao Completa = 0 e Morte = -1000 Necessita conjunto de pares (entrada , sada) --> ( sintomas, solicitar tratamento ) Verificar se a melhor deciso sensvel a pequenas mudan as nas probabilidades e utilidades atribudas
Atribua Utilidade
23
IA Russel pg 586
24
Perguntas?
25
Obrigado!
26