Agentes Inteligentes 01

TIP
Somos agentes inteligentes, no es as?
Un agente es cualquier cosa capaz de percibir su medioambiente con la ayuda de sensores y actuar en ese medio utilizando actuadores.
Percepciones
Medio ambiente
Sensores
?
Actuadores Acciones
diciembre de 2013
Agente humano Vs Agente Robot
Entradas: Sentidos
Salidas: Extremidades Boca y otras
Entradas: Sensores Robticos Dispositivos de entrada Salidas: Actuadores Dispositivos de salida
Cada agente puede percibir sus propias acciones (pero no siempre sus efectos)
diciembre de 2013 3
Percepcin:
Indica que el agente puede recibir entradas en cualquier instante
Secuencia de Percepciones:
Refleja el historial completo de lo que el agente ha recibido
Secuencia de percepciones -> Decisin
diciembre de 2013
Indica el comportamiento del agente percepcin -- accin

Funcin del agente:
Descripcin Matemtica abstracta Tabla de Secuencia de percepciones->Acciones
Programa del agente:

Implementacin completa
diciembre de 2013
Percepciones: Dnde est (A o B) Hay suciedad ?
Acciones posibles: Moverse hacia la izquierda, derecha, Aspirar la suciedad o No hacer nada
Una Funcin: Si hay suciedad, entonces aspirar de otra forma cambiar de cuadrcula
diciembre de 2013
Secuencia de percepciones [A, Limpio]
Accin Derecha
[A, Sucio] [B, Limpio]

[B, Sucio]a [A, Limpio],[A, Limpio] [A, Limpio],[A, Sucio] ------[A, Limpio],[A, Limpio],[A, Limpio] [A, Limpio],[A, Limpio],[A, Sucio] ____ ____
Aspirar Izquierda
Aspirar Derecha Aspirar ------Derecha Aspirar ____ ____
diciembre de 2013 7
funcin AGENTE-ASPIRADORA ([localizacin, estado]) devuelve una accin si estado = Sucio entonces devolver Aspirar de otra forma, si localizacin = A entonces devolver Derecha de otra forma, si localizacin = B entonces devolver Izquierda
diciembre de 2013
Un agente racional
Es aquel que hace lo correcto (lo que permite al agente obtener el mejor desempeo).
Medidas de rendimiento
Incluye los criterios que determinan el xito en el comportamiento del agente
diciembre de 2013
La medida de rendimiento que define el criterio de xito. El conocimiento del medio en el que habita acumulado por el agente. Las acciones que el agente puede llevar a cabo. La secuencia de percepciones del agente hasta el momento.
diciembre de 2013
10
En cada posible secuencia de percepciones, un agente racional deber emprender aquella accin que supuestamente maximice su medida de rendimiento, basndose en las evidencias aportadas por la secuencia de percepciones y en el conocimiento que el agente mantiene almacenado.
diciembre de 2013
11
Si asumimos que: Medida de rendimiento (aspiradora)
1 pto. al agente por cada recuadro limpio en un perodo dado.(1000 periodos)
La <<geografa>> del medio se conoce a priori, pero la distribucin de la suciedad y la localizacin inicial del agente no se conocen. Acciones: izquierda, derecha, aspirar y NoOp Percibe correctamente su localizacin y si esta localizacin contiene suciedad
diciembre de 2013
12
Un agente omnisciente:
Conoce el resultado de su accin y acta de acuerdo a l.
Llevar a cabo acciones con la intencin de modificar percepciones futuras (Recopilacin de informacin)
Ej. Exploracin en un medio inicialmente desconocido
diciembre de 2013
13
No slo recopila informacin, sino que aprende lo mximo posible de lo que esta percibiendo Hay agentes en los que se conoce totalmente el entorno a priori. En estos casos, el agente no necesita percibir y aprender, simplemente acta de manera correcta. Estos agentes son muy frgiles:
Ejemplo: escarabajo estercolero y la avispa cavadora
diciembre de 2013
14
Autonoma:
Un agente carece de autonoma cuando se apoya ms en el conocimiento inicial que le proporciona su diseador que en sus propias percepciones
Un agente racional debe ser autnomo, debe aprender a determinar cmo tiene que compensar el conocimiento incompleto o parcial inicial
diciembre de 2013
15
Entornos de trabajo->problemas Agentes->soluciones.
REAS (Rendimiento, Entorno, Actuadores, Sensores) Ejemplo: Taxista automtico
diciembre de 2013
16
Cualidades deseables:

llegue al destino correcto, minimice el consumo de combustible; minimice el tiempo de viaje y/o costo, minimice el nmero de infracciones de trfico y de molestias a otros conductores; maximice la seguridad, la comodidad del pasajero y el beneficio.
diciembre de 2013
17
Tipo de Agente
Taxista
Medidas de Rendimiento
Seguro, rpido, legal, viaje confortable, maximizacin del beneficio
Entorno
Carreteras, otro trfico, peatones, clientes
Actuadores
Direccin, acelerador, freno, seal, bocina, visualizador
Sensores
Cmaras, sonar, velocmetro, GPS, tacmetro, visualizador de aceleracin, sensor del motor, teclado.
diciembre de 2013
18
Lo que importa no es la distincin entre un medio real de y la artificial, relacin sino entre la el complejidad
comportamiento del agente, la secuencia de

percepciones generada por el medio y la medida de rendimiento.
diciembre de 2013
19
Agentes Software (o robots software o softbots)

Por ejemplo un softbot diseado para pilotar el simulador de vuelo de un gran avin
Imagina un robot diseado para que revise fuentes

de informacin en Internet: Adaptable al cliente. Debera poseer: PLN, Aprender el perfil del cliente, Ser capaz de cambiar sus planes dinmicamente
diciembre de 2013
20
diciembre de 2013
21
Si los sensores proporcionan acceso al estado completo del medio en cada momento, se dice que el entorno de trabajo es Totalmente observable.
Si los sensores no reciben informacin de parte del sistema debido al ruido y la existencia de sensores poco exactos, se dice que el entorno de trabajo es Parcialmente observable.
diciembre de 2013
22
Si el siguiente estado del medio esta totalmente determinado por el estado actual y la accin ejecutada por el agente, entonces se dice que el entorno es Determinista, si no, es Estocstico. Si el medio el parcialmente observable entonces es comn que sea estocstico
(Taxi no puede predecir el trfico)
Si el medio es determinista, excepto para las acciones de otros agentes, entonces se dice que el medio es Estratgico.
diciembre de 2013 23
En un entorno de trabajo Episdico, la experiencia del agentes se divide en episodios atmicos. Cada episodio consiste en la percepcin del agente y la realizacin de una nica accin posterior (el sig. episodio no depende de las acciones de episodios previos) En entornos de trabajo Secuenciales la decisin presente puede afectar decisiones futuras (ajedrez)
diciembre de 2013 24
Si el entorno puede cambiar cuando el agente esta deliberando, entonces se dice que el entorno es Dinmico, de otra forma es Esttico. Si el entorno no cambia con el paso del tiempo, pero el rendimiento del agente cambia se dice que el medio es Semidinmico
diciembre de 2013
25
La distincin entre Discreto y Continuo se puede aplicar:

al estado del medio, a la forma en la que se maneja el tiempo y a las percepciones y acciones del agente.
Ajedrez tiene un # finito de estados distintos
conjunto discreto de percepciones y acciones
Taxista-> edo. Continuo y un problema de tiempo continuo
diciembre de 2013
26
La distincin clave est en identificar si el comportamiento de un agente B est mejor descrito por la maximizacin de una medida de rendimiento cuyo valor depende del comportamiento de un agente A.
Entorno multiagente competitivo

Entorno multiagente cooperativo
La Comunicacin a menundo emerge como un comportamiento racional en entornos multiagente.
diciembre de 2013
27
PARADIGMA DE LOS AGENTES

Desarrollo de entidades que puedan actuar de forma autnoma y razonada
[Russell 1996]
Agente: entidad que percibe

y acta sobre un entorno
Estructura de los agentes AGENTE

Programa
Cumplir con la funcin del agente
Arquitectura
Puede ser una computadora sencilla o un hardware especial.
Programa debe ser apropiado para la arquitectura
Eficiencia Solidez Flexibilidad
PROGRAMAS DE LOS AGENTES

Percepciones actuales
ENTRADAS
Sensores
Actuadores
DEVOLVER UNA ACCIN
Tipos bsicos de programas Agentes Reactivos simples Agentes reactivos basados en modelos Agentes basados en objetivos Agentes basados en utilidad
Agentes reactivos simples

Seleccionan las acciones en base a las percepciones actuales
Simples Inteligencia limitada

Determinista Aleatorio
Agentes reactivos basados en modelos

Almacenan informacin en estados internos de las partes del ambiente que los sensores no pueden percibir en el estado actual
Agentes basados en modelos

Actan con la intencin de alcanzar sus metas
Agentes basados en objetivos

Actan con la intencin de alcanzar sus metas
Agentes basados en utilidad

Intentan maximizar la utilidad deseada
FUNCIN DE UTILIDAD
Proyecta un estado en un nmero real que representa el nivel de felicidad o utilidad
Seleccionar la accin que lo lleve a alcanzar la mayor utilidad esperada Utilidad = media de todos los estados posibles resultantes, ponderando con la probabilidad del resultado
Agentes basados en utilidad
Agentes que aprenden

Agentes Inteligentes 01

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Agentes Inteligentes 01

Diunggah oleh

Hak Cipta:

Format Tersedia

TIP

Somos agentes inteligentes, no es as?

Agente humano Vs Agente Robot

Salidas: Extremidades Boca y otras

Entradas: Sensores Robticos Dispositivos de entrada Salidas: Actuadores Dispositivos de salida

Indica que el agente puede recibir entradas en cualquier instante

Refleja el historial completo de lo que el agente ha recibido

Secuencia de percepciones -> Decisin

Indica el comportamiento del agente percepcin -- accin

Programa del agente:

Percepciones: Dnde est (A o B) Hay suciedad ?

Secuencia de percepciones [A, Limpio]

[A, Sucio] [B, Limpio]

Si asumimos que: Medida de rendimiento (aspiradora)

1 pto. al agente por cada recuadro limpio en un perodo dado.(1000 periodos)

Entornos de trabajo->problemas Agentes->soluciones.

REAS (Rendimiento, Entorno, Actuadores, Sensores) Ejemplo: Taxista automtico

comportamiento del agente, la secuencia de

Agentes Software (o robots software o softbots)

Imagina un robot diseado para que revise fuentes

La distincin entre Discreto y Continuo se puede aplicar:

Taxista-> edo. Continuo y un problema de tiempo continuo

Entorno multiagente competitivo

La Comunicacin a menundo emerge como un comportamiento racional en entornos multiagente.

PARADIGMA DE LOS AGENTES

Agente: entidad que percibe

Estructura de los agentes AGENTE

Programa debe ser apropiado para la arquitectura

Eficiencia Solidez Flexibilidad

PROGRAMAS DE LOS AGENTES

DEVOLVER UNA ACCIN

Agentes reactivos simples

Simples Inteligencia limitada

Agentes reactivos basados en modelos

Agentes basados en modelos

Agentes basados en objetivos

Agentes basados en utilidad

Agentes basados en utilidad

Agentes que aprenden

Anda mungkin juga menyukai