Agent

人工智能的基础概念,表示可以自主决策的智能对象。

src:《AIMA》 第二章

PEAS模型:智能体的任务环境描述

PEAS 模型是四个因为单词的首字母简写:

  • Performance:性能
  • Environment:环境
  • Actuator:执行器
  • Sensor:感受器

PEAS 描述了智能体以及周边环境的基本属性。

环境

环境是智能体面对任务的一部分,也是智能体理性决策的首要条件。

环境有以下属性:

  • 观测性:环境是否是智能体可观测的?部分可观测的还是完全可观测的?
  • 智能体的数量:单个智能体还是多个智能体?
  • 竞争或者合作:智能体之间是竞争的关系?还是合作的关系?
  • 确定性:智能体进入的下一个状态是否是确定的?下一个状态是否完全由当前状态和即将执行的动作确定?
  • 随机性:环境是依据随机性概率演变的吗?
  • 回合性:当前的决策只对当前有影响吗?还是对未来也有影响?
  • 静态和动态:当智能体思考、决策时,环境是否还会发生变化?
  • 离散或连续:环境的状态是连续的吗?还是按照步骤一步一步来的?
  • 已知性:智能体对当前环境物理世界的规则认知是已知的吗?

以上最苦难的情况,莫过于:部分可观测,多智能体,非确定性,序贯,动态,连续的环境。

例如:陌生环境中的自动驾驶

性能度量

性能度量定义了智能体的目标。评估智能体的输出序列,是否符合环境的状态。

机器没有欲望,所以无法自己定义目标。机器的目标一定是人定义的。

手段和目标的差别:给智能体的,应该是目标,而不是的手段。

理性智能体的定义:

对于每个可能的感知序列,给定感知序列提供的证据和智能体所拥有的任何先验知识,理性智能体应该选择一个期望最大化其性能度量的动作。

理性的智能体做正确的事,而对期望的最大化,就是正确的事。

智能体的感受器和执行器

感受器部分

感受器是智能体感知外界环境的机制。可以简单也可以十分复杂。

感受器拥有一套算法处理外界的感受信息,高级的智能体可以反思环境。反思的方式就是问自己:“现在的世界是什么样子?”

世界模型其实就是感受器反思过程的一部分。

执行器部分

执行器负责对环境输出。也可以简单或复杂。

执行器解决问题是:“在已有对世界感知的情况下,现在的我应该采取什么动作?”

执行器的反思问题是:“假如我采取了某个动作,会发生什么?”。

基于效用的执行器会一个另外的问题:“在这样的状态下,我会有多快乐?”

效用是经济学上的概念,衡量人类感知的幸福指数。

学习型智能体,可自主提升能力的智能体

性能元素是经典的智能体组成部分,包含了感受器和执行器。除此之外,还加入了学习元素、评估者、和问题生成器。

以上新加入的三部分模块,共同实现对“性能元素”的优化。即根据外部状态,根据性能元素内部产生的变化,重新对性能元素微调参数,达到学习的效果。