Agent
人工智能的基础概念,表示可以自主决策的智能对象。
src:《AIMA》 第二章
PEAS模型:智能体的任务环境描述
PEAS 模型是四个因为单词的首字母简写:
- Performance:性能
- Environment:环境
- Actuator:执行器
- Sensor:感受器
PEAS 描述了智能体以及周边环境的基本属性。
环境
环境是智能体面对任务的一部分,也是智能体理性决策的首要条件。
环境有以下属性:
- 观测性:环境是否是智能体可观测的?部分可观测的还是完全可观测的?
- 智能体的数量:单个智能体还是多个智能体?
- 竞争或者合作:智能体之间是竞争的关系?还是合作的关系?
- 确定性:智能体进入的下一个状态是否是确定的?下一个状态是否完全由当前状态和即将执行的动作确定?
- 随机性:环境是依据随机性概率演变的吗?
- 回合性:当前的决策只对当前有影响吗?还是对未来也有影响?
- 静态和动态:当智能体思考、决策时,环境是否还会发生变化?
- 离散或连续:环境的状态是连续的吗?还是按照步骤一步一步来的?
- 已知性:智能体对当前环境物理世界的规则认知是已知的吗?
以上最苦难的情况,莫过于:部分可观测,多智能体,非确定性,序贯,动态,连续的环境。
例如:陌生环境中的自动驾驶
性能度量
性能度量定义了智能体的目标。评估智能体的输出序列,是否符合环境的状态。
机器没有欲望,所以无法自己定义目标。机器的目标一定是人定义的。
手段和目标的差别:给智能体的,应该是目标,而不是的手段。
理性智能体的定义:
对于每个可能的感知序列,给定感知序列提供的证据和智能体所拥有的任何先验知识,理性智能体应该选择一个期望最大化其性能度量的动作。
理性的智能体做正确的事,而对期望的最大化,就是正确的事。
智能体的感受器和执行器
感受器部分
感受器是智能体感知外界环境的机制。可以简单也可以十分复杂。
感受器拥有一套算法处理外界的感受信息,高级的智能体可以反思环境。反思的方式就是问自己:“现在的世界是什么样子?”
世界模型其实就是感受器反思过程的一部分。
执行器部分
执行器负责对环境输出。也可以简单或复杂。
执行器解决问题是:“在已有对世界感知的情况下,现在的我应该采取什么动作?”
执行器的反思问题是:“假如我采取了某个动作,会发生什么?”。
基于效用的执行器会一个另外的问题:“在这样的状态下,我会有多快乐?”
效用是经济学上的概念,衡量人类感知的幸福指数。
学习型智能体,可自主提升能力的智能体
性能元素是经典的智能体组成部分,包含了感受器和执行器。除此之外,还加入了学习元素、评估者、和问题生成器。
以上新加入的三部分模块,共同实现对“性能元素”的优化。即根据外部状态,根据性能元素内部产生的变化,重新对性能元素微调参数,达到学习的效果。