人工智能(AI) - 代理和环境

  • 简述

    人工智能系统由代理及其环境组成。代理人在他们的环境中行动。环境可能包含其他代理。
  • 什么是代理和环境?

    代理是可以通过传感器感知其环境并通过效应器对该环境起作用的任何事物。
    • 人类代理具有与传感器平行的感觉器官,例如眼睛、耳朵、鼻子、舌头和皮肤,以及用于效应器的其他器官,例如手、腿、嘴。
    • 机器人代理取代了传感器的相机和红外测距仪,以及效应器的各种电机和执行器。
    • 软件代理已将位串编码为其程序和动作。
    代理和环境
  • 代理术语

    • 代理的绩效衡量- 它是标准,它决定了代理的成功程度。
    • 代理的行为- 这是代理在任何给定的感知序列之后执行的动作。
    • Percept - 它是代理在给定实例的感知输入。
    • 感知序列- 这是代理人迄今为止所感知的所有历史。
    • Agent Function - 它是从规则序列到动作的映射。
  • 理性

    理性不过是理性、理智、判断力强的状态。
    理性与预期的行动和结果有关,具体取决于代理所感知的内容。以获取有用信息为目的的行动是理性的重要组成部分。
  • 什么是理想理性代理?

    一个理想的理性代理是能够根据以下条件采取预期行动以最大化其绩效衡量标准的代理:
    • 它的感知序列
    • 其内置的知识库
    代理人的合理性取决于以下几点 -
    • 绩效衡量标准,它决定了成功的程度。
    • 代理的感知序列到现在为止。
    • 智能体关于环境的先验知识
    • 代理可以执行的操作。
    一个理性的智能体总是执行正确的动作,其中正确的动作是指使智能体在给定的感知序列中最成功的动作。代理解决的问题以性能测量、环境、执行器和传感器 (PEAS) 为特征。
  • 智能代理的结构

    代理的结构可以被视为 -
    • 代理 = 架构 + 代理程序
    • 架构 = 代理执行的机器。
    • 代理程序 = 代理功能的实现。

    简单反射代理

    • 他们只根据当前的感知选择行动。
    • 仅当仅根据当前的规则做出正确的决定时,它们才是理性的。
    • 他们的环境是完全可观察的。
    Condition-Action Rule - 这是一个将状态(条件)映射到动作的规则。
    简单反射代理

    基于模型的反射代理

    他们使用世界模型来选择他们的行动。它们保持内部状态。
    模型- 关于“世界上的事情如何发生”的知识。
    内部状态- 它是当前状态未观察到的方面的表示,具体取决于感知历史。
    更新状态需要以下信息 -
    • 世界如何发展。
    • 代理的行为如何影响世界。
    基于模型的反射代理

    基于目标的代理

    他们选择自己的行动以实现目标。基于目标的方法比反射代理更灵活,因为支持决策的知识是明确建模的,因此允许修改。
    目标- 它是对理想情况的描述。
    基于目标的反射代理

    基于实用程序的代理

    他们根据每个状态的偏好(效用)选择操作。
    当 -
    • 有相互冲突的目标,其中只有少数可以实现。
    • 目标的实现存在一些不确定性,您需要权衡成功的可能性与目标的重要性。
    基于实用程序的代理
  • 环境的性质

    一些程序在完全人工的环境中运行,仅限于键盘输入、数据库、计算机文件系统和屏幕上的字符输出。
    相反,一些软件代理(软件机器人或软件机器人)存在于丰富的、无限的软件机器人域中。模拟器有一个非常详细、复杂的环境。软件代理需要实时从一长串动作中进行选择。旨在扫描客户的在线偏好并向客户展示有趣物品的软件机器人在真实人工环境中工作。
    最著名的人工环境图灵测试环境,在这个环境中,一个真实的和其他的人工代理在平等的基础上进行测试。这是一个非常具有挑战性的环境,因为软件代理很难像人类一样执行。

    图灵测试

    系统智能行为的成功可以通过图灵测试来衡量。
    两个人和一台被评估的机器参加测试。两人之中,一人扮演测试者的角色。他们每个人都坐在不同的房间里。测试人员不知道谁是机器谁是人。他通过打字来询问问题并将它们发送给两个智能体,他会收到输入的回复。
    该测试旨在愚弄测试人员。如果测试人员无法从人类响应中确定机器的响应,则称该机器是智能的。
  • 环境属性

    环境具有多重属性 -
    • Discrete / Continuous - 如果环境的不同、明确定义的状态数量有限,则环境是离散的(例如,国际象棋);否则它是连续的(例如,驾驶)。
    • Observable / Partially Observable - 如果可以从感知中确定每个时间点的环境的完整状态,那么它是可观察的;否则只能部分观察到。
    • 静态/动态- 如果代理在行动时环境没有改变,那么它是静态的;否则它是动态的。
    • 单代理/多代理- 环境可能包含与代理相同或不同种类的其他代理。
    • 可访问/不可访问- 如果代理的感觉装置可以访问环境的完整状态,则该代理可以访问环境。
    • Deterministic / Non-deterministic - 如果环境的下一个状态完全由当前状态和代理的动作决定,那么环境是确定性的;否则它是不确定的。
    • 情节/非情节- 在情节环境中,每一集都由代理感知然后采取行动。其动作的质量仅取决于情节本身。后续情节不依赖于先前情节中的动作。情节环境要简单得多,因为代理不需要提前考虑。