人工智能导论期末复习

第一章 绪论

人工智能简介

人工智能定义

人工智能是指研究,模拟人类智能的理论,方法,技术以及应用系统的一门技术科学,使用机器代替人类实现认知,识别,分析,决策等功能,本质上是对人的意识和思想的信息过程的模拟。

人工智能发展的三个阶段

  1. AI不如人的阶段(不好用)
  2. AI超过普通人(可以用)
  3. AI超越专家(很好用)

互联网与人工智能

  • 数字化
  • 网联化
  • 智能化

人工智能发展的三个层次

  1. 弱人工智能(专用人工智能)

  2. 强人工智能(通用人工智能)

  3. 超人工智能

人工智能要素

人工智能三要素——算法、算力和数据

  • 算法突破:深度学习

  • 算力突破:智能芯片

  • 资源突破:大数据

算法

机器学习 = 构建一个映射函数

什么是机器学习?

通过算法使得机器能从大量数据中学习规律从而对新的样本做决策。
规律:决策(预测)函数

机器学习实例
  • 图像分类
  • 目标检测
  • 实例分割
  • 垃圾邮件过滤
  • 文档归类
  • 情感分类

数据集

举例:
VISUAL GNOME
PASCAL Visual Object Classes
MS COCO
Large-scale Celeb Faces Attributes (CelebA) Dataset
The KITTI Vision Benchmark Suite
ChatGPT训练数据集

算力

智能芯片指的是针对人工智能算法做特殊加速设计的芯片。
根据功能分为:

  • 训练芯片
  • 推断芯片
    根据应用场景分为:
  • 服务器端芯片
  • 边缘端芯片
    根据技术架构分为:
  • 通用类芯片(GPU)
  • 基于FPGA的半定制化芯片
  • 全定制化ASIC芯片
  • 类脑计算芯片

人工智能前沿应用现状

  • 目标检测
  • 图像分割
  • 细粒度图像分类
  • 人脸识别
  • 根据条件生成图像
  • 预测未来
  • 图像标题生产
  • 图像风格化
  • 图像转换
  • 美颜
  • 属性编辑
  • 图像去噪去雾去抖动
  • 图像增强修复彩色化
  • 图像超分辨率
  • 跨模态检索自然场景下文字检测识别
  • 换脸
  • 语音助理
  • ChatGPT
  • Sora

人工智能发展趋势挑战

  • 新时代的电力
  • 融入知识
    挑战:
  • 人的内涵和人的本质
  • 法律
  • 隐私
  • 偏见
  • 可解释性
  • 诚信体系
  • 安全

第二章 知识表示与知识图谱

知识与知识表示

知识:把有关信息关联在一起所形成的信息结构。
知识反映了客观世界中事物之间的关系,不同事物或者相同事物间的不同关系形成了不同的知识。

知识的特性

  1. 相对正确性
  2. 不确定性
  3. 可表示性与可利用性

知识的表示

知识表示(knowledge representation):将人类知识形式化或者模型化。
知识表示是对知识的一种描述,或者说是一组约定,一种计算机可以接受的用于描述知识的数据结构。

一阶谓词逻辑表示法

详情参照离散数学所讲内容,不再重复。

一阶谓词逻辑表示法的特点

优点:

  1. 自然性
  2. 精确性
  3. 严密性
  4. 容易实现

局限性:

  1. 不能表示不确定的知识
  2. 组合爆炸
  3. 效率低

应用:
(1)自动问答系统(Green等人研制的QA3系统)
(2)机器人行动规划系统(Fikes等人研制的STRIPS系统)
(3)机器博弈系统(Filman等人研制的FOL系统)
(4)问题求解系统(Kowalski等设计的PS系统)

产生式表示法

产生式通常用于表示事实、规则以及它们的不确定性度量,适合于表示事实性知识和规则性知识。

确定性规则知识的产生式表示

基本形式:
IF P THEN Q
或者:
P -> Q

不确定性规则知识的产生式表示

基本形式:
IF P THEN Q (置信度)
或者:
P -> Q (置信度)

确定性事实性知识的产生式表示

三元组表示:
(对象,属性,值)
或者:
(关系,对象1,对象2)

不确定性事实性知识的产生式表示

四元组表示:
(对象,属性,值,置信度)
或者:
(关系,对象1,对象2,置信度)

产生式与谓词逻辑中的蕴含式的区别

蕴含式只能表示精确知识,而产生式不仅可以表示精确的知识,还可以表示不精确知识。蕴含式的匹配总要求是精确的。产生式匹配可以是精确的,也可以是不精确的,只要按某种算法求出的相似度落在预先指定的范围内就认为是可匹配的。

产生式的形式描述及语义

巴科斯范式BNF(backus normal form)

  • 规则库:用于描述相应领域内知识的产生式集合。
  • 综合数据库(事实库,上下文,黑板):一个用于存放问题求解过程中各种当前信息的数据结构。
  • 控制系统(推理机构):由一组程序组成,负责整个产生式系统的运行,实现对问题的求解。
    控制系统做以下几项工作:
  1. 推理
  2. 冲突消解
  3. 执行规则
  4. 检查推理终止条件

产生式系统的例子——动物识别系统

产生式表示法的特点

优点:

  1. 自然性
  2. 模块性
  3. 有效性
  4. 清晰性

缺点:

  1. 效率不高
  2. 不能表达结构性知识

适合产生式表示的知识:
(1)领域知识间关系不密切,不存在结构关系。
(2)经验性及不确定性的知识,且相关领域中对这些知识没有严格、统一的理论。
(3)领域问题的求解过程可被表示为一系列相对独立的操作,且每个操作可被表示为一条或多条产生式规则。

框架表示法

一种结构化的知识表示方法。
框架(frame):一种描述所论对象(一个事物、事件或概念)属性的数据结构。
一个框架由若干个被称为“槽”(slot)的结构组成,每一个槽又可根据实际情况划分为若干个“侧面”(faced)。
一个槽用于描述所论对象某一方面的属性。
一个侧面用于描述相应属性的一个方面。
槽和侧面所具有的属性值分别被称为槽值和侧面值。

框架表示法的特点

  1. 结构性
  2. 继承性
  3. 自然性

知识图谱

知识图谱是一种互联网环境下的知识表示方法。目的是为了提高搜索引擎的能力,改善用户的搜索质量以及搜索体验。Google、百度和搜狗等搜索引擎公司构建的知识图谱,分别称为知识图谱、知心和知立方。

知识图谱的定义

知识图谱(Knowledge Graph/Vault),又称科学知识图谱,用各种不同的图形等可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。
知识图谱是由一些相互连接的实体及其属性构成的。
三元组是知识图谱的一种通用表示方式:
(实体1-关系-实体2)
(实体-属性-属性值)
知识图谱可被看作是一张图,图中的节点表示实体或概念,而图中的边则由属性或关系构成。

知识图谱的架构

知识图谱的逻辑架构:模式层与数据层
数据层:主要是由一系列的事实组成,而知识以事实为单位进行存储。
模式层:构建在数据层之上,是知识图谱的核心。
获取知识的资源对象大体可分为:
结构化数据:知识定义和表示都比较完善的数据。
半结构化数据:部分数据是结构化的,但存在大量结构化程度较低的数据。
非结构化数据:没有定义和规范约束的自由数据。

知识图谱的构建

知识图谱的构建是指从最原始数据出发,采用一系列自动或者半自动的技术手段, 提取知识事实,并将其存入知识库的数据层和模式层。
这一过程包含:知识提取、知识表示、知识融合、知识推理四个过程。
主要有两种构造方式:
(1)自顶向下指的是先为知识图谱定义好本体与数据模式,再将实体加入到知识库。
(2)自底向上指的是从一些开放链接数据中提取出实体,选择其中置信度较高的加入到知识库,再构建顶层的本体模式。
经典应用:

  • 维基百科
  • DBpedia
  • YAGO
  • XLORE

知识图谱的特点

  1. 精确性
  2. 多样性
  3. 可解释性

第五章 搜索求解策略

搜索的概念

问题求解:

  • 问题的表示
  • 求解方法(搜素法,归约法,归结法,推理法,产生式)

搜索中需要解决的基本问题:
(1)是否一定能找到一个解。
(2)找到的解是否是最佳解。
(3)时间与空间复杂性如何。
(4)是否终止运行或是否会陷入一个死循环。

搜索的主要过程:
(1) 从初始或目的状态出发,并将它作为当前状态。
(2) 扫描操作算子集,将适用当前状态的一些操作算子作用于当前状态而得到新的状态,并建立指向其父结点的指针 。
(3) 检查所生成的新状态是否满足结束状态,如果满足,则得到问题的一个解,并可沿着有关指针从结束状态反向到达开始状态,给出一解答路径;否则,将新状态作为当前状态,返回第(2)步再进行搜索。

搜索策略的类型

搜索方向
  1. 数据驱动:从初始状态出发的正向搜索。
  2. 目的驱动:从目的的状态出发的逆向搜索。
  3. 双向搜素:同时从目的状态和初始状态搜索。
盲目搜索和启发式搜索
  1. 盲目搜索:在不具有对特定问题的任何有关信息的条件下,按固有的步骤(依次或随机调用操作算子)进行的搜索。
  2. 启发式搜索:考虑特定问题领域可应用的知识,动态地确定调用操作算子的步骤,优先选择较适合的操作算子,尽量减少不必要的搜索,以求尽快地到达结束状态。

状态空间的搜索策略

状态空间表示法

状态:表示系统状态、事实等叙述型知识的一组变量或数组:
操作:表示引起状态变化的过程型知识的一组关系或函数:
状态空间:利用状态变量和操作符号,表示系统或者问题的有关知识的符号体系,状态空间是一个四元组:

求解路径:从S0结点到G结点的路径。
状态空间解: 一个有限的操作算子序列。

实例

八数码问题
旅行商问题

盲目的图搜索策略

回溯策略

带回溯策略的搜索:
●从初始状态出发,不停地、试探性地寻找路径,直到它到达目的或“不可解结点”,即“死胡同”为止。
●若它遇到不可解结点就回溯到路径中最近的父结点上,查看该结点是否还有其他的子结点未被扩展。若有,则沿这些子结点继续搜索;如果找到目标,就成功退出搜索,返回解题路径。

广度优先策略

以接近起始节点的程度(深度)为依据,进行逐层扩展的节点搜索方法。
特点:

1) 每次选择深度最浅的节点首先扩展,搜索是逐层进行的;
2) 一种高价搜索,但若有解存在,则必能找到它。
OPEN表(NPS表):已经生成出来但其子状态未被扩展的状态,特点:先进先出。
CLOSED表(PS表和NSS表的合并):记录了已被生成扩展过的状态。

深度优先策略

首先扩展最新产生的节点, 深度相等的节点按生成次序的盲目搜索。
特点:扩展最深的节点的结果使得搜索沿着状态空间某条单一的路径从起始节点向下进行下去;仅当搜索到达一个没有后裔的状态时,才考虑另一条替代的路径。
算法:
防止搜索过程沿着无益的路径扩展下去,往往给出一个节点扩展的最大深度——深度界限;
与宽度优先搜索算法最根本的不同:将扩展的后继节点放在OPEN表的前端。
深度优先搜索算法的OPEN表后进先出。
在深度优先搜索中,当搜索到某一个状态时,它所有的子状态以及子状态的后裔状态都必须先于该状态的兄弟状态被搜索。
为了保证找到解,应选择合适的深度限制值,或采取不断加大深度限制值的办法,反复搜索,直到找到解。
深度优先搜索并不能保证第一次搜索到的某个状态时的路径是到这个状态的最短路径。
对任何状态而言,以后的搜索有可能找到另一条通向它的路径。如果路径的长度对解题很关键的话,当算法多次搜索到同一个状态时,它应该保留最短路径。

启发式图搜索策略

启发式策略

启发式信息

用来简化搜索过程有关具体问题领域的特性的信息叫做启发信息。

启发式图搜索策略

启发式图搜索策略(利用启发信息的搜索方法)的特点:重排OPEN表,选择最有希望的节点加以扩展。
种类:A、A*算法等

运用启发式策略的两种基本情况

(1)一个问题由于存在问题陈述和数据获取的模 糊性,可能会使它没有一个确定的解。
(2)虽然一个问题可能有确定解,但是其状态空间特别大,搜索中生成扩展的状态数会随着搜索 的深度呈指数级增长。

启发信息和估价函数

启发信息

在具体求解中,能够利用与该问题有关的信息来简化搜索过程,称此类信息为启发信息。

启发式搜索:利用启发信息的搜索过程。

求解问题中能利用的大多是非完备的启发信息:
(1)求解问题系统不可能知道与实际问题有关的全部信息,因而无法知道该问题的全部状态空间,也不可能用一套算法来求解所有的问题。
(2)有些问题在理论上虽然存在着求解算法,但是在工程实践中,这些算法不是效率太低,就是根本无法实现。

按运用的方法分类:

  1. 陈述性启发信息:用于更准确,更精炼地描述状态
  2. 过程性启发信息:用于构造操作算子
  3. 控制性启发信息:表示控制策略的知识

按作用分类

  1. 用于扩展结点的选择:用于决定应先扩展哪一个节点,以免盲目扩展。
  2. 用于生成节点的选择:用于决定要生成哪些后继节点,以免盲目生成过多无用的节点。
  3. 用于删除节点的选择:用于决定删除哪些无用节点,以免造成进一步的时空浪费。
估价函数

估价函数(evaluation function):估算节点“希望”程度的量度。
估价函数值 f(n) :从初始节点经过 n节点到达目标节点的路径的最小代价估计值,其一般形式是
g(n):从初始节点 S0 到节点 n 的实际代价 ;
h(n):从节点 n 到目标节点 Sg 的最优路径的估计代价,称为启发函数。
注:
h(n) 比重大:降低搜索工作量,但可能导致找不到最优解;
h(n) 比重小:一般导致工作量加大,极限情况下变为盲目搜索,但可能可以找到最优解。

A搜索算法

使用了估价函数 f 的最佳优先搜索。

A*算法

特点:

  1. 可接纳性(当一个搜索算法在最短路径存在时能保证找到它,就称该算法是可采纳的。)
  2. 单调性(A*搜索算法中采用单调性启发函数,可以减少比较代价和调整路径的工作量,从而减少搜索代价。)
  3. 信息性(在两个 A 启发策略的h1和h2中,如果对搜索空间中的任一状态n都有h1(n) ≤ h2(n),就称策略h2比h1具有更多的信息性。如果某一搜索策略的h(n)越大,则 A 算法搜索的信息性越多,所搜索的状态越少。但更多的信息性需要更多的计算时间,可能抵消减少搜索空间所带来的益处。)

后续更多内容请参考博客文章:https://blog.csdn.net/fancywxq/article/details/140085279?spm=1001.2014.3001.5501