第三篇人工智能AI应用场景图形图

来源：卡片时间：2023/8/29

教材中从第3到第6篇，共四次课分别讲解图形图像处理技术，包括：图像识别、图形识别、人脸识别及表情识别等。故事选用场景：识别植物的APP软件、自动驾驶汽车的交通标志识别、刷脸门禁系统、以及通过微表情透析人物内心活动（表情识别，人脸识别的一个特殊分支）等。

01概念梳理

一、图像图形识别

图像识别利用计算机对图像进行处理、分析和理解，用以识别各种不同模式下的目标和对象的技术，比如：动植物识别、地标识别等。

而从图像中抓取图形特征（图形识别），这很符合人类视觉的认知习惯。在具体技术应用中，除了提取主要图形特征，还需提取相关特征。

二、人脸表情识别

人脸识别，是图像处理技术中的重要应用之一。其流程有：图像采集、人脸定位、特征提取、特征对比（人脸资料库）、识别成功与否。

人类的表情丰富多彩（表情识别），通过表情可以判断人的某种心理活动。比如：人们在办理刑事案件时非常有帮助。常见的7种表情特征有：愤怒、厌恶、恐惧、高兴、平静、伤心、惊讶等。

这些在UCMake软件应用中均有相应的积木块可选用。

02原理解析

通过分类并提取重要特征来识别图像——图像采集、图像预处理、特征提取、识别。概括就是搜索、匹配、识别。神经网络图像识别是目前非常成熟的技术，已远远超越人类的识别能力。其流程如下：

第一：训练，成千上万种动物的图片会被打上标签，成为神经网络的训练样本。神经网络将学习并对它们进行分类。

第二：输入，未打标签的图片被放入神经网络进行预训练。

第三：输出，（第一层）神经元先对简单形状进行提取，比如边缘部分；（高层）神经元继续提取更复杂的结构；（顶层）神经元再把高度复杂、抽象的概念提取出来，也就是区分不同动物的标准；最后根据它训练出来的能力，神经网络给出和图片最相似的结果。

03案例实现

识别颜色并追踪

使用图像识别传感器，可以实现颜色识别及踪功能。比如：识别到红色物体，舞台中的角色就会随之改变位置并进行颜色反馈。

图像识别传感器是一款体积小巧、低功耗传感器。内置识别程序，所有识别都在本地处理，无须联网；其具有颜色、大小、形状识别，人脸追踪等功能，在巡线、无人驾驶、自动分拣、跟踪小球或人脸等应用中发挥作用。

卡片识别

软件UCMake中，其扩展功能中有一项：交通卡片识别，通过摄像头识别交通标志卡片。具体操作：先通过摄像头让AI学习各种标志卡片，然后再识别并说出识别结果。

1、添加3个扩展模块（视频侦测、交通卡片识别、机器学习）；

2、定义5个学习函数（自定义积木块），分别为：前进、后退、左转、右转、停止；

3、编程定义主程序，分别调用自定义函数进行学习；

4、编程当按下空格键启动图形识别功能。

5、手持交通标志卡，面对笔记本电脑的摄像头，让AI进行学习。

6、AI学习完毕，按空格键启动图形识别功能进行识别。

软件平台中的机器学习模块，可以让AI自动识别学习。

人脸识别

模拟实现门禁系统。先录入人脸信息到系统库，再实现识别。具体实现过程：

1、添加2个扩展模块（视频侦测、人脸识别）；

2、定义录入人脸信息的函数；如果按下a键，录入1号人脸信息；如果按下b键，录入2号人脸信息。读者还可以尝试其他录入方式。

3、定义识别函数，给定3秒时间，如果检测到人脸在已知系统库中，则反馈搜索结果并让计时器归零。

4、定义主程序，启动视频模块。测试数据。

表情识别

程序中包含有相关积木块，可以预判人的大致年龄、颜值高低等。比如：检测到人脸后，可以判断其表情状态是高兴、愤怒、亦或是恐惧？并给出结果反馈。

04总结

本次课核心内容：

1、图形图像技术的概念及原理浅析；

2、应用案例实践。

随着技术的不断发展，图像图形技术应用的场景也越来越广泛。不同的软件平台，包含的人工智能模块也不尽相同。但核心模块：视频侦测、人脸识别、机器学习等基本是实现人工智能创意的核心模块，是学习研究的重点。