教材中从第3到第6篇,共四次课分别讲解图形图像处理技术,包括:图像识别、图形识别、人脸识别及表情识别等。故事选用场景:识别植物的APP软件、自动驾驶汽车的交通标志识别、刷脸门禁系统、以及通过微表情透析人物内心活动(表情识别,人脸识别的一个特殊分支)等。
01概念梳理
一、图像图形识别
图像识别利用计算机对图像进行处理、分析和理解,用以识别各种不同模式下的目标和对象的技术,比如:动植物识别、地标识别等。
而从图像中抓取图形特征(图形识别),这很符合人类视觉的认知习惯。在具体技术应用中,除了提取主要图形特征,还需提取相关特征。
二、人脸表情识别
人脸识别,是图像处理技术中的重要应用之一。其流程有:图像采集、人脸定位、特征提取、特征对比(人脸资料库)、识别成功与否。
人类的表情丰富多彩(表情识别),通过表情可以判断人的某种心理活动。比如:人们在办理刑事案件时非常有帮助。常见的7种表情特征有:愤怒、厌恶、恐惧、高兴、平静、伤心、惊讶等。
这些在UCMake软件应用中均有相应的积木块可选用。
02原理解析
通过分类并提取重要特征来识别图像——图像采集、图像预处理、特征提取、识别。概括就是搜索、匹配、识别。神经网络图像识别是目前非常成熟的技术,已远远超越人类的识别能力。其流程如下:
第一:训练,成千上万种动物的图片会被打上标签,成为神经网络的训练样本。神经网络将学习并对它们进行分类。
第二:输入,未打标签的图片被放入神经网络进行预训练。
第三:输出,(第一层)神经元先对简单形状进行提取,比如边缘部分;(高层)神经元继续提取更复杂的结构;(顶层)神经元再把高度复杂、抽象的概念提取出来,也就是区分不同动物的标准;最后根据它训练出来的能力,神经网络给出和图片最相似的结果。
03案例实现
识别颜色并追踪
使用图像识别传感器,可以实现颜色识别及踪功能。比如:识别到红色物体,舞台中的角色就会随之改变位置并进行颜色反馈。
图像识别传感器是一款体积小巧、低功耗传感器。内置识别程序,所有识别都在本地处理,无须联网;其具有颜色、大小、形状识别,人脸追踪等功能,在巡线、无人驾驶、自动分拣、跟踪小球或人脸等应用中发挥作用。
卡片识别
软件UCMake中,其扩展功能中有一项:交通卡片识别,通过摄像头识别交通标志卡片。具体操作:先通过摄像头让AI学习各种标志卡片,然后再识别并说出识别结果。
1、添加3个扩展模块(视频侦测、交通卡片识别、机器学习);
2、定义5个学习函数(自定义积木块),分别为:前进、后退、左转、右转、停止;
3、编程定义主程序,分别调用自定义函数进行学习;
4、编程当按下空格键启动图形识别功能。
5、手持交通标志卡,面对笔记本电脑的摄像头,让AI进行学习。
6、AI学习完毕,按空格键启动图形识别功能进行识别。
软件平台中的机器学习模块,可以让AI自动识别学习。
人脸识别
模拟实现门禁系统。先录入人脸信息到系统库,再实现识别。具体实现过程:
1、添加2个扩展模块(视频侦测、人脸识别);
2、定义录入人脸信息的函数;如果按下a键,录入1号人脸信息;如果按下b键,录入2号人脸信息。读者还可以尝试其他录入方式。
3、定义识别函数,给定3秒时间,如果检测到人脸在已知系统库中,则反馈搜索结果并让计时器归零。
4、定义主程序,启动视频模块。测试数据。
表情识别
程序中包含有相关积木块,可以预判人的大致年龄、颜值高低等。比如:检测到人脸后,可以判断其表情状态是高兴、愤怒、亦或是恐惧?并给出结果反馈。
04总结
本次课核心内容:
1、图形图像技术的概念及原理浅析;
2、应用案例实践。
随着技术的不断发展,图像图形技术应用的场景也越来越广泛。不同的软件平台,包含的人工智能模块也不尽相同。但核心模块:视频侦测、人脸识别、机器学习等基本是实现人工智能创意的核心模块,是学习研究的重点。
转载请注明:http://www.0431gb208.com/sjszlff/4322.html