深度学习项目——表情识别（3）数据初探与 Pipeline_综合

1. 分析

（1） kaggle上比赛的题目解析：
五种表情：惊讶、愤怒、高兴、悲伤和中性（已经剔除数量较少的厌恶和恐惧）
评估指标：ACC（准确率）和 AUC

（2）表情识别很多难点，表现在两个方面：

形式一：每个文件夹放一个种类的图片
形式二：两个文件夹，一个文件夹放图片（非结构化数据），另外一个CSV文件存储标签和路径

经验：形式一只适合数量少的数据，而且只能做分类任务；形式二更加合理，方便管理和分布式存储

探索的内容：数据的数量、是否有类别不均、文件格式等等。

方法一：Linux 的 bash脚本，直接在终端中编程进行探索

在这里插入图片描述

方法二：python脚本（更常用）
在这里插入图片描述
还可以加入更复杂的逻辑，例如查看文件后缀等。

在这里插入图片描述
其它三方包：

Pipeline：先搭框架，再不断迭代、优化。

要考虑数据集存在的问题：

在这里插入图片描述

两大块：

注：PNG格式的图片有四个通道！采用的是 RGBA 格式（还包括一个alpha参数-透明度）

生成器具体实施的两种思路：
① 图片 ② 图片路径（更具通用性）

这样不断循环，不断优化，最后再提交测试集

注：数据增强
在图像处理任务中，一般在数据加载和深度学习建模的过程中，还有一个基本都会用到的子步骤：数据增强。

数据增强并不是扩充数据落入磁盘再加载训练，而是数据加载之后再做数据增强，增强之后再送人模型进行训练。（或者在加载的途中就进行数据增强）

（数据增强具有随机性）