InsightFace 在 OneFlow 中的实现

English | 简体中文

本文介绍如何在 OneFlow 中训练 InsightFace，并在验证数据集上对训练好的网络进行验证。

背景介绍

InsightFace 开源项目

InsightFace 原仓库是基于 MXNet 实现的人脸识别研究开源项目。

在该项目中，集成了：

CASIA-Webface、MS1M、VGG2 等用于人脸识别研究常用的数据集（以 MXNet 支持的二进制形式提供，可以从这里查看数据集的详细说明以及下载链接）。
以 ResNet、MobileFaceNet、InceptionResNet_v2 等深度学习网络作为 Backbone 的人脸识别模型。
涵盖 SphereFace Loss、Softmax Loss、SphereFace Loss 等多种损失函数的实现。

InsightFace 在 OneFlow 中的实现

在 InsightFace 开源项目已有的工作基础上，OneFlow 对 InsightFace 基本的人脸识别模型进行了移植，目前已实现的功能包括：

支持了使用 MS1M、Glint360k 作为训练数据集，Lfw、Cfp_fp 以及 Agedb_30 作为验证数据集，提供了对网络进行训练和验证的脚本。
支持 ResNet100 和 MobileFaceNet 作为人脸识别模型的 Backbone 网络。
实现了 Softmax Loss 以及 Margin Softmax Loss（包括 Nsoftmax、Arcface、Cosface 和 Combined Loss 等）。
实现了模型并行和 Partial FC 优化。
实现了 MXNet 的模型转换。

未来将计划逐步完善：

更多的数据集转换。
更丰富的 Backbone 网络。
更全面的损失函数实现。
增加分布式运行的说明。

我们对所有的开发者开放 PR，非常欢迎您加入新的实现以及参与讨论。

准备工作

在开始运行前，请先确定：

安装 OneFlow。
准备训练和验证的 OFRecord 数据集。

安装 OneFlow

根据 Install OneFlow 的步骤进行安装最新 master whl 包即可。

python3 -m pip install oneflow -f https://oneflow-staging.oss-cn-beijing.aliyuncs.com/branch/master/cu102/6aa719d70119b65837b25cc5f186eb19ef2b7891/index.html --user

准备数据集

根据加载与准备 OFRecord 数据集准备 ImageNet 的 OFReocord 数据集，用以进行 InsightFace 的测试。

InsightFace 原仓库中提供了一系列人脸识别任务相关的数据集，已经完成了人脸对齐等预处理过程。请从这里下载相应的数据集，并且转换成 OneFlow 可以识别的 OFRecord 格式。考虑到步骤繁琐，也可以直接下载已经转好的 OFRecord 数据集：

MS1M-ArcFace(face_emore)

MS1MV3

下面以数据集 MS1M-ArcFace 为例，展示如何将下载到的数据集转换成 OFRecord 格式。

1. 下载数据集

下载好的 MS1M-ArcFace 数据集，内容如下：

faces_emore/
       train.idx
       train.rec
       property
       lfw.bin
       cfp_fp.bin
       agedb_30.bin

前三个文件是训练数据集 MS1M 的 MXNet 的 recordio 格式相关的文件，后三个 .bin 文件是三个不同的验证数据集。

2. 将训练数据集 MS1M 从 recordio 格式转换为 OFRecord 格式

训练数据集转换有两种方式: (2.1部分)直接使用python脚本生成n个shuffle过的数据part，或(2.2部分)python脚本生成一个part，再根据需要用spark做shuffle和partition。 2.1 直接使用 Python 脚本

运行：

python tools/dataset_convert/mx_recordio_2_ofrecord_shuffled_npart.py  --data_dir datasets/faces_emore --output_filepath faces_emore/ofrecord/train --num_part 16

成功后将得到 num_part 数量个 OFRecord，本示例中为 16 个，显示如下：

tree ofrecord/test/
ofrecord/test/
|-- _SUCCESS
|-- part-00000
|-- part-00001
|-- part-00002
|-- part-00003
|-- part-00004
|-- part-00005
|-- part-00006
|-- part-00007
|-- part-00008
|-- part-00009
|-- part-00010
|-- part-00011
|-- part-00012
|-- part-00013
|-- part-00014
`-- part-00015

0 directories, 17 files

2.2 Python 脚本 + Spark Shuffle + Spark Partition

运行：

python tools/dataset_convert/mx_recordio_2_ofrecord.py --data_dir datasets/faces_emore --output_filepath faces_emore/ofrecord/train

成功后将得到一个包含所有数据的 OFReocrd（part-0），需要进一步使用 Spark 进行 Shuffle 和 Partition。成功安装和部署 Spark 后，您需要：

下载工具 jar 包

您可以通过 Github 或者 OSS 下载 Spark-oneflow-connector-assembly-0.1.0.jar 文件。

运行 Spark 命令

运行

//Start Spark 
./Spark-2.4.3-bin-hadoop2.7/bin/Spark-shell --jars ~/Spark-oneflow-connector-assembly-0.1.0.jar --driver-memory=64G --conf Spark.local.dir=/tmp/
// shuffle and partition in 16 parts
import org.oneflow.Spark.functions._
Spark.read.chunk("data_path").shuffle().repartition(16).write.chunk("new_data_path")
sc.formatFilenameAsOneflowStyle("new_data_path")

然后就可以得到 16 个 part 的 OFRecord，显示如下

tree ofrecord/test/
ofrecord/test/
|-- _SUCCESS
|-- part-00000
|-- part-00001
|-- part-00002
|-- part-00003
|-- part-00004
|-- part-00005
|-- part-00006
|-- part-00007
|-- part-00008
|-- part-00009
|-- part-00010
|-- part-00011
|-- part-00012
|-- part-00013
|-- part-00014
`-- part-00015

0 directories, 17 files

训练和验证

训练

为了减小用户使用的迁移成本，OneFlow 的脚本已经调整为 Torch 实现的风格，用户可以使用 configs/*.py 直接修改参数。

运行脚本：

eager

./train_ddp.sh

Graph

train_graph_distributed.sh

验证

另外，为了方便查看保存下来的预训练模型精度，我们提供了一个仅在验证数据集上单独执行验证过程的脚本。

运行

./val.sh

OneFLow2ONNX

pip install oneflow-onnx==0.5.1
./convert.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README_CH.md

README_CH.md

InsightFace 在 OneFlow 中的实现

目录

背景介绍

InsightFace 开源项目

InsightFace 在 OneFlow 中的实现

准备工作

安装 OneFlow

准备数据集

1. 下载数据集

2. 将训练数据集 MS1M 从 recordio 格式转换为 OFRecord 格式

训练和验证

训练

eager

Graph

验证

OneFLow2ONNX

Files

README_CH.md

Latest commit

History

README_CH.md

File metadata and controls

InsightFace 在 OneFlow 中的实现

目录

背景介绍

InsightFace 开源项目

InsightFace 在 OneFlow 中的实现

准备工作

安装 OneFlow

准备数据集

1. 下载数据集

2. 将训练数据集 MS1M 从 recordio 格式转换为 OFRecord 格式

训练和验证

训练

eager

Graph

验证

OneFLow2ONNX