Skip to content

Latest commit

 

History

History
50 lines (33 loc) · 2.25 KB

benchmark.md

File metadata and controls

50 lines (33 loc) · 2.25 KB

简体中文 | English

Benchmark

此文档主要对比PaddleVideo模型库与主流模型库的训练速度。

环境配置

硬件环境

  • 8 NVIDIA Tesla V100 (16G) GPUs
  • Intel(R) Xeon(R) Gold 6148 CPU @ 2.40GHz

软件环境

  • Python 3.7
  • PaddlePaddle2.0
  • CUDA 10.1
  • CUDNN 7.6.3
  • NCCL 2.1.15
  • GCC 8.2.0

实验与评价指标

实验中我们测量了平均训练时间,包括数据处理和模型训练两个部分,训练速度均采用每秒钟训练的样本数量(ips)来计量, 数值越大说明训练速度越快,并且考虑到机器预热的问题,前50次迭代的时间没有被计算在内。

在相同的数据和模型配置下对比了PaddleVideo和其他的视频理解工具箱,为了保证比较的公平性,对比实验都是在相同的硬件条件下进行,实验所用数据请参考数据准备 观察下表可以发现PaddleVideo相比其他的视频理解框架在训练速度方面取得了巨大的提升,尤其是Slowfast模型取得了将近一倍的训练速度的提升。 对于每一种模型配置,我们采用了相同的数据预处理方法并且保证输入是相同的。

实验结果

分类模型

Model batch size x gpus PaddleVideo(ips) Reference(ips) MMAction2 (ips) PySlowFast (ips)
TSM 16x8 58.1 46.04(temporal-shift-module) To do X
PPTSM 16x8 57.6 X X X
TSN 16x8 To do To do (tsn-pytorch) To do X
Slowfast 16x8 99.5 X To do 43.2
Attention_LSTM 128x8 112.6 X X X

定位模型

Model PaddleVideo(ips) MMAction2 (ips) BMN(boundary matching network) (ips)
BMN 43.84 x x