深度学习的编译可以分为图优化和算子优化,目前图优化基本是基于算子级别的模式匹配规则进行子图替换实现的,而随着算子和算子变体的不断增加,模式匹配规则也需要不断增加,为此本项目提出“子算子”的概念,将算子转化为子算子的组合,并且基于子算子的模式匹配规则进行图优化,可以大量减少模式匹配规则的数量,在图优化效率上不低于现有的图优化工具。
本项目仍然是一个图优化工具,输入是不同AI框架输出的模型文件(目前只支持用本项目提供的API描述网络),输出是一个TE python文件,需要接入TVM编译栈调用Ansor执行。
本项目基于C++实现,
git clone this
mkdir build
cd build
cmake ..
make -j3
目前项目并不完善,处于快速变动期,一些未来的工作需要完成。