1. Fine-tuning on Document AI Tasks

This repo has my implementation of models used for fine-tuning on document AI task.

Current Working:

Currently working on finetuning models on FUNSD Dataset

WANDB Report:

FUNSD Dataset:

The wandb progress report can be found out here here

2. Paper Implementations:

Natural Language Processing

DocFormer: End-to-End Transformer for Document Understanding [Paper] [Code]
LiLT: A Simple yet Effective Language-Independent Layout Transformer,for Structured Document Understanding [Paper] [Code]
EIT: Enhanced Interactive Transformer [Paper][Code]

Visual Question Answering

LaTr: Layout-aware transformer for scene-text VQA [Paper] [Code]

Computer Vision

Vision Image Transformer (ViT) [Paper] [Code]

3. Projects: