KoGPT2-Summarization

한국어 GPT-2 from SKT-AI

Pre-train 된 GPT-2를 문서 요약 데이터로 2차 pre-training

embedding size: 768
hidden size: 768
max input length: 1024
vocab size: 50000
number of layers: 12
number of attention heads: 12

Nvidia 2080ti 8장으로 학습

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
assets		assets
images		images
.gitignore		.gitignore
README.md		README.md
clean_text.py		clean_text.py
config.py		config.py
distributed_train.py		distributed_train.py
reader.py		reader.py
train.py		train.py
transformers_version.ipynb		transformers_version.ipynb
tutorial.ipynb		tutorial.ipynb

Provide feedback