Language Models are Unsupervised Multitask Learners #2

ysasano · 2019-03-04T14:04:35Z

一言でいうと

(WikipediaとBooksCorpusしか使っていない)BERTとは異なり、Common Crawlの多様で大規模な学習データで言語モデルを学習することで、多くのタスクで"Zero-shot"で SOTAのスコアを達成した手法。「特に凝ったことをしなくても言語モデル自体が本質的にマルチタスク学習器である」ことを主張している。

論文リンク

https://blog.openai.com/better-language-models/

著者/所属機関

Alec Radford, Jeffrey Wu, Rewon Child, David Luan, Dario Amodei, Ilya Sutskever

OpenAI

投稿日付(yyyy/MM/dd)

2019/2/14

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Language Models are Unsupervised Multitask Learners #2

Language Models are Unsupervised Multitask Learners #2

ysasano commented Mar 4, 2019

Language Models are Unsupervised Multitask Learners #2

Language Models are Unsupervised Multitask Learners #2

Comments

ysasano commented Mar 4, 2019

一言でいうと

論文リンク

著者/所属機関

投稿日付(yyyy/MM/dd)

概要

新規性・差分

手法

結果

コメント