论文<BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding> 以下陆续介绍bert及其变体(介绍的为粗体) bert自从横空出世以来,引起广泛关注,相关研究及bert变体/扩展喷涌而出,如ELECTRA.DistilBERT.SpanBERT.RoBERTa.MASS.UniLM.ERNIE等. 由此,bert的成就不仅是打破了多项记录,更是开创了一副可期的前景. 1, Bert 在看b…