论文阅读:FastFormers: Highly Efficient Transformer Models for Natural Language Understanding 这是微软的一篇论文,解决transformer参数量大导致的次奥率问题。 Transformer模型在NLU上... » 阅读全文