本文是针对谷歌Transformer模型的解读,根据我自己的理解顺序记录的. 另外,针对Kyubyong实现的tensorflow代码进行解读,代码地址https://github.com/Kyubyong/transformer 这里不会详细描述Transformer的实现机理,如果有不了解Transformer的可以先阅读文章<Attention is all you need>,以及我列出的一些参考博客,都是不错的解读. Layer Normalization 首先是Layer Norm
CUDA和TensorFlow的版本匹配问题 部分转载自博客:https://blog.csdn.net/MahoneSun/article/details/80809042 列举一些CUDA和TensorFlow版本搭配时出现的一些问题 CUDA9.2 + 1.8版本tensorflow ImportError: libcudnn.so.7: cannot open shared objectfile: No such file or directory CUDA9.2 +1.7版本tenso