Transformers |

Embedding Models从架构到实现

概述随着人工智能和自然语言处理（NLP）的快速发展，Embedding Model（嵌入模型）已成为理解和处理文本、图像、音频等数据的核心技术之一。 ...

手搓Transformer

概述完整的Transformer包含Embeddings、Positional encoding、AddNormal、MultiHeadAttention、DecoderLayer、attention、FeedForward、EncoderLayer等多个部分。 ...

Transformers学习记录

NLP基础自然语言处理（Natural Language Processing，NLP）是一门借助计算机技术研究人类语言的科学。 NLP发展史 1970年代以前: 基于文法规则，问题：自然语言是上下文有关文法，规则无法穷举 1970年代 ~ 2006年: 基于数学模型和统计方法的自然语言处理方法开始兴起, 如“通信系统加隐马尔可夫模型”，有向图 2006年 ~ 2017年: 辛顿（Hinton）证明深度信念网络（Deep Belief Networks，DBN）可以通过逐层预训练策略有效地进行训练, 深度学习方法兴起(CNN, LSTM) 2017年 ~ 至今: Google 公司提出了 Attention 注意力模型，Transformer结构几乎一统江湖统计语言模型发展史 Transformers模型随着BERT和GPT的大火，Transformer 结构已经替代了循环神经网络 (RNN) 和卷积神经网络 (CNN)，成为了当前 NLP 模型的标配。 ...