mantch

mantch的博客

汇总&资源

mantch

2019-07-28

字数统计:

466字

阅读时长≈

1分

置顶

【NLP】智能客服

mantch

2019-09-30

NLP

字数统计:

5.8k字

阅读时长≈

19分

我们就会产生一个想法：能不能有一个机器人来回答这些重复的问题，它能 24 小时的工作不用休息，降低客户成本，还能挖掘聊天记录里面的一些有价值的知识点。这就是智能客服产生的背景。

【NLP】XLNet

mantch

2019-09-30

NLP

字数统计:

4.7k字

阅读时长≈

16分

XLNet 是一个类似 BERT 的模型，而不是完全不同的模型。总之，XLNET是一种通用的自回归预训练方法。它是CMU和Google Brain团队在2019年6月份发布的模型，最终，XLNet 在 20 个任务上超过了 BERT 的表现，并在 18 个任务上取得了当前最佳效果（state-of…

【NLP】BERT

mantch

2019-09-28

NLP

字数统计:

5.7k字

阅读时长≈

20分

BERT的全称是BIDIRECTIONAL ENCODER REPRESENTATION FROM TRANSFORMERS，是Google2018年提出的预训练模型，即双向Transformer的Encoder，因为decoder是不能获要预测的信息的。模型的主要创新点都在pre-train方法…

【NLP】Transformer

mantch

2019-09-26

NLP

字数统计:

3.7k字

阅读时长≈

13分

什么是Transformer 《Attention Is All You Need》是一篇Google提出的将Attention思想发挥到极致的论文。这篇论文中提出一个全新的模型，叫 Transformer，抛弃了以往深度学习任务里面使用到的 CNN 和 RNN。目前大热…

推荐系统

mantch

2019-09-09

推荐系统

字数统计:

8.5k字

阅读时长≈

29分

推荐系统是利用电子商务网站向客户提供商品信息和建议，帮助用户决定应该购买什么产品，模拟销售人员帮助客户完成购买过程。个性化推荐是根据用户的兴趣特点和购买行为，向用户推荐用户感兴趣的信息和商品。随着电子商务规模的不断扩大，商品个数和种类快速增长，顾客需要花费大量的时间才能找到自己想买的商品。这种浏…

【NLP】注意力机制(Attention)

mantch

2019-08-31

NLP

字数统计:

4.1k字

阅读时长≈

14分

什么是Attention机制在“编码器—解码器（seq2seq）”⼀节⾥，解码器在各个时间步依赖相同的背景变量来获取输⼊序列信息。当编码器为循环神经⽹络时，背景变量来⾃它最终时间步的隐藏状态。现在，让我们再次思考那⼀节提到的翻译例⼦：输⼊为英语序列“They”“are…

【NLP】seq2seq

mantch

2019-08-30

NLP

字数统计:

3.2k字

阅读时长≈

12分

在⾃然语⾔处理的很多应⽤中，输⼊和输出都可以是不定⻓序列。以机器翻译为例，输⼊可以是⼀段不定⻓的英语⽂本序列，输出可以是⼀段不定⻓的法语⽂本序列，例如：英语输⼊：“They”、“are”、“watching”、“.” 法语输出：“Ils”、“regardent”、“.” 当输⼊和输出都是不定⻓序…

【NLP】textRNN & textCNN

mantch

2019-08-27

NLP

字数统计:

2.8k字

阅读时长≈

9分

TEXTRNN指的是利用RNN循环神经网络解决文本分类问题，文本分类是自然语言处理的一个基本任务，试图推断出给定文本(句子、文档等)的标签或标签集合。在一些自然语言处理任务中，当对序列进行处理时，我们一般会采用循环神经网络RNN，尤其是它的一些变种，如LSTM(更常用)，GRU。当然我们也可以把…

【NLP】GloVe

mantch

2019-08-24

NLP

字数统计:

1.8k字

阅读时长≈

6分

正如GloVe论文的标题而言，GloVe的全称叫Global Vectors for Word Representation，它是一个基于全局词频统计（count-based & overall statistics）的词表征（word representation）工具，它可以把一个单词表达…

【NLP】fastText

mantch

2019-08-23

NLP

字数统计:

2.1k字

阅读时长≈

7分

英语单词通常有其内部结构和形成⽅式。例如，我们可以从“dog”“dogs”和“dogcatcher”的字⾯上推测它们的关系。这些词都有同⼀个词根“dog”，但使⽤不同的后缀来改变词的含义。而且，这个关联可以推⼴⾄其他词汇。在word2vec中，我们并没有直接利⽤构词学中的信息。⽆论是在跳字模型还…

1 / 4