当前位置：代码迷 >> 综合 >> 天池文本分类比赛-task4

详细解决方案

天池文本分类比赛-task4

热度：75 发布时间：2024-02-01 21:39:19.0

天池文本分类比赛

在这里插入图片描述

task 4 基本深度学习的文本分类

这次的task开始学习深度学习的方法来处理文本分类的任务，相对于机器学习方法，深度学习处理文本，有如下的优点：

处理的文本的维度相对降低
考虑单词之间的关系，而不是只进行统计学上的分析

深度学习可以将文本数据提取特征用更低维度的特征来表示，个人感觉类似与SVD。本次的重点内容是FastText.

FastText

最经典的深度神经网络结构三部分组成：

input layer
hidden layer
output layer

需要注意的一点就是input layer后经过Embedding处理，

Facebook-fastText可以查看这个处理方式的具体实现。

相关解决方案