DATAWHALE-NLP-TASK04
2020-07-22 23:59
330 查看
DATAWHALE-NLP Task04:文本分类1
最近2天分数没有上去,只是大概学了FASTTEXT的基本用法。
1. FASTTEXT
train_set['ft_label']='__label__' + train_set['label'].astype(str) train_set['ft_label']='__label__' + train_set['label'].astype(str) train_set[['text','ft_label']].to_csv('train_ft.csv', index=None, header=None, sep='\t') model = fasttext.train_supervised('train_ft.csv', lr=1.0, wordNgrams=2,verbose=2, minCount=1, epoch=25, loss="hs") val_pred = [model.predict(x)[0][0].split('__')[-1] for x in train_set['text']] print(f1_score(train_set['label'].astype(str), val_pred, average='macro')) val_pred = [model.predict(x)[0][0].split('__')[-1] for x in test_set['text']] pd.DataFrame(val_pred,columns=['label']).to_csv('./NLP/ft_result.csv',index=False)
但是出现各种错乱,并没有调出结果。
2. DEV
DEV最近由于空间溢出(大约可以提供1G空间存储),或者经常fail to fetch等等问题也有一定的影响,所以学习期间还是优先在本地跑比较好。
相关文章推荐
- Datawhale《深度学习-NLP》Task1-NLP-召回率、准确率、ROC曲线、AUC、PR曲线学习理解
- Datawhale入门NLP比赛——Task1NLP之新闻文本分类赛题理解
- Datawhale零基础入门NLP赛事-02数据读取与数据分析
- Datawhale 计算机视觉基础-图像处理(上)-Task04 图像滤波
- Datawhale零基础入门NLP——新闻文本分类(一)熟悉赛题(天池比赛)
- DataWhale 零基础入门NLP赛事-新闻文本分类 TASK2 数据读取与数据分析
- 【DataWhale学习记录13-02】零基础入门CV赛事-Task04-模型训练与验证
- Datawhale零基础入门NLP-Task01-day3
- Datawhale零基础入门NLP赛事 - Task1 赛题理解
- 【学习笔记】Datawhale零基础入门NLP赛事--天池新闻文本分类--Day2数据理解与数据分析
- Datawhale | NLP (1)
- Datawhale NLP自然语言处理 Task3
- Datawhale NLP入门:Task5 基于深度学习的文本分类2
- Datawhale零基础入门NLP-Task01-day 1
- Datawhale零基础入门NLP赛事Task 02: 数据读取与数据分析
- Datawhale零基础入门NLP赛事-04基于深度学习的文本分类1FastText
- [不知pandas为何物的纯金小白]Datawhale零基础入门NLP赛事--天池新闻文本分类--Day1理解赛题
- Datawhale零基础入门NLP赛事-LUV
- Datawhale零基础入门NLP-Task2 数据读取与数据分析
- Datawhale零基础入门NLP赛事-01赛题理解