【学习笔记】Datawhale零基础入门NLP赛事--天池新闻文本分类--Day2数据理解与数据分析
2020-07-22 23:56
489 查看
今日目标
- 学习使用Pandas读取赛题数据
- 分析赛题数据的分布规律
了解Pandas
Basic Concepts
pandas 是面向列的数据分析应用程序接口
Primary Data structure: dataframe & series
- series: a single column
- dataframe: contains one or more series
- load an entire file into a Dataframe: DataFrame.describe: show interesting statistics about a DataFrame
- Data.head: displays the first few records of a dataFrame
- DataFrame.hist: quickly study the distribution of values in a column
--------------------------------------------打卡分割线----------------------------------------------------------
相关文章推荐
- Datawhale零基础入门NLP——新闻文本分类(一)熟悉赛题(天池比赛)
- Datawhale零基础入门NLP赛事Task 02: 数据读取与数据分析
- Datawhale 零基础入门CV赛事-Task1 赛题理解---学习笔记
- 【DataWhale学习记录13-02】零基础入门CV赛事-Task02-数据读取与数据扩增
- 数据分析入门基础知识——学习笔记
- 【DataWhale学习记录13-02】零基础入门CV赛事-Task01-赛题理解
- JavaScript基础学习笔记(一)——入门、语法、变量、数据类型
- python数据分析入门学习笔记
- python数据分析与挖掘学习笔记(3)_小说文本数据挖掘part1
- 学习笔记(01):零基础搞定Python数据分析与挖掘-课程介绍
- Python学习笔记(二)——编程0基础数据分析进阶之路
- 利用Pythonj进行数据分析学习笔记——第五章 pandas入门
- (4篇长图带你机器学习入门)数据分析入门_PART4统计基础_CH012 KNN最邻近分类
- coursera NLP学习笔记之week3 文本分类和朴素贝叶斯
- 学习笔记(02):零基础搞定Python数据分析与挖掘-课程介绍
- java 从零开始,学习笔记之基础入门<线程及实例分析>(十九)
- 零基础入门-javaScript学习笔记之从基本数据类型学起
- Python玩转数据分析学习笔记-01基础
- 大数据技术学习笔记之hive框架基础3-sqoop工具的使用及具体业务分析
- linux学习入门 基础部分(9)[1.系统日志默认分类2.日志管理服务rsyslog3.日志分析工具journa4.时间同步5.timedatectl命令]