Linux作业(三)-shell统计某文章中出现频率最高的N个单词并排序输出出现次数
2017-04-25 21:42
926 查看
Linux课上的作业周三交,若有考虑不周到的地方,还请多多不吝赐教。
shell处理文本相关的经常使用命令见此博客
#
#假设输入两个參数 则第一个为统计单词的个数。第二个为要统计的文章
#假设输入一个參数 则默认统计单词的个数为10
#
详细思路:
将各种符号用换行替换(tr命令)
大写改小写(tr命令)
排序、统计单词个数并除去反复 (sort和uniq)
按出现次数的高低排序(sort)
打印N个须要统计的单词
shell处理文本相关的经常使用命令见此博客
#
#假设输入两个參数 则第一个为统计单词的个数。第二个为要统计的文章
#假设输入一个參数 则默认统计单词的个数为10
#
详细思路:
将各种符号用换行替换(tr命令)
大写改小写(tr命令)
排序、统计单词个数并除去反复 (sort和uniq)
按出现次数的高低排序(sort)
打印N个须要统计的单词
#!/bin/bash if [ $# -ne 2 -a $# -ne 1 ] ;then echo "usage: `basename $0 ` input file " echo exit fi if [ $# -eq 1 ];then I_TOP=10 I_FILE=$1 fi if [ $# -eq 2 ];then I_TOP=$1 I_FILE=$2 fi tr -sc "[A-Z][a-z]" "[\012*]" < $I_FILE | \ tr "[A-Z]" "[a-z]" | \ sort | uniq -c | \ sort -k1 -n -r | \ head -$I_TOP | nl
相关文章推荐
- Linux作业(三)-shell统计某文章中出现频率最高的N个单词并排序输出出现次数
- java实现读取一篇英文文章,统计其中每个单词出现的次数并排序输出
- 针对一个文件 统计其中的单词和字符数 找出文件中出现次数最多的单词数 将文件中出现的单词按频率进行排序并输出
- 统计一篇英文文章内每个单词出现频率,并返回出现频率最高的前10个单词及其出现次数
- 一个文本文件统计各个单词出现的频率最高的10个词以及次数
- 统计文章出现频率最高的单词 2011211554
- 统计一TXT文档中单词出现频率,输出频率最高的10个单词
- 统计文章中单词的字数并按照出现的频率排序(treeSet)
- Java实现 统计单词出现的次数并按照单词频率从高到低输出
- Linux下统计文本文件中前n个出现频率最高的单词
- 设计相应的数据结构和算法,尽量高效的统计一片英文文章(总单词数目)里出现的所有英文单词, * 按照在文章中首次出现的顺序打印输出该单词和它的出现次数。
- 一个一维整形数组,若干个数字,统计数组中不同的数字出现的次数,并按照出现频率从小到大排序输出,相同频率按数字大小排序输出
- 输出一篇英文文章前十个出现频率最高的单词
- [python]使用Counter统计文章中出现频率最高的单词
- java 统计10000篇文章中不同单词出现的次数并以次序排序
- 统计海量文章内容中出现次数前K大的单词并输出(完整实现)
- 统计分析文章中英文单词出现次数及频率(C++实现)
- 统计一篇文章的单词数量,并且输出频率前10单词的数量
- 统计文章中单词出现的次数(续)
- js查找一篇英文文章中出现频率最高的单词