读取JDK API文档,并根据单词出现频率排序
2018-12-26 21:08
155 查看
1,拿到 API 文档
登录 https://docs.oracle.com/javase/8/docs/api/ ,
选中特定的类,然后 copy 其中的内容,
放入 TXT 文件中 ,
2,读取TXT内容,并排序
package com.lgx.test; import java.io.BufferedReader; import java.io.File; import java.io.FileNotFoundException; import java.io.FileReader; import java.io.IOException; import java.util.ArrayList; import java.util.Collections; import java.util.Comparator; import java.util.List; import java.util.Map; import java.util.Map.Entry; import java.util.Set; import java.util.TreeMap; public class ReadVectorAPI { public static String filename = "src/Vector.txt"; public static StringBuffer sb = null; public static void main(String[] args) { try { //根据单词字母排序 countWordOrderByWord(); //根据单词频率排序 countWordOrderByCount(); } catch (FileNotFoundException e) { e.printStackTrace(); } } // 计算单词的出现次数,依据单词排序 public static void countWordOrderByWord() throws FileNotFoundException { BufferedReader br = null; try { br = new BufferedReader(new FileReader(new File(filename))); String inputLine = null; TreeMap<String, Integer> map = new TreeMap<String, Integer>(); while ((inputLine = br.readLine()) != null) { String[] words = inputLine.split("[ \n\t\r.,;:!?(){}]"); for (int i = 0; i < words.length; i++) { String key = words[i].toLowerCase(); if (key.length() > 0) { if (map.get(key) == null) { map.put(key, 1); } else { int times = map.get(key).intValue(); times++; map.put(key, times); } } } } Set<Map.Entry<String, Integer>> entrySet = map.entrySet(); System.out.println("=====根据单词字母排序====="); for (Map.Entry<String, Integer> entry : entrySet) { System.out.println(entry.getKey() + " 在API文档中出现了 " + entry.getValue() + " 次"); } } catch (IOException e) { e.printStackTrace(); } } // 计算单词的出现次数,依据次数排序 public static void countWordOrderByCount() throws FileNotFoundException { BufferedReader br = null; try { br = new BufferedReader(new FileReader(new File(filename))); String inputLine = null; TreeMap<String, Integer> map = new TreeMap<String, Integer>(); while ((inputLine = br.readLine()) != null) { String[] words = inputLine.split("[ \n\t\r.,;:!?(){}]"); for (int i = 0; i < words.length; i++) { String key = words[i].toLowerCase(); if (key.length() > 0) { if (map.get(key) == null) { map.put(key, 1); } else { int times = map.get(key).intValue(); times++; map.put(key, times); } } } } List<Map.Entry<String, Integer>> list = new ArrayList<Map.Entry<String, Integer>>(map.entrySet()); Collections.sort(list, new Comparator<Map.Entry<String, Integer>>() { public int compare(Entry<String, Integer> o1, Entry<String, Integer> o2) { return o2.getValue().compareTo(o1.getValue()); } }); System.out.println("=====根据单词频率排序====="); for (Map.Entry<String, Integer> mapping : list) { System.out.println(mapping.getKey() + " 在API文档中出现了 " + mapping.getValue() + " 次"); } } catch (IOException e) { e.printStackTrace(); } } }
输出结果前部分截图为;
相关文章推荐
- 读取一段文档,输出每个单词出现的频率,并且把出现频率最高的十个单词输出。
- 读取一篇英文文档,并输出其中出现频率最多的十个单词
- 统计单词出现频率及排序 从单机到多机合作
- 统计英文文本文档中前十个出现频率最多的单词
- 统计单词出现的频率及排序
- 统计一个文档中出现频率最多的k个单词的实现
- 赫夫曼树(一),对字符串中的字符出现频率进行设置权,并且根据权大小进行排序
- [LeetCode] Sort Characters By Frequency 根据字符出现频率排序
- 统计一个文档中出现频率最多的10个单词(英文文档)
- 一个简单的程序,统计文本文档中的单词和汉字数,逆序排列(出现频率高的排在最前面)。python实现。
- 在一段文本中搜索并打印出包含某个单词的句子,根据出现次数排序
- 统计一TXT文档中单词出现频率,输出频率最高的10个单词
- Java 读取一段英文文档统计每个单词出现的次数和单词的总数
- C语言输入英文统计单词的出现的频率排序
- 读取txt文档中单词,并计算单词出现的次数(英文文档)
- java读取一篇英语文章并且统计出单词出现的频率并从高到低输出
- 针对一个文件 统计其中的单词和字符数 找出文件中出现次数最多的单词数 将文件中出现的单词按频率进行排序并输出
- 找出一篇英语文档中出现频率最高的十个单词
- LeetCode 451. Sort Characters By Frequency (根据字符出现频率排序)
- Leetcode451. 根据字符出现频率排序 golang go语言