java 词频统计代码
2016-10-18 23:11
597 查看
package hello; import java.io.BufferedReader; import java.io.FileNotFoundException; import java.io.FileReader; import java.io.IOException; import java.util.HashMap; import java.util.Iterator; import java.util.StringTokenizer; public class WordCount { public void sort(int[] arry) { int temp; for (int i = 0; i < arry.length; i++) { for (int j = i; j < arry.length; j++) { if (arry[i] > arry[j]) { temp = arry[i]; arry[i] = arry[j]; arry[j] = temp; } } } for (int k = 0; k < arry.length; k++) { System.out.print(arry[k] + " "); } } public static void main(String[] args) { // 用HashMap存放<单词:词频>这样一个映射关系 HashMap<String, Integer> hashMap = new HashMap<String, Integer>(); // 用正则表达式来过滤字符串中的所有标点符号 String regex = "[【】、.。,,。\"!--;:?\'\\]]"; try { // 读取要处理的文件 BufferedReader br = new BufferedReader(new FileReader("src/file80.txt")); String value; while ((value = br.readLine()) != null) { value = value.replaceAll(regex, " "); // 使用StringTokenizer来分词(StringTokenizer详见JDK文档) StringTokenizer tokenizer = new StringTokenizer(value); while (tokenizer.hasMoreTokens()) { String word = tokenizer.nextToken(); if (!hashMap.containsKey(word)) { hashMap.put(word, new Integer(1)); } else { int k = hashMap.get(word).intValue() + 1; hashMap.put(word, new Integer(k)); } } } // 遍历HashMap,输出结果 Iterator iterator = hashMap.keySet().iterator(); while (iterator.hasNext()) { String word = (String) iterator.next(); System.out.println(word + ":\t" + hashMap.get(word)); } } catch (FileNotFoundException e) { e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } } }
相关文章推荐
- java 字符串词频统计实例代码
- Java:基于Map实现的频率统计代码
- 利用正则表达式获取特定文件(如java class)并对其进行处理(如代码统计)
- Java在Eclipse下的代码统计
- 项目代码行数统计--java类统计
- Java词频统计算法(使用单词树)
- 用java写的词频统计
- java实现统计代码行数
- Java正则表达式(三)、代码量统计工具(统计java源文件中注释、代码、空白行数量)
- 统计文件夹下java代码行数
- 代码统计小程序 Java
- 统计网页访问量的JAVA Script代码
- java正则表达式例程 提取网页中的email 统计代码的空行 有效代码行 注释行
- 给定一个文件夹,统计文件夹中包含的Java源文件的代码行。
- Java正则表达式(三)、代码量统计工具(统计java源文件中注释、代码、空白行数量)
- [JAVA实用应用] 项目代码行数统计器,帮助你统计项目一共有多少行代码
- 给定一个Java文件,统计文件中的代码行
- 发一个统计项目代码行数的Java代码
- 用java统计一个目录(含子目录)下所有java源文件中代码行数
- 统计Java程序代码行数(Java)