搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的长度为1-255字节。 假设目前有一千万个记录(这些查询串的重复度比较高, 虽然总数是1千万,但如果除去重复后,不超过3百
2016-01-12 16:20
1056 查看
import java.util.*; public class Paixu { public static void main(String[] args) { Map<String,Integer> table =new Hashtable<String,Integer>(); for(int i=0;i<100000;i++) { String a ="a"+new Random().nextInt(30); if(!table.containsKey(a)) { table.put(a, 1); }else table.put(a, table.get(a)+1); } List list =new ArrayList(); int count=0; Iterator it =table.keySet().iterator(); while(it.hasNext()) { if(count<10){ String key =(String)it.next(); Integer val =table.get(key); bijiao ii =new bijiao(); ii.setKey(key); ii.setVal(val); list.add(ii); count++; } } Collections.sort(list); while(it.hasNext()) { String key = (String)it.next(); Integer val =table.get(key); bijiao uu =new bijiao(); if(val>uu.getVal()) { bijiao pp =new bijiao(); pp.setKey(key); pp.setVal(val); list.set(9, pp); Collections.sort(list); } } for(int t =0;t<10;t++) { bijiao yy =(bijiao)list.get(t); System.out.println(yy.getKey()+"++"+yy.getVal()); } } } | class bijiao implements Comparable { private String key; public String getKey() { return key; } public void setKey(String key) { this.key = key; } public int getVal() { return val; } public void setVal(int val) { this.val = val; } private int val; @Override public int compareTo(Object o) { // TODO 自动生成的方法存根 return 0; } } |
相关文章推荐
- 微信搜一搜迈出新的一步,好戏来了
- AJAX 支持搜索引擎问题分析
- 搜索引擎对关键词作弊判断方法揭密
- 使用php记录用户通过搜索引擎进网站的关键词
- android将搜索引擎设置为中国雅虎无法搜索问题解决方法
- Asp.Net、asp实现的搜索引擎网址收录检查程序
- 如何让搜索引擎抓取AJAX内容解决方案
- PHP判断来访是搜索引擎蜘蛛还是普通用户的代码小结
- php实现判断访问来路是否为搜索引擎机器人的方法
- php获取从百度、谷歌等搜索引擎进入网站关键词的方法
- 解析PHP对现有搜索引擎的调用
- C#判断访问来源是否为搜索引擎链接的方法
- WordPress特定文章对搜索引擎隐藏或只允许搜索引擎查看
- PHP屏蔽蜘蛛访问代码及常用搜索引擎的HTTP_USER_AGENT
- apache禁止搜索引擎收录、网络爬虫采集的配置方法
- 如何准确判断请求是搜索引擎爬虫(蜘蛛)发出的请求
- PHP统计nginx访问日志中的搜索引擎抓取404链接页面路径
- xunsearch数字搜索的特殊处理
- 搜索引擎的Robots规则
- 说说即刻搜索那点事儿