您的位置:首页 > 编程语言 > Java开发

京东商城(360Buy)价格识别 java版

2013-01-04 16:05 141 查看
上一篇介绍到 利用Jsoup抓取各个电商网站的信息

不过有时候会遇到价格是图片的问题

这时候你只能得到一张图片了

如果有个能把图片解析出来那该多爽啊

去百度一搜“京东(360Buy)价格识别” 还真有

猪八戒上有人还发布任务了,不过那都是老早以前的了

网上有好多版本,

我自己也做了一个java版的

识别率 99.9%

我们相信java的强大,不过怕涉及到侵权问题,源码我就不贴了 需要学习的可以留邮箱,我发给你

这里我只讲思路

(1)首先你的会切图 用java

下面给个小例子:

这个是个切图的方法,x,y 是原来图片要切割的起始坐标, wight 和hight 是 要切割的宽和高, img 是原图的流

这是一个队Png 后缀的图的切割方法,也是后一个抠图的方法,

如果想切割jpg 的 的话,可以把两句改改

=============

BufferedImage.TYPE_INT_RGB

PNG

================

BufferedImage newImage = new BufferedImage(wight, hight, BufferedImage.TYPE_INT_ARGB);
ImageIO.write(newImage, "PNG", new File(x + "_" + y + "_" + wight
+ "_.png"));

public static BufferedImage cat(int x, int y, int wight, int hight,
BufferedImage img) {
int[] simgRgb = new int[wight * hight];
img.getRGB(x, y, wight, hight, simgRgb, 0, wight);
BufferedImage newImage = new BufferedImage(wight, hight,
BufferedImage.TYPE_INT_ARGB);
newImage.setRGB(0, 0, wight, hight, simgRgb, 0, wight);
try {
ImageIO.write(newImage, "PNG", new File(x + "_" + y + "_" + wight
+ "_.png"));
} catch (IOException e) {
e.printStackTrace();
}
return newImage;
}


(2)会对图片做索引

对图片做索引我前面讲过了

(3) 将网上抓来的价格图片切割后在你的索引里查询,

(4) 将返回的第一个字记录下来

最后输出结果 下面是我贴的部分结果:

ps:由于京东价格在不断变化的,这个例子已经失效了,上面的图片地址有的已经不存在了,程序修改了下,还是可以用的

http://price.360buyimg.com/gp1005187106,1.png
图片链接错误,请查证!!!! http://price.360buyimg.com/gp1006754125,1.png 144.00 http://price.360buyimg.com/gp635281,1.png 348.00 http://price.360buyimg.com/gp1006749154,1.png 229.00 http://price.360buyimg.com/gp1002462797,1.png 图片链接错误,请查证!!!! http://price.360buyimg.com/gp1003198953,1.png 168.00 http://price.360buyimg.com/gp247723,1.png 图片链接错误,请查证!!!! http://price.360buyimg.com/gp1005973369,1.png 220.00 http://price.360buyimg.com/gp1005258226,1.png 175.00 http://price.360buyimg.com/gp635260,1.png 318.00 http://price.360buyimg.com/gp412666,1.png 64.00 http://price.360buyimg.com/gp1006702266,1.png 229.00 http://price.360buyimg.com/gp1005973327,1.png 220.00 http://price.360buyimg.com/gp623242,1.png 67.00 http://price.360buyimg.com/gp623244,1.png 191.00 http://price.360buyimg.com/gp333428,1.png 318.00 http://price.360buyimg.com/gp285159,1.png 266.00 http://price.360buyimg.com/gp1005186888,1.png 图片链接错误,请查证!!!! http://price.360buyimg.com/gp412669,1.png 175.00 http://price.360buyimg.com/gp623246,1.png 195.00 http://price.360buyimg.com/gp247729,1.png 图片链接错误,请查证!!!! http://price.360buyimg.com/gp252585,1.png 66.00 http://price.360buyimg.com/gp252586,1.png 178.00 http://price.360buyimg.com/gp668124,1.png 63.00 http://price.360buyimg.com/gp668119,1.png 174.00 http://price.360buyimg.com/gp412663,1.png 179.00 http://price.360buyimg.com/gp300728,1.png 83.80 http://price.360buyimg.com/gp623208,1.png 104.00 http://price.360buyimg.com/gp300731,1.png 208.00 http://price.360buyimg.com/gp344861,1.png[/code] 
测试结果太给力了,99.9999999999999%的准确性

由于好多人问我要,我也不经常上博客,留下下载地址

下载点这里
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: