您的位置:首页 > 运维架构

commoncrawl 源码库是用于 Hadoop 的自定义 InputFormat 配送实现

2015-08-11 02:43 513 查看
commoncrawl 源码库是用于 Hadoop 的自定义 InputFormat 配送实现。

Common Crawl 提供一个示例程序 BasicArcFileReaderSample.java (位于 org.commoncrawl.samples) 用来配置 InputFormat。

commoncrawl / commoncrawl

Watch414 Fork86

CommonCrawl Project Repository — More...

http://www.commoncrawl.org

Issues
#10Add jar to maven central repository?by wiseman 2014-05-14
#9sameerby sameerpany 2014-03-25
#7Update binaries path in build.xmlby andy-m 2012-10-30
#6Fix group id for Mavenby jseppanen 2012-04-03
#5VerifyErrorby gsingers 2012-05-07
master分支代码最近更新:2013-02-14

下载zip
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: