您的位置:首页 > 理论基础 > 计算机网络

Java网络爬虫crawler4j学习笔记<3> IO类

2016-11-08 09:55 330 查看

源代码

package edu.uci.ics.crawler4j.util;

import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import java.io.File;

public class IO {

//日志记录对象
private static Logger logger = LoggerFactory.getLogger(IO.class);

public static boolean deleteFolder(File folder) {
// 删除目录,并判断执行删除操作后目录是否存在
return deleteFolderContents(folder) && folder.delete();
}

// 使用递归的方法删除一个目录及其下的所有子目录及文件
public static boolean deleteFolderContents(File folder) {
logger.debug("Deleting content of: " + folder.getAbsolutePath());
File[] files = folder.listFiles();
for (File file : files) {
// 如果是文件,则直接删除
if (file.isFile()) {
if (!file.delete()) {
return false;
}
} else {  // 如果是目录,则对目录递归执行deleteFolderContents操作
if (!deleteFolder(file)) {
return false;
}
}
}
// 删除完毕,返回true
return true;
}
}


代码分析

crawler4j项目中util包下的IO类只包含一个功能,删除某个目录,使用的是递归删除的方法。

在实际运行过程中,主要用于在爬虫启动初始化配置阶段,清空一个目录,用于存放db数据文件。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: