您的位置:首页 > 编程语言 > Java开发

Springboot项目RZSpider3.3.8版本发布-网页爬虫后台管理

2018-11-01 12:13 501 查看
版权声明:本文为博主原创文章,未经博主允许不得转载! https://blog.csdn.net/rico_zhou/article/details/83618255

 一.项目介绍

   二.使用方式

1.基本功能

2.网页爬虫

  • 基本认知:此爬虫系统内置5个已写好爬虫,后台ID分别是10001-10005,请不要随意修改,支持语言JAVA,JAVASCRIPT,PYTHON等,可自定义,但后台安全需要另行配置
  • 权限认知:超级管理员和管理员可以定义爬虫类型和添加编写自定义爬虫,普通用户可添加已有的爬虫管理及爬虫任务
  • 自定义爬虫:接口已写好,源码资源文件已内置文件流的jar包和源码,以及连接数据库的jar包和源码,自定义爬虫有示例代码,后台编译运行,注意安全
  • 爬虫任务:添加爬虫任务可修改默认参数,爬虫管理自带一个默认参数,请根据格式修改内容,可设置任务启动频次
  • 启动任务:定时任务和固有频次任务会自动添加至任务详情并启动,只执行一次的任务需设置启动时间并启用任务,每次任务详情ID表示一次任务,对应启动会覆盖原有数据
  • 导出数据:数据格式以excel为主,内置爬虫及自定义爬虫可解析则以excel输出,无法解析的则以文本格式输出,下载包括准确任务数据以及未筛选全数据,可选择下载
  • 其他认知:内置爬虫使用htmlunit,后台ID段是10001-19999,自定义爬虫后台ID段是20001-29999

3.博客管理

4.图书管理

  • 基本认知:此系统属个人系统,未添加借阅管理,可自行添加,支持批量上传,请下载模板以供参考,支持导出excel

5.通用工具

  • 基本认知:已内置了几个简单的工具,如二维码生成,解析,计算器,OCR,文本格式化,代码格式化等等,可自定义添加,需修改代码
  • 权限认知:超级管理员和管理员可以添加工具,普通员工可添加已有工具并运行和下载
  • 添加工具:分为网页版和客户端版工具,网页版可包含客户端,网页版可直接运行,可上传源码,安装包等,但对应文件只能一个
  • 启用工具:工具启用都是网页版,下载的源码及安装版等则属于客户端版,但上传文件可自行添加

6.简单游戏

  • 与通用工具目录相同,使用同上

7.聊天工具

  • 基本认知:尚未完善

8.配置文件

  • 基本认知:基本配置详见bootdo和若依系统源码
  • 添加配置:主要是文件application.yml的filepath配置
  • 详情配置:uploadPath:上传图片文件所在位置,必填。uploadCachePath:缓存文件夹,必填。uploadToolPath:上传工具文件所在位置,必填。 uploadGamePath:上传游戏文件所在位置。customSpiderPath:自定义爬虫文件所在位置,必填。javaCompilerPath:java编译器所在位置(tool.jar目录),选填,不填则默认系统编译器。jreRunPath:java运行环境(jre)所在位置(jre目录),选填,不填则使用系统java环境。后期将简化配置,使用默认文件夹

9.基础设置

  • 基础设置包括主题设置,下载管理直链管理,包括登录背景设置,首页介绍,代码包名前缀,示例代码,手册,音乐插件设置等等
  • 登录背景可设置内置特效,首页介绍即首页显示内容,代码包名前缀即自定义爬虫代码包名,示例代码即创建自定义爬虫时的默认代码,手册即介绍,音乐插件使用zplayer,鸣谢!
  • 下载管理,可自定义下载文件并生成下载外链,设置下载限制次数时间等等
  • 直链管理,可自定义音频,视频,图片,zip,html等文件,生成直链,可在线浏览文件内容
  • 系统工具有清理缓存功能,会将配置文件下无用文件清除,数据库中自定义爬虫测试数据清除等等

10.注意事项

  • 配置文件不要只写盘符,尽量使用不同的文件夹,目录均不添加斜杠“/”“”
  • 自定义爬虫是将前台书写的代码传到后台编译运行,需要自行设置服务器安全,或者修改源码
  • 系统工具有清理缓存功能,会将配置文件下无用文件清除,因此配置文件的目录一定要慎配

 三.联系方式

1.基本方式

  • 此项目建立在开源项目bootdo和若依系统基础上,点击链接加入群聊【BootDo交流二群】:614726589【若依交流二群】:1389287 感谢!
  • 本人联系方式,QQ:2320095772
  • 邮箱,QQ邮箱:2320095772@qq.com
  • 博客:http://www.rzspider.top/rzblog
  • 在线预览:https://www.rzspider.top       用户名:testadmin   密码:testadmin  开源项目请勿攻击! 谢谢!

 四.更新日志

1.v3.3.8  2018年10月26

  • 新增博客浏览日志,记录浏览博客的基本信息
  • 新增博客概览,对博客网站进行数据统计
  • 新增公告管理
  • 新增博客搬家功能,目前仅支持CSDN博客搬入
  • 新增文章中代码高亮
  • 优化博客浏览
  • 修复其他若干bug

2.v3.3.2  2018年10月16

  • 新增直链管理,可在线查看网页
  • 新增专栏图标
  • 新增编辑器代码高亮
  • 新增文章下载功能
  • 调整手机屏幕自适应
  • 优化博客浏览
  • 修复其他若干bug

3.v3.2.16  2018年10月10

  • 新增博客模块
  • 新增博客管理,博客设置,文章管理,标签管理,专栏管理等
  • 新增博客网站高度自定义
  • 新增网站图标网站名称自定义
  • 新增网站样式设置,颜色设置,左右侧边栏设置等
  • 新增网站图标网站名称自定义
  • 修复其他若干bug

4.v3.2.14  2018年9月29

  • 新增博客模块
  • 新增博客管理,博客设置,文章管理,标签管理,专栏管理等
  • 新增博客网站高度自定义
  • 新增网站图标网站名称自定义
  • 修复其他若干bug

5.v3.2.3  2018年9月10

  • 新增下载管理,可生成外链供他人无登录下载
  • 新增网站设置,ip,端口,域名等保存
  • 新增邮件服务设置,默认发件人等
  • 添加自定义爬虫编程前验证项目文件
  • 修复其他若干bug

6.v3.2.1  2018年9月5

  • 新增音乐搜索添加,搜索网易云音乐添加
  • 新增音乐导出JSON
  • 更新zbplay音乐插件
  • 支持注册成Windows服务
  • 添加自定义爬虫对nodejs支持
  • 修复其他bug

6.v3.2.0  2018年8月31

  • 新增表格搜索框提示功能
  • 新增自定义爬虫参数可视化添加
  • 新增爬虫自定义参数自动可视化显示
  • 新增自定义爬虫字段描述和版本号
  • 新增爬虫代码备份,查看及导出
  • 新增5个内置爬虫,ID:10003~10007
  • 新增爬虫任务数据预览
  • 新增工具箱,无需登录

  五.图片预览

 

 

 

 

 

 

 

 

欢迎交流学习!

 

阅读更多
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐