搜客天下网络信息采集器高级用法:虎客语言1
2007-08-05 21:01
232 查看
搜客天下网络信息采集器的规则底层使用的是虎客公司自己研发的虎客语言所创建的,它的使用方法和windowsAPI的使用方法比较相似,只需要调用相应的函数,便能实现相应的功能。
那么,我们首先要理解虎客语言的语法,它的表达方式和普通编程语言的便达方式比较相似,比如字符串连接的函数的声明方式是:BaseFunction<string>:ConcatString("字符串1","字符串2"); 其中BaseFunction是所有的函数标记,任何一个虎客语言的函数都是以这个标记作为开始,<string>指的是函数的返回类型,这里指的是返回的类型是字符串类型,ConcatString是要调用的函数名称,括号里面表示的是函数所接收的参数。需要注意的是,虎客语言是严格区分大小写的。
我们明白了虎客语言的简单语法之后,我们该如何去使用它呢?
BaseFunction<string>:ConcatString(":MultiNum(<1>,15'>http://www.zzz.com/search.aspx?allItem=",BaseFunction<string>:MultiNum(<1>,15));
其中<1>是Url分析中的第一个匹配规则匹配出的数据,也就是我们能得到的页数。
Var<string>:url(BaseFunction<string>:ConcatString("http://soft.sokezone.com/SoftTest/test.aspx?type1=<1>&type2=<2>&page=<0,1,<3>,1,1>","\r\n"));
BaseFunction<void>:WriteFile("c:\\a.txt",MemberField:url);
Var<string>:url();
这段逻辑的意思是将当前生成的URL血入到一个文件中,这样随着抓取的进行,URL就会被记录下来,我们可以使用记录下来的URL列表将资源下载下来。
就是这么简单,在接下来的文章里,我们将逐步帮您慢慢的理解并学习虎客语言的使用方法和技巧,便于您更好的组建您的抓取规则,谢谢。
搜客天下网络信息采集器
那么,我们首先要理解虎客语言的语法,它的表达方式和普通编程语言的便达方式比较相似,比如字符串连接的函数的声明方式是:BaseFunction<string>:ConcatString("字符串1","字符串2"); 其中BaseFunction是所有的函数标记,任何一个虎客语言的函数都是以这个标记作为开始,<string>指的是函数的返回类型,这里指的是返回的类型是字符串类型,ConcatString是要调用的函数名称,括号里面表示的是函数所接收的参数。需要注意的是,虎客语言是严格区分大小写的。
我们明白了虎客语言的简单语法之后,我们该如何去使用它呢?
BaseFunction<string>:ConcatString(":MultiNum(<1>,15'>http://www.zzz.com/search.aspx?allItem=",BaseFunction<string>:MultiNum(<1>,15));
其中<1>是Url分析中的第一个匹配规则匹配出的数据,也就是我们能得到的页数。
Var<string>:url(BaseFunction<string>:ConcatString("http://soft.sokezone.com/SoftTest/test.aspx?type1=<1>&type2=<2>&page=<0,1,<3>,1,1>","\r\n"));
BaseFunction<void>:WriteFile("c:\\a.txt",MemberField:url);
Var<string>:url();
这段逻辑的意思是将当前生成的URL血入到一个文件中,这样随着抓取的进行,URL就会被记录下来,我们可以使用记录下来的URL列表将资源下载下来。
就是这么简单,在接下来的文章里,我们将逐步帮您慢慢的理解并学习虎客语言的使用方法和技巧,便于您更好的组建您的抓取规则,谢谢。
搜客天下网络信息采集器
相关文章推荐
- C# 语言表现树形结构—TreeView高级用法指南
- Chuck语言学习笔记——3.int&float以及<<<>>>更高级的用法
- delphi2006语言新特性:Record类型高级用法
- C语言语法笔记 – 高级用法 指针数组 指针的指针 二维数组指针 结构体指针 链表
- delphi2006语言新特性:Record类型高级用法
- 小程序web-view分享html5网页,h5网页通过webview分享到微信群——微信web-view高级用法14
- DB2 SELECT语句高级用法
- c++高级---C/C++语言void及void指针
- Newtonsoft.Json高级用法
- Hibernate:HQL/QBC查询语言比较的用法
- Newtonsoft.Json高级用法
- #define 高级用法(Ex) __FILE__ __FUNCTION__ __LINE__
- jQuery动画高级用法(上)——详解animation中的.queue()函数
- JScript中正则表达式用法详解(附例子:JScript多语言语法加亮引擎)
- ping命令的高级用法
- Windows批处理的高级用法
- 高级语言程序的两种处理方式——编译和解释
- 高级语言虚拟机的一点理解,对比.NET和Java平台
- C 语言宏高级应用
- Java语言class类用法及泛化(详解)