您的位置:首页 > 其它

基于XML的SPSS分析服务系统模型

2013-04-01 19:56 357 查看
基于XML的SPSS分析服务系统模型
戴兴中1,刘凤芹1,王亚楠2,周晓宁1

(1 济南钢铁股份有限公司,山东 济南 250101;2 山东师范大学,山东 济南 250014)
摘 要:提出一个基于XML的SPSS分析服务系统模型,该系统采用结构化的XML封装待分析数据,服务器端和客户端之间通过Web Service交换压缩后的XML文档进行交互。Internet上的用户可通过浏览器或客户端软件调用服务器提供的SPSS服务。还从该系统中抽象出适合解决此类问题的三层服务结构模型。

关键词
:SPSS;XML;Web Service;分析服务系统模型;三层服务结构

中图分类号
:TP311   文献标识码: A 
文章编号:1004-4620(2006)05-0046-03

An XML-based SPSS Analysis Service System Model
DAI Xing-zhong1, LIU Feng-qin1, WANG Ya-nan2, ZHOU Xiao-ning1

(1 Jinan Iron and Steel Co., Ltd., Jinan 250101, China; 2 Shandong Normal University, Jinan 250014, China)

Abstract: An XML-based SPSS analysis service system model is proposed. Constructive XML is adopted to encapsulate analysis data in this
system. Compressed XML document is transmitted by web service between servers and clients. Users on the Internet can transfer SPSS analysis service with browser or client software. Finally, Three-layer service structure, which is applicable to solve this kind
of problems, is abstracted from this system.

Key words
: SPSS; XML; web service; analysis service system model; three-layer service structure
1 引 言
  统计分析,特别是结合实际问题的统计分析,要进行大量数据的数学运算,SPSS软件是当前使用广泛、功能强大的统计软件之一。然而在实际生产应用中,由于受到空间、资源和平台的限制,无法对数据进行快速及时的统计分析,限制了决策速度的提高。

  XML(Extensible Markup Language)是一种倍受关注的网上数据交换的标准。XML提供了一个有效交换数据的方式,由于XML是自描述性的,其结构和内容共存,与显示分离,XML数据文档可以很容易地根据它的架构来验证其有效性并重用这些数据[1]。Web 服务器是描述一些操作(利用标准化的XML消息传递机制可以通过网络访问这些操作)的接口。它是一种想把Internet/Intranet变成一个虚拟计算环境的观念和技术,允许异质的客户端使用标准网络协议(如HTTP
和SMTP 协议)访问服务器端提供的服务[2]。

  在结构化XML文档特点和Web 服务器技术的支持下,提出一个基于XML的SPSS分析服务系统模型,该模型采用结构化的XML封装待分析数据,在服务器端和客户端之间通过Web 服务器交换压缩后的XML文档进行交互,使得Internet上的用户可以通过浏览器或客户端软件调用服务器提供的SPSS分析服务,并从系统中抽象出适合此类问题的三层服务结构模型。
2 系统模型总体设计
2.1 系统构架  根据上述基于XML的SPSS分析服务系统设计思想,该系统模型的总体框架如图1所示。
  图1 基于XML的SPSS分析服务系统框架
  该系统采用服务器/客户模式,若干个客户端通过引用服务器端公布的Web 服务器实现与服务器的交互,形成一个开放性、标准性、松耦合性的系统结构。客户端主要向用户提供人机交互功能,将用户需要进行的分析转换为调用服务器端的Web 服务器。为了减少网络负载,服务器端和客户端之间仅传递高层语义消息(特定的操作和用于分析的数据),通过传递XML封装的SOAP包交换数据。服务器端主要完成数据统计分析操作,实现XML解压缩、数据转换存储和分析结果返回等功能。服务器端将这些操作以Web 服务器方式供Internet上若干个客户端引用,使得系统可以支持跨平台的实时数据分析。

2.2 客户端

  客户端由用户交互模块、XML预处理模块和客户端代理组成(如图2所示)。为了减小服务器端的工作量,客户端应尽可能多地在本地完成用户操作,如确保数据的完整性、有效性等。由于XML具有其它方法不具备的数据描述特点,可以很容易地根据其架构来验证其有效性。
图2 客户端结构示意图
  (1)用户交互模块向用户提供了与系统的交互界面,这个交互界面可以是浏览器,也可以是客户端软件。用户可以通过交互模块进行原始数据的输入、编辑,还可通过此模块申请SPSS服务,并获取显示返回的统计分析结果。

  (2)XML预处理模块包含数据转换单元和结构化XML文档生成单元。数据转换单元起到的是中间转换处理的作用,负责桥接内部待分析数据和外部的XML通信数据,即负责处理从关系数据库数据到XML文档的数据转换。XML预处理模块定义了XML文档与关系数据库中关系表的映射关系以及XML文档结构,并将这些定义好的映射关系保存到表示映射关系的特定格式的XML映射关系定义文件中。数据转换单元根据映射文件处理从关系数据库数据到XML文档的转换。结构化XML文档生成单元负责将用户选择的统计分析要求封装入XML文档,使其对于服务器端服务程序具有有效性。XML预处理模块还负责将服务器端返回的分析结果转换为用户交互模块可识别的数据格式。

  (3)客户端代理负责将XML数据封装模块传来的数据进行压缩处理,并调用服务器端的Web 服务器。客户端代理还负责把服务器端返回的服务结果提交给XML预处理模块。

2.3 服务器端

  服务器端主要由SPSS系统、服务解析模块、服务器端代理和数据库组成。服务器端的SPSS系统负责统计分析接收到的数据,并输出分析统计结果。服务器端不仅要完成客户端指定的数据统计分析操作,还必须负责管理所有客户端和SPSS系统之间的信息交换,这个任务由服务解析模块和服务器端代理来完成。

  服务器端代理负责客户端和服务器端之间的信息传递,解压缩客户端的分析请求文档,然后将解压后的XML文档提交给服务解析模块。服务解析模块根据已知的DTD和解压后得到的XML文档,对XML文档进行解析。必要情况下(用户要求存储或数据增量式提交时),将XML文档的内容以关系数据的形式存储到关系数据库中,然后将结构化的XML文档内封装的客户端请求转换为Syntax命令,连同待分析的数据一起转交给SPSS系统执行分析操作,SPSS系统完成数据分析后,服务解析模块负责将SPSS系统的分析结果保存并转换为XML文档格式,交给服务器端代理,再由服务器端代理通过Web
服务器返回给客户端。由于要返回客户的分析结果的数据量不大,就可以选择直接传递XML文档,而非压缩后的文件,这个由代理根据分析结果的数据量自适应决定。

  使用UML给出的服务器端处理用户请求的顺序见图3。这个顺序图描述了服务器端从收到请求到返回结果的整个过程中,服务器端各部分之间的交互关系。

图3 服务器端各部分交互关系顺序
3 三层服务结构
  客户端提交给服务器端的数据和需要进行的SPSS分析要求都是封装在XML文档里的。服务器端的服务解析模块只需对收到的XML文档进行解析、自动转换成Syntax命令,便可调用SPSS系统进行统计分析操作。客户端的XML预处理模块只需把待分析数据从关系型数据库中提取出来,然后将数据和分析要求封装入XML文档,交给客户端代理。而客户端代理和服务器端代理无需关心XML文档内容,因为它们只是对封装好的XML文档进行压缩、解压、发送和接收操作。

  如图4所示,可以将基于XML的SPSS分析服务系统中的各个模块归类到三个抽象的层中,即应用层、数据转换层和通信层。
  图4 三层服务结构
  (1)客户端的用户交互模块和服务器端的SPSS系统处于应用层。在Web 服务器技术的支持下,分布在网络不同计算机中的客户端和服务器端构成了一个虚拟的计算机系统,客户端的用户交互模块可以轻松地调用Internet上其它主机上的SPSS系统,而对用户来说这都是透明的,整个数据分析过程就像使用本地的SPSS系统一样。

  (2)客户端的XML预处理模块和服务器端的服务解析模块处于数据转换层。数据转换层向上负责把接收到的XML文档解释成应用层能够识别的格式,向下负责为通信层提供封装好的XML文档。

  (3)客户端代理和服务器端代理处于通信层。通信层负责客户端和服务器端的通信,也就是说,客户端代理负责把用户的数据发送给服务器端并接收服务器端返回的服务结果,服务器端代理负责响应服务请求。通信层与数据转换层交换的是封装好的XML文档(XML文档里包含用户提交的待分析数据和分析要求或服务器返回的分析结果),而处于通信层的服务器端代理和客户端代理不用关心这个XML文档里的内容,它们只负责服务器和客户端的通信,并且自适应地进行数据的压缩、解压缩处理。

  三层的服务结构中,各层的功能相互独立。只要定义好层间统一的接口,任何一层执行机制的改变都不会影响系统的正常运行,这样有利于系统的模块化设计。这种结构下,只需改变应用层,就可以将此系统模型扩展应用到其它网络服务。
4 结 语
  基于XML的SPSS分析服务系统模型设计依据SPSS统计分析的特点,采用三层的服务结构,为Internet用户提供了一种开放的、跨平台的数据分析服务,而且为其它网络服务提供了可参考模式。由于SPSS系统功能的多种多样性,如何形成一个完整、高效的SPSS分析服务系统还需要更多的努力。但是,理论与实验已证明,基于XML的SPSS分析服务系统节省了大量的网络资源,减少了人对系统的干预,具有很好的可行性和很高的应用价值。
参考文献:

[1] 高阳, 谭力民.基于XML文档的关系数据库与面向对象数据库之间的信息交互[J].计算机工程与应用, 2003, 39(3):196~197.

[2] 胡春明, 怀进鹏, 孙海龙.基于Web服务的网格体系结构及其支持环境研究[J].软件学报, 2004, 15(7):1064~1073.
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: