集算器比较csv文件中数据差异_润乾软件|数据处理-数据计算引擎
2017-04-06 10:47
495 查看
old.csv和new.csv的逻辑主键是userName和date,需要分别找出新增的、删除的、修改的数据行。源文件如下:
可以看到new.csv中的第2、3行是新增的记录,第4行是修改的记录,old.csv中第3行是删除的记录。
集算器代码:
A1,B1:以逗号为分隔符读入文件。
A2,B2:将数据按照关键字排序。后面的merge函数要求数据有序。
A3:按关键字找到新增的记录。函数merge可进行多数据集归并,@d表示归并时找出差集。类似地还还有并集@u,交集@i。计算结果如下:
A4:按关键字找到删除的记录。计算结果如下:
A5:将关键字作为普通字段,找到修改过的记录。计算结果如下:
A6:A5是中间计算结果,要计算更新的记录,还要在A6中计算A5和“新增”记录之间的差集。计算结果如下:
B6:将A6返回给JAVA或报表工具。
上述脚本已经完成了所有的数据处理工作,接下来通过JDBC将集算器脚本集成在JAVA里。JAVA代码如下:
//建立esProc jdbc连接
Class.forName("com.esproc.jdbc.InternalDriver");
con= DriverManager.getConnection("jdbc:esproc:local://");
//调用esProc,其中test是脚本文件名,可接收参数
st =(com.esproc.jdbc.InternalCStatement)con.prepareCall("call test()");
st.execute();//执行esProc存储过程
ResultSet set = st.getResultSet();//获得计算结果
如果要将多个数据集返回给JAVA,可以将B6的代码改为:result new,delete,update。
润乾软件| 润乾集算器 |
润乾报表
可以看到new.csv中的第2、3行是新增的记录,第4行是修改的记录,old.csv中第3行是删除的记录。
集算器代码:
A1,B1:以逗号为分隔符读入文件。
A2,B2:将数据按照关键字排序。后面的merge函数要求数据有序。
A3:按关键字找到新增的记录。函数merge可进行多数据集归并,@d表示归并时找出差集。类似地还还有并集@u,交集@i。计算结果如下:
A4:按关键字找到删除的记录。计算结果如下:
A5:将关键字作为普通字段,找到修改过的记录。计算结果如下:
A6:A5是中间计算结果,要计算更新的记录,还要在A6中计算A5和“新增”记录之间的差集。计算结果如下:
B6:将A6返回给JAVA或报表工具。
上述脚本已经完成了所有的数据处理工作,接下来通过JDBC将集算器脚本集成在JAVA里。JAVA代码如下:
//建立esProc jdbc连接
Class.forName("com.esproc.jdbc.InternalDriver");
con= DriverManager.getConnection("jdbc:esproc:local://");
//调用esProc,其中test是脚本文件名,可接收参数
st =(com.esproc.jdbc.InternalCStatement)con.prepareCall("call test()");
st.execute();//执行esProc存储过程
ResultSet set = st.getResultSet();//获得计算结果
如果要将多个数据集返回给JAVA,可以将B6的代码改为:result new,delete,update。
润乾软件| 润乾集算器 |
润乾报表
相关文章推荐
- 一共81个,开源大数据处理工具汇总:查询引擎、流式计算、迭代计算、离线计算、键值存储、表格存储、文件存储、资源管理、日志收集系统、消息系统、分布式服务、集群管理、基础设施、搜索引擎、数据挖掘=监控
- Python利用pandas计算多个CSV文件数据值的实例
- 一共81个,开源大数据处理工具汇总:查询引擎、流式计算、迭代计算、离线计算、键值存储、表格存储、文件存储、资源管理、日志收集系统、消息系统、分布式服务、集群管理、基础设施、搜索引擎、数据挖掘=监控
- Python利用pandas计算多个CSV文件数据值
- c#Winform程序调用app.config文件配置数据库连接字符串 SQL Server文章目录 浅谈SQL Server中统计对于查询的影响 有关索引的DMV SQL Server中的执行引擎入门 【译】表变量和临时表的比较 对于表列数据类型选择的一点思考 SQL Server复制入门(一)----复制简介 操作系统中的进程与线程
- bcp怎么导出一个表数据为带列名的csv格式文件
- php数据导入导出之excel(csv文件)
- 在Sql中查询csv文件中的数据
- 大杀毒软件比较与引擎介绍
- 通过试验探索Access 2000/XP 数据库的最佳 NTFS 权限设置Microsoft Jet 数据库引擎打不开文件'D:\wwwroot\test\data\'。 它已经被别的用户以独占方式打开,或没有查看数据的权限。
- 想写一个网站分发数据的软件,就是网站将数据文件分发到所有的客户机里,怎么实现?
- 各大杀毒软件比较与引擎介绍
- 使用ODBC, 将CSV文件里的数据导入DataSet
- 将Excel或CSV文件中的数据导出到DataSet
- C#数据计算精度比较低
- Flex 读取CSV文件,数据放入DataGrid
- datagrid数据导出到excel文件给客户端下载的几种方法 (xls,csv,html)
- 在jsp中点击按钮,在bean中把已经查出的数据,生成csv文件,然后在ie中自动打开
- 使用ODBC, 将CSV文件里的数据导入DataSet
- MySQL 直接读取csv文件数据到表中