FileHelper 一个极好的数据文本文件处理类库
2008-07-07 14:41
239 查看
这个我应该是看Scott的博客,看他介绍的经典小工具的时候看到的,感谢。
我经常接触到一些csv格式存储的数据文件,把这些文件导入数据库,或者把数据库的数据导出成为excel文件或者csv文件。
自己写功能解析自然好,但是需要处理的地方太多,如果是标准文件还好,但是如果文本文件里含有保留分隔符,或者数据格式有一些小错误,都需要自己处理。而且如果数据格式变化了,每次还要修改自己的代码。所以,我一直没写这个代码。
偷懒,一直用Excel的Text to Data 功能凑合,或者用SQL的导入导出功能,再就是用从网页上拷贝粘贴数据到excel,然后清除格式的方法。
这些方法其实都有弊端,典型的就是大量的手工才做,重复劳动,这些到还能忍受了,当涉及到数据库,用的最多的自然就是SQL自带的导入导出功能。这个功能大体上好用,可是如果文本文件里面有一点错误,他就罢工。这倒还可以忍受,后来我在64位机器上装了64位的SQL,这样微软居然不支持直接由Excel导入,说64位版本不需要这个功能,我在网上看到了许多类似需求,微软都坚持说不提供这个64位的flat文件驱动!一等就是3年,SQL2005年发布,现在已经2008年了。可怕。
终于看到了这个阿根廷人编写的开源文本文件导入导出帮助类库!
本来以为还挺难使用,谁知,人家的帮助写得好,类库做的也好。我稍微调试了一下,就上手了!
最基本的用法可以看他主页的教程。
根据自己的文本文件格式,建立类库模板,定义好接受字段之类的。
增加引用类库文件到自己的项目。
一次性读取文本文件到内存。
最后是写入到其他的数据库或者转换格式保存。
我的问题是,我的文本文件比较大,大于50M,一次性读入的时候总是内存溢出,看了一下发现这个类库居然还提供了异步导入方式,就是读取一行,写一行!
略微看了一下,也好解决。
语法上,本类库兼容.net 1.0 和 .net 2.0,所以可以直接用.net 2.0的最新的语法写。写起来很方便!读取出来的数据可以直接赋给列表对象!
当然,类库本身也提供了对写入SQL,到处Excel的支持!由于作者的写入SQL的方式需要把SQL密码写道代码中,我就没有采用,而是自己用SQL数据连接写入SQL库的。
当然那个导出到EXcel的方式用起来还是很方便的。
总之这个工具最到的好处是,相当于你自己写了一个导入导出的功能,用法强大,容错性高,方便包含在自己的项目中,对文本进行自动化处理,完全省掉了自己编写功能的辛苦!强烈推荐!
The FileHelpers are a free and easy to use .NET library to import/export
data from fixed
length or delimited records in files, strings or
streams.
The idea is pretty simple:
The Library also has support for import/export data from differents storages like Excel,
Access, SqlServer, etc.
using System;
2using System.Configuration;
3using System.Data.SqlClient;
4//在此处增加对这个类库的引用就可以了
5using FileHelpers;
6
7
8namespace FileHelpersSample
9
读取文本文件时,需要实现定义一个类,这个类的语法也十分简单,而且作者还提供了一个帮助向导,帮助你自动生成这个类文件(真是体贴周到!)
我这里为了偷懒,读入的时候就都都成了字符型,而且也没加什么处理,其实这个类库还只是纠错,按格式读取,读取的时候转换格式等功能!你自己慢慢看,需要的时候再用。我是一次性转到SQL临时表里,自己用程序再处理的,当然你可以用作者提供的类库在读入的时候一次性处理,究竟哪种方式好,我还没研究,感觉自己的方式比较省事(你说的?愿意听你的看法。)
using System;
2using FileHelpers;
3
4namespace FileHelpersSample
5
我经常接触到一些csv格式存储的数据文件,把这些文件导入数据库,或者把数据库的数据导出成为excel文件或者csv文件。
自己写功能解析自然好,但是需要处理的地方太多,如果是标准文件还好,但是如果文本文件里含有保留分隔符,或者数据格式有一些小错误,都需要自己处理。而且如果数据格式变化了,每次还要修改自己的代码。所以,我一直没写这个代码。
偷懒,一直用Excel的Text to Data 功能凑合,或者用SQL的导入导出功能,再就是用从网页上拷贝粘贴数据到excel,然后清除格式的方法。
这些方法其实都有弊端,典型的就是大量的手工才做,重复劳动,这些到还能忍受了,当涉及到数据库,用的最多的自然就是SQL自带的导入导出功能。这个功能大体上好用,可是如果文本文件里面有一点错误,他就罢工。这倒还可以忍受,后来我在64位机器上装了64位的SQL,这样微软居然不支持直接由Excel导入,说64位版本不需要这个功能,我在网上看到了许多类似需求,微软都坚持说不提供这个64位的flat文件驱动!一等就是3年,SQL2005年发布,现在已经2008年了。可怕。
终于看到了这个阿根廷人编写的开源文本文件导入导出帮助类库!
本来以为还挺难使用,谁知,人家的帮助写得好,类库做的也好。我稍微调试了一下,就上手了!
最基本的用法可以看他主页的教程。
根据自己的文本文件格式,建立类库模板,定义好接受字段之类的。
增加引用类库文件到自己的项目。
一次性读取文本文件到内存。
最后是写入到其他的数据库或者转换格式保存。
我的问题是,我的文本文件比较大,大于50M,一次性读入的时候总是内存溢出,看了一下发现这个类库居然还提供了异步导入方式,就是读取一行,写一行!
略微看了一下,也好解决。
语法上,本类库兼容.net 1.0 和 .net 2.0,所以可以直接用.net 2.0的最新的语法写。写起来很方便!读取出来的数据可以直接赋给列表对象!
当然,类库本身也提供了对写入SQL,到处Excel的支持!由于作者的写入SQL的方式需要把SQL密码写道代码中,我就没有采用,而是自己用SQL数据连接写入SQL库的。
当然那个导出到EXcel的方式用起来还是很方便的。
总之这个工具最到的好处是,相当于你自己写了一个导入导出的功能,用法强大,容错性高,方便包含在自己的项目中,对文本进行自动化处理,完全省掉了自己编写功能的辛苦!强烈推荐!
The FileHelpers are a free and easy to use .NET library to import/export
data from fixed
length or delimited records in files, strings or
streams.
The idea is pretty simple:
You can strong type your flat file (fixed or delimited) simply describing a class that maps to each record and later read/write your file as an strong typed .NET array |
Access, SqlServer, etc.
using System;
2using System.Configuration;
3using System.Data.SqlClient;
4//在此处增加对这个类库的引用就可以了
5using FileHelpers;
6
7
8namespace FileHelpersSample
9
读取文本文件时,需要实现定义一个类,这个类的语法也十分简单,而且作者还提供了一个帮助向导,帮助你自动生成这个类文件(真是体贴周到!)
我这里为了偷懒,读入的时候就都都成了字符型,而且也没加什么处理,其实这个类库还只是纠错,按格式读取,读取的时候转换格式等功能!你自己慢慢看,需要的时候再用。我是一次性转到SQL临时表里,自己用程序再处理的,当然你可以用作者提供的类库在读入的时候一次性处理,究竟哪种方式好,我还没研究,感觉自己的方式比较省事(你说的?愿意听你的看法。)
using System;
2using FileHelpers;
3
4namespace FileHelpersSample
5
相关文章推荐
- FileHelper 一个极好的数据文本文件处理类库
- iOS 一个在UDP/TCP通信时,对16进制、10进制、NSData等数据之间的转换发送等处理的工具类库,一行代码将16进制字符串轻松转换成UDP需要的指令数据
- 一个java处理JSON格式数据的通用类(封装了一个class)
- 利用ajaxfileupload.js实现跨域上传图片并处理返回的数据
- FastJson处理json数据时遇到一个问题
- 实际中碰到的一个异构系统之间数据交换的处理方式设计
- 数组和字典的writeToFile方法——在项目开发中处理网络数据的时候,可以把请求获得的网络数据保存为plist文件,这样更方便开发
- JavaScript日期处理类库 Moment.js和JavaScript数据加密类库 Cryptico.js
- C#16位MD5加密算法的一个错误测试数据处理
- 一个方便且通用的导出数据到 Excel 的类库
- 一个很好的开源类库metadata-extractor处理jpeg图片
- fileinput模块可以循环一个或多个文本文件的内容
- 山寨一个PetShop(Task002)——数据类库Model
- Hibernate处理一个实体映射多张相同结构的数据表--动态映射
- 向记事本里写入数据、一个修改密码的判断方法(用记录本处理密码的方式)
- Hibernate处理一个实体映射多张相同结构的数据表--动态映射
- ajaxfileupload.js+springMVC实现多个图片与数据同一个ajax方法上传
- 一个java处理JSON格式数据的通用类(封装了一个class)
- (六)Ireport制作一个规范的报表,处理数据格式
- perl 完成一个固定格式的文本文件处理