java解析获取Excel中的数据--同时兼容2003及2007
2016-04-08 17:14
736 查看
java解析获取Excel中的数据--同时兼容2003及2007
标签: exceljavaexceptionstringnulloffice2012-09-10 10:44 31256人阅读 评论(12) 收藏 举报
分类:
J2EE(31)
版权声明:本文为博主原创文章,未经博主允许不得转载。
首先大家先了解一下以下内容:引用 http://feitian0127.iteye.com/blog/1152524
java解析Excel(兼容2003及2007)
刚开始从网上找了个例子使用new HSSFWorkbook(new FileInputStream(excelFile))来读取Workbook,
对Excel2003以前(包括2003)的版本没有问题,但读取Excel2007时发生如下异常:
org.apache.poi.poifs.filesystem.OfficeXmlFileException: The supplied data appears to be in the Office 2007+ XML. You are calling the part of POI that deals with OLE2 Office Documents. You need to call a different part of POI to process this data (eg XSSF instead
of HSSF)
该错误意思是说,文件中的数据是用Office2007+XML保存的,而现在却调用OLE2 Office文档处理,应该使用POI不同的部分来处理这些数据,比如使用XSSF来代替HSSF。
于是按提示使用XSSF代替HSSF,用new XSSFWorkbook(excelFile)来读取Workbook,对Excel2007没有问题了,可是在读取Excel2003以前(包括2003)的版本时却发生了如下新异常:
org.apache.poi.openxml4j.exceptions.InvalidOperationException: Can't open the specified file: '*.xls'
该错误是说,操作无效,不能打开指定的xls文件。
到网上查了下,原来是XSSF不能读取Excel2003以前(包括2003)的版本,这样的话,就需要在读取前判断文件是2003前的版本还是2007的版本,然后对应调用HSSF或XSSF来读取。
这种做法比较麻烦,看了下API,发现XSSF和HSSF虽然在不同的包里,但却引用了同一接口Workbook,于是想到了这样的读取方法:
Workbook book = null;
try {
book = new XSSFWorkbook(excelFile);
} catch (Exception ex) {
book = new HSSFWorkbook(new FileInputStream(excelFile));
}
本认为程序应该没错了吧,但一运行还是报错(当时用得是poi3.6的zip包):
java.lang.ClassNotFoundException: org.openxmlformats.schemas.spreadsheetml.x2006.main.CTSheet
网上搜了下,是少poi-ooxml-schemas-xxx.jar包,根据提示在Apache网站上(http://labs.renren.com/apache-mirror//poi/release/bin/)下载了3.7的zip文件(poi-bin-3.7-20101029.zip),解压后将poi相关的包和xml相关的包都放上去。
在各版本的Excel中测试,没有发生异常,问题解决。
下面是POI的API网址,不过是英文的:
POI API Documentation
http://poi.apache.org/apidocs/index.html
转入正题:以下是代码,代码也是从别人的代码拿过来的,其中修改了部分
[java] view
plain copy
package com.execl;
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;
import java.util.ArrayList;
import java.util.List;
import org.apache.poi.hssf.usermodel.HSSFCell;
import org.apache.poi.hssf.usermodel.HSSFWorkbook;
import org.apache.poi.ss.usermodel.Cell;
import org.apache.poi.ss.usermodel.Row;
import org.apache.poi.ss.usermodel.Sheet;
import org.apache.poi.ss.usermodel.Workbook;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;
/**
*
* @描述:测试excel读取
*
* 导入的jar包
*
* poi-3.8-beta3-20110606.jar
*
* poi-ooxml-3.8-beta3-20110606.jar
*
* poi-examples-3.8-beta3-20110606.jar
*
* poi-excelant-3.8-beta3-20110606.jar
*
* poi-ooxml-schemas-3.8-beta3-20110606.jar
*
* poi-scratchpad-3.8-beta3-20110606.jar
*
* xmlbeans-2.3.0.jar
*
* dom4j-1.6.1.jar
*
* jar包官网下载地址:http://poi.apache.org/download.html
*
* 下载poi-bin-3.8-beta3-20110606.zipp
*
* @作者:建宁
*
* @时间:2012-08-29 下午16:27:15
*/
public class ImportExecl
{
/** 总行数 */
private int totalRows = 0;
/** 总列数 */
private int totalCells = 0;
/** 错误信息 */
private String errorInfo;
/** 构造方法 */
public ImportExecl()
{
}
/**
*
* @描述:得到总行数
*
* @作者:建宁
*
* @时间:2012-08-29 下午16:27:15
*
* @参数:@return
*
* @返回值:int
*/
public int getTotalRows()
{
return totalRows;
}
/**
*
* @描述:得到总列数
*
* @作者:建宁
*
* @时间:2012-08-29 下午16:27:15
*
* @参数:@return
*
* @返回值:int
*/
public int getTotalCells()
{
return totalCells;
}
/**
*
* @描述:得到错误信息
*
* @作者:建宁
*
* @时间:2012-08-29 下午16:27:15
*
* @参数:@return
*
* @返回值:String
*/
public String getErrorInfo()
{
return errorInfo;
}
/**
*
* @描述:验证excel文件
*
* @作者:建宁
*
* @时间:2012-08-29 下午16:27:15
*
* @参数:@param filePath 文件完整路径
*
* @参数:@return
*
* @返回值:boolean
*/
public boolean validateExcel(String filePath)
{
/** 检查文件名是否为空或者是否是Excel格式的文件 */
if (filePath == null || !(WDWUtil.isExcel2003(filePath) || WDWUtil.isExcel2007(filePath)))
{
errorInfo = "文件名不是excel格式";
return false;
}
/** 检查文件是否存在 */
File file = new File(filePath);
if (file == null || !file.exists())
{
errorInfo = "文件不存在";
return false;
}
return true;
}
/**
*
* @描述:根据文件名读取excel文件
*
* @作者:建宁
*
* @时间:2012-08-29 下午16:27:15
*
* @参数:@param filePath 文件完整路径
*
* @参数:@return
*
* @返回值:List
*/
public List<List<String>> read(String filePath)
{
List<List<String>> dataLst = new ArrayList<List<String>>();
InputStream is = null;
try
{
/** 验证文件是否合法 */
if (!validateExcel(filePath))
{
System.out.println(errorInfo);
return null;
}
/** 判断文件的类型,是2003还是2007 */
boolean isExcel2003 = true;
if (WDWUtil.isExcel2007(filePath))
{
isExcel2003 = false;
}
/** 调用本类提供的根据流读取的方法 */
File file = new File(filePath);
is = new FileInputStream(file);
dataLst = read(is, isExcel2003);
is.close();
}
catch (Exception ex)
{
ex.printStackTrace();
}
finally
{
if (is != null)
{
try
{
is.close();
}
catch (IOException e)
{
is = null;
e.printStackTrace();
}
}
}
/** 返回最后读取的结果 */
return dataLst;
}
/**
*
* @描述:根据流读取Excel文件
*
* @作者:建宁
*
* @时间:2012-08-29 下午16:40:15
*
* @参数:@param inputStream
*
* @参数:@param isExcel2003
*
* @参数:@return
*
* @返回值:List
*/
public List<List<String>> read(InputStream inputStream, boolean isExcel2003)
{
List<List<String>> dataLst = null;
try
{
/** 根据版本选择创建Workbook的方式 */
Workbook wb = null;
if (isExcel2003)
{
wb = new HSSFWorkbook(inputStream);
}
else
{
wb = new XSSFWorkbook(inputStream);
}
dataLst = read(wb);
}
catch (IOException e)
{
e.printStackTrace();
}
return dataLst;
}
/**
*
* @描述:读取数据
*
* @作者:建宁
*
* @时间:2012-08-29 下午16:50:15
*
* @参数:@param Workbook
*
* @参数:@return
*
* @返回值:List<List<String>>
*/
private List<List<String>> read(Workbook wb)
{
List<List<String>> dataLst = new ArrayList<List<String>>();
/** 得到第一个shell */
Sheet sheet = wb.getSheetAt(0);
/** 得到Excel的行数 */
this.totalRows = sheet.getPhysicalNumberOfRows();
/** 得到Excel的列数 */
if (this.totalRows >= 1 && sheet.getRow(0) != null)
{
this.totalCells = sheet.getRow(0).getPhysicalNumberOfCells();
}
/** 循环Excel的行 */
for (int r = 0; r < this.totalRows; r++)
{
Row row = sheet.getRow(r);
if (row == null)
{
continue;
}
List<String> rowLst = new ArrayList<String>();
/** 循环Excel的列 */
for (int c = 0; c < this.getTotalCells(); c++)
{
Cell cell = row.getCell(c);
String cellValue = "";
if (null != cell)
{
// 以下是判断数据的类型
switch (cell.getCellType())
{
case HSSFCell.CELL_TYPE_NUMERIC: // 数字
cellValue = cell.getNumericCellValue() + "";
break;
case HSSFCell.CELL_TYPE_STRING: // 字符串
cellValue = cell.getStringCellValue();
break;
case HSSFCell.CELL_TYPE_BOOLEAN: // Boolean
cellValue = cell.getBooleanCellValue() + "";
break;
case HSSFCell.CELL_TYPE_FORMULA: // 公式
cellValue = cell.getCellFormula() + "";
break;
case HSSFCell.CELL_TYPE_BLANK: // 空值
cellValue = "";
break;
case HSSFCell.CELL_TYPE_ERROR: // 故障
cellValue = "非法字符";
break;
default:
cellValue = "未知类型";
break;
}
}
rowLst.add(cellValue);
}
/** 保存第r行的第c列 */
dataLst.add(rowLst);
}
return dataLst;
}
/**
*
* @描述:main测试方法
*
* @作者:建宁
*
* @时间:2012-08-29 下午17:12:15
*
* @参数:@param args
*
* @参数:@throws Exception
*
* @返回值:void
*/
public static void main(String[] args) throws Exception
{
ImportExecl poi = new ImportExecl();
// List<List<String>> list = poi.read("d:/aaa.xls");
List<List<String>> list = poi.read("c:/book.xlsx");
if (list != null)
{
for (int i = 0; i < list.size(); i++)
{
System.out.print("第" + (i) + "行");
List<String> cellList = list.get(i);
for (int j = 0; j < cellList.size(); j++)
{
// System.out.print(" 第" + (j + 1) + "列值:");
System.out.print(" " + cellList.get(j));
}
System.out.println();
}
}
}
}
/**
*
* @描述:工具类
*
* @作者:建宁
*
* @时间:2012-08-29 下午16:30:40
*/
class WDWUtil
{
/**
*
* @描述:是否是2003的excel,返回true是2003
*
* @作者:建宁
*
* @时间:2012-08-29 下午16:29:11
*
* @参数:@param filePath 文件完整路径
*
* @参数:@return
*
* @返回值:boolean
*/
public static boolean isExcel2003(String filePath)
{
return filePath.matches("^.+\\.(?i)(xls)$");
}
/**
*
* @描述:是否是2007的excel,返回true是2007
*
* @作者:建宁
*
* @时间:2012-08-29 下午16:28:20
*
* @参数:@param filePath 文件完整路径
*
* @参数:@return
*
* @返回值:boolean
*/
public static boolean isExcel2007(String filePath)
{
return filePath.matches("^.+\\.(?i)(xlsx)$");
}
}
算吧! 我把我的源码也放上—— 哈哈
http://download.csdn.net/detail/mmm333zzz/4560058
顶2
踩0
上一篇两种方式解决jquery
Ajax 发送中文乱码的方法,
下一篇SWT中的FormLayout
详细解释
我的同类文章
J2EE(31)•java版蓝缘官网商业源码出售2015-12-17阅读605
•自定义日期类型的数据绑定
前台 - 后台 或 后台 - 前台 互相转换2014-03-21阅读3267
•转:java二维码工具类,中间带LOGO的,很强大2013-12-11阅读12856
•基于springMVC+springSecurity3.x+Mybaits3.x的权限系统,,开放源码,支持开源2013-11-24阅读46544
•解决main
No MyBatis mapper was found in 的警告2013-11-21阅读4706
•mybatis执行批量更新batch
update 的方法(oracle,mysql)2015-04-26阅读2581
•Jquery
将表单序列化为Json对象.同时提交多个表单的参数2013-12-20阅读3918
•解决java使用sigar获取linux系统内存使用信息报错的问题2013-11-22阅读3495
•解决Spring
MVC 对AOP不起作用的问题2013-11-21阅读8496
•Linux下安装memcached,绝对成功,2013-11-13阅读2428
更多文章
猜你在找
<iframe id="iframeu1607657_0" src="http://pos.baidu.com/bcdm?sz=728x90&rdid=1607657&dc=2&di=u1607657&dri=0&dis=0&dai=2&ps=13832x305&coa=at%3D3%26rsi0%3D728%26rsi1%3D90%26pat%3D6%26tn%3DbaiduCustNativeAD%26rss1%3D%2523FFFFFF%26conBW%3D1%26adp%3D1%26ptt%3D0%26titFF%3D%2525E5%2525BE%2525AE%2525E8%2525BD%2525AF%2525E9%25259B%252585%2525E9%2525BB%252591%26titFS%3D%26rss2%3D%2523000000%26titSU%3D0%26ptbg%3D90%26piw%3D0%26pih%3D0%26ptp%3D0&dcb=BAIDU_SSP_define&dtm=BAIDU_DUP_SETJSONADSLOT&dvi=0.0&dci=-1&dpt=none&tsr=0&tpr=1460106773068&ti=java%E8%A7%A3%E6%9E%90%E8%8E%B7%E5%8F%96Excel%E4%B8%AD%E7%9A%84%E6%95%B0%E6%8D%AE%EF%BC%8D%EF%BC%8D%E5%90%8C%E6%97%B6%E5%85%BC%E5%AE%B92003%E5%8F%8A2007%20-%20%E8%93%9D%E7%BC%98%20-%20%E5%8D%9A%E5%AE%A2%E9%A2%91%E9%81%93%20-%20CSDN.NET&ari=1&dbv=2&drs=3&pcs=1141x550&pss=1265x16011&cfv=0&cpl=4&chi=1&cce=true&cec=UTF-8&tlm=1460106773<u=http%3A%2F%2Fblog.csdn.net%2Fmmm333zzz%2Farticle%2Fdetails%2F7962377<r=https%3A%2F%2Fwww.baidu.com%2Flink%3Furl%3D9UT5YEeCyNzD3FgyhWCvdBy-HelgseeN-mzYzkc9FUN4dGLe8948bleBu3Ri3nbe4cNKcjPMFxfMd_c3LJpjlq%26wd%3D%26eqid%3De349a2350000a95700000005570775de&ecd=1&psr=1366x768&par=1366x728&pis=-1x-1&ccd=24&cja=false&cmi=6&col=zh-CN&cdo=-1&tcn=1460106773&qn=c6afd2f5522a0bd5&tt=1460106773045.30.186.205" width="728" height="90" align="center,center" vspace="0" hspace="0" marginwidth="0" marginheight="0" scrolling="no" frameborder="0" allowtransparency="true" style="border-width: 0px; border-style: initial; vertical-align: bottom; margin: 0px;"></iframe>
查看评论
12楼 guobji2015-10-22
11:48发表 [回复]
that so good!
11楼 qq_316261372015-09-27
21:39发表 [回复]
整理的非常好,漂亮
10楼 qq_274745512015-04-17
16:13发表 [回复]
为什么我还会报错提示。。?The supplied data appears to be in the Office 2007+ XML. You are calling the part of POI that deals with OLE2 Office Documents. You need to call a different part of POI to process this data (eg XSSF instead of HSSF) 大神们可以加QQ598745153为我解答一下吗 在线等
9楼 sandglassy2014-12-11
16:38发表 [回复]
good,不过三楼说的有道理,但是整体思路真心是很不错~~ 多谢!
8楼 yebai2014-12-01
19:37发表 [回复]
确实如此~
7楼 duanqi252014-08-08
17:49发表 [回复]
try、catch那里处理得非常妙,学习了,哈哈~
6楼 WanChangHuang2014-07-28
15:19发表 [回复]
手机号码解析不对,数字类型后面.0没有清除
5楼 heartche2014-06-16
11:00发表 [回复]
谢谢分享!
4楼 why3799962922014-05-22
10:47发表 [回复]
引用“luojuehuai”的评论:
博主写的非常好,顶起。希望能再发扬分享精神。
3楼 b19899282014-03-12
20:58发表 [回复]
楼主这个有bug,就是第一行一定要比下面的行多,不然读取长度就会以第一行来算
2楼 不怎么迷糊2014-01-15
09:37发表 [回复]
博主写的很详细,考虑的比较周全 ,感谢博主的分享精神
1楼 luojuehuai2013-10-21
20:34发表 [回复]
博主写的非常好,顶起。希望能再发扬分享精神。
相关文章推荐
- AFNetworking 3.0携带参数上传文件Demo 付java服务器端代码
- 用javah导出类的头文件,常见错误及解决方法
- 公司正式学习java第一周(作业实例)
- Java环境配置
- java使用部分字符串搜索文件
- LeetCode 238 -Product of Array Except Self ( JAVA )
- SpringMVC Controller介绍
- 升级java1.8及ssh版本中碰到的问题(四)
- java:按行读取服务器压缩文件内容
- java condition使用及分析
- Java中缓存之内存缓存
- Java中级开发工程师知识点归纳
- JAVA第四次作业
- Spring - 控制反转IOC
- 深入理解Java 8 Lambda
- Java内省
- java学习笔记(4)
- Java 基于MySQL数据库的简单学生管理系统
- JAVA之——经典算法50题
- 如何把myeclipse中的项目导到git.oschina