您的位置:首页 > 其它

解析excel文件

2016-01-04 11:54 288 查看
 首先大家先了解一下以下内容:引用 http://feitian0127.iteye.com/blog/1152524

    java解析Excel(兼容2003及2007)

刚开始从网上找了个例子使用new HSSFWorkbook(new FileInputStream(excelFile))来读取Workbook,

对Excel2003以前(包括2003)的版本没有问题,但读取Excel2007时发生如下异常:

org.apache.poi.poifs.filesystem.OfficeXmlFileException: The supplied data appears to be in the Office 2007+ XML. You are calling the part of POI that deals with OLE2 Office Documents. You need to call a different part of POI to process this data (eg XSSF instead
of HSSF)

该错误意思是说,文件中的数据是用Office2007+XML保存的,而现在却调用OLE2 Office文档处理,应该使用POI不同的部分来处理这些数据,比如使用XSSF来代替HSSF。

于是按提示使用XSSF代替HSSF,用new XSSFWorkbook(excelFile)来读取Workbook,对Excel2007没有问题了,可是在读取Excel2003以前(包括2003)的版本时却发生了如下新异常:

org.apache.poi.openxml4j.exceptions.InvalidOperationException: Can't open the specified file: '*.xls'

该错误是说,操作无效,不能打开指定的xls文件。

到网上查了下,原来是XSSF不能读取Excel2003以前(包括2003)的版本,这样的话,就需要在读取前判断文件是2003前的版本还是2007的版本,然后对应调用HSSF或XSSF来读取。

这种做法比较麻烦,看了下API,发现XSSF和HSSF虽然在不同的包里,但却引用了同一接口Workbook,于是想到了这样的读取方法:

Workbook book = null;

try {

book = new XSSFWorkbook(excelFile);

} catch (Exception ex) {

book = new HSSFWorkbook(new FileInputStream(excelFile));

}

本认为程序应该没错了吧,但一运行还是报错(当时用得是poi3.6的zip包):

java.lang.ClassNotFoundException: org.openxmlformats.schemas.spreadsheetml.x2006.main.CTSheet

网上搜了下,是少poi-ooxml-schemas-xxx.jar包,根据提示在Apache网站上(http://labs.renren.com/apache-mirror//poi/release/bin/)下载了3.7的zip文件(poi-bin-3.7-20101029.zip),解压后将poi相关的包和xml相关的包都放上去。

在各版本的Excel中测试,没有发生异常,问题解决。

下面是POI的API网址,不过是英文的:

POI API Documentation

http://poi.apache.org/apidocs/index.html

   转入正题:以下是代码,代码也是从别人的代码拿过来的,其中修改了部分

[java] view
plaincopy

package com.execl;

import java.io.File;

import java.io.FileInputStream;

import java.io.IOException;

import java.io.InputStream;

import java.util.ArrayList;

import java.util.List;

import org.apache.poi.hssf.usermodel.HSSFCell;

import org.apache.poi.hssf.usermodel.HSSFWorkbook;

import org.apache.poi.ss.usermodel.Cell;

import org.apache.poi.ss.usermodel.Row;

import org.apache.poi.ss.usermodel.Sheet;

import org.apache.poi.ss.usermodel.Workbook;

import org.apache.poi.xssf.usermodel.XSSFWorkbook;

/**

*

* @描述:测试excel读取

*

* 导入的jar包

*

* poi-3.8-beta3-20110606.jar

*

* poi-ooxml-3.8-beta3-20110606.jar

*

* poi-examples-3.8-beta3-20110606.jar

*

* poi-excelant-3.8-beta3-20110606.jar

*

* poi-ooxml-schemas-3.8-beta3-20110606.jar

*

* poi-scratchpad-3.8-beta3-20110606.jar

*

* xmlbeans-2.3.0.jar

*

* dom4j-1.6.1.jar

*

* jar包官网下载地址:http://poi.apache.org/download.html

*

* 下载poi-bin-3.8-beta3-20110606.zipp

*

* @作者:建宁

*

* @时间:2012-08-29 下午16:27:15

*/

public class ImportExecl

{

/** 总行数 */

private int totalRows = 0;

/** 总列数 */

private int totalCells = 0;

/** 错误信息 */

private String errorInfo;

/** 构造方法 */

public ImportExecl()

{

}

/**

*

* @描述:得到总行数

*

* @作者:建宁

*

* @时间:2012-08-29 下午16:27:15

*

* @参数:@return

*

* @返回值:int

*/

public int getTotalRows()

{

return totalRows;

}

/**

*

* @描述:得到总列数

*

* @作者:建宁

*

* @时间:2012-08-29 下午16:27:15

*

* @参数:@return

*

* @返回值:int

*/

public int getTotalCells()

{

return totalCells;

}

/**

*

* @描述:得到错误信息

*

* @作者:建宁

*

* @时间:2012-08-29 下午16:27:15

*

* @参数:@return

*

* @返回值:String

*/

public String getErrorInfo()

{

return errorInfo;

}

/**

*

* @描述:验证excel文件

*

* @作者:建宁

*

* @时间:2012-08-29 下午16:27:15

*

* @参数:@param filePath 文件完整路径

*

* @参数:@return

*

* @返回值:boolean

*/

public boolean validateExcel(String filePath)

{

/** 检查文件名是否为空或者是否是Excel格式的文件 */

if (filePath == null || !(WDWUtil.isExcel2003(filePath) || WDWUtil.isExcel2007(filePath)))

{

errorInfo = "文件名不是excel格式";

return false;

}

/** 检查文件是否存在 */

File file = new File(filePath);

if (file == null || !file.exists())

{

errorInfo = "文件不存在";

return false;

}

return true;

}

/**

*

* @描述:根据文件名读取excel文件

*

* @作者:建宁

*

* @时间:2012-08-29 下午16:27:15

*

* @参数:@param filePath 文件完整路径

*

* @参数:@return

*

* @返回值:List

*/

public List<List<String>> read(String filePath)

{

List<List<String>> dataLst = new ArrayList<List<String>>();

InputStream is = null;

try

{

/** 验证文件是否合法 */

if (!validateExcel(filePath))

{

System.out.println(errorInfo);

return null;

}

/** 判断文件的类型,是2003还是2007 */

boolean isExcel2003 = true;

if (WDWUtil.isExcel2007(filePath))

{

isExcel2003 = false;

}

/** 调用本类提供的根据流读取的方法 */

File file = new File(filePath);

is = new FileInputStream(file);

dataLst = read(is, isExcel2003);

is.close();

}

catch (Exception ex)

{

ex.printStackTrace();

}

finally

{

if (is != null)

{

try

{

is.close();

}

catch (IOException e)

{

is = null;

e.printStackTrace();

}

}

}

/** 返回最后读取的结果 */

return dataLst;

}

/**

*

* @描述:根据流读取Excel文件

*

* @作者:建宁

*

* @时间:2012-08-29 下午16:40:15

*

* @参数:@param inputStream

*

* @参数:@param isExcel2003

*

* @参数:@return

*

* @返回值:List

*/

public List<List<String>> read(InputStream inputStream, boolean isExcel2003)

{

List<List<String>> dataLst = null;

try

{

/** 根据版本选择创建Workbook的方式 */

Workbook wb = null;

if (isExcel2003)

{

wb = new HSSFWorkbook(inputStream);

}

else

{

wb = new XSSFWorkbook(inputStream);

}

dataLst = read(wb);

}

catch (IOException e)

{

e.printStackTrace();

}

return dataLst;

}

/**

*

* @描述:读取数据

*

* @作者:建宁

*

* @时间:2012-08-29 下午16:50:15

*

* @参数:@param Workbook

*

* @参数:@return

*

* @返回值:List<List<String>>

*/

private List<List<String>> read(Workbook wb)

{

List<List<String>> dataLst = new ArrayList<List<String>>();

/** 得到第一个shell */

Sheet sheet = wb.getSheetAt(0);

/** 得到Excel的行数 */

this.totalRows = sheet.getPhysicalNumberOfRows();

/** 得到Excel的列数 */

if (this.totalRows >= 1 && sheet.getRow(0) != null)

{

this.totalCells = sheet.getRow(0).getPhysicalNumberOfCells();

}

/** 循环Excel的行 */

for (int r = 0; r < this.totalRows; r++)

{

Row row = sheet.getRow(r);

if (row == null)

{

continue;

}

List<String> rowLst = new ArrayList<String>();

/** 循环Excel的列 */

for (int c = 0; c < this.getTotalCells(); c++)

{

Cell cell = row.getCell(c);

String cellValue = "";

if (null != cell)

{

// 以下是判断数据的类型

switch (cell.getCellType())

{

case HSSFCell.CELL_TYPE_NUMERIC: // 数字

cellValue = cell.getNumericCellValue() + "";

break;

case HSSFCell.CELL_TYPE_STRING: // 字符串

cellValue = cell.getStringCellValue();

break;

case HSSFCell.CELL_TYPE_BOOLEAN: // Boolean

cellValue = cell.getBooleanCellValue() + "";

break;

case HSSFCell.CELL_TYPE_FORMULA: // 公式

cellValue = cell.getCellFormula() + "";

break;

case HSSFCell.CELL_TYPE_BLANK: // 空值

cellValue = "";

break;

case HSSFCell.CELL_TYPE_ERROR: // 故障

cellValue = "非法字符";

break;

default:

cellValue = "未知类型";

break;

}

}

rowLst.add(cellValue);

}

/** 保存第r行的第c列 */

dataLst.add(rowLst);

}

return dataLst;

}

/**

*

* @描述:main测试方法

*

* @作者:建宁

*

* @时间:2012-08-29 下午17:12:15

*

* @参数:@param args

*

* @参数:@throws Exception

*

* @返回值:void

*/

public static void main(String[] args) throws Exception

{

ImportExecl poi = new ImportExecl();

// List<List<String>> list = poi.read("d:/aaa.xls");

List<List<String>> list = poi.read("c:/book.xlsx");

if (list != null)

{

for (int i = 0; i < list.size(); i++)

{

System.out.print("第" + (i) + "行");

List<String> cellList = list.get(i);

for (int j = 0; j < cellList.size(); j++)

{

// System.out.print(" 第" + (j + 1) + "列值:");

System.out.print(" " + cellList.get(j));

}

System.out.println();

}

}

}

}

/**

*

* @描述:工具类

*

* @作者:建宁

*

* @时间:2012-08-29 下午16:30:40

*/

class WDWUtil

{

/**

*

* @描述:是否是2003的excel,返回true是2003

*

* @作者:建宁

*

* @时间:2012-08-29 下午16:29:11

*

* @参数:@param filePath 文件完整路径

*

* @参数:@return

*

* @返回值:boolean

*/

public static boolean isExcel2003(String filePath)

{

return filePath.matches("^.+\\.(?i)(xls)$");

}

/**

*

* @描述:是否是2007的excel,返回true是2007

*

* @作者:建宁

*

* @时间:2012-08-29 下午16:28:20

*

* @参数:@param filePath 文件完整路径

*

* @参数:@return

*

* @返回值:boolean

*/

public static boolean isExcel2007(String filePath)

{

return filePath.matches("^.+\\.(?i)(xlsx)$");

}

}





<!-- excel文档解析 -->

<dependency>

<groupId>org.apache.poi</groupId>

<artifactId>poi</artifactId>

<version>3.11-beta3</version>

</dependency>

<dependency>

<groupId>org.apache.poi</groupId>

<artifactId>poi-ooxml</artifactId>

<version>3.11-beta3</version>

</dependency>

<dependency>

<groupId>org.apache.poi</groupId>

<artifactId>poi-ooxml-schemas</artifactId>

<version>3.11-beta3</version>

</dependency>
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: