您的位置:首页 > 运维架构 > Apache

java实现Excel文件解析---apache POI以及把汉字转化为拼音

2017-12-06 11:56 936 查看

java实现Excel文件解析----apache  POI以及把汉字转化为拼音

1、POI简介
Apache POI是Apache软件基金会的开放源码函式库,POI提供给Java程序对Microsoft Office格式档案读和写的工程。
Apache POI的官网地址是:http://poi.apache.org/  你可以去里面查api来实现不同文件的解析,我这里只介绍实现Excel文件的解析。
2、实现Excel文件解析。
我的Excel文件内容为:





(1)、导包



(2)、编写代码
工具类 工具类是把汉字解析为拼音
package com.haha.utils;

import java.util.Arrays;

import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;

public class PinYin4jUtils {
/**
* 将字符串转换成拼音数组
*
* @param src
* @return
*/
public static String[] stringToPinyin(String src) {
return stringToPinyin(src, false, null);
}

/**
* 将字符串转换成拼音数组
*
* @param src
* @return
*/
public static String[] stringToPinyin(String src, String separator) {

return stringToPinyin(src, true, separator);
}

/**
* 将字符串转换成拼音数组
*
* @param src
* @param isPolyphone
*            是否查出多音字的所有拼音
* @param separator
*            多音字拼音之间的分隔符
* @return
*/
public static String[] stringToPinyin(String src, boolean isPolyphone,
String separator) {
// 判断字符串是否为空
if ("".equals(src) || null == src) {
return null;
}
char[] srcChar = src.toCharArray();
int srcCount = srcChar.length;
String[] srcStr = new String[srcCount];

for (int i = 0; i < srcCount; i++) {
srcStr[i] = charToPinyin(srcChar[i], isPolyphone, separator);
}
return srcStr;
}

/**
* 将单个字符转换成拼音
*
* @param src
* @return
*/
public static String charToPinyin(char src, boolean isPolyphone,
String separator) {
// 创建汉语拼音处理类
HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
// 输出设置,大小写,音标方式
defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);

StringBuffer tempPinying = new StringBuffer();

// 如果是中文
if (src > 128) {
try {
// 转换得出结果
String[] strs = PinyinHelper.toHanyuPinyinStringArray(src,
defaultFormat);

// 是否查出多音字,默认是查出多音字的第一个字符
if (isPolyphone && null != separator) {
for (int i = 0; i < strs.length; i++) {
tempPinying.append(strs[i]);
if (strs.length != (i + 1)) {
// 多音字之间用特殊符号间隔起来
tempPinying.append(separator);
}
}
} else {
tempPinying.append(strs[0]);
}

} catch (BadHanyuPinyinOutputFormatCombination e) {
e.printStackTrace();
}
} else {
tempPinying.append(src);
}

return tempPinying.toString();

}

public static String hanziToPinyin(String hanzi) {
return hanziToPinyin(hanzi, " ");
}

/**
* 将汉字转换成拼音
*
* @param hanzi
* @param separator
* @return
*/
public static S
c14e
tring hanziToPinyin(String hanzi, String separator) {

// 创建汉语拼音处理类
HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
// 输出设置,大小写,音标方式
defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);

String pinyingStr = "";
try {
pinyingStr = PinyinHelper.toHanyuPinyinString(hanzi, defaultFormat,
separator);
} catch (BadHanyuPinyinOutputFormatCombination e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
return pinyingStr;
}

/**
* 将字符串数组转换成字符串
*
* @param str
* @param separator
*            各个字符串之间的分隔符
* @return
*/
public static String stringArrayToString(String[] str, String separator) {
StringBuffer sb = new StringBuffer();
for (int i = 0; i < str.length; i++) {
sb.append(str[i]);
if (str.length != (i + 1)) {
sb.append(separator);
}
}
return sb.toString();
}

/**
* 简单的将各个字符数组之间连接起来
*
* @param str
* @return
*/
public static String stringArrayToString(String[] str) {
return stringArrayToString(str, "");
}

/**
* 将字符数组转换成字符串
*
* @param str
* @param separator
*            各个字符串之间的分隔符
* @return
*/
public static String charArrayToString(char[] ch, String separator) {
StringBuffer sb = new StringBuffer();
for (int i = 0; i < ch.length; i++) {
sb.append(ch[i]);
if (ch.length != (i + 1)) {
sb.append(separator);
}
}
return sb.toString();
}

/**
* 将字符数组转换成字符串
*
* @param str
* @return
*/
public static String charArrayToString(char[] ch) {
return charArrayToString(ch, " ");
}

/**
* 取汉字的首字母
*
* @param src
* @param isCapital
*            是否是大写
* @return
*/
public static char[] getHeadByChar(char src, boolean isCapital) {
// 如果不是汉字直接返回
if (src <= 128) {
return new char[] { src };
}
// 获取所有的拼音
String[] pinyingStr = PinyinHelper.toHanyuPinyinStringArray(src);

// 创建返回对象
int polyphoneSize = pinyingStr.length;
char[] headChars = new char[polyphoneSize];
int i = 0;
// 截取首字符
for (String s : pinyingStr) {
char headChar = s.charAt(0);
// 首字母是否大写,默认是小写
if (isCapital) {
headChars[i] = Character.toUpperCase(headChar);
} else {
headChars[i] = headChar;
}
i++;
}

return headChars;
}

/**
* 取汉字的首字母(默认是大写)
*
* @param src
* @return
*/
public static char[] getHeadByChar(char src) {
return getHeadByChar(src, true);
}

/**
* 查找字符串首字母
*
* @param src
* @return
*/
public static String[] getHeadByString(String src) {
return getHeadByString(src, true);
}

/**
* 查找字符串首字母
*
* @param src
* @param isCapital
*            是否大写
* @return
*/
public static String[] getHeadByString(String src, boolean isCapital) {
return getHeadByString(src, isCapital, null);
}

/**
* 查找字符串首字母
*
* @param src
* @param isCapital
*            是否大写
* @param separator
*            分隔符
* @return
*/
public static String[] getHeadByString(String src, boolean isCapital,
String separator) {
char[] chars = src.toCharArray();
String[] headString = new String[chars.length];
int i = 0;
for (char ch : chars) {

char[] chs = getHeadByChar(ch, isCapital);
StringBuffer sb = new StringBuffer();
if (null != separator) {
int j = 1;

for (char ch1 : chs) {
sb.append(ch1);
if (j != chs.length) {
sb.append(separator);
}
j++;
}
} else {
sb.append(chs[0]);
}
headString[i] = sb.toString();
i++;
}
return headString;
}

public static void main(String[] args) {
// pin4j 简码 和 城市编码
String s1 = "中华人民共和国";
String[] headArray = getHeadByString(s1); // 获得每个汉字拼音首字母
System.out.println(Arrays.toString(headArray));

String s2 ="长城" ;
System.out.println(Arrays.toString(stringToPinyin(s2,true,",")));

String s3 ="长";
System.out.println(Arrays.toString(stringToPinyin(s3,true,",")));
}
}
解析excel文件的测试类
package com.haha.poi;

import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.util.Arrays;

import org.apache.poi.hssf.usermodel.HSSFRow;
import org.apache.poi.hssf.usermodel.HSSFSheet;
import org.apache.poi.hssf.usermodel.HSSFWorkbook;
import org.junit.Test;

import com.haha.utils.PinYin4jUtils;

public class POITest {
@Test//解析excel
public void fun1() throws Exception{
//获得待解析的Excel文件
//得到Excel工作簿对象
HSSFWorkbook wb =
new HSSFWorkbook(
new FileInputStream("C:/Users/帅哥/Desktop/POI/区域导入测试数据.xls"));
//取出要解析的文件中的表格,0代表取出的是sheet1表格
HSSFSheet sheet = wb.getSheetAt(0);
//获得表格中一共有多少行
int rowcount = sheet.getLastRowNum();
//遍历并取出表格中的每一行数据
for(int i = 1 ; i <= rowcount ; i ++ ){
HSSFRow row = sheet.getRow(i);
//获得行中每个单元格的值
//short cellCount = row.getLastCellNum();
String areaNum = row.getCell(0).getStringCellValue();
String province = row.getCell(1).getStringCellValue();
String city = row.getCell(2).getStringCellValue();
String quyu = row.getCell(3).getStringCellValue();
String code = row.getCell(4).getStringCellValue();

//生成城市全拼
String citycode = PinYin4jUtils.hanziToPinyin(city, "");
//将字符串拼接为简码
String[] strs = PinYin4jUtils.getHeadByString(province+city+quyu);

System.out.println(areaNum+"=>"+province+"=>"+city+"=>"+quyu+"=>"+code+"=>"+citycode+"=>"+Arrays.toString(strs));
}
}
}
结果:



结果中的string数组可以通过StringUtils的join方法变成string字符串。











内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: