java实现Excel文件解析---apache POI以及把汉字转化为拼音
2017-12-06 11:56
936 查看
java实现Excel文件解析----apache POI以及把汉字转化为拼音
1、POI简介Apache POI是Apache软件基金会的开放源码函式库,POI提供给Java程序对Microsoft Office格式档案读和写的工程。
Apache POI的官网地址是:http://poi.apache.org/ 你可以去里面查api来实现不同文件的解析,我这里只介绍实现Excel文件的解析。
2、实现Excel文件解析。
我的Excel文件内容为:
(1)、导包
(2)、编写代码
工具类 工具类是把汉字解析为拼音
package com.haha.utils; import java.util.Arrays; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType; import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat; import net.sourceforge.pinyin4j.format.HanyuPinyinToneType; import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination; public class PinYin4jUtils { /** * 将字符串转换成拼音数组 * * @param src * @return */ public static String[] stringToPinyin(String src) { return stringToPinyin(src, false, null); } /** * 将字符串转换成拼音数组 * * @param src * @return */ public static String[] stringToPinyin(String src, String separator) { return stringToPinyin(src, true, separator); } /** * 将字符串转换成拼音数组 * * @param src * @param isPolyphone * 是否查出多音字的所有拼音 * @param separator * 多音字拼音之间的分隔符 * @return */ public static String[] stringToPinyin(String src, boolean isPolyphone, String separator) { // 判断字符串是否为空 if ("".equals(src) || null == src) { return null; } char[] srcChar = src.toCharArray(); int srcCount = srcChar.length; String[] srcStr = new String[srcCount]; for (int i = 0; i < srcCount; i++) { srcStr[i] = charToPinyin(srcChar[i], isPolyphone, separator); } return srcStr; } /** * 将单个字符转换成拼音 * * @param src * @return */ public static String charToPinyin(char src, boolean isPolyphone, String separator) { // 创建汉语拼音处理类 HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat(); // 输出设置,大小写,音标方式 defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE); defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE); StringBuffer tempPinying = new StringBuffer(); // 如果是中文 if (src > 128) { try { // 转换得出结果 String[] strs = PinyinHelper.toHanyuPinyinStringArray(src, defaultFormat); // 是否查出多音字,默认是查出多音字的第一个字符 if (isPolyphone && null != separator) { for (int i = 0; i < strs.length; i++) { tempPinying.append(strs[i]); if (strs.length != (i + 1)) { // 多音字之间用特殊符号间隔起来 tempPinying.append(separator); } } } else { tempPinying.append(strs[0]); } } catch (BadHanyuPinyinOutputFormatCombination e) { e.printStackTrace(); } } else { tempPinying.append(src); } return tempPinying.toString(); } public static String hanziToPinyin(String hanzi) { return hanziToPinyin(hanzi, " "); } /** * 将汉字转换成拼音 * * @param hanzi * @param separator * @return */ public static S c14e tring hanziToPinyin(String hanzi, String separator) { // 创建汉语拼音处理类 HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat(); // 输出设置,大小写,音标方式 defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE); defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE); String pinyingStr = ""; try { pinyingStr = PinyinHelper.toHanyuPinyinString(hanzi, defaultFormat, separator); } catch (BadHanyuPinyinOutputFormatCombination e) { // TODO Auto-generated catch block e.printStackTrace(); } return pinyingStr; } /** * 将字符串数组转换成字符串 * * @param str * @param separator * 各个字符串之间的分隔符 * @return */ public static String stringArrayToString(String[] str, String separator) { StringBuffer sb = new StringBuffer(); for (int i = 0; i < str.length; i++) { sb.append(str[i]); if (str.length != (i + 1)) { sb.append(separator); } } return sb.toString(); } /** * 简单的将各个字符数组之间连接起来 * * @param str * @return */ public static String stringArrayToString(String[] str) { return stringArrayToString(str, ""); } /** * 将字符数组转换成字符串 * * @param str * @param separator * 各个字符串之间的分隔符 * @return */ public static String charArrayToString(char[] ch, String separator) { StringBuffer sb = new StringBuffer(); for (int i = 0; i < ch.length; i++) { sb.append(ch[i]); if (ch.length != (i + 1)) { sb.append(separator); } } return sb.toString(); } /** * 将字符数组转换成字符串 * * @param str * @return */ public static String charArrayToString(char[] ch) { return charArrayToString(ch, " "); } /** * 取汉字的首字母 * * @param src * @param isCapital * 是否是大写 * @return */ public static char[] getHeadByChar(char src, boolean isCapital) { // 如果不是汉字直接返回 if (src <= 128) { return new char[] { src }; } // 获取所有的拼音 String[] pinyingStr = PinyinHelper.toHanyuPinyinStringArray(src); // 创建返回对象 int polyphoneSize = pinyingStr.length; char[] headChars = new char[polyphoneSize]; int i = 0; // 截取首字符 for (String s : pinyingStr) { char headChar = s.charAt(0); // 首字母是否大写,默认是小写 if (isCapital) { headChars[i] = Character.toUpperCase(headChar); } else { headChars[i] = headChar; } i++; } return headChars; } /** * 取汉字的首字母(默认是大写) * * @param src * @return */ public static char[] getHeadByChar(char src) { return getHeadByChar(src, true); } /** * 查找字符串首字母 * * @param src * @return */ public static String[] getHeadByString(String src) { return getHeadByString(src, true); } /** * 查找字符串首字母 * * @param src * @param isCapital * 是否大写 * @return */ public static String[] getHeadByString(String src, boolean isCapital) { return getHeadByString(src, isCapital, null); } /** * 查找字符串首字母 * * @param src * @param isCapital * 是否大写 * @param separator * 分隔符 * @return */ public static String[] getHeadByString(String src, boolean isCapital, String separator) { char[] chars = src.toCharArray(); String[] headString = new String[chars.length]; int i = 0; for (char ch : chars) { char[] chs = getHeadByChar(ch, isCapital); StringBuffer sb = new StringBuffer(); if (null != separator) { int j = 1; for (char ch1 : chs) { sb.append(ch1); if (j != chs.length) { sb.append(separator); } j++; } } else { sb.append(chs[0]); } headString[i] = sb.toString(); i++; } return headString; } public static void main(String[] args) { // pin4j 简码 和 城市编码 String s1 = "中华人民共和国"; String[] headArray = getHeadByString(s1); // 获得每个汉字拼音首字母 System.out.println(Arrays.toString(headArray)); String s2 ="长城" ; System.out.println(Arrays.toString(stringToPinyin(s2,true,","))); String s3 ="长"; System.out.println(Arrays.toString(stringToPinyin(s3,true,","))); } }解析excel文件的测试类
package com.haha.poi; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.IOException; import java.util.Arrays; import org.apache.poi.hssf.usermodel.HSSFRow; import org.apache.poi.hssf.usermodel.HSSFSheet; import org.apache.poi.hssf.usermodel.HSSFWorkbook; import org.junit.Test; import com.haha.utils.PinYin4jUtils; public class POITest { @Test//解析excel public void fun1() throws Exception{ //获得待解析的Excel文件 //得到Excel工作簿对象 HSSFWorkbook wb = new HSSFWorkbook( new FileInputStream("C:/Users/帅哥/Desktop/POI/区域导入测试数据.xls")); //取出要解析的文件中的表格,0代表取出的是sheet1表格 HSSFSheet sheet = wb.getSheetAt(0); //获得表格中一共有多少行 int rowcount = sheet.getLastRowNum(); //遍历并取出表格中的每一行数据 for(int i = 1 ; i <= rowcount ; i ++ ){ HSSFRow row = sheet.getRow(i); //获得行中每个单元格的值 //short cellCount = row.getLastCellNum(); String areaNum = row.getCell(0).getStringCellValue(); String province = row.getCell(1).getStringCellValue(); String city = row.getCell(2).getStringCellValue(); String quyu = row.getCell(3).getStringCellValue(); String code = row.getCell(4).getStringCellValue(); //生成城市全拼 String citycode = PinYin4jUtils.hanziToPinyin(city, ""); //将字符串拼接为简码 String[] strs = PinYin4jUtils.getHeadByString(province+city+quyu); System.out.println(areaNum+"=>"+province+"=>"+city+"=>"+quyu+"=>"+code+"=>"+citycode+"=>"+Arrays.toString(strs)); } } }结果:
结果中的string数组可以通过StringUtils的join方法变成string字符串。
相关文章推荐
- java实现excel文件上传,解析,导入
- Java进度条(excel文件解析)的实现
- JAVA实现把汉字转化成拼音(转)
- J2SE综合--JAVA实现把汉字转化成拼音
- Java程序员从笨鸟到菜鸟之(一百零五)java操作office和pdf文件(三)利用jxl实现数据导出excel报表以及与POI的区别
- 【Java】使用Apache POI生成和解析Excel文件
- JAVA 文件与base64之间的转化, 以及Web实现base64上传文件
- java 实现中文转化为拼音代码 汉字转化为拼音源码分享
- java实现excel文件上传并解析内容保存到数据库中
- 文件一键上传、汉字转拼音、excel文件上传下载功能模块的实现
- 文件一键上传、汉字转拼音、excel文件上传下载功能模块的实现
- Java解析OFFICE(word,excel,powerpoint)以及PDF的实现方案及开发中的点滴分享
- 文件一键上传、汉字转拼音、excel文件上传下载功能模块的实现
- 文件一键上传、汉字转拼音、excel文件上传下载功能模块的实现
- Java程序员从笨鸟到菜鸟之(一百零五)java操作office和pdf文件(三)利用jxl实现数据导出excel报表以及与POI的区别
- 用Java转化汉字为拼音全拼
- 用C#实现汉字转化为拼音
- 用C#实现汉字转化为拼音
- 用Java转化汉字为拼音全拼
- C#实现汉字转化为拼音