場景:對于經常需要導入Excel模板或數據來解析后加以應用的,使用頻率非常之高,做了一個比較穩定的版本,體現在這些地方
工具:org.apache.poi
使用前必須了解這些:
1、要解析,那肯定先判斷是不是Excel
2、xls后綴的Excel,是03版及以前的用HSSFWorkbook類
xlsx后綴的Excel,是07版及以后的用XSSFWorkbook解析
3、getWorkbook這個方法是我自己亂造各種Excel數據不斷測試搜索修正得出的結果,其他的像簡單的判斷后綴xls還是xlsx來決定用HSSH還是XSSF是不保險的,比如你可能沒遇過org.apache.poi.openxml4j.exceptions.InvalidFormatException這樣的異常,當然這個異常仍然是因為Excel類型導致獲取workbook時出錯,然而我查到的結果是,Excel最底層是xml實現的,類型問題出在這兒,看異常的描述也可以稍微看出來openxml4j.exceptions
4 、可能出現空行,空的單元格,或者單元格值為空的情況,這些情況,在我的readExcel()方法里都考慮到了,為什么我不用迭代器,或者加強的for each循環?就是因為這些坑爹的空單元格或者空行啊,迭代器內部在取cell單元格對象時跳過這些空的對象,who knows why?我也不知道,反正我測試過,跳過去了,本來5個單元格,一個空的,結果就只得到4個數據,即使用cell.isEmpty()和cell!=null來判斷,也沒卵用,因為遍歷的時候直接跳過去了,都沒有判斷的機會
5、取單元格數據,這個就比較簡單了,判斷單元格類型,根據類型做相應的處理取出來,但是我覺得我這個getCellValue()的方法應該有漏洞,先這么用著
下面上代碼,簡單描述下關鍵部位
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.io.InputStream;
import java.io.PushbackInputStream;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.Map;
import java.util.List;
import org.apache.poi.POIXMLDocument;
import org.apache.poi.openxml4j.exceptions.InvalidFormatException;
import org.apache.poi.openxml4j.opc.OPCPackage;
import org.apache.poi.poifs.filesystem.POIFSFileSystem;
import org.apache.poi.ss.usermodel.Cell;
import org.apache.poi.ss.usermodel.Row;
import org.apache.poi.ss.usermodel.Sheet;
import org.apache.poi.ss.usermodel.Workbook;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;
import org.apache.poi.hssf.usermodel.HSSFCell;
import org.apache.poi.hssf.usermodel.HSSFWorkbook;
import org.apache.xmlbeans.impl.piccolo.io.FileFormatException;
/**
*yanbiao 2016.10.25
*/
public class ExcelUtil {
private static final String EXTENSION_XLS = "xls";
private static final String EXTENSION_XLSX = "xlsx";
/**
* 文件檢查
*/
private void preReadCheck(String filePath) throws FileNotFoundException, FileFormatException {
File file = new File(filePath);
if (!file.exists()) {
throw new FileNotFoundException("導入的文件不存在:" + filePath);
}
if (!(filePath.endsWith(EXTENSION_XLS) || filePath.endsWith(EXTENSION_XLSX))) {
throw new FileFormatException("傳入的文件不是excel");
}
}
/**
* 取得WorkBook對象
* xls:HSSFWorkbook,03版
* xlsx:XSSFWorkbook,07版
*/
private Workbook getWorkbook(String filePath) throws IOException, InvalidFormatException {
//直接判斷后綴來返回相應的Workbook對象多數情況沒問題,但是這個更保險,第3條已經說明
Workbook wb = null;
InputStream is = new FileInputStream(filePath);
if (!is.markSupported()) {
is = new PushbackInputStream(is, 8);
}
if (POIFSFileSystem.hasPOIFSHeader(is)) {
return new HSSFWorkbook(is);
}
if (POIXMLDocument.hasOOXMLHeader(is)) {
return new XSSFWorkbook(OPCPackage.open(is));
}
throw new IllegalArgumentException("您的excel版本目前不支持poi解析");
}
/**
* 讀取excel文件內容
*/
public Map<Integer, List<String>> readExcel(String filePath) throws FileNotFoundException, FileFormatException {
// 檢查和獲取workbook對象
this.preReadCheck(filePath);
Workbook wb = null;
Map<Integer,List<String>> map = new HashMap<Integer, List<String>>();
try {
wb = this.getWorkbook(filePath);
// 默認只讀取第一個sheet
Sheet sheet = wb.getSheetAt(0);
int rowcount = sheet.getLastRowNum();//邏輯行,包括空行
int cellcount = sheet.getRow(0).getLastCellNum();//第一行(將來作為字段的行)有多少個單元格
for (int i=0;i<rowcount;i++) { //這里用最原始的for循環來保證每行都會被讀取
List<String> list = new ArrayList<String>();
Row row = sheet.getRow(i);
if(null!=row){
for (int j=0;j<cellcount;j++) {
list.add(getCellValue(row.getCell(j))); //這里也是用for循環,用Cell c:row這樣的遍歷,空單元格就被拋棄了
}
System.out.println("第"+(row.getRowNum()+1)+"行數據:"+list.toString());
map.put(row.getRowNum(), list);
}else{
for (int j=0;j<cellcount;j++) {
list.add("無數據");
}
System.out.println("第"+(i+1)+"行數據:"+list.toString());
map.put(i, list);
}
}
} catch (Exception e) {
System.out.println("讀取Excel異常:"+e.getMessage());
e.printStackTrace();
} finally {
if (wb != null) {
try {
wb.close();
} catch (IOException e) {
e.printStackTrace();
}
}
}
return map;
}
/**
* 取單元格的值
*/
private String getCellValue(Cell c) {
if (c == null) {
return "無數據";
}
String value = "";
switch (c.getCellType()){
case HSSFCell.CELL_TYPE_NUMERIC://數字
value = c.getNumericCellValue()+"";
break;
case HSSFCell.CELL_TYPE_STRING://字符串
value = c.getStringCellValue();
break;
case HSSFCell.CELL_TYPE_BOOLEAN://boolean
value = c.getBooleanCellValue()+"";
break;
case HSSFCell.CELL_TYPE_FORMULA://公式
value = c.getCellFormula()+"";
break;
case HSSFCell.CELL_TYPE_BLANK://空值
value= "無數據";
break;
case HSSFCell.CELL_TYPE_ERROR:
value = "非法字符";
break;
default:
value= "未知類型";
break;
}
return value;
}
}
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持億速云。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。