iT邦幫忙

2018 iT 邦幫忙鐵人賽
DAY 6
0
自我挑戰組

資訊技術解戈迪安繩結系列 第 5

IT|軟體|POI Apache Microsoft Office 格式檔案讀和寫功能

怎麼會命名成 Poor Obfuscation Implementation


POI 套件從 2001 年就開始了初始專案,由於 MS 的封閉特性,Office 檔案格式並沒有開放,作者就戲稱這個檔案格式是非常難以被理解,很混亂的一種檔案,就用了 Poor Obfuscation 這兩個字,當然還是成功地被 reverse-engineered,成就了這個專案,除了 MS Office 軟體之外,我們現在也可以用程式產生 Office 檔案。

主要元件


Excel (XSSF=HSSF+XSSF)
HSSF, XSSF
Excel 分為兩種檔案格式,比較舊的是 HSSFWorkbook,檔案格式為 Excel 1997-2003 版的Excel,副檔名是 xls,XSSFWorkbook 是 Excel 2007-10 的版本,副檔名是 xlsx。
基本的階層概念為一個 xlsx 檔案 XSSFWorkbook,裡面有多個工作表 XSSFSheet,每一個 Sheet 下面有一個表格,裡面有多列資料 XSSFRow,每列資料中有多欄資料儲存格 XSSFCell。

階層關係
XSSFWorkbook -> XSSFSheet -> XSSFRow -> XSSFCell

物件與檔案格式對應關係

Word (HWPF+XWPF)
PowerPoint (HSLF+XSLF)
OpenXML4J (OOXML)
OLE2 Filesystem (POIFS): OLE 2 Compound Document format 的Java Implementation
OLE2 Document Props (HPSF): Open Packaging Conventions (OPC) 的 Java Implementation
Outlook (HSMF)
Visio (HDGF+XDGF)
TNEF (HMEF): Microsoft's TNEF (Transport Neutral Encoding Format),也就是 winmail.dat,用在 Outlook 跟 Exchange -Publisher (HPBF): Publisher file format

參考


Java 通過Poi api操作(read/write)Excel
Java Code Examples
如何使用 Apache POI 處理 Excel 檔案


上一篇
IT|程式設計|Front-End|Redis 及 WebSocket的一個實時消息推送系統
下一篇
IT|軟體|Kafka MQ 高吞吐量分佈式訊息
系列文
資訊技術解戈迪安繩結29

尚未有邦友留言

立即登入留言