iT邦幫忙

3

客戶都是PDF文件,請問如何自動整理成excel,用於導入ERP自動生成客戶訂單

erp
  • 分享至 

  • xImage

客戶都是PDF文件,請問如何自動整理成excel,用於導入ERP自動生成客戶訂單
請問有推薦的廠商或是軟件嗎,謝謝!

看更多先前的討論...收起先前的討論...
aaron3399 iT邦好手 1 級 ‧ 2023-04-03 11:09:03 檢舉
參考一下
https://ithelp.ithome.com.tw/questions/10210824
aaron3399 iT邦好手 1 級 ‧ 2023-04-04 15:38:28 檢舉
從你的角度來看覺得可行性如何呢? 這個模式的優點及可能遇到的困難有哪些呢?
想知道樓主的想法~
小MIS iT邦研究生 1 級 ‧ 2023-04-04 16:29:36 檢舉
aaron 大, 謝謝您!
aaron3399 iT邦好手 1 級 ‧ 2023-04-05 07:11:31 檢舉
你也可以諮詢一下相關的廠商....
對於電子資料交換會有全面的考量以及經驗可以參考
例如天河電訊、SPS Commerce
harry731 iT邦新手 2 級 ‧ 2023-04-06 09:41:10 檢舉
其實這是個沒有意義的假議題
ERP本身在訂單模組大概都會有報價單然後轉客戶訂單
或是直接KEY客戶訂單
而且除非貴司已經是產業龍頭之類的或是產品具有獨家專利且無可替代的,
不然的話,剛好滿足MOQ的單跟數量比MOQ多數倍的單,在單價上,業務跟客戶之間還是會有所攻防
所以直接把PDF整理成EXCEL有必要嗎?
況且這中間誰敢保證OCR可以維持百分百識別成功?
真要堅持把PDF弄成EXCEL
不如搞個Form或是Web,方便人員將PDF的重點資訊輸入
然後再匯成EXCEL輸出,方便後續導入
題外話,貴司用SAP?
小MIS iT邦研究生 1 級 ‧ 2023-04-06 10:17:49 檢舉
集團不同公司有用 SAP、TIPTOP、天心 (嘆氣)
aaron3399 iT邦好手 1 級 ‧ 2023-04-06 10:32:35 檢舉
不同公司不同產業不同時期,用不同系統很正常啊....
就做一個內部系統資訊拋轉交換平台、或是BI平台之類的來整合資訊吧......
如果PDF 是固定的表單欄位,EXCEL 本來就可以直接匯入這些欄位資料之後,在轉入資料庫內,這沒有很困難,困難的是怎麼做統一表單,還有轉入資料庫怎麼讓 ERP 做後續的動作
Albert iT邦高手 1 級 ‧ 2023-04-06 16:39:48 檢舉
::
小MIS iT邦新手 1 級 ‧ 2023-04-06 10:17:49
集團不同公司有用 SAP、TIPTOP、天心 (嘆氣)
::
但是可以成立資料交貨中心
自己去取
小MIS iT邦研究生 1 級 ‧ 2023-04-07 09:51:28 檢舉
謝謝!
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中
4
菜雞
iT邦新手 5 級 ‧ 2023-04-04 16:22:29
最佳解答

您可以使用光學字符識別(OCR)軟件來將PDF文件中的文本識別並提取出來,然後使用資料處理軟件將它們轉換成Excel格式。

以下是一些推薦的OCR軟件:

Adobe Acrobat Pro DC - 這是一個全面的PDF工具,其中包括OCR功能。您可以使用Adobe Acrobat Pro DC將PDF文件轉換為可編輯的文檔,例如Word文檔或Excel表格。

ABBYY FineReader - 這是一款專業的OCR軟件,可以識別多種語言,包括中文。ABBYY FineReader可以將PDF文件轉換為Excel、Word等格式。

Readiris - 這是一款OCR軟件,可以識別多種語言。Readiris可以將PDF文件轉換為Excel、Word等格式。

Textract - 這是一款AWS的OCR服務,支援多種文件格式識別,如PDF、JPG、PNG、GIF等等,轉換後可以儲存成JSON格式,方便後續程式處理。

Microsoft Office Lens - 它是微軟的掃描工具,支援多種語言識別,並且可以將識別後的文本自動轉換成Excel、Word等格式。Office Lens可以在iOS和Android設備上下載。

需要注意的是,使用OCR軟件進行識別時,請確保PDF文件中的文字清晰可讀,否則識別效果會受到影響。

希望這些信息對您有所幫助!

https://chat.openai.com/chat

菜雞 iT邦新手 5 級 ‧ 2023-04-04 16:23:48 檢舉

或是找個工讀生來處理這件事情

2
尼克
iT邦大師 1 級 ‧ 2023-04-03 20:43:44

EDI

小MIS iT邦研究生 1 級 ‧ 2023-04-07 09:51:02 檢舉

謝謝您,但客戶完全不理會這個,只提供PDF

0
海綿寶寶
iT邦大神 1 級 ‧ 2023-04-04 14:47:46

MIB

EDI 有聽過,想說 MIB 是什麼,原來是這個......... XD

0
CabLate嫻
iT邦新手 5 級 ‧ 2023-04-04 19:06:55

pdf的話,務必要請客戶提供完全統一格式的,其實也不論pdf,任何資料交換都是這樣。
使用pdf轉excel我猜無法符合你的需求,因為不一定能符合預期。

我曾經處理過是將pdf轉word,並透過word的xml來解析內容,後續就單純開個api把東西放到Excel或是直接入資料庫。可能看似有點笨,因為這種方法必須嚴格要求客戶每次送來的檔案規格一致,不然可能會造成今天基於A文件把解析程式寫好了,結果B長得又完全不一樣。但可以一定程度保證資料完整性與正確性。

另外個人覺得OCR的不可控性極高,儘管可能有很多library已經足夠成熟,但我仍不會把客戶資料的整理寄託在這類技術上,除非你有能力自己去調校。只要是經手客戶資料的需求,保留原始資料完整性都絕對是優先考量。

0
kaonick
iT邦新手 5 級 ‧ 2023-04-06 10:50:37

最近也是在搞這個!
有幾種方式:
1.如果PDF內容是可讀的,就依需要內容讀取資料(這部份要考慮資料定位問題,還有資料位置可能不固定的問題),然後可以透過RPA(簡單一點,就滑鼠、鍵盤控制),想辦法把資料自動填到ERP內,自動輸入。
2.如果PDF內容不可讀,就得要用OCR,然後再依要求,擷取資料內容,然後一樣寫進ERP內。
3.如果知道資料異動介面,可以直接寫入介面檔,就不用RPA這段了。

比較難的是要怎麼抓取不同版型的文件內容,而且資料位置不固定之類的問題,目前公司有用ABBYY的FlexCapture,只是要錢錢,不便宜,而且還要算張的,辨識一張收多少錢。

不算簡單的任務,而且通常老闆都會說,阿不就OCR就好了....

以後老闆可能會改說:啊不就AI就好了?XDXDXD

小MIS iT邦研究生 1 級 ‧ 2023-04-07 09:51:14 檢舉

真的很無奈,謝謝您

不明
【**此則訊息已被站方移除**】
0
yunus0_0
iT邦新手 5 級 ‧ 2023-04-19 09:34:55

如果資料來源是Excel或Word轉為PDF的話 你可以參考這個套件Bytescout.PDFExtractor

0
automato
iT邦新手 5 級 ‧ 2023-04-23 22:41:01

可以參考我們公司的RPA喔:
https://docs.emily.tips/pdf2txt
這應該是你在找的應用:
https://ithelp.ithome.com.tw/articles/10311967
我們也有串OCR跟時下最流行的ChatGPT:
https://docs.emily.tips/google-ocr
https://docs.emily.tips/chatgpt

我要發表回答

立即登入回答