iT邦幫忙

0

txt中 奇怪的字

  • 分享至 

  • xImage

最近下載了pdf檔的小說來看

為了方便觀看所以用轉檔工具轉txt

並想翻譯成繁體中文

但其中有的文字怪怪的

無法翻譯 而且也搜尋不到

像是下面的那句

忽⻓叹⼀⼝⽓

其中忽跟嘆是可以搜尋到跟翻譯的

但其他幾個字就不行

直接在google這邊搜尋可以搜尋到

但複製到word、txt就不行

用電腦的記事本打開發現那些不能翻譯跟搜尋的字

比其他正常的字還要扁一點點

請問這是什麼問題?該怎麼解決?

看更多先前的討論...收起先前的討論...
淺水員 iT邦大師 6 級 ‧ 2022-09-18 19:06:02 檢舉
建議補上
1. Pdf檔案
2. 轉檔程式名稱
3. 轉檔後的txt
正在問神中...
PDF不好用嗎?為何硬要轉TXT?
canrong iT邦新手 2 級 ‧ 2022-09-19 09:09:15 檢舉
我們看起來像是會通靈嗎...
簡單猜測「字型問題」。
不過正如頭樓上大大所說,PDF不好嗎?為什麼要轉成txt?
該不會是因為PDF的每行的間距太大?
未看先猜編碼問題
簡體和繁體本來就很容易產生問題
其次TXT更是問題的製造機
畢竟人家就是最陽春的格式了
淺水員 iT邦大師 6 級 ‧ 2022-09-19 12:33:49 檢舉
轉 txt 我可以理解啦
常看小說的人會喜歡自己自訂背景、字型、行距等
例如 txt 可以丟到 calibre 去看
而且他還要轉繁體
某些網頁為了防烤那些地方其實都是圖片,而不是文字,所以既然是圖片,怎麼轉TXT呢
最簡單的作法就是轉成圖片之後去OCR,再轉繁體中文,只能這樣
簡單說,看盜版文件還這麼大聲問的,也只有樓主了
aaron3399 iT邦好手 1 級 ‧ 2022-09-21 14:25:23 檢舉
好歹也截個畫面來看看.....
簡繁轉換GB、BIG-5碼可能有些字沒有對應
如果是UTF-8就不用轉了
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友回答

立即登入回答