iT邦幫忙

0

C#批次讀取PDF檔問題

請教各位大大:
我寫了一個批次讀取PDF檔的程式,如下:
try
{
foreach (string item in dirs)
{
DirectoryInfo Folder1 = new DirectoryInfo(item);
//用foreach迴圈去對資料夾內的每一個pdf檔進行讀取
foreach (FileInfo File in Folder1.GetFiles())
{
string filepath = @"E:\test\TXT\";
PDDocument doc = PDDocument.load(File.FullName);
PDFTextStripper pdfStripper = new PDFTextStripper();
Content = pdfStripper.getText(doc);
filepath = filepath + File.Name.Replace(".pdf", ".txt");
sw_log.WriteLine(++count + " : " + File.FullName);
p.swTxt(filepath, Content);
doc.close();
}//end foreach (FileInfo File in Folder1.GetFiles())
}//end foreach (string item in dirs)
}
catch (Exception ex)
{
sw_log.WriteLine(ex.ToString());
}
讀取第一個PDF檔轉出TXT沒問題,要批次讀取第二次PDF檔時出現如下Error
System.IO.FileNotFoundException: 無法載入檔案或組件 'IKVM.OpenJDK.Text
目前不知道如何解決此問題?
該程式寫法若使用iTextSharp套件則可以正常的批次處理~
但改寫為pdfbox1.7.0套件時,則無法批次處理,出現如上Error~
不知道有沒有批次處理的範例可以參考的~
感激不盡~!!

1 個回答

0
mybeldandy
iT邦研究生 5 級 ‧ 2013-11-11 14:30:28
最佳解答

感覺還沒關完檔案就要開下一個
在 doc.close();下面加
doc = null;
試看看好了

我要發表回答

立即登入回答