有木有高手用过这个pdfbox![C# 使用pdfbox提取文本提取了一堆控制字符 C# 使用pdfbox提取文本提取了一堆控制字符](https://www.codebye.com/wp-content/uploads/2016/07/929156393-1745003286.gif)
原因是需要对pdf进行提取文本操作,所以之前用了iTextSharp,但是原因是协议是AGPL,所以改用pdfbox,结果给出去以后测试直接就打回来了…提取谋篇文字版PDF的时候,提取了一堆![C# 使用pdfbox提取文本提取了一堆控制字符 C# 使用pdfbox提取文本提取了一堆控制字符](https://www.codebye.com/wp-content/uploads/2016/07/20569014561744150824.jpg)
这种东西出来,没有正常的文字。
有没有高手用过pdfbox,看下这种问题出现的原因是什么,要怎么去解决呢![C# 使用pdfbox提取文本提取了一堆控制字符 C# 使用pdfbox提取文本提取了一堆控制字符](https://www.codebye.com/wp-content/uploads/2016/07/-383879615-339973582.gif)
![C# 使用pdfbox提取文本提取了一堆控制字符 C# 使用pdfbox提取文本提取了一堆控制字符](https://www.codebye.com/wp-content/uploads/2016/07/929156393-1745003286.gif)
原因是需要对pdf进行提取文本操作,所以之前用了iTextSharp,但是原因是协议是AGPL,所以改用pdfbox,结果给出去以后测试直接就打回来了…提取谋篇文字版PDF的时候,提取了一堆
![C# 使用pdfbox提取文本提取了一堆控制字符 C# 使用pdfbox提取文本提取了一堆控制字符](https://www.codebye.com/wp-content/uploads/2016/07/20569014561744150824.jpg)
![C# 使用pdfbox提取文本提取了一堆控制字符 C# 使用pdfbox提取文本提取了一堆控制字符](https://www.codebye.com/wp-content/uploads/2016/07/-1451378336-1423207449.jpg)
有没有高手用过pdfbox,看下这种问题出现的原因是什么,要怎么去解决呢
![C# 使用pdfbox提取文本提取了一堆控制字符 C# 使用pdfbox提取文本提取了一堆控制字符](https://www.codebye.com/wp-content/uploads/2016/07/-383879615-339973582.gif)
解决方案
30
![C# 使用pdfbox提取文本提取了一堆控制字符 C# 使用pdfbox提取文本提取了一堆控制字符](https://www.codebye.com/wp-content/uploads/2016/07/1444509214-325490097.gif)
30
快扔分,话说解决了没
40
本人觉得很可能问题出在pdf文档上,pdf跟xps一样,都有打印版和发布版,可以暂且不管这个问题,换个其他的pdf文档试试