我从网上 找了一个 读word的方法,网上 好像 大同小异,只有这种方法。
import java.net.HttpURLConnection;
import java.net.URL;
import org.textmining.text.extraction.WordExtractor;
public class ReadWord {
public static String getWordStr(String file ) throws Exception{
URL url = new URL(file);
HttpURLConnection con = (HttpURLConnection) url.openConnection();
con.setDefaultUseCaches(false);
con.setUseCaches(false);
//指示应用程序要从 URL 连接读取数据
con.setDoOutput(true);
con.setDoInput(true);
String str =null;
con.connect();
WordExtractor extractor = new WordExtractor();
str = extractor.extractText(con.getInputStream());//由于 对本构造函数 理解不是 很清晰,所以,读的时候是把整个文档全读出来了。
return str;
}
}
现在 出现 的 问题 是 如果 那个 word文档 内容 太多的话, 就会 出现 异常,有没有什么 解决办法,extractor.extractText(con.getInputStream()).subString(什么的不行,因为 我不知道它的长度,如果 它长度太短,我这两个索引 就还是 不好取啊。
有什么方法可以 解决,有人 读过 么? 今天 就这么多分了,诸位老师 见谅啊。明天我有了 ,肯定加上,谢谢。
------解决方案--------------------
------解决方案--------------------
- Java code
len = request.getContentLength(); b = new byte[len]; while (i < len) { t = in.readByte(); b[i] = t; i++; }
------解决方案--------------------
JF
------解决方案--------------------
接点分~