问题描述
通常,CSV和excel文件格式将用于导入数据,因为很容易以编程方式提取数据。 我的用户不喜欢Excel文件格式输入数据,他们喜欢Word文档。 但是我不确定如何从Microsoft Word文档中提取数据。 有人尝试过吗? 你有什么建议吗?
找到了此 ,但不确定如何创建此类模板以及在Java中使用哪个API提取值。
1楼
像这样的库使它比以前更容易实现。
2楼
如果我们想到Microsoft Office Word文档,则Java没有内置类来处理此问题,但是Apache Foundation开发的Apache POI包使您能够读取Java中的Microsoft Word文档。
import org.apache.poi.poifs.filesystem.*;
import org.apache.poi.hwpf.*;
import org.apache.poi.hwpf.extractor.*;
import java.io.*;
public class readDoc
{
public static void main( String[] args )
{
String filesname = "Hello.doc";
POIFSFileSystem fs = null;
try
{
fs = new POIFSFileSystem(new FileInputStream(filesname;
//Couldn't close the braces at the end as my site did not allow it to close
HWPFDocument doc = new HWPFDocument(fs);
WordExtractor we = new WordExtractor(doc);
String[] paragraphs = we.getParagraphText();
System.out.println( "Word Document has " + paragraphs.length + " paragraphs" );
for( int i=0; i<paragraphs .length; i++ ) {
paragraphs[i] = paragraphs[i].replaceAll("\\cM?\r?\n","");
System.out.println( "Length:"+paragraphs[ i ].length());
}
}
catch(Exception e) {
e.printStackTrace();
}
}
}
您仍然可以从此更多参考
希望对您有帮助
3楼
我喜欢这个答案的评论:
您可能想探索InfoPath,它是MS表格技术,并且您可以从MS Word导入表格。 – 月30日下午2点32分