当前位置: 代码迷 >> java >> 为了将html解析为字符串,我使用了tika解析器,但是我遇到了一些问题,例如库和jdeveloper中的错误
  详细解决方案

为了将html解析为字符串,我使用了tika解析器,但是我遇到了一些问题,例如库和jdeveloper中的错误

热度:58   发布时间:2023-07-31 11:55:30.0

首先,我必须下载tika-bundle-0.9.jar,但找不到。 其次,我写了这些

 try {
        URL itemURL = new URL("");
        DataInputStream daHTMLfromDaItem = new DataInputStream(itemURL.openStream());
        Tika tika = new Tika();
        Metadata metadata = new Metadata();
        Reader reader = tika.parse(daHTMLfromDaItem, metadata);

          String s=reader.toString();
          //System.out.print(s);


    } catch (Exception e) {
        e.printStackTrace();
    }

错误

Error(5,24): cannot access class org.apache.tika.Tika; class file has wrong version 49.0, should be 45.3 or 46.0 or 47.0 or 48.0

Error(6,33): cannot access class org.apache.tika.metadata.Metadata; class file has wrong version 49.0, should be 45.3 or 46.0 or 47.0 or 48.0

Error(15,13): class Tika not found in class mypackage.TikaParsing

Error(15,29): class Tika not found in class mypackage.TikaParsing

Error(16,13): class Metadata not found in class mypackage.TikaParsing

Error(16,37): class Metadata not found in class mypackage.TikaParsing

另外,我不得不说,除了tika-bundle-0.9.jar之外,我还添加了所有必需的库。 是否由于tika-bundle-0.9.jar会发生一些问题,我如何找到tika-bundle-0.9.jar? 我找不到解决方法。

谢谢

tika库已使用Java 1.5进行了编译,但是您尝试在Java 1.4环境中运行它们。 这就是第一条错误消息告诉我们的内容。 版本49.0由Java 1.5生成,版本48.0由Java 1.4.x生成

使用Java 1.5+运行您的应用程序,或尝试查找与Java 1.4.2兼容的旧版本的tika。

Tika捆绑包可从Maven购买。 如果您使用的是maven,请添加以下内容:

<dependencies>
 <dependency>
   <groupId>org.apache.tika</groupId>
   <artifactId>tika-bundle</artifactId>
   <version>0.9</version>
   <scope>provided</scope>
 </dependency>
<dependencies>

如果您不使用Maven,请从附近的Maven存储库中手动获取它,例如 (每个版本位于其自己的子目录中)

  相关解决方案