问题 Apache Nutch和Solr集成


我试过跟着 nutch教程 但是schema.xml文件有点问题。

我被告知nutch为我的项目提供了架构,基本上就是这个......

cp ${NUTCH_RUNTIME_HOME}/conf/schema.xml ${APACHE_SOLR_HOME}/example/solr/conf/

我已经在Tomcat中部署了我的solr文件,并且当我转到Solr仪表板时出现的错误是

collection1: org.apache.solr.common.SolrException:org.apache.solr.common.SolrException:
Plugin init failure for [schema.xml] fieldType "text": 
Plugin init failure for [schema.xml] analyzer/filter:
Error loading class 'solr.EnglishPorterFilterFactory'

这与我的solrconfig.xml文件中的这个元素有关(我可以对此进行评论,但不确定它有多重要)

<filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt"/>

我已经编辑了我的solrconfig.xml来尝试包含一系列与solr一起提供的jar文件

<lib path="/etc/solr/collection1/libs/dist/solr-core-4.2.1.jar" />
<lib path="/etc/solr/collection1/libs/dist/solr-analysis-extras-4.2.1.jar" />

但我不认为它们包含缺少的类“solr.EnglishPorterFilterFactory”

有谁知道为什么这可能不起作用或我错过了什么? 我不是一个Java开发人员,所以毫无疑问它会很简单:)

UPDATE 在发现模式中有一些旧类被引用之后,我又在nutch / conf中看了一下,看起来好像有一个$ {NUTCH_RUNTIME_HOME} /conf/schema-solr4.xml文件似乎有效。

如果这是正确的,不是100%但是嘿......


11110
2018-04-11 10:02


起源



答案:


好像 EnglishPorterFilterFactory 不再是4.x.请参阅中的注释 这是3.6.0文档

Deprecated.
  Use SnowballPorterFilterFactory with language="English" instead

许多弃用的东西在4.0中消失了。我会按照它说的做,看看 SnowballPorterFilterFactory的文档


12
2018-04-11 15:30



还使用“$ {NUTCH_RUNTIME_HOME} /conf/schema-solr4.xml”而不是旧配置 - Carlton


答案:


好像 EnglishPorterFilterFactory 不再是4.x.请参阅中的注释 这是3.6.0文档

Deprecated.
  Use SnowballPorterFilterFactory with language="English" instead

许多弃用的东西在4.0中消失了。我会按照它说的做,看看 SnowballPorterFilterFactory的文档


12
2018-04-11 15:30



还使用“$ {NUTCH_RUNTIME_HOME} /conf/schema-solr4.xml”而不是旧配置 - Carlton