问题 现在删除的模块'nltk.model.NGramModel'是否有替代品?


我一直试图找到一个连续两天的替代品,但找不到任何相关的东西。 我基本上试图获得合成句子的概率分数(通过替换从语料库中挑选的原始句子中的一些单词来合成)。

我尝试过Collocations,但我得到的分数并不是很有帮助。所以我尝试使用语言模型概念,却发现由于一些错误,从NLTK中删除了看似有用的模块“模型”。

如果有人能让我知道一些在python中获得ngram模型实现的替代方法,那真的很棒,或者更好的是,建议我用其他方法来解决“评分”句子的问题。


6894
2017-10-18 18:24


起源

我手动下载了版本3.0a1(最后一个包含模型),我正在使用那个,并非没有痛苦。 “官方推荐”是使用最新版本 model 科。但是,我不知道如何使用它,所有在线完成任务的信息都是指版本3.0a1中的旧模型包,所以我决定使用它。我没有使用太多Python或nltk,但我的印象是两者都更成熟并且有更强的社区支持。 - Trylks


答案:


根据 这个关于nltk回购的公开问题NGramModel 由于一些错误,目前还没有掌握。他们目前的解决方案是从模型分支安装代码。这比主人大约晚了8个月,所以你可能会错过其他功能和错误修复。

pip install https://github.com/nltk/nltk/tarball/model

相关代码是 这里是模型分支。如果您不想使用过时的分支,可以将其复制到本地代码。如果您真的关心使用它,您可以尝试修复 突出的错误 在它上面并提交拉取请求。


15
2017-10-18 18:32