问题 尝试下载nltk数据时出现405错误


当我尝试下面的代码

python -c "import nltk; nltk.download('punkt'); 
nltk.download('averaged_perceptron_tagger'); 
nltk.download('maxent_treebank_pos_tagger'); 
nltk.download('wordnet')"

控制台说

[nltk_data] Error loading punkt: HTTP Error 405: Not allowed.
[nltk_data] Error loading averaged_perceptron_tagger: HTTP Error 405:
[nltk_data]     Not allowed.
[nltk_data] Error loading maxent_treebank_pos_tagger: HTTP Error 405:
[nltk_data]     Not allowed.
[nltk_data] Error loading wordnet: HTTP Error 405: Not allowed.

10629
2017-07-26 05:21


起源

看起来下载服务器已关闭。 - Klaus D.
我在这里看到同样的问题所以你并不孤单。 - Kyle Campbell
同样的问题。我想我们应该等。 - Julien Salinas
这是由Github原始文件链接的下降引起的。请等待我们找到替代=) - alvas
我们在OpenDaylight的CI基础设施中看到了这一点 lists.opendaylight.org/pipermail/dev/2017-July/003971.html - dfarrell07


答案:


这是由Github原始文件链接的下降引起的。

同时,一个临时解决方案是手动下载文件:

PATH_TO_NLTK_DATA=/home/username/nltk_data/
wget https://github.com/nltk/nltk_data/archive/gh-pages.zip
unzip gh-pages.zip
mv nltk_data-gh-pages/ $PATH_TO_NLTK_DATA

我们正在努力寻找数据和模型下载的替代方案。

与此同时, @everyone请帮助检查您的脚本,并确保您没有超载数据下载! 先谢谢你!!

请检查 https://github.com/nltk/nltk/issues/1787 有关此问题的最新更新。


11
2017-07-26 08:33



github.com/nltk/nltk/issues/1787#issuecomment-318040782 这里提到的解决方案对我有用 - Koen Dercksen


对于MacOSX - 对上述答案的小修改:

PATH_TO_NLTK_DATA=~/nltk_data/
wget https://github.com/nltk/nltk_data/archive/gh-pages.zip
unzip gh-pages.zip
mv nltk_data-gh-pages/packages/ $PATH_TO_NLTK_DATA

请注意,这是一个很大的下载(约700MB)。


0
2017-07-27 14:36