当前位置: 代码迷 >> 综合 >> win10报错[nltk_data] Error loading punkt: <urlopen error [Errno 11004] [nltk_data] getaddrinfo fai
  详细解决方案

win10报错[nltk_data] Error loading punkt: <urlopen error [Errno 11004] [nltk_data] getaddrinfo fai

热度:91   发布时间:2023-09-13 21:27:08.0

nltk_data下载错误 Error loading stopwords: urlopen error [Errno 11004] 解决办法

[nltk_data] Error loading stopwords: <urlopen error [WinError 10054]

前言

这是由于nltkstopwords语料下载错误,nltk的其他语料下载错误也会出现这个错误。

我尝试了几种方法

  1. 直接在 nltk_data 的官网下载。我没有下载成功。
  2. 有人说是网站权限不够,这个我也没有成功下载。
  3. 通过修改电脑host,这个我也没有成功
  4. github下载语料,这个成功了

解决办法

【1】下载语料

网站: https://github.com/nltk/nltk_data/tree/gh-pages

在网站按以下目录找到需要的目录,比如我要找stopwords

win10报错[nltk_data] Error loading punkt: <urlopen error [Errno 11004] [nltk_data] getaddrinfo fai

找到语料库点进去下载(下载可能很慢,只要自行找一下加速插件就可以快速下载了)

win10报错[nltk_data] Error loading punkt: <urlopen error [Errno 11004] [nltk_data] getaddrinfo fai

【2】放置语料

首先在python控制台或在其他地方打印nltk语料库地址

import nltk
nltk.find('.')
# print(nltk.find('.'))

     
  • 1
  • 2
  • 3

由于我是已经放置好语料了,所以只显示一个地址

如果没有放置过语料,会显示多个地址,把语料放置在其中一个目录下即可

win10报错[nltk_data] Error loading punkt: <urlopen error [Errno 11004] [nltk_data] getaddrinfo fai

在文件管理器中找到相应目录(注意不是直接放置nltk_data目录下)

没有corpora就自行创建

要解压放置

win10报错[nltk_data] Error loading punkt: <urlopen error [Errno 11004] [nltk_data] getaddrinfo fai

测试stopwords

from nltk.corpus import stopwords
stop_words = stopwords.words('english') #选择英文停止词 去重 得到英文停止词表
print(stop_words)

     
  • 1
  • 2
  • 3

结果

win10报错[nltk_data] Error loading punkt: <urlopen error [Errno 11004] [nltk_data] getaddrinfo fai

  相关解决方案