博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
【NLTK】python自然语言处理的nltk_data
阅读量:5939 次
发布时间:2019-06-19

本文共 1961 字,大约阅读时间需要 6 分钟。

hot3.png

nltk 系列学习:http://www.burnelltek.com/blog/24026f94f7e611e6841d00163e0c0e36

NLTK是由许多许多的包来构成的

官方的nltk.download()老是下载失败。无数遍了。浪费了很多很多时间。

python命令行:

>>>import nltk>>>nltk.download()

下载某个包,很慢,例如punkt ,我就用nltk.download()试着下载了一个,观察他的文件位置,这才发现原来有好几个文档目录。

https://raw.githubusercontent.com/nltk/nltk_data/gh-pages/index.xml

官方下载http://nltk.org/nltk_data/

另外,也可以到nltk.code.google.com 下载,

 

nltk 这个package会按照以下目录顺序查找需要的data,

C:\\Python27\\nltk_data\
C:\\nltk_data
D:\\nltk_data
E:\\nltk_data
所以,下载好了我的压缩包之后,解压放入以上任何一个目录就可以了

├─chunkers #这一级为nltk_data下的文件夹│ └─maxent_ne_chunker #这一级为相对应文件夹下的数据文件├─corpora      #这一级为nltk_data下的文件夹│ ├─abc        #这一级为相对应文件夹下的数据文件│ ├─alpino│ ├─basque_grammars│ ├─biocreative_ppi│ ├─book_grammars│ ├─brown│ ├─brown_tei│ ├─cess_cat│ ├─cess_esp│ ├─chat80│ ├─city_database│ ├─cmudict│ ├─comtrans│ ├─conll2000│ ├─conll2002│ ├─conll2007│ ├─dependency_treebank│ ├─europarl_raw│ │ │ ├─floresta│ ├─gazetteers│ ├─genesis│ ├─gutenberg│ ├─hmm_treebank_pos_tagger│ ├─ieer│ ├─inaugural│ ├─indian│ ├─jeita│ ├─kimmo│ ├─knbc│ │ │ ├─langid│ ├─large_grammars│ ├─machado│ │ │ ├─mac_morpho│ ├─maxent_ne_chunker│ ├─maxent_treebank_pos_tagger│ ├─movie_reviews│ │ │ ├─names│ ├─nombank.1.0│ │ │ ├─nps_chat│ ├─oanc_masc│ │ │ ├─paradigms│ ├─pe08│ ├─pil│ ├─pl196x│ ├─ppattach│ ├─problem_reports│ ├─propbank│ │ │ ├─ptb│ ├─punkt│ ├─qc│ ├─reuters│ │ │ ├─rslp│ ├─rte│ ├─sample_grammars│ ├─semcor│ │ │ ├─senseval│ ├─shakespeare│ ├─sinica_treebank│ ├─smultron│ ├─spanish_grammars│ ├─state_union│ ├─stopwords│ ├─swadesh│ ├─switchboard│ ├─tagsets│ ├─timit│ ││ ├─toolbox│ │ │ ├─treebank│ │ │ ├─udhr│ ├─udhr2│ ├─unicode_samples│ ├─verbnet│ ├─webtext│ ├─wordnet│ ├─wordnet_ic│ ├─words│ └─ycoe├─grammars│ ├─basque_grammars│ ├─book_grammars│ ├─large_grammars│ ├─sample_grammars│ └─spanish_grammars├─help│ └─tagsets├─stemmers│ └─rslp├─taggers│ ├─hmm_treebank_pos_tagger│ ├─maxent_ne_chunker│ └─maxent_treebank_pos_tagger└─tokenizers└─punkt

 

转载于:https://my.oschina.net/mickelfeng/blog/840900

你可能感兴趣的文章
深入理解Java的接口和抽象类
查看>>
java与xml
查看>>
Javascript异步数据的同步处理方法
查看>>
iis6 zencart1.39 伪静态规则
查看>>
SQL Server代理(3/12):代理警报和操作员
查看>>
基于事件驱动的DDD领域驱动设计框架分享(附源代码)
查看>>
Linux备份ifcfg-eth0文件导致的网络故障问题
查看>>
2018年尾总结——稳中成长
查看>>
JFreeChart开发_用JFreeChart增强JSP报表的用户体验
查看>>
度量时间差
查看>>
apache prefork模式优化错误
查看>>
jmeter高级用法例子,如何扩展自定义函数
查看>>
通过jsp请求Servlet来操作HBASE
查看>>
JS页面刷新保持数据不丢失
查看>>
清橙A1202&Bzoj2201:彩色圆环
查看>>
使用data pump工具的准备
查看>>
springMVC---级联属性
查看>>
get和post区别
查看>>
crontab执行shell脚本日志中出现乱码
查看>>
cmd.exe启动参数说明
查看>>