记得2007年上半年,最初读到这本书的时候还是草稿,用了整个一个暑假来仔细研究这本书,现在已经和以前的有很大不同了!
如果你要是自然语言学或语言信息处理相关专业的学生,又对python与nltk感兴趣的话,就看这本书吧,可以当做入门读物来看,整本书即涉及到了语料库的操作,也对传统的基于规则的方法有所涉及。全书包括了分词(tokenization)、词性标注(POS)、语块(Chunk)标注、句法剖析与语义剖析等方面,是nlp中不错的一本实用教程。
当然缺点还是有的。算是鸡蛋挑骨头吧。首先、对理论介绍不够,这可能与本书实用性很强的写作风格有关,如果你要想了解更多的理论,可以看专门讲理论的书籍;其次、对中文介绍不多,bird好像是澳洲人……所以,如果各位要是想为中文信息处理做贡献的话,还是在看本书的同时,看看中文的paper吧,网上资料很多,不多说了;另外,这本书可能并不能涉及到NLTK中的全部模块与语料,所以在研究时,可借助NLTK的网站文档来学习。
这本书最早是作为NLTK的在线教程出现的,每次都随着NLTK的变化来改变,所以与NLTK关系很是“暧昧”,呵呵。总之,这本书可以说是学习NLTK的不二之选!
本文由作者笔名:小小评论家 于 2023-03-26 14:33:08发表在本站,文章来源于网络,内容仅供娱乐参考,不能盲信。
本文链接: http://www.w2mh.com/show/53550.html