语料处理

知乎:我的NLP(自然语言处理)历程(6)——语料导入

本章将介绍将原始语料导入到SQLServer的基本方法。这个也是实施自然语言处理所需要进行的第一个基础步骤。

知乎:我的NLP(自然语言处理)历程(7)——语料清洗

语料在导入到正式表以后,在进行自然语言处理之前需要做适当的语料清洗。清洗后的语料将会变得更加“干净”并有利于后期分析。这些均由C#函数来实现。

知乎:我的NLP(自然语言处理)历程(9)——词典导入

本章主要讲述词典数据的导入与词典数据的初步分析。作者从网络上找到了很多公开的词典库,尽力搜罗并整合入库。