中文切词(又称中文分词,Chinese Word Segmentation)指的是将一个汉字序列切分成一个一个单独的词。中文分词是文本挖掘的基础,对于输入的一段中文,成功的进行中文分词,可以达到电脑自动识别语句含义的效果。这种方法又叫做机械分词方法,它是按照一定的策略将待分析的汉字串与一个 “充分大的”机器词典中的词条进行配,若在词典中找到某个字符串,则匹配成功(识别出一个词)。
搜索引擎也有分词技术。
简单些理解就是搜索引擎会将你输入的词进行拆分。比较明显的体现就是当你输入一个比较长的词时,发现词不是连贯的。这就是搜索引擎的分词技术的体现。
如果,你针对搜索引擎的这个技术做相应的处理,那么你的关键词就不会被分开,从目前的搜索引擎算法来看,直是完整的词,在某些时间排名会明显的比分开的高。
举个例子,再把百度词条的链接加上,本文的参考价值就大不一样了哈!