黑喵SEO为您提供:SEO优化、SEO学习、SEO优化方案、SEO网站诊断

首页 > SEO优化

关键词分词技术

网络整理 2018-12-20 15:29:00 SEO优化
  seo怎么做好分词技能?怎么分词可以满意搜索引擎?什么是百度分词?SEO是否有触摸一些分词组件呢?从百度分词不难看出,分词是依据词义、词语、词频的办法,来决定搜索引擎对词语的捕捉。
  
  SEO怎么学懂关键词分词技能?
  
  中文分词一般为:字符串匹配、核算分词、词义分词。
  
  第“一”种:字符串匹配分词
  
  这种分词技能又称之为机械分词办法,直白说就是扫描字符串,查询页面中字符串的子串和词相同,则视为匹配,该类分词一般会参加启发式规矩,例如:正向/逆向最大化匹配、长词优化等办法。
  
  优势:匹配速度快,完成进程简略
  
  劣势:难以区别歧义词,匹配不精准
  
  正向最大值匹配:把关键词从左到右进行匹配
  
  逆向最大值匹配:把关键词从右到左进行匹配
  
  最短途径分词法:搜索引擎提取文中词数最小值
  
  第二种:核算分词
  
  这类分词依据人工标示的词性和核算特征,对中文进行建模,即依据观测到的数据(标示好的语料)对模型参数进行估量,即练习。 在分词阶段再经过模型核算各种分词呈现的概率,将概率最大的分词成果作为终究成果。常见的序列标示模型有HMM和CRF。
  
  长处:很好处理歧义和未登录词问题,作用比依据字符串匹配作用好
  
  缺陷:需要很多的人工标示数据,较慢的分词速度
  
  相邻的字一起呈现的次数越多,就越有可能构成一个词。因此字与字相邻共现的频率或概率可以较好的反映成词的可信度。
  
  可以对语句中相邻共现的各个字的组合的频度进行核算,核算它们的互现信息。定义两个字的互现信息,核算两个汉字X、Y的相邻共现概率。互现信息表现了汉字之间结合联系的严密程度。
  
  第三种:词义分词
  
  词义分词法:经过机器语音断定的分词办法,主要用以处理歧义现象。

 
<黑 喵S E O,www.bxdzc.com>

Tags:

免责声明:本站内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。(QQ:422026368)

搜索
网站分类
标签列表