解密搜索引擎技术实战
书名: 解密搜索引擎技术实战
作者: 罗刚编著
出版社: 电子工业出版社
出版日期
文摘: 本书主要包括总体介绍部分、爬虫部分、自然语言处理部分、全文检索部分以及相关案例分析。爬虫部分介绍了网页遍历方法和如何实现增量抓取,并介绍了从网页等各种格式的文档中提取主要内容的方法。自然语言处理部分从统计机器学习的原理出发,包括了中文分词与词性标注的理论与实现以及在搜索引擎中的实用等细节,同时对文档排重、文本分类、自动聚类、句法分析树、拼写检查等自然语言处理领域的经典问题进行了深入浅出的介绍并总结了实现方法。在全文检索部分,结合Lucene 3.0介绍了搜索引擎的原理与进展。用简单的例子介绍了Lucene的最新应用方法。
大学教程-解密搜索引擎技术实战
常见问题FAQ
- 源码等资源都是完整的可运营的吗?
- 千图巨创园资源分享目的是学习研究使用,资源由会员分享及编辑人员整理后发布,请勿商用!
再次申明一下,站点所有数据仅供会员学习、参考、研究使用,不得商用!如果你对资源感觉比较满意,建议您购买正版程序或者最新的教程,以便获取更好的技术支持。
- 你们提供技术支持吗?
- 千图巨创目前资源众多,如果您有项目外包二开需求,请联系客服。我们不对特定资源提供技术支持。如有技术需求请加QQ群与网友互动交流
- 想购买你们的终身会员,如果你们后期关站了怎么办?
- 感谢您的关注,目前vip.qiantukt.cn域名注册已经超过10年并且我们有自己的项目技术团队,千图巨创站点只是方便项目技术查阅资料使用,对外没有盈利需求。目前至可预见的未来一段时间,我们没有关站的可能。如果出现政策或者其他原因导致vip.qiantukt.cn无法正常运行,我们承诺,凡事在有效期内的终身会员及年会员都会收到一份完整的站点数据!