本站
非官方网站,
信息完全免费,仅供参考,不收取任何费用,具体请以官网公布为准!
063819 信息检索技术 32学时/ 2学分
英文译名:Web Information Retrieval
适用领域:计算机应用技术、计算机软件与理论
开课单位:计算机科学与技术学院
教学目的:本课程主要目的在于介绍Web信息搜索方面的一些基本知识和研究进展,将以相关经典论文内容作为课程的主要内容,目的在于深入了解相关问题及其解决方案,了解其基本思想和采用的主要手段,希望达到的主要教学目标如下:(1)了解Web信息搜索的基本理论和主要研究进展;(2)培养学生的研究兴趣,以及发现问题和解决问题的能力。完成本课程学习后,能够理解和掌握现有Web信息搜索方面的主要进展,感兴趣的同学在老师的指导下可以开展相关的研究工作。
教学方式及学时分配:课堂授课28学时,研讨4学时
学时 |
教学内容 |
教学方式 |
2 |
课程介绍、布尔模型与索引 |
授课 |
2 |
互联网网页下载/网络爬虫、分词、词典与索引 |
授课 |
2 |
词汇表和倒排记录表 |
授课 |
2 |
语义网、本体 |
授课 |
2 |
本体学习 |
授课 |
2 |
词典的数据结构、词项定位的数据结构 |
授课 |
2 |
词项定位的数据结构、通配查询处理、轮排索引、k-gram索引 |
授课 |
2 |
编辑距离、拼写校正、Soundex |
授课 |
2 |
文档评分词项权重 |
授课 |
2 |
向量空间模型 |
授课 |
2 |
搜索系统的评分 |
授课 |
2 |
文档聚类和分类 |
授课 |
2 |
Web概述及搜索基础 |
授课 |
2 |
PageRank算法 |
授课 |
2 |
最新研究进展介绍 |
授课 |
2 |
最新研究进展介绍 |
研讨 |
教学主要内容及对学生的要求:本课程要求学生应学习过《数据结构》、《算法设计与分析》、《高等数学》、《概率论》、《图论》等课程。主要内容包括Web信息检索相关的主要技术,如文本检索技术、搜索引擎技术、容错式检索技术等。
内容摘要:随着互联网的快速发展,Web上的信息正在急速增长,如何更加高效的利用这些信息是人们急需解决的问题,信息检索也因此成为一个重要的研究领域。课程主要内容分为四大部分:
第一部分,主要介绍文本检索方面的知识。文本检索是现代搜索引擎的基础。本部分的主要内容在于介绍文本检索的基本概念和技术,如布尔模型、分词、词典与索引、词汇表和倒排记录表等。
第二部分,介绍搜索引擎的相关技术。搜索引擎作为文本检索理论的实际应用,已经得到快速的发展,成为人们在互联网上搜索信息的主要工具。本部分将主要介绍搜索引擎相关的内容,如互联网网页下载/网络爬虫、语义网、本体、搜索系统的评分、PageRank算法等。
第三部分,介绍关于搜索系统中容错式检索方面的内容。用户在使用检索系统时,有时在检索中存在拼写错误或不明确检索结果时,检索系统如何提供鲁棒性处理和通配符查询,本部分将介绍通配查询处理、轮排索引、k-gram索引、编辑距离、拼写校正、Soundex等。
第四部分,以研讨的方式介绍当前信息检索技术的最新研究进展,内容会随着时间的不同动态变化。
考核方式:考试或报告100%
主要参考书目:
[1] 《信息检索导论》,王斌(译),2010,人民邮电出版社。
[2] 《Information Retrieval》,C. J. van Rijsbergen’s,Butterworths, 1979。
http://www.dcs.gla.ac.uk/Keith/Preface.html
[3] 《Information Retrieval: A Survey》,Ed Greengrass. 2000。
http://www.csee.umbc.edu/cadip/readings/IR.report.120600.book.pdf
[4] 《Introduction to Information Retrieval》,C.D. Manning, P. Raghavan, H. Schütze. Cambridge UP, 2007。http://www-csli.stanford.edu/~schuetze/information-retrieval-book.html