本站
非官方网站,
信息完全免费,仅供参考,不收取任何费用,具体请以官网公布为准!
063819 信息检索技术 32学时/ 2学分
英文译名:Web Information Retrieval
适用领域:计算机应用技术、计算机软件与理论
开课单位:计算机科学与技术学院
教学目的:本课程主要目的在于介绍Web信息搜索方面的一些基本知识和研究进展,将以相关经典论文内容作为课程的主要内容,目的在于深入了解相关问题及其解决方案,了解其基本思想和采用的主要手段,希望达到的主要教学目标如下:(1)了解Web信息搜索的基本理论和主要研究进展;(2)培养学生的研究兴趣,以及发现问题和解决问题的能力。完成本课程学习后,能够理解和掌握现有Web信息搜索方面的主要进展,感兴趣的同学在老师的指导下可以开展相关的研究工作。
教学方式及学时分配:课堂授课30学时,研讨2学时
学时 |
教学内容 |
教学方式 |
2 |
课程介绍、文本检索、查询类型 |
授课 |
2 |
文档索引与词语加权、相似性函数 |
授课 |
2 |
查询扩展、检索的效果、高效的检索 |
授课 |
2 |
文档聚类和分类、Web概述、Web爬行器 |
授课 |
2 |
Tag信息和Link信息的使用 |
授课 |
2 |
PageRank算法、HITS算法 |
授课 |
2 |
个性化Web搜索 |
授课 |
2 |
文本过滤 |
授课 |
2 |
数据库技术在Web搜索方面的应用 |
授课 |
2 |
W3QL、WebSQL、WebSSQL |
授课 |
2 |
搜索引擎评估 |
授课 |
2 |
元搜索引擎 |
授课 |
2 |
数据库选择技术 |
授课 |
2 |
文档选择技术 |
授课 |
2 |
结果合并技术 |
授课 |
2 |
最新研究进展介绍 |
研讨 |
教学主要内容及对学生的要求:本课程要求学生应学习过《数据结构》、《算法设计与分析》、《高等数学》、《概率论》、《图论》等课程。主要内容包括Web信息检索相关的主要技术,如文本检索技术、搜索引擎技术、数据集成技术等。
内容摘要:随着互联网的快速发展,Web上的信息正在急速增长,如何更加高效的利用这些信息是人们急需解决的问题,信息检索也因此成为一个重要的研究领域。课程主要内容分为四大部分:
第一部分,主要介绍文本检索方面的知识。文本检索是现代搜索引擎的基础。本部分的主要内容在于介绍文本检索的基本概念和技术,如查询类型、文档索引和术语加权、相似性函数、检索的有效性、高效的检索、文档聚类、文档分类等。
第二部分,介绍搜索引擎的相关技术。搜索引擎作为文本检索理论的实际应用,已经得到快速的发展,成为人们在互联网上搜索信息的主要工具。本部分将主要介绍搜索引擎相关的内容,如爬行器、标签信息的使用、链接信息的使用、个性化搜索、数据库方法在Web信息搜索中的应用、搜索引擎的评估等。
第三部分,介绍关于Web数据集成方面的内容。Web数据库是一种可以基于Web而进行访问的数据库,本部分将介绍DBMSE、Web数据库聚类、Web数据库搜索接口集成、结果提取和注释等。
第四部分,以研讨的方式介绍当前信息检索技术的最新研究进展,内容会随着时间的不同动态变化。
考核方式:作业20%,考试80%
主要参考书目:
[1] 《Information Retrieval》,C. J. van Rijsbergen’s,Butterworths, 1979。
http://www.dcs.gla.ac.uk/Keith/Preface.html
[2] 《Information Retrieval: A Survey》,Ed Greengrass. 2000。
http://www.csee.umbc.edu/cadip/readings/IR.report.120600.book.pdf
[3] 《Introduction to Information Retrieval》,C.D. Manning, P. Raghavan, H. Schütze. Cambridge UP, 2007。http://www-csli.stanford.edu/~schuetze/information-retrieval-book.html