课程编号: 092M5025H |
课时: 40 |
学分: 2.0 |
课程属性: 专业普及课 |
主讲教师:何苯 |
英文名称: Modern Information Retrieval |
教学目的、要求
本课程为计算机科学与技术学科研究生的专业普及课。本课程主要以互联网内容应用为背景讲授和讨论现代信息检索领域的主要思想和关键技术。主要内容有检索模型、检索评价、相关反馈、查询扩展、信息的组织和索引、文本处理、文本分类与聚类、信息过滤、WEB检索等等。 通过本课程的学习,希望学生能了解信息检索的基本思想和概念,了解信息检索相关的最新研究成果,培养学生在信息检索相关领域的研究能力和在互联网内容应用上的知识运用能力。
预修课程
概率统计,算法与数据结构
教 材
Christopher D.Manning, Hinrich Schütze, Prabhakar Raghavan. 信息检索导论 (王斌 译)。人民邮电出版社
主要内容
第一章绪论:
信息检索的典型应用 信息检索的基本概念和发展历史 信息检索和其他相关学科的关系
第二章
标引和检索性能评价:效率和效果,查全率和查准率、其他测度,相关评测语料和评测会议
第三章信息检索模型:
布尔模型、向量空间模型、概率模型、统计语言模型、DFR模型等
第四章相关反馈和查询扩展:
相关反馈和查询扩展 相关反馈的概念。相关反馈和伪相关反馈。Rocchio公式。查询扩展的概念。基于全局分析的查询扩展。基于自动局部分析的查询扩展
第五章文本处理:
词法分析、句法分析、语义分析
第六章文本分类和聚类:
文本分类的概念,特征选择方法及其比较,文本分类算法。分类的评价。聚类的概念,聚类算法及聚类的评价
第七章信息的组织和索引:
倒排表以及其他相关索引结构。索引构建及压缩。快速检索方法。搜索系统的搭建
第八章 信息过滤:
基于内容的过滤和基于协同的过滤。自适应过滤方法。
第九章 WEB检索:
信息采集、链接分析算法、WEB建模、元搜索及结果合并方法
第十章 其他应用:
跨语言检索、问答系统等
参考文献
贝泽耶茨,黄萱菁,张奇,邱锡鹏. 现代信息检索(原书第二版)。机械工业出版社。2012