本课程是信息管理与信息系统/大数据管理与应用/应用统计学等专业的专业核心课程。数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务处理进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。基本上,数据挖掘就是从大量的、不完全的、有噪声的、模糊的实际应用数据中,提取隐含在其中的,人们事先不知道,但又是潜在有用的信息和知识的过程。
课程代码: tmp4925 课程性质:专业基础选修课
适用专业:信息管理与信息系统总学分数:2.0
总学时数: 32 修订年月: 2021年12月
编写年月: 2020年3月执笔:刘国胜
一、课程简介和教学目标
1.课程简介(中文):
本课程是信息管理与信息系统全日制专业、辅修和双学位专业的专业基础选修课。数据挖掘从统计学和人工智能领域演变而来,是一门新兴且实用性很强的交叉学科,也是大数据分析的主要支撑技术。在互联网背景下的商务运营与管理中,数据挖掘的主要任务是辅助管理者对海量数据进行智能化分析和利用,已在诸如信用评级、欺诈发现、精准营销、客户关系管理和股市投资等方面获得广泛而成功的应用。通过本课程的学习,有助于学生了解数据分析技术的基本思想,掌握最新的数据挖掘技术,能够应用常见的数据挖掘工具进行深入的业务数据分析,为今后在商业运营和企业管理中,利用大数据技术提升企业市场竞争力,提供良好的理论和技术训练。
course introduction
this course is a fundamental optional course of the full-time, minor and double-degree major of information management and information system. data mining is derived from the areas of statistics and artificial intelligence. being a new and applicable filed, data mining is also the basis of big data. in the field of internet business operation and management, the task of data mining is to help the manager analyzing and utilizing the huge volume of data, and it has being widely used in credits rating, fraud discovering, marketing, customer relation management and stocks investment. this course can help the students to know the basic theory of data analysis, to master the newest technology of data analysis, to be able to use data mining tools to analyze business data, to improve the ability of applying it in enterprise management.
2.教学目标
通过学习,使学生掌握数据挖掘理论以及如何用数据挖掘来解决商务运营与管理中的实际问题,包括(1)对数据挖掘的发展趋势和应用场景具有基本了解;(2)掌握数据挖掘的分析方法和策略,较好的掌关联分析、聚类和分类等经典算法的基本理论、计算思维和实现过程;(4)掌握通过编程工具实现几类经典数据挖掘技术;(5)了解数据挖据在具体商业领域的应用方法。
二、课程教学内容及学时分配
第一部分导论(2学时)
理解数据挖掘的基本概念、性质、功能和应用领域,了解数据挖掘问题的分类、各类问题的主要特征、以及相关方法的适用场景。
第二部分:工具准备(2学时)
主要内容:选择某一种编程语言作为工具,掌握该工具中数据挖掘相关的编程模块、实现策略与编程技巧。
第三部分:数据挖掘的基本方法(14学时)
主要内容:(1)概念学习和概念描述;(2)分类算法:包括id3决策树算法,决策树修剪,决策树的规则提炼;贝叶斯分类方法;knn分类方法(3)关联规则和购物篮分析:关联规则的概念,支持度和置信度,apriori算法;(4)聚类方法:k-means分类方法;(5)前沿方法简介,包括遗传算法、支持向量机方法、神经网络方法:算法原理及调用已有工具包实现分类、预测等。
第四部分:数据挖掘案例分析(2学时)
主要内容:数据挖掘在零售业、银行业、无线通信业、电信业等领域的应用案例分析。
第五部分:算法编程实现(12学时)
主要内容:要求学生采用编程工具实现aprior、id3等几种主要的数据挖掘算法。
三、课程教学的基本要求
数据挖掘与商务智能课程的理论性和应用性均较强,在教学方法上,可采用课堂讲授、案例分析、上机实验等方式进行。
本课程以课堂教学为主,以课堂教学中使用的(电子)教案的内容为主线,课外阅读指定的参考文献并利用网上资源,加深对教学内容的理解。教师教学活动中应侧重于培养学生理解数据挖掘主要原理,并介绍当今的一些发展动态。在课堂上应对数据挖掘的基本概念、数据挖掘建模方法、编程实现技术等进行必要的讲授,并详细讲授每章的重点、难点内容;讲授中应注意理论联系实际,通过必要的案例讲解加深学生对有关概念、理论等内容的理解,并应采用多媒体辅助教学,加大课堂授课的知识含量。重要术语用英文单词标注。
上机实验可结合matalb/python等编程软件等来实施。
考试主要采用闭卷方式,考试范围应涵盖所有讲授的内容,考试内容应能客观反映出学生对本门课程主要概念的记忆、掌握程度,对有关理论、技术和方法的理解、掌握及综合运用能力。考试题型应尽量多样化。
总评成绩:平时作业占40%,闭卷考试占60%。
四、课程思政目标与内容安排
通过本课程的学习,旨在培养学生的家国情怀,使学生对四个自信、党的方针政策等方面有深刻的认识和理解,实现与思想政治理论课的同向同行,为中国特色社会主义事业培养合格的建设者和可靠的接班人。具体为:
目标1:将数据挖掘理论和方法与坚持党的领导、人民民主专政、科学发展观等党的方针政策和国家治理理念结合,辅助阐述其科学性和合理性。
目标2:将数据挖掘案例与我国经济社会发展成果相结合,增强学生对中国特色社会主义制度和市场经济制度的认同感和自豪感。
为此,将在本课程中重点开展以下思政教育内容:
内容1:运用我国传统文化思想阐述聚类、分类、关联分析的基本概念。
内容2:在聚类、分类算法讲解中引导学生理解我国人民民主专政、科学发展观等的科学性和合理性。
内容3:采用我国近年来民生、金融和产业发展样本开展数据挖掘案例分析。
五、本课程与其它课程的联系与分工
先修课程:概率论与数理统计、程序设计语言、数据结构
后续课程:
六、建议教材及教学参考书
[1](加)韩家炜、堪博编,范明、孟小峰译,《数据挖掘概念与技术(原书第2版)》,机械工业出版社出版,2007年出版
[2]元昌安编,《数据挖掘原理与spss clementine应用宝典》,电子工业出版社,2009年出版
[3]纪希禹编,《数据挖掘技术应用实例》,机械工业出版社,2009年出版
[4](美)奥尔森(olson,d.)、(中)石勇编,吕巍等译,《商业数据挖掘导论》,机械工业出版社,2007年出版
[5]毛国君等编,《数据挖掘原理与算法(第二版)》,清华大学出版社, 2007年出版
[6]pang-ning tan , michael steinbach , vipin kumar (作者) 范明 , 范宏建 (译者),数据挖掘导论,人民邮电出版社,2011年出版
《数据挖掘》课程教学大纲
introduction to data mining
课程代码:24123220 课程性质:专业应用课/选修
适用专业:应用统计学 总学分数:2
总学时数:32 修订年月:2016.6
编写年月:2010.11 执 笔:徐圣兵
课程简介(中文):数据挖掘是应用统计学专业核心课程,本课程以数据挖掘为主要内容,讲述实现数据挖掘的各主要功能、挖掘算法和应用,并通过对实际数据的分析更加深入地理解常用的数据挖掘模型。掌握数据挖掘软件使用,培养学生数据分析和处理的能力。
一、 课程目的
通过对《数据挖掘》的学习,使学生掌握数据挖掘的基本概念和主要应用。数据挖掘技术经过十几年的发展,已经取得一批重要成果,特别是在基本概念、基本原理、基本算法等方面的发展越来越清晰。本课程以介绍基本概念、基本原理为主,以企业实务应用为纬,其目的是为学生将来就职及继续学习提供知识储备。
数据挖掘是课程之基础课程是数据库原理,解决数据处理中的数据表示,关系数据库的管理及查询、数据预处理、数据清洗等问题,通过本课程学习让学生了解信息处理、提取技术的发展方向以及数据挖掘技术本身的概念、原理、方法与应用。
二、课程教学目标
1. 数据挖掘基本原理的掌握。
2. 数据挖掘技术在各行业的实例应用。
3. 数据挖掘工具的基本使用、报表判读、解析及参数调整方法。
4. 基本编程以解决、辅助数据挖掘工具之能力的培养。
5. 数据挖掘项目的计划、实施、管理知识与技术。
三、课程教学内容及学时分配
(一)教学内容
本课程主要学习的内容包括数据预处理、分类与预测、聚类分析等内容。
(二)学时分配
本课程的教学时数为32学时,学时分配如下表:
序号 | 内 容 | 学 时安 排 | 小计 | |
理论课时 | 实验或习题课时 上机课时 | |||
1 | 数据挖掘概述 | 2 | 0 | 2 |
2 | 数据挖掘工具 | 2 | 0 | 2 |
3 | 数据探索 | 2 | 0 | 2 |
4 | 数据预处理 | 2 | 0 | 2 |
5 | 数据挖掘技术 | 8 | 0 | 8 |
6 | 数据挖掘案例选讲 | 16 | 0 | 16 |
总计 | 32 | 0 | 32 |
三、课程教学的基本要求
1. 数据挖掘概述
数据挖掘概述、实验方式、分组、商用数据挖掘工具介绍。
2. 数据预处理
常见的数据预处理方法有:数据清洗、数据集成、数据转换和数据归约。
3. 分类方法及预测
分类方法原理。决策树、规则产生器、记忆推理、等分类法在行销、风险分析、决策支援上的实务应用
4. 聚类分析原理及应用
聚类分析将大量数据划分为性质相同的子类,以便于了解数据的分布情况。自动聚类分析在客户筛选、异常检测;基因表达定位、税务申报欺诈、走私行为、网络安全及入侵分析检測等方面的应用
5. 购物篮分析、关联分析的原理及应用
购物篮分析是通过发现顾客放入其购物篮中的不同商品,即不同项之间的关联,这种关联的发现可以帮助零售商制定营销策略、商品布局。超级市场、电子商务的交易行为建模及应用;流行病爆发之预警分析;客户对银行产品需求模式、网站用途及用户浏览路径分析;股市行情关连分析及预测。
6.支持向量机是一种用於线性与非线性数据的分类方法。医保金额申报的欺诈检测、生物学序列(dna) 比对分析的应用。
四、本课程与其它课程的联系与分工
先修课程:高等代数、数学分析
后续课程:数据挖掘课程设计
五、建议教材及教学参考书
[1]matlab数据分析与挖掘实战,张良均等,机械工业出版社
[2]数据挖掘原理与应用,邝祝芳等, 清华大学出版社
[3]数据挖掘原理与技术,张云涛、龚玲著,电子工业出版社
[4]数据挖掘原理与spss clementine应用宝典,元昌安等,电子工业出版社