主讲课程:大数据分析方法与应用、统计分析

大数据分析方法与应用

教学周 课时 内容 说明
1 2 导论课 大数据的概念和应用;大数据与机器学习;课程提纲;考核形式和课堂纪律
2 2 单变量的线性回归 线性回归模型;代价函数;梯度下降法;线性代数回顾:矩阵与向量;矩阵运算
3 2 多变量的线性回归 多参数的梯度下降法;多项式拟合;正规方程式(normal equations)求解参数
4 2 Logistic回归 Logistic回归模型;二分类;代价函数和梯度下降法;多分类
5 2 正则化(regularization) 欠拟合/过拟合;改进的代价函数;线性回归和Logistic回归的正则化
6 2 神经网络 神经元生理模型;神经网络模型
7 2 神经网络训练 代价函数;反向传播算法
8 2 阶段性总结 模型选择;训练/测试集;正规化;学习曲线
9 2 支持向量机 SVM原理;SVM核
10 2 非监督学习 k-means;初始化
11 2 数据的降维 PCA
12 2 开发和设计机器学习系统 偏差(bias)和方差(variance),泛化能力(generalization),机器学习系统的优化策略
13 2 应用:推荐系统 回顾和综合运用前面的知识点
14 2 大规模机器学习 针对大数据的机器学习
15 2 延伸内容 在线学习;MapReduce;数据并行处理
16 2 复习 重点回顾,考试安排

大数据分析方法与应用实验

教学周 课时 内容 说明
5 3 Octave基础 讲解Octave的基本语法,自定义函数和m文件的编写
6 3 Octave基础(续) 结合理论课内容,讲解Octave中的矩阵运算和算法实现
7 3 单变量线性回归 用线性回归模型来预测企业利润
8 3 多变量线性回归 用多变量线性回归模型来预测论文的接收(根据两个reviewer的评分)情况,包括梯度下降和正规方程求解
9 3 逻辑回归与正规化 逻辑回归分类器,以及正规化方法的使用。
10 3 多分类问题和神经网络 使用逻辑回归模型和神经网络求解多分类问题,分别实现识别手写数字的应用。
11 3 神经网络训练 反向传播算法,完成对神经网络模型的训练
12 3 SVM 用支持向量机来实现一个垃圾邮件识别算法
13、14 3 大作业 融会贯通地使用各种大数据分析方法,在前面学过的算法寄出上实现人脸识别应用

* Acknowledgment & Reference: The Coursera open class 'Machine Learning' by Andrew Ng

SPSS统计分析

教学周 课时 内容 说明
1 2 导论课 数据统计分析的概念;应用案例介绍;强调概率论和数理统计基础的重要性;课程提纲;考核形式和课堂纪律
2 2 概率论-基本概念 随机试验、样本空间、随机事件、概率、条件概型与乘法公式、全概率公式与贝叶斯公式
3 2 概率论-随机变量 离散型随机变量,0-1分布、泊松分布、二项分布;连续性随机变量,均匀分布、指数分布、正态分布;概率密度函数,分布函数。 随机变量的数字特征:期望、方差、协方差、相关系数、矩。 大数定律和中心极限定理
4 2 数理统计-抽样分布|参数估计 总体、样本、统计量;抽样分布:卡方分布、t分布、F分布;点估计:矩估计法、最大似然法;区间估计:单侧置信区间、双侧置信区间
5 2 数理统计-假设检验 参数检验:正态总体的均值和方差的假设检验;非参数检验:分布拟合检验(卡方拟合检验)、秩和检验
6 2 SPSS统计分析功能 基本统计分析功能;统计图形
7 2 SPSS统计分析功能 均值比较与检验;方差分析(ANOVA)
8 2 SPSS统计分析功能 相关分析;回归分析
9 2 SPSS统计分析功能 非参数检验(卡方拟合检验)
10 2 SPSS统计分析功能 聚类分析;主成分分析
11 2 SPSS案例分析 典型案例介绍;公共数据集的获取
12-13 4 SPSS案例分析 分组实践
14-15 4 SPSS案例分析 汇报答辩

C语言程序设计与实践

教学周 课时 内容 说明
1 2 导论课 主流程序语言介绍;计算机系统的组成;二进制、十六进制;C语言的特点;C语言的学习建议
2 2 集成开发环境 Visual Studio IDE的介绍;程序调试:断点设置、单步调试、变量窗口、内存窗口;编码风格;程序示例
3 2 基本数据类型和表达式 C语言保留关键字;数据类型;常量、变量;运算符
4 2 控制台输入输出语句 基本输入输出函数库stdio.h;scanf、printf
5 2 程序结构 顺序结构、选择结构、循环结构
6 2 数组 整型数组、字符串;向量和矩阵;字符串操作函数库string.h
7 2 函数 函数定义和调用;形参、实参;递归调用;变量的作用域:局部变量、全局变量
8 2 编译预处理 宏定义 #define;文件包含 #include;条件编译 #ifdef 跨平台的实现
9 2 指针
10 2 结构和联合 struct、union、链表
11 2 I/O操作 文件读写操作
12 2 算法 数据结构+算法=程序;算法导论
13-14 4 上机练习
15 2 复习 知识点系统性回顾