(一)单选题
1.以下()组变量之间存在线性回归关系? A:学生的性别与他的成绩 B:儿子的身高与父亲的身高 C:正方形的边长与面积D: 正三角形的边长与周长
2.回归问题和分类问题的区别是? A:回归问题有标签,分类问题没有 B:回归问题输出值是离散的,分类问题输出值是连续的C:回归问题输出值是连续的,分类问题输出值是离散的 D:回归问题与分类问题在输入属性值上要求不同
3.以下说法错误的是? A:残差是预测值与真实值之间的差值B:损失函数越小,模型训练得一定越好 C:正则项的目的是为了避免模型过拟合 D:最小二乘法不需要选择学习率
4.哪些算法不需要数据归一化? A:kNN B:k-means C:SVMD: 决策树
5.以下()些方法不能用于处理欠拟合?A:增大正则化系数 B:增加新的特征 C:增加模型复杂度 D:对特征进行变换,使用组合特征或高维特征
6.以下哪些方法不能用于处理过拟合? A:对数据进行清洗 B:增大训练数据的量 C:利用正则化技术D:增加数据属性的复杂度
7.下列关于线性回归分析中的残差(Residuals)说法正确的是? 选项:A:残差均值总是为零 B:残差均值总是小于零 C:残差均值总是大于零 D:以上说法都不对
8.为了观察测试 Y 与 X 之间的线性关系,X 是连续变量,使用下列哪种图形比较适合? 选项:A:散点图 B:柱形图 C:直方图 D:以上都不对
9.假如你在训练一个线性回归模型,则:1. 如果数据量较少,容易发生过拟合。2. 如果假设空间较小,容易发生过拟合。关于这两句话,下列说法正确的是? 选项: A:1 和 2 都错误B:1 正确,2 错误 C:1 错误,2 正确 D:1 和 2 都正确
10.关于特征选择,下列对 Ridge 回归和 Lasso 回归说法正确的是? 选项: A:Ridge 回归适用于特征选择B:Lasso 回归适用于特征选择 C:两个都适用于特征选择 D:以上说法都不对
11.构建一个最简单的线性回归模型需要几个系数(只有一个特征)? 选项: A:1 个B:2 个 C:3 个 D:4 个
12.向量x=[1,2,3,4,-9,0]的L1范数是多少? A:1 B:19 C:6 D:根号111
(二)多选题
1.以下哪些是使用数据规范化(特征缩放)的原因? A:它通过降低梯度下降的每次迭代的计算成本来加速梯度下降 B:它通过减少迭代次数来获得一个好的解,从而加快了梯度下降的速度 C:它不能防止梯度下降陷入局部最优 D:它防止矩阵X^TX 不可逆(奇异/退化)
2.线性回归中,我们可以使用最小二乘法来求解系数,下列关于最小二乘法说法正确的是?( )A:只适用于线性模型,不适合逻辑回归模型等其他模型 B:不需要选择学习率 C:当特征数量很多的时候,运算速度会很慢 D:不需要迭代训练
3.欠拟合的处理主要有哪些方式:() A:增加模型复杂度 B:减小正则化系数 C:增大正则化系数D:添加新特征
4.假如使用一个较复杂的回归模型来拟合样本数据,使用 Ridge回归,调试正则化参数,来降低模型复杂度,若正则化系数较大时,关于偏差(bias)和方差(variance),下列说法正确的是?( ) 选项: A:偏差减小B:偏差增大 C:方差减小 D:方差增大
(三)判断题
1.如果两个变量相关,那么它们一定是线性关系。 答案: 【错误】
2.随机梯度下降,每次迭代时候,使用一个样本。 答案: 【正确】
3.L2正则化往往用于防止过拟合,而L1正则化往往用于特征选择。 答案: 【正确】
4.过拟合的处理可以通过减小正则化系数。 答案: 【错误】
推荐文章
发表评论