1. 神经网络中的批量归一化(Batch Normalization)技术通常应用在:
神经网络中的批量归一化(Batch Normalization)技术通常应用在:
A. 输入层之前
B. 每个隐藏层之后
C. 输出层之后
D. 任何层之前
答案:B
2. 支持向量机中,软间隔与硬间隔的主要区别在于:
支持向量机中,软间隔与硬间隔的主要区别在于:
A. 软间隔允许一定的分类错误,硬间隔不允许
B. 软间隔适用于线性可分问题,硬间隔适用于线性不可分问题
C. 软间隔的计算复杂度高于硬间隔
D. 软间隔的分类效果一定优于硬间隔
答案:A
3. 在多元线性回归分析中,若残差图中存在明显的异方差性,可以采取的补救措施是:
在多元线性回归分析中,若残差图中存在明显的异方差性,可以采取的补救措施是:
A. 增加样本量
B. 使用加权最小二乘法
C. 减少自变量数量
D. 变换因变量
答案:B
4. 在聚类分析中,若数据集非常大且希望快速得到聚类结果,同时不要求得到全局最优解,可以选择的算法是:
在聚类分析中,若数据集非常大且希望快速得到聚类结果,同时不要求得到全局最优解,可以选择的算法是:
A. K-means算法
B. 层次聚类算法
C. DBSCAN算法
D. 谱聚类算法
答案:A
5. 神经网络中的激活函数Sigmoid与Tanh相比,主要区别是:
神经网络中的激活函数Sigmoid与Tanh相比,主要区别是:
A. Sigmoid输出值在(0,1)之间,Tanh输出值在(-1,1)之间
B. Sigmoid是线性函数,Tanh是非线性函数
C. Sigmoid适用于隐藏层,Tanh适用于输出层
D. Sigmoid计算复杂度高于Tanh
答案:A
6. 支持向量机中,线性可分与线性不可分的区别在于:
支持向量机中,线性可分与线性不可分的区别在于:
A. 数据集的维度
B. 数据集的大小
C. 数据集是否可通过一个超平面完全分开
D. 数据集的分布
答案:C
7. 时间序列预测中,若数据存在明显的季节性,可以选择的模型是:
时间序列预测中,若数据存在明显的季节性,可以选择的模型是:
A. AR模型
B. MA模型
C. ARIMA模型
D. SARIMA模型
答案:D
8. 在假设检验中,若检验统计量的观测值落在拒绝域内,则:
在假设检验中,若检验统计量的观测值落在拒绝域内,则:
A. 一定接受原假设
B. 一定拒绝原假设
C. 可能接受原假设,也可能拒绝原假设
D. 无法确定是否拒绝原假设
答案:B
9. 聚类分析中,评估聚类效果好坏的常用指标之一是:
聚类分析中,评估聚类效果好坏的常用指标之一是:
A. 准确率
B. 召回率
C. 轮廓系数
D. F1值
答案:C
10. 决策树算法中,信息增益比是用来衡量:
决策树算法中,信息增益比是用来衡量:
A. 属性的重要性
B. 属性的复杂性
C. 属性在划分数据集中的效率
D. 属性的相关性
答案:C
11. 时间序列分析中的指数平滑法中的平滑系数α:
时间序列分析中的指数平滑法中的平滑系数α:
A. 越大,预测值越接近历史数据的近期值
B. 越小,预测值越接近历史数据的近期值
C. 越大,预测值越平滑
D. 对预测值无影响
答案:A
12. 支持向量机中,核函数的选择对:
支持向量机中,核函数的选择对:
A. 模型的复杂度无影响
B. 模型的复杂度有显著影响
C. 模型的训练时间无影响
D. 模型的测试性能无影响
答案:B
13. 在多元线性回归分析中,若自变量之间存在高度共线性,会导致:
在多元线性回归分析中,若自变量之间存在高度共线性,会导致:
A. 回归系数的估计值稳定
B. 回归系数的估计值不稳定
C. 模型的预测能力提高
D. 模型的解释性增强
答案:B
14. 时间序列分析中的自回归模型(AR)主要处理的是:
时间序列分析中的自回归模型(AR)主要处理的是:
A. 数据的季节性
B. 数据的趋势性
C. 数据的前后依赖性
D. 数据的随机波动
答案:C
15. 聚类分析中,K-means算法的初始中心点选择对最终结果:
聚类分析中,K-means算法的初始中心点选择对最终结果:
A. 无影响
B. 有一定影响
C. 决定性作用
D. 完全不确定
答案:B
16. 神经网络中的梯度消失问题通常发生在:
神经网络中的梯度消失问题通常发生在:
A. 输入层
B. 隐藏层(特别是深层网络中的层)
C. 输出层
D. 任何层都可能
答案:B
17. 在决策树算法中,剪枝的目的是:
在决策树算法中,剪枝的目的是:
A. 提高模型的复杂度
B. 降低模型的复杂度
C. 增加模型的训练时间
D. 提高模型在训练集上的准确率
答案:B
18. 时间序列分析中的移动平均法主要用于:
时间序列分析中的移动平均法主要用于:
A. 预测未来值
B. 平滑数据
C. 识别趋势
D. 识别季节性
答案:B
19. 在回归分析中,如果增加一个新的自变量后,R方值显著增加,这意味着:
在回归分析中,如果增加一个新的自变量后,R方值显著增加,这意味着:
A. 新变量与因变量无关
B. 新变量提高了模型的拟合度
C. 新变量增加了模型的复杂性
D. 新变量导致了过拟合
答案:B
20. 在时间序列分析中,若数据存在明显的自相关性且希望消除这一特征,可以采取的措施是:
在时间序列分析中,若数据存在明显的自相关性且希望消除这一特征,可以采取的措施是:
A. 差分运算
B. 对数变换
C. 标准化处理
D. 归一化处理
答案:A
21. 聚类分析中,若希望得到的聚类结果具有层次结构,可以选择的算法是:
聚类分析中,若希望得到的聚类结果具有层次结构,可以选择的算法是:
A. K-means算法
B. 层次聚类算法
C. DBSCAN算法
D. 谱聚类算法
答案:B
22. 神经网络中的学习率设置对模型的:
神经网络中的学习率设置对模型的:
A. 训练时间无影响
B. 预测能力无影响
C. 收敛速度有影响
D. 可解释性有影响
答案:C
23. 在决策分析中,最大最小后悔值准则与最大期望效用准则相比,主要考虑的是:
在决策分析中,最大最小后悔值准则与最大期望效用准则相比,主要考虑的是:
A. 决策者的风险偏好
B. 决策结果的不确定性
C. 决策者的心理承受能力
D. 决策方案的数量
答案:B
24. 时间序列分析中的滞后算子主要用于:
时间序列分析中的滞后算子主要用于:
A. 构造平稳序列
B. 识别趋势性
C. 捕捉季节性
D. 消除自相关性
答案:A
25. 聚类分析中,若数据集非常大且希望快速得到聚类结果,同时不要求得到全局最优解,可以选择的算法是:
聚类分析中,若数据集非常大且希望快速得到聚类结果,同时不要求得到全局最优解,可以选择的算法是:
A. K-means算法(结合适当优化策略)
B. 层次聚类算法
C. DBSCAN算法(在大数据集上可能较慢)
D. 谱聚类算法(计算复杂度高)
答案:A
26. 神经网络中的正则化技术主要用于:
神经网络中的正则化技术主要用于:
A. 增加模型的复杂度
B. 防止过拟合
C. 加速模型收敛
D. 提高模型在训练集上的准确率
答案:B
27. 神经网络中的批量梯度下降与随机梯度下降相比,主要区别是:
神经网络中的批量梯度下降与随机梯度下降相比,主要区别是:
A. 更新权重的频率不同
B. 计算损失函数的方式不同
C. 初始化参数的方法不同
D. 选择激活函数的策略不同
答案:A
28. 在决策树算法中,预剪枝的目的是:
在决策树算法中,预剪枝的目的是:
A. 提高模型的复杂度
B. 降低模型的复杂度
C. 增加模型的训练时间
D. 提高模型在测试集上的准确率
答案:B
29. 时间序列分析中的ADF(Augmented Dickey-Fuller)检验主要用于:
时间序列分析中的ADF(Augmented Dickey-Fuller)检验主要用于:
A. 检验数据的平稳性
B. 检验数据的趋势性
C. 检验数据的季节性
D. 检验数据的自相关性
答案:A
30. 聚类分析中,若希望自动确定聚类数量且对数据分布无假设,可以选择的算法是:
聚类分析中,若希望自动确定聚类数量且对数据分布无假设,可以选择的算法是:
A. K-means算法
B. 层次聚类算法
C. DBSCAN算法
D. 谱聚类算法
答案:C
31. 神经网络中的激活函数ReLU(Rectified Linear Unit)相比Sigmoid,主要优势是:
神经网络中的激活函数ReLU(Rectified Linear Unit)相比Sigmoid,主要优势是:
A. 避免了梯度消失问题
B. 提高了模型复杂度
C. 增强了模型可解释性
D. 减少了计算量
答案:A
32. 在决策分析中,后悔值准则通常用于:
在决策分析中,后悔值准则通常用于:
A. 确定型决策
B. 风险型决策
C. 不确定型决策
D. 多属性决策
答案:C
33. 时间序列预测中,若数据存在明显的季节性且希望捕捉这一特征,可以选择的模型是:
时间序列预测中,若数据存在明显的季节性且希望捕捉这一特征,可以选择的模型是:
A. AR模型
B. MA模型
C. ARIMA模型
D. SARIMA模型
答案:D
34. 聚类分析中,若数据集较小且希望得到全局最优解,可以选择的算法是:
聚类分析中,若数据集较小且希望得到全局最优解,可以选择的算法是:
A. K-means算法
B. 层次聚类算法
C. DBSCAN算法
D. 谱聚类算法
答案:B
35. 神经网络中的池化层(Pooling Layer)主要用于:
神经网络中的池化层(Pooling Layer)主要用于:
A. 减少参数数量
B. 增加模型复杂度
C. 提高模型预测能力
D. 增强模型可解释性
答案:A
36. 支持向量机中,核函数的选择对模型的:
支持向量机中,核函数的选择对模型的:
A. 训练时间无影响
B. 预测能力无影响
C. 复杂度有影响
D. 可解释性有影响
答案:C
37. 时间序列分析中的偏自相关函数(PACF)主要用于识别:
时间序列分析中的偏自相关函数(PACF)主要用于识别:
A. 数据的趋势性
B. 数据的季节性
C. 数据的滞后阶数
D. 数据的随机性
答案:C
38. 在回归分析中,若残差图中存在明显的漏斗形或喇叭形,说明:
在回归分析中,若残差图中存在明显的漏斗形或喇叭形,说明:
A. 数据存在异方差性
B. 数据存在自相关性
C. 模型拟合度好
D. 模型预测能力强
答案:A
39. 聚类分析中,评估聚类效果好坏的常用指标之一是轮廓系数,其值越接近1表示:
聚类分析中,评估聚类效果好坏的常用指标之一是轮廓系数,其值越接近1表示:
A. 聚类效果越差
B. 聚类效果越好
C. 簇内样本相似度低
D. 簇间样本相似度高
答案:B
40. 在决策分析中,期望值准则通常用于:
在决策分析中,期望值准则通常用于:
A. 确定型决策
B. 风险型决策
C. 不确定型决策
D. 多属性决策
答案:B
41. 假设检验中,P值小于显著性水平α时,应:
假设检验中,P值小于显著性水平α时,应:
A. 接受原假设
B. 拒绝原假设
C. 无法确定是否接受原假设
D. 以上都不对
答案:B
42. 聚类分析中,K-means算法的聚类中心数量:
聚类分析中,K-means算法的聚类中心数量:
A. 是固定的
B. 是随机选择的
C. 可以动态调整
D. 取决于数据集的样本数
答案:A
43. 在多元回归分析中,若两个自变量之间存在高度共线性,会导致:
在多元回归分析中,若两个自变量之间存在高度共线性,会导致:
A. 回归系数显著
B. 回归系数不显著
C. 模型拟合度提高
D. 模型预测能力增强
答案:B
44. 时间序列分析中的自相关函数(ACF)主要用于识别:
时间序列分析中的自相关函数(ACF)主要用于识别:
A. 数据的趋势性
B. 数据的季节性
C. 数据的周期性
D. 数据的随机性
答案:C
45. 在决策树构建过程中,选择最优划分属性的依据通常是:
在决策树构建过程中,选择最优划分属性的依据通常是:
A. 信息增益
B. 基尼指数
C. 熵值
D. 方差
答案:A
46. 时间序列分析中的SARIMA模型主要用于处理?
时间序列分析中的SARIMA模型主要用于处理?
A. 平稳序列
B. 非平稳序列且包含趋势性
C. 非平稳序列且包含季节性(以及可能的趋势性)
D. 仅包含随机误差的序列
答案:C
47. 聚类分析中,若数据集较小且希望得到全局最优解,可以选择的算法是?
聚类分析中,若数据集较小且希望得到全局最优解,可以选择的算法是?
A. K-means(可能陷入局部最优)
B. 层次聚类(可以得到全局最优解,但计算复杂度较高,在数据集较小时可接受)
C. DBSCAN(基于密度,无需预先指定聚类数量,但不一定得到全局最优)
D. 谱聚类(需要构造相似度矩阵,计算复杂度高)
答案:B
48. 在回归分析中,若残差图中存在明显的喇叭形或漏斗形,说明?
在回归分析中,若残差图中存在明显的喇叭形或漏斗形,说明?
A. 数据存在异方差性
B. 数据存在自相关性
C. 模型拟合度好
D. 模型存在遗漏变量问题
答案:A
49. 神经网络中的权重初始化对模型的?
神经网络中的权重初始化对模型的?
A. 训练时间无影响
B. 预测能力无影响
C. 收敛速度有影响
D. 可解释性有影响
答案:C
50. 时间序列分析中的自相关函数(ACF)图主要用于识别?
时间序列分析中的自相关函数(ACF)图主要用于识别?
A. 数据的趋势性
B. 数据的季节性
C. 数据的滞后阶数(或自相关性)
D. 数据的异方差性
答案:C
51. 在聚类分析中,轮廓系数(Silhouette Coefficient)的值越接近1表示?
在聚类分析中,轮廓系数(Silhouette Coefficient)的值越接近1表示?
A. 聚类效果越差
B. 聚类效果越好
C. 簇内样本相似度低
D. 簇间样本相似度高且簇内样本相似度低(相对)
答案:B
52. 支持向量机中,软间隔与硬间隔的主要区别在于?
支持向量机中,软间隔与硬间隔的主要区别在于?
A. 是否允许误分类点存在
B. 是否使用核函数
C. 是否需要正则化参数
D. 是否需要交叉验证
答案:A
53. 神经网络中的学习率过大可能导致?
神经网络中的学习率过大可能导致?
A. 模型收敛速度加快
B. 模型无法收敛
C. 模型过拟合
D. 模型欠拟合
答案:B
54. 在决策树算法中,选择最优划分属性的依据通常是?
在决策树算法中,选择最优划分属性的依据通常是?
A. 信息增益比
B. 基尼指数
C. 熵值本身
D. 方差分析
答案:A
55. 时间序列分析中的ARIMA模型可以处理?
时间序列分析中的ARIMA模型可以处理?
A. 平稳序列
B. 非平稳序列
C. 季节性序列(需结合SARIMA)
D. 仅包含随机误差的序列
答案:B
56. 聚类分析中,若希望自动确定聚类数量且对数据分布无假设,可以选择的算法是?
聚类分析中,若希望自动确定聚类数量且对数据分布无假设,可以选择的算法是?
A. K-means(需要预先指定K值)
B. 层次聚类(需要人为确定剪枝高度)
C. DBSCAN(基于密度,无需预先指定聚类数量)
D. 谱聚类(需要构造相似度矩阵)
答案:C
57. 在回归分析中,若自变量之间存在高度共线性,会导致?
在回归分析中,若自变量之间存在高度共线性,会导致?
A. 回归系数显著
B. 回归系数不显著
C. 模型拟合度提高
D. 残差平方和减小
答案:B
58. 神经网络中的批量大小(Batch Size)对模型的?
神经网络中的批量大小(Batch Size)对模型的?
A. 训练时间有影响
B. 预测能力无影响
C. 收敛速度无影响
D. 可解释性有影响
答案:A
59. 在决策分析中,下列哪项是不确定型决策常用的准则?
在决策分析中,下列哪项是不确定型决策常用的准则?
A. 期望值准则
B. 最大化最小收益
C. 最小化最大后悔值
D. 乐观准则与悲观准则
答案:D
60. 时间序列分析中的移动平均模型(MA)主要关注的是?
时间序列分析中的移动平均模型(MA)主要关注的是?
A. 当前值与过去值之间的关系
B. 当前值与随机误差之间的关系
C. 过去值与未来值之间的关系
D. 随机误差之间的自相关性
答案:D
61. 在聚类分析中,若数据集非常大且希望快速得到聚类结果,可以选择的算法是?
在聚类分析中,若数据集非常大且希望快速得到聚类结果,可以选择的算法是?
A. K-means(标准版)
B. 层次聚类
C. DBSCAN(在大数据集上可能较慢)
D. MiniBatchKMeans(K-means的变种,适用于大数据)
答案:D
62. 神经网络中的Dropout技术主要用于?
神经网络中的Dropout技术主要用于?
A. 增加模型复杂度
B. 防止过拟合
C. 加速模型收敛
D. 提高训练集准确率
答案:B
63. 下列哪个不是支持向量机的核函数?
下列哪个不是支持向量机的核函数?
A. 线性核
B. 多项式核
C. 径向基核
D. 感知机核
答案:D
64. 在回归分析中,残差图的主要作用是?
在回归分析中,残差图的主要作用是?
A. 检查模型的线性关系
B. 检查模型的异方差性
C. 检查模型的自相关性
D. 检查模型的共线性
答案:B
65. 在时间序列分析中,ADF检验的原假设是?
在时间序列分析中,ADF检验的原假设是?
A. 序列是平稳的
B. 序列有单位根
C. 序列是自相关的
D. 序列是白噪声
答案:B
66. 下列哪个是评估聚类效果好坏的常用指标?
下列哪个是评估聚类效果好坏的常用指标?
A. 准确率
B. 召回率
C. 轮廓系数
D. F1分数
答案:C
67. 在决策树算法中,剪枝的目的是?
在决策树算法中,剪枝的目的是?
A. 提高模型复杂度
B. 降低模型复杂度
C. 增加训练时间
D. 提高测试集准确率
答案:B
68. 下列哪项不是神经网络中的常见激活函数?
下列哪项不是神经网络中的常见激活函数?
A. Sigmoid
B. Tanh
C. ReLU
D. Logistic
答案:D
69. 时间序列中的自回归模型(AR)主要关注的是?
时间序列中的自回归模型(AR)主要关注的是?
A. 当前值与过去值之间的关系
B. 当前值与未来值之间的关系
C. 当前值与随机误差之间的关系
D. 过去值与未来值之间的关系
答案:A
70. 在假设检验中,当P值大于显著性水平α时,应?
在假设检验中,当P值大于显著性水平α时,应?
A. 接受原假设
B. 拒绝原假设
C. 无法确定
D. 重新收集数据
答案:A
71. 下列哪个不是聚类分析的常用算法?
下列哪个不是聚类分析的常用算法?
A. K-means
B. DBSCAN
C. 层次聚类
D. 决策树
答案:D
72. 在多元线性回归分析中,增加自变量通常会导致?
在多元线性回归分析中,增加自变量通常会导致?
A. 调整后的R方减小
B. 残差平方和增大
C. 自由度增加
D. 回归系数标准误减小
答案:D
73. 时间序列分析中的指数平滑法主要用于?
时间序列分析中的指数平滑法主要用于?
A. 长期趋势预测
B. 季节变动预测
C. 周期变动预测
D. 随机变动预测
答案:A
74. 在决策分析中,下列哪项是风险型决策常用的准则?
在决策分析中,下列哪项是风险型决策常用的准则?
A. 最大化最小收益
B. 最小化最大后悔值
C. 期望值准则
D. 乐观准则
答案:C
75. 在回归分析中,若残差图中存在明显的漏斗形或喇叭形,可能说明?
在回归分析中,若残差图中存在明显的漏斗形或喇叭形,可能说明?
A. 数据存在异方差性
B. 数据存在自相关性
C. 模型拟合度好(此选项通常不正确)
D. 模型存在遗漏变量问题(此选项与异方差性相关但非直接)
答案:A
76. 神经网络中的权重衰减(L2正则化)主要用于?
神经网络中的权重衰减(L2正则化)主要用于?
A. 增加模型复杂度
B. 防止过拟合(通过惩罚大权重)
C. 加速模型收敛
D. 提高训练集准确率
答案:B
77. 在决策分析中,下列哪项是确定型决策的特点?
在决策分析中,下列哪项是确定型决策的特点?
A. 存在多种可能状态且概率已知
B. 存在多种可能状态但概率未知
C. 只存在一种确定的状态
D. 决策结果完全不确定
答案:C
78. 时间序列分析中的偏自相关函数(PACF)图主要用于识别?
时间序列分析中的偏自相关函数(PACF)图主要用于识别?
A. 数据的趋势性
B. 数据的季节性
C. 数据的滞后阶数(或自相关性中的直接影响)
D. 数据的异方差性
答案:C
79. 在聚类分析中,若数据集较小且希望得到精确解,可以选择的算法是?
在聚类分析中,若数据集较小且希望得到精确解,可以选择的算法是?
A. K-means(可能陷入局部最优)
B. DBSCAN(基于密度,适用于大数据)
C. 层次聚类(可以得到全局最优解,但计算复杂度较高)
D. 近似算法
答案:C
80. 支持向量机中的软间隔分类允许?
支持向量机中的软间隔分类允许?
A. 所有样本点必须分类正确
B. 部分样本点可以分类错误(但尽量少)
C. 不考虑样本点的分类错误
D. 只考虑支持向量的分类错误
答案:B
81. 神经网络中的激活函数主要用于?
神经网络中的激活函数主要用于?
A. 增加模型非线性
B. 减少模型参数
C. 加速模型收敛
D. 提高模型可解释性
答案:A
82. 在决策树算法中,剪枝的目的是为了?
在决策树算法中,剪枝的目的是为了?
A. 提高模型复杂度
B. 降低模型复杂度(防止过拟合)
C. 增加训练时间
D. 提高测试集准确率(间接效果)
答案:B
83. 时间序列分析中的季节性差分主要用于处理?
时间序列分析中的季节性差分主要用于处理?
A. 平稳序列
B. 非平稳序列中的趋势性
C. 非平稳序列中的季节性
D. 随机误差序列
答案:C
84. 聚类分析中,若希望得到层次化的聚类结果,可以选择的算法是?
聚类分析中,若希望得到层次化的聚类结果,可以选择的算法是?
A. K-means
B. DBSCAN
C. 层次聚类
D. 谱聚类
答案:C
85. 在回归分析中,若自变量之间存在高度共线性,可能导致?
在回归分析中,若自变量之间存在高度共线性,可能导致?
A. 回归系数不显著
B. 回归系数显著
C. 模型拟合度提高
D. 残差平方和减小
答案:A
86. 神经网络中的正则化技术主要用于?
神经网络中的正则化技术主要用于?
A. 增加模型复杂度
B. 防止过拟合
C. 加速模型收敛
D. 提高训练集准确率
答案:B
87. 在决策分析中,下列哪项是不确定型决策常用的启发式准则?
在决策分析中,下列哪项是不确定型决策常用的启发式准则?
A. 期望值准则
B. 最大化最小收益(悲观准则)
C. 最小化最大后悔值(后悔值准则)
D. 等可能准则(或拉普拉斯准则)
答案:D
88. 时间序列分析中的自相关函数(ACF)和偏自相关函数(PACF)主要用于?
时间序列分析中的自相关函数(ACF)和偏自相关函数(PACF)主要用于?
A. 识别序列的趋势性
B. 识别序列的季节性
C. 识别序列的滞后阶数(或自相关性)
D. 识别序列的异方差性
答案:C
89. 在聚类分析中,若数据集非常大且希望得到近似最优解,可以选择的算法是?
在聚类分析中,若数据集非常大且希望得到近似最优解,可以选择的算法是?
A. K-means(标准版,可能陷入局部最优)
B. 层次聚类(计算复杂度高)
C. DBSCAN(基于密度,适用于大数据但参数敏感)
D. 近似算法如K-means++或MiniBatchKMeans
答案:D
90. 神经网络中的学习率设置过小可能导致?
神经网络中的学习率设置过小可能导致?
A. 模型收敛速度加快
B. 模型无法收敛
C. 模型过拟合
D. 模型欠拟合(训练不充分)
答案:D
91. 支持向量机中的核函数主要用于?
支持向量机中的核函数主要用于?
A. 将数据映射到高维空间
B. 将数据映射到低维空间
C. 计算支持向量
D. 确定分类边界
答案:A
92. 在回归分析中,若残差图中存在明显的波动性,可能说明?
在回归分析中,若残差图中存在明显的波动性,可能说明?
A. 数据存在异方差性
B. 数据存在自相关性
C. 模型拟合度好
D. 模型存在遗漏变量问题
答案:B
93. 聚类分析中,轮廓系数(Silhouette Coefficient)的值越接近-1表示?
聚类分析中,轮廓系数(Silhouette Coefficient)的值越接近-1表示?
A. 聚类效果越好
B. 聚类效果越差
C. 簇内样本相似度高
D. 簇间样本相似度高
答案:B
94. 在决策分析中,下列哪项是风险型决策与不确定型决策的主要区别?
在决策分析中,下列哪项是风险型决策与不确定型决策的主要区别?
A. 是否存在多种可能状态
B. 每种状态发生的概率是否已知
C. 决策结果是否确定
D. 是否使用期望值准则
答案:B
95. 时间序列中的自回归积分滑动平均模型(ARIMA)可以处理?
时间序列中的自回归积分滑动平均模型(ARIMA)可以处理?
A. 仅包含随机误差的序列
B. 非平稳序列
C. 季节性序列(需结合SARIMA)
D. 平稳且自相关的序列
答案:B
96. 假设检验中的第一类错误是指?
假设检验中的第一类错误是指?
A. 原假设为真时拒绝原假设
B. 原假设为假时接受原假设
C. 原假设为真时接受原假设
D. 原假设为假时拒绝原假设
答案:A
97. 下列哪个是聚类分析中的常见算法,且不需要预先指定聚类数?
下列哪个是聚类分析中的常见算法,且不需要预先指定聚类数?
A. K-means
B. DBSCAN
C. 层次聚类(需要剪枝确定聚类数)
D. 谱聚类(需要确定聚类数)
答案:B
98. 在多元线性回归分析中,增加不相关的自变量通常会导致?
在多元线性回归分析中,增加不相关的自变量通常会导致?
A. R方值增加
B. 调整后的R方值减小
C. 回归系数显著
D. 残差平方和减小
答案:B
99. 时间序列分析中的白噪声过程是指?
时间序列分析中的白噪声过程是指?
A. 序列值完全随机
B. 序列值有趋势性
C. 序列值有季节性
D. 序列值自相关
答案:A
100. 在决策树算法中,用于衡量特征重要性的是?
在决策树算法中,用于衡量特征重要性的是?
A. 信息增益
B. 基尼系数
C. 熵
D. 方差
答案:A