1、【单选题】【单选题】下列关于数据和数据分析的说法正确的是( )
- A、数据就是数据库中的表格
- B、文字、声音、图像这些都是数据
- C、数据分析的数据只能是结构化的
- D、数据分析不可能预测未来几天的天气变化
正确答案: B:文字、声音、图像这些都是数据;
2
【单选题】【单选题】下列关于数据分析流程的说法错误的是( )
- A、需求分析是数据分析最重要的一部分
- B、模型评价能够评价模型的优劣
- C、分析与建模时只能够使用数值型数据
- D、数据预处理是能够建模的前提
正确答案: C:分析与建模时只能够使用数值型数据;
3
【单选题】下列关于分析与建模流程的说法错误的是( )
- A、分析与建模的模型选择要根据需求确定
- B、分析与建模丁作是数据分析的核心
- C、分析和建模时可以选择多个模型,同时分析
- D、传统的统计对比分析不属于分析与建模流程
正确答案: D:传统的统计对比分析不属于分析与建模流程;
4
【单选题】下列关于模型评价与优化的说法正确的是( )
- A、模型评价的目的是为了确认模型的有效性
- B、所有的模型评价方法相同
- C、模型评价结果良好,模型一定可用,不需要重构
- D、模型构建完成就可以使用
正确答案: A:模型评价的目的是为了确认模型的有效性;
5
【单选题】下列不属于数据分析应用场景的是( )
- A、计算机硬盘使用寿命预测
- B、码头货物吞吐址预测
- C、某人一生的命运预测
- D、产品销拭分析
正确答案: C:某人一生的命运预测;
6
【单选题】下列不属于 Python 优势的是( )
- A、拥有大量的第 方库,能够调用 C++ Java 语言
- B、开源免费
- C、语法简洁,程序开发速度快
- D、程序的运行速度在所有计算机语言中最快
正确答案: D:程序的运行速度在所有计算机语言中最快;
知识点:
7
【单选题】Jupyter Notebook 不具备的功能是( )
- A、Jupyter Notebook 可以将文件分享给他人
- B、Jupyter Notebook 可以直接生成一份交互式文档
- C、Jupyter Notebook 可以导出 HTML 文件
- D、Jupyter Notebook 可以安装 Python
正确答案: D:Jupyter Notebook 可以安装 Python
一.单选题(共5题,100.0分)
1
【单选题】【单选题】下列对Python中的NumPy描述不正确的是( )。
- A、NumPy的数据容器能够保存任意类型的数据
- B、NumPy提供ndarray和array两种基本的对象
- C、NumPy是用于数据科学计算的基础模块
- D、NumPy能够对多维数组进行数值运算
正确答案: B:
知识点:
2
【单选题】【单选题】下列选项中表示数组维度的是( )。
- A、size
- B、shape
- C、dtype
- D、ndim
正确答案: D:ndim;
知识点:
3
【单选题】【单选题】代码“np.arange(0,1,0.2)”的运行结果为( )。
- A、[0.2, 0.4, 0.6,0.8]
- B、[0.,0.2, 0.4, 0.6,0.8]
- C、[0.,0.2,0.4,0.6,0.8,1.0]
- D、[0.2,0.4,0.6,0.8,1.0]
正确答案: B:[0.,0.2, 0.4, 0.6,0.8];
4
【单选题】【单选题】代码“np.linspace(0,10,5)”的运行结果为( )。
- A、[ 0., 2.5., 5., 7.5., 10.]
- B、[0., 2.5., 5., 7.5.]
- C、[0,2.5,5,7.5]
- D、[0,2.5,5,7.5,10]
正确答案: A:[ 0., 2.5., 5., 7.5., 10.];
5
【单选题】【单选题】下列用于横向组合数组的函数是( )
- A、vstack
- B、hsplit
- C、vsplit
- D、hstack
正确答案: D:hstack;
知识点:
.单选题(共8题,100.0分)
1
【单选题】下列关于pandas数据读/写说法正确的是( )
- A、to_csv()方法能够将结构化数据写入CSV文件
- B、read_sql函数能够读取所有数据库的数据
- C、read_csv 函数无法读取文本文档的数据
- D、to_csv()方法能够将结构化数据写入 Excel 文件
正确答案: A:
2
【单选题】下列关于pandas 基本操作说法错误的是( )。
- A、在创建 DataFrame 的过程中可同时设置索引
- B、在创建 DataFrame 后可设置索引
- C、使用 describe()方法可以对 DataFrame 进行描述性统计
- D、drop( )方法可以删除某列的数据
正确答案: C
3
【单选题】下列关于pandas支持的数据结构的说法错误的是( )。
- A、pandas 支持 Series 和 DataFrame
- B、Series 被定义为能够存储各种类型数据的一维数组
- C、pandas 只支持 Series 数据结构
- D、DataFrame 可与带有标记轴(行和列)的二维数组一起使用
正确答案: C:
知识点:
4
【单选题】以下分组操作中不涉及原始对象的是( )。
- A、应用一个函数
- B、分割对象
- C、聚合数据
- D、结合结果
正确答案: C:聚合数据;
5
【单选题】下列关于 apply( )方法说法正确的是( )。
- A、apply( )方法无法应用于分组操作
- B、apply( )方法作用范围:pandas 中的 Series 和 DataFrame
- C、apply( )方法只能对行、列进行操作
- D、apply( )方法中不能自定义函数
正确答案: B:apply( )方法作用范围:pandas 中的 Series 和 DataFrame;
知识点:
6
【单选题】下列关于分组聚合的说法错误的是( )。
- A、pandas分组方法只有一个groupby()方法
- B、pandas分组聚合操作能够实现组内标准化
- C、使用 pandas的groupby()方法进行分组时,只能对列进行操作
- D、pandas 聚合时能够使用agg()、apply()、transform()方法
正确答案: C:使用 pandas的groupby()方法进行分组时,只能对列进行操作;
7
【单选题】使用pivot_table函数制作透视表时可用下列( )参数设置行分组键。
- A、data
- B、raw
- C、values
- D、index
正确答案: D:index;
知识点:
8
【单选题】下列对DataFrame 的常用属性说法错误的是( )。
- A、column 可查看 DataFrame 的列名
- B、dtypes 可查看各列的数据类型
- C、values 可以获取元素
- D、index 可查看索引情况
正确答案: A:column 可查看 DataFrame 的列名;
.单选题(共9题,100.0分)
1
【单选题】在下列选项中可以进行主键合并的是( )。
- A、append( )
- B、combine_first( )
- C、concat
- D、merge
正确答案: D
2
【单选题】在下列选项中可以进行横向堆叠的是( )。
- A、join( )
- B、concat
- C、combine_first( )
- D、merge
正确答案: B:concat
3
【单选题】在下列选项中可以进行重叠合并的是( )
- A、combine_first( )
- B、concat
- C、merge
- D、append( )
正确答案: A:combine_first( )
4
【单选题】下列关于pandas中drop_duplicates()方法的说法正确的是( )。
- A、drop_duplicates()方法不会改变原数据的排列
- B、drop_duplicates()是常用的主键合并方法,能够实现左连接和右连接
- C、drop_duplicates(方法只对DataFrame有效
- D、drop_duplicates()方法仅支持单一特征数据去重
正确答案: A:drop_duplicates()方法不会改变原数据的排列;
5
【单选题】下列关于特征去重的说法错误的是( )。
- A、corr( )方法可通过相似度矩阵去重
- B、可通过equals()方法进行特征去重
- C、相似度矩阵去重可对任意类型的重复特征去重
- D、相似度矩阵去重只能对数值型的重复特征去重
正确答案: C:相似度矩阵去重可对任意类型的重复特征去重;
知识点:
6
【单选题】在下列选项中可以进行特征删除的是( )。
- A、dropna()方法
- B、notnull( )方法
- C、fillna()方法
- D、isnull()方法
正确答案: A:dropna()方法;
7
【单选题】在下列选项中可以进行缺失值替换的是( )。
- A、fillna()方法
- B、notnull()方法
- C、dropna()方法
- D、isnull()方法
正确答案: A:fillna()方法;
8
【单选题】下列关于插值法的说法错误的是( )
- A、线性插值通过求解线性方程得到缺失值
- B、常见的线性插值有拉格朗日插值和牛顿插值
- C、常见的插值法有线性插值、多项式插值和样条插值
- D、pandas 中的interpolate()方法可进行插值操作
正确答案: B:常见的线性插值有拉格朗日插值和牛顿插值;
9
【单选题】在下列选项中可以进行哑变量处理的是( )。
- A、dummies 函数
- B、get_cut 函数
- C、get_dummies 函数
- D、cut 函数
正确答案: C:get_dummies 函数;
10在下列选项中不属于检测与处理缺失值的方法的是( )
A.插值法
B.替换法
C.哑变量处理
D.删除法 C
.单选题(共10题,100.0分)
1
【单选题】下列关于绘图的标准流程说法错误的是( )。
- A、添加标题、坐标轴标签,绘制图形等步骤没有先后顺序
- B、添加图例必须在绘制图形之后进行
- C、绘图之前必须先创建画布,不可省略
- D、绘图流程的最后部分是保存和显示图形
正确答案: C
2
【单选题】pyplot 使用 rc 配置文件来自定义图形的各种默认属性,用于修改线条上点的形状的rc参数名称是( )。
- A、lines.markersize
- B、lines.marker
- C、lines.linestyle
- D、lines.linewidth
正确答案: B:
3
【单选题】下列代码中能够为图形添加图例的是( )。
- A、plt.xticks([0,1,2,3,4])
- B、plt.plot(x, y)
- C、plt.title(‘散点图’)
- D、plt.legend(‘y = cos x’)
正确答案: D
4
【单选题】下列图形常用于分析各分组数据在总数据中所占比例的是( )
- A、箱线图
- B、柱形图
- C、饼图
- D、折线图
正确答案: C
5
【单选题】下列说法不正确的是( )。
- A、柱形图可以用于查看整体数据的数量分布
- B、散点图可以用于查看数据中的离群值
- C、箱线图可以用于查看特征间的相关关系
- D、折线图可以用于查看数据的数量差异和变化趋势
正确答案: C
知识点:
6
【单选题】下列有关seaborn库说法正确的是( )。
- A、在 seaborn 库的主题样式中 darkgrid 表示黑色背景
- B、seaborn库是Matplotlib库的替代者
- C、使用 despine 函数可以设置图形的边框
- D、使用 set_context 函数可以设置主题样式
正确答案: C
7
【单选题】HLS颜色空间中的H表示为( )
- A、空间大小
- B、饱和度
- C、色调
- D、亮度
正确答案: C
8
【单选题】下列不是系列配置项的是( )。
- A、标签配置项
- B、文本样式配置项
- C、标记点配置项
- D、标题配置项
正确答案: D
9
【单选题】下列有关全局配置项说法错误的是( )。
- A、全局配置项可以对标题、图例、坐标轴等的配置项进行配置
- B、TitleOpts类和 AxisOpts 类的参数设置完全相同
- C、使用LegendOpts类配置图例配置项
- D、使用 TitleOpts 类配置标题配置项
正确答案: B
10
【单选题】下列说法正确的是( )。
- A、stripplot 函数接收的数据只能是列表和数据框
- B、基本散点图和 3D 散点图的绘制方法相同
- C、热力图可用于了解数据集中的变量的相关关系
- D、使用 stripplot 函数可以绘制线性回归拟合图
正确答案: C
.单选题(共5题,100.0分)
1
【单选题】skleam转换器的主要方法不包括( )。
- A、transform( )
- B、fit_transform( )
- C、fit( )
- D、fit_transforms( )
正确答案: D
2
【单选题】sklearn 中用于对特征进行归一化的函数是( )。
- A、StandardScaler
- B、Binarizer
- C、MinMaxScaler
- D、Normalizer
正确答案: D
3
【单选题】下列算法中属于分类方法的是( )。
- A、SVC 算法
- B、K-MEDOIDS 算法
- C、CLARANS 算法
- D、CLIOUE 算法
正确答案: A
4
【单选题】classification_report函数用于输出分类模型评价报告,其内容不包括( )。
- A、true_postive_rate
- B、fl-score I
- C、recall
- D、precision
正确答案: A
5
【单选题】下列关于回归模型评价指标说法不正确的是( )。
- A、均方误差越接近0,模型性能越差
- B、平均绝对误差的值越接近 0,模型性能越好
- C、可解释方差越接近 0,模型性能越差。
- D、R²值越接近1,模型性能越好
正确答案: A
二.多选题(共3题,30.0分)
1
【多选题】【多选题】下列关于 Jupyter Notebook 的描述错误的是( )
- A、Jupyter Notebook Markdown 无法使用 LaTeX 语法
- B、Jupyter Notebook 有两种单元形式
- C、Jupyter Notebook 仅仅支待 Python 语言
- D、Jupyter Notebook 有两种模式
2
【多选题】【多选题】下列关于 Python 数据分析库的描述错误的是( )
- A、NumPy 的在线安装不需要其他任何辅助工具
- B、scikit-learn 包含所有算法
- C、pandas 能够实现数据的整理工作
- D、SciPy 的主要功能是可视化图表
正确答案: ABD
3
【多选题】【多选题】下列属于 Anaconda 主要特点的是( )
- A、额外的加速和优化是免费的
- B、包含了众多流行的科学、数学、工程、数据分析的 Python
- C、支持 Python 2.6 2.7 3.4 3.5 3.6, 可自由切换
- D、完全开源和免费
正确答案: BCD: