1、【单选题】【单选题】下列关于数据和数据分析的说法正确的是( )
A、数据就是数据库中的表格
B、文字、声音、图像这些都是数据
C、数据分析的数据只能是结构化的
D、数据分析不可能预测未来几天的天气变化
正确答案: B :文字、声音、图像这些都是数据;
2
【单选题】【单选题】下列关于数据分析流程的说法错误的是( )
A、需求分析是数据分析最重要的一部分
B、模型评价能够评价模型的优劣
C、分析与建模时只能够使用数值型数据
D、数据预处理是能够建模的前提
正确答案: C :分析与建模时只能够使用数值型数据;
3
【单选题】下列关于分析与建模流程的说法错误的是( )
A、分析与建模的模型选择要根据需求确定
B、分析与建模丁作是数据分析的核心
C、分析和建模时可以选择多个模型,同时分析
D、传统的统计对比分析不属于分析与建模流程
正确答案: D :传统的统计对比分析不属于分析与建模流程;
4
【单选题】下列关于模型评价与优化的说法正确的是( )
A、模型评价的目的是为了确认模型的有效性
B、所有的模型评价方法相同
C、模型评价结果良好,模型一定可用,不需要重构
D、模型构建完成就可以使用
正确答案: A :模型评价的目的是为了确认模型的有效性;
5
【单选题】下列不属于数据分析应用场景的是( )
A、计算机硬盘使用寿命预测
B、码头货物吞吐址预测
C、某人一生的命运预测
D、产品销拭分析
正确答案: C :某人一生的命运预测;
6
【单选题】下列不属于 Python 优势的是( )
A、拥有大量的第 方库,能够调用 C++ Java 语言
B、开源免费
C、语法简洁,程序开发速度快
D、程序的运行速度在所有计算机语言中最快
正确答案: D :程序的运行速度在所有计算机语言中最快;
知识点:
7
【单选题】Jupyter Notebook 不具备的功能是( )
A、Jupyter Notebook 可以将文件分享给他人
B、Jupyter Notebook 可以直接生成一份交互式文档
C、Jupyter Notebook 可以导出 HTML 文件
D、Jupyter Notebook 可以安装 Python
正确答案: D :Jupyter Notebook 可以安装 Python
一.单选题(共5题,100.0分)
1
【单选题】【单选题】下列对Python中的NumPy描述不正确的是( )。
A、NumPy的数据容器能够保存任意类型的数据
B、NumPy提供ndarray和array两种基本的对象
C、NumPy是用于数据科学计算的基础模块
D、NumPy能够对多维数组进行数值运算
正确答案: B :
知识点:
2
【单选题】【单选题】下列选项中表示数组维度的是( )。
A、size
B、shape
C、dtype
D、ndim
正确答案: D :ndim;
知识点:
3
【单选题】【单选题】代码“np.arange(0,1,0.2)”的运行结果为( )。
A、[0.2, 0.4, 0.6,0.8]
B、[0.,0.2, 0.4, 0.6,0.8]
C、[0.,0.2,0.4,0.6,0.8,1.0]
D、[0.2,0.4,0.6,0.8,1.0]
正确答案: B :[0.,0.2, 0.4, 0.6,0.8];
4
【单选题】【单选题】代码“np.linspace(0,10,5)”的运行结果为( )。
A、[ 0., 2.5., 5., 7.5., 10.]
B、[0., 2.5., 5., 7.5.]
C、[0,2.5,5,7.5]
D、[0,2.5,5,7.5,10]
正确答案: A :[ 0., 2.5., 5., 7.5., 10.];
5
【单选题】【单选题】下列用于横向组合数组的函数是( )
A、vstack
B、hsplit
C、vsplit
D、hstack
正确答案: D :hstack;
知识点:
.单选题(共8题,100.0分)
1
【单选题】下列关于pandas数据读/写说法正确的是( )
A、to_csv()方法能够将结构化数据写入CSV文件
B、read_sql函数能够读取所有数据库的数据
C、read_csv 函数无法读取文本文档的数据
D、to_csv()方法能够将结构化数据写入 Excel 文件
正确答案: A :
2
【单选题】下列关于pandas 基本操作说法错误的是( )。
A、在创建 DataFrame 的过程中可同时设置索引
B、在创建 DataFrame 后可设置索引
C、使用 describe()方法可以对 DataFrame 进行描述性统计
D、drop( )方法可以删除某列的数据
正确答案: C
3
【单选题】下列关于pandas支持的数据结构的说法错误的是( )。
A、pandas 支持 Series 和 DataFrame
B、Series 被定义为能够存储各种类型数据的一维数组
C、pandas 只支持 Series 数据结构
D、DataFrame 可与带有标记轴(行和列)的二维数组一起使用
正确答案: C :
知识点:
4
【单选题】以下分组操作中不涉及原始对象的是( )。
A、应用一个函数
B、分割对象
C、聚合数据
D、结合结果
正确答案: C :聚合数据;
5
【单选题】下列关于 apply( )方法说法正确的是( )。
A、apply( )方法无法应用于分组操作
B、apply( )方法作用范围:pandas 中的 Series 和 DataFrame
C、apply( )方法只能对行、列进行操作
D、apply( )方法中不能自定义函数
正确答案: B :apply( )方法作用范围:pandas 中的 Series 和 DataFrame;
知识点:
6
【单选题】下列关于分组聚合的说法错误的是( )。
A、pandas分组方法只有一个groupby()方法
B、pandas分组聚合操作能够实现组内标准化
C、使用 pandas的groupby()方法进行分组时,只能对列进行操作
D、pandas 聚合时能够使用agg()、apply()、transform()方法
正确答案: C :使用 pandas的groupby()方法进行分组时,只能对列进行操作;
7
【单选题】使用pivot_table函数制作透视表时可用下列( )参数设置行分组键。
A、data
B、raw
C、values
D、index
正确答案: D :index;
知识点:
8
【单选题】下列对DataFrame 的常用属性说法错误的是( )。
A、column 可查看 DataFrame 的列名
B、dtypes 可查看各列的数据类型
C、values 可以获取元素
D、index 可查看索引情况
正确答案: A :column 可查看 DataFrame 的列名;
.单选题(共9题,100.0分)
1
【单选题】在下列选项中可以进行主键合并的是( )。
A、append( )
B、combine_first( )
C、concat
D、merge
正确答案: D
2
【单选题】在下列选项中可以进行横向堆叠的是( )。
A、join( )
B、concat
C、combine_first( )
D、merge
正确答案: B :concat
3
【单选题】在下列选项中可以进行重叠合并的是( )
A、combine_first( )
B、concat
C、merge
D、append( )
正确答案: A :combine_first( )
4
【单选题】下列关于pandas中drop_duplicates()方法的说法正确的是( )。
A、drop_duplicates()方法不会改变原数据的排列
B、drop_duplicates()是常用的主键合并方法,能够实现左连接和右连接
C、drop_duplicates(方法只对DataFrame有效
D、drop_duplicates()方法仅支持单一特征数据去重
正确答案: A :drop_duplicates()方法不会改变原数据的排列;
5
【单选题】下列关于特征去重的说法错误的是( )。
A、corr( )方法可通过相似度矩阵去重
B、可通过equals()方法进行特征去重
C、相似度矩阵去重可对任意类型的重复特征去重
D、相似度矩阵去重只能对数值型的重复特征去重
正确答案: C :相似度矩阵去重可对任意类型的重复特征去重;
知识点:
6
【单选题】在下列选项中可以进行特征删除的是( )。
A、dropna()方法
B、notnull( )方法
C、fillna()方法
D、isnull()方法
正确答案: A :dropna()方法;
7
【单选题】在下列选项中可以进行缺失值替换的是( )。
A、fillna()方法
B、notnull()方法
C、dropna()方法
D、isnull()方法
正确答案: A :fillna()方法;
8
【单选题】下列关于插值法的说法错误的是( )
A、线性插值通过求解线性方程得到缺失值
B、常见的线性插值有拉格朗日插值和牛顿插值
C、常见的插值法有线性插值、多项式插值和样条插值
D、pandas 中的interpolate()方法可进行插值操作
正确答案: B :常见的线性插值有拉格朗日插值和牛顿插值;
9
【单选题】在下列选项中可以进行哑变量处理的是( )。
A、dummies 函数
B、get_cut 函数
C、get_dummies 函数
D、cut 函数
正确答案: C :get_dummies 函数;
10在下列选项中不属于检测与处理缺失值的方法的是( )
A.插值法
B.替换法
C.哑变量处理
D.删除法 C
.单选题(共10题,100.0分)
1
【单选题】下列关于绘图的标准流程说法错误的是( )。
A、添加标题、坐标轴标签,绘制图形等步骤没有先后顺序
B、添加图例必须在绘制图形之后进行
C、绘图之前必须先创建画布,不可省略
D、绘图流程的最后部分是保存和显示图形
正确答案: C
2
【单选题】pyplot 使用 rc 配置文件来自定义图形的各种默认属性,用于修改线条上点的形状的rc参数名称是( )。
A、lines.markersize
B、lines.marker
C、lines.linestyle
D、lines.linewidth
正确答案: B :
3
【单选题】下列代码中能够为图形添加图例的是( )。
A、plt.xticks([0,1,2,3,4])
B、plt.plot(x, y)
C、plt.title('散点图')
D、plt.legend('y = cos x')
正确答案: D
4
【单选题】下列图形常用于分析各分组数据在总数据中所占比例的是( )
A、箱线图
B、柱形图
C、饼图
D、折线图
正确答案: C
5
【单选题】下列说法不正确的是( )。
A、柱形图可以用于查看整体数据的数量分布
B、散点图可以用于查看数据中的离群值
C、箱线图可以用于查看特征间的相关关系
D、折线图可以用于查看数据的数量差异和变化趋势
正确答案: C
知识点:
6
【单选题】下列有关seaborn库说法正确的是( )。
A、在 seaborn 库的主题样式中 darkgrid 表示黑色背景
B、seaborn库是Matplotlib库的替代者
C、使用 despine 函数可以设置图形的边框
D、使用 set_context 函数可以设置主题样式
正确答案: C
7
【单选题】HLS颜色空间中的H表示为( )
A、空间大小
B、饱和度
C、色调
D、亮度
正确答案: C
8
【单选题】下列不是系列配置项的是( )。
A、标签配置项
B、文本样式配置项
C、标记点配置项
D、标题配置项
正确答案: D
9
【单选题】下列有关全局配置项说法错误的是( )。
A、全局配置项可以对标题、图例、坐标轴等的配置项进行配置
B、TitleOpts类和 AxisOpts 类的参数设置完全相同
C、使用LegendOpts类配置图例配置项
D、使用 TitleOpts 类配置标题配置项
正确答案: B
10
【单选题】下列说法正确的是( )。
A、stripplot 函数接收的数据只能是列表和数据框
B、基本散点图和 3D 散点图的绘制方法相同
C、热力图可用于了解数据集中的变量的相关关系
D、使用 stripplot 函数可以绘制线性回归拟合图
正确答案: C
.单选题(共5题,100.0分)
1
【单选题】skleam转换器的主要方法不包括( )。
A、transform( )
B、fit_transform( )
C、fit( )
D、fit_transforms( )
正确答案: D
2
【单选题】sklearn 中用于对特征进行归一化的函数是( )。
A、StandardScaler
B、Binarizer
C、MinMaxScaler
D、Normalizer
正确答案: D
3
【单选题】下列算法中属于分类方法的是( )。
A、SVC 算法
B、K-MEDOIDS 算法
C、CLARANS 算法
D、CLIOUE 算法
正确答案: A
4
【单选题】classification_report函数用于输出分类模型评价报告,其内容不包括( )。
A、true_postive_rate
B、fl-score I
C、recall
D、precision
正确答案: A
5
【单选题】下列关于回归模型评价指标说法不正确的是( )。
A、均方误差越接近0,模型性能越差
B、平均绝对误差的值越接近 0,模型性能越好
C、可解释方差越接近 0,模型性能越差。
D、R²值越接近1,模型性能越好
正确答案: A
二.多选题(共3题,30.0分)
1
【多选题】【多选题】下列关于 Jupyter Notebook 的描述错误的是( )
A、Jupyter Notebook Markdown 无法使用 LaTeX 语法
B、Jupyter Notebook 有两种单元形式
C、Jupyter Notebook 仅仅支待 Python 语言
D、Jupyter Notebook 有两种模式
2
【多选题】【多选题】下列关于 Python 数据分析库的描述错误的是( )
A、NumPy 的在线安装不需要其他任何辅助工具
B、scikit-learn 包含所有算法
C、pandas 能够实现数据的整理工作
D、SciPy 的主要功能是可视化图表
正确答案: ABD
3
【多选题】【多选题】下列属于 Anaconda 主要特点的是( )
A、额外的加速和优化是免费的
B、包含了众多流行的科学、数学、工程、数据分析的 Python
C、支持 Python 2.6 2.7 3.4 3.5 3.6, 可自由切换
D、完全开源和免费
正确答案: BCD :