
《Spark大数据分析与内存计算》——第八章
什么库是Databricks公司发布的基于Spark平台的并行图计算库A. GraphFramesB. Spark StreamingC. DataFrameD. GraphX
第八章作业及答案
快捷查找:Ctrl+F 在搜索框中输入题目
一. 单选题(共4题)
1. (单选题)什么库是Databricks公司发布的基于Spark平台的并行图计算库
A. GraphFrames
B. Spark Streaming
C. DataFrame
D. GraphX
正确答案: A:GraphFrames ;
2. (单选题)什么可用于发现网络中环,经常用于社交网络,发现社交圈子,算法使用顶点ID标注图中每个连通体,将连通体中序号最小的顶点的ID作为连通体的ID
A. PageRank算法
B. 标签传播算法
C. 三角形计数
D. 连通分量
正确答案: D:连通分量 ;
3. (单选题)Spark项目中的什么模块用于图及图并行计算
A. Spark SQL
B. Spark Streaming
C. DataFrame
D. GraphX
正确答案: D:GraphX ;
4. (单选题)什么用于确定通过图数据集中每个顶点的三角形数量。当计算三角形个数时,图都被作为无向图处理,平行边仅计算一次,自环则会被忽略。
A. PageRank算法
B. 标签传播算法
C. 连通分量
D. 三角形计数
正确答案: D:三角形计数 ;
二. 多选题(共1题)
5. (多选题)GraphFrames实现的算法包括
A. 三角形计数
B. 广度优先搜索
C. 连通分量
D. 最短路径
正确答案: ABCD:三角形计数 ; 广度优先搜索 ; 连通分量 ; 最短路径 ;
三. 判断题(共5题)
6. (判断题)广度优先搜索是最常用的图搜索算法之一。
A. 对
B. 错
正确答案: 对
7. (判断题)GraphFrames中最短路径算法实际上是通过封装GraphX的最短路径算法实现的,GraphX实现的是单源最短路径,采用经典的Dijkstra(迪杰斯特拉)算法。
A. 对
B. 错
正确答案: 对
8. (判断题)PageRank算法最初是拉里?/span>佩奇和谢尔盖?/span>布林用来解决搜索引擎中网页排名的,故又称网页排名算法、Google左侧排名或佩奇排名。
A. 对
B. 错
正确答案: 对
9. (判断题)连通分量可用于发现网络中环,经常用于社交网络,发现社交圈子,算法使用顶点ID标注图中每个连通体,将连通体中序号最小的顶点的ID作为连通体的ID。
A. 对
B. 错
正确答案: 对
10. (判断题)三角形计数用于确定通过图数据集中每个顶点的三角形数量。当计算三角形个数时,图都被作为无向图处理,平行边仅计算一次,自环则会被忽略。
A. 对
B. 错
正确答案: 对
更多推荐
所有评论(0)