文档
测试

构建Cube

PUT
http://192.168.88.132:7070/kylin/api/cubes/{cubeName}/rebuild

接口描述

构建并计算某个cube,即多为立方体的数据计算

请求头

参数名
类型
描述
必填
Authorization
string
示例:Basic QURNSU46S1lMSU4=
必填
Content-Type
string
示例:application/json
必填

请求参数

参数名
类型
描述
必填
buildType
string
示例:BUILD
必填
startTime
long
必填
endTime
long
必填

响应参数

参数名
类型
描述
必填
uuid
string
示例:9f67b428-86e7-c62f-dea6-e5a5cd9d61a9
必填
last_modified
number
示例:1588065188362
必填
version
string
示例:2.6.0.20500
必填
name
string
示例:BUILD CUBE - cube_test2 - FULL_BUILD - CST 2020-04-28 17:13:08
必填
type
string
示例:BUILD
必填
duration
number
示例:0
必填
related_cube
string
示例:cube_test2
必填
display_cube_name
string
示例:cube_test2
必填
related_segment
string
示例:0cf00549-639a-c102-2dbc-984ded580d87
必填
exec_start_time
number
示例:0
必填
exec_end_time
number
示例:0
必填
exec_interrupt_time
number
示例:0
必填
mr_waiting
number
示例:0
必填
steps
array
数据列表
必填
interruptCmd
object
示例:null
必填
id
string
示例:9f67b428-86e7-c62f-dea6-e5a5cd9d61a9-00
必填
name
string
示例:Create Intermediate Flat Hive Table
必填
sequence_id
number
示例:0
必填
exec_cmd
object
示例:null
必填
interrupt_cmd
object
示例:null
必填
exec_start_time
number
示例:0
必填
exec_end_time
number
示例:0
必填
exec_wait_time
number
示例:0
必填
step_status
string
示例:PENDING
必填
cmd_type
string
示例:SHELL_CMD_HADOOP
必填
info
object
数据字典
必填
run_async
boolean
示例:false
必填
submitter
string
示例:ADMIN
必填
job_status
string
示例:PENDING
必填
build_instance
string
示例:unknown
必填
progress
number
示例:0
必填

说明 / 示例

示例: http://192.168.88.132:7070/kylin/api/cubes/cube_test2/rebuild 参数:{"buildType":"BUILD","startTime":0,"endTime":0} 参数说明: startTime - 增量构建的开始时间, 例如: 1388563200000 for 2014-1-1,如果全量构建则为0 endTime - 增量构建的结束时间,如果全量构建则为0 buildType - 必要参数,有如下选择: ‘BUILD’, ‘MERGE’, ‘REFRESH’ 构建说明: Cube的构建包括以下步骤,由任务调度引擎执行: 1、创建临时的Hive平表(从Hive中读取数据) 2、计算各维度的不同值,并收集各Cuboid的统计数据 3、创建并保存字典 4、保存Cuboid统计信息 5、创建HTable 6、计算Cube(一轮或者若干轮) 7、将Cube计算结果转成Hive 8、加载HFile到HBase 9、更新Cube元数据 10、垃圾回收 注:Cuboid特指Kylin中在某一维度组合下所计算的数据。 Cube的构建方式包括全量构建和增量构建: 全量构建:对数据模型中没有指定分隔时间列信息的Cube,采用全量构建,适用于以下两种情况:(1)事实表的数据不是按时间增长的;(2)事实表的数据比较小或更新频率很低,全量构建不会造成太大的存储空间浪费 增量构建:进行增量构建的时候每次会从Hive中读取一个时间范围内的数据,下次构建的时候自动以上次结束的时间为起点时间