数据源模块

创建完工程(Project)后,要为该project添加数据源。 数据源只支持Hive,无需手动配置,在整个Hadoop生态集群(至少包含mapreduce、yarn、Hive、HBase、Zookeeper、kylin)启动后,kylin会自动关联到当前生态环境中的Hive。 这里所说的数据源是指在连接到数仓Hive的前提下,去选择Hive中的数据库及库中的相关表。 ## 添加数据表 ![image.png](https://cos.easydoc.net/25469987/files/kbq5d9c8.png) 数据表的添加有两种方式: **方式一**:直接填写所需的数据库及数据表,参考如下: ![image.png](https://cos.easydoc.net/25469987/files/kbly9ndn.png) 直接在输入框中填入所要加载的数据表,格式为:db1.table1,db1.table2,db1.table3, 以英文逗号结尾。 计算列基数(Calculate column cadinality),默认是为真,添加计算。 **方式二**:直接从数据库树状图上进行选择,参考如下: ![image.png](https://cos.easydoc.net/25469987/files/kblz279c.png) 主要是分为三部分: 1. 列出当前Hive下的所有数据库 2. 点击数据库,展开列出其下的所有表 3. 填写数据表的过滤条件 ## 列表 用于列出当前project的数据表及其相关信息。 参考如下: ![image.png](https://cos.easydoc.net/25469987/files/kblzteui.png) ### Tables展示 以结构树的形式展示当前所有的数据表, 父节点为数据库,可以有多个; 子节点为该库下添加的数据表,不是原数据库下的所有数据表,而是添加数据表时所选择添加的数据表; 孙节点为当前表下的所有数据列,==该节点可以不用展示== ### 表信息 当点击左侧树结构下的某个数据库下的数据表时,右侧呈现出当前表的详细信息。 分为六个功能点:重载数据表(Reload Table)、删除数据表(Unload Table)、列信息(Columns)、元数据(Extend Information)、权限(Access)、快照(Snapshot) 参考如下: ![image.png](https://cos.easydoc.net/25469987/files/kbq52aak.png) **重载数据表** ==该功能当前阶段可以不用考虑== 根据目前测试,当我更改表结构后,使用功能后,展现的依然是以前的表结构,此处可能是个bug. **删除数据表** 从加载的数据表中删除某个加载的表。 **列信息** 列信息包括:编号id、列名(Name)、数据类型(Data Type)、基数(Cardinality)、注释(Comment) ![image.png](https://cos.easydoc.net/25469987/files/kbm0f301.png) **元数据** 元数据信息主要包括:表名(TABLE NAME)、数据库(DATABASE)、表类型(TABLE TYPE)、快照时间(SNAPSHOT TIME)、文件地址(LOCATION)、输入格式(INPUT FORMAT)、输出格式(OUTPUT FORMAT)、所属用户(OWNER)、表文件总数(TOTAL FILE NUMBER)、总文件大小(TOTAL FILE SIZE)、分区(PARTITIONED)、分区列(PARTITION COLUMNS) ![image.png](https://cos.easydoc.net/25469987/files/kbm0hvy8.png) **快照** ==该功能当前阶段可以不用考虑== Snapshot,使用当前表数据的cuboid,在cube计算前是空,只有cube计算完后才会有这个信息展示。 ![image.png](https://cos.easydoc.net/25469987/files/kbq4v80b.png) **Access** ==该功能当前阶段可以不用考虑== 列出当前可操作此表的用户或角色 ![image.png](https://cos.easydoc.net/25469987/files/kbq4zm0k.png)