配置文件官网
可以参考官网的说明
属性参数
属性名 | 默认值 | 说明 |
---|
type | 无(必须指定) | 组件类型名称,必须是"hive" |
hive.metastore | 无(必须指定) | 元数据仓库地址,例如:thrift://node3:9083 |
hive.database | 无(必须指定) | 数据库名称 |
hive.table | 无(必须指定) | 表名 |
hive.partition | 无(可选) | 逗号分割的分区值,标识写到哪个分区。可以包含逃逸字符。例如,如果表分区字段为(continent: string, country: string, time: string),则"Asia,India,2030-05-26-01-21"表示continent为Asia,country为India,time是2030-05-26-01-21 |
callTimeout | 10000 | Hive和HDFS的IO操作超时时间,例如openTxn、write、commit、abort等操作。单位为毫秒 |
batchSize | 15000 | 一个Hive事务允许写的事件最大数量 |
roundValue | 1 | 控制多长时间生成一个文件夹的时间的值 |
roundUnit | minute | 控制多长时间生成一个文件夹的单位,可选值有:second、minute、hour |
例子
agent.name = a1
a1.sources = r1
a1.channels = c1
a1.sinks = k1
a1.sources.r1.type = netcat
a1.sources.r1.bind = 0.0.0.0
a1.sources.r1.port = 44444
a1.channels.c1.type = memory
a1.channels.c1.capacity = 10000
a1.channels.c1.transactionCapacity = 1000
a1.sinks.k1.type = hive
a1.sinks.k1.hive.metastore = thrift://node3:9083
a1.sinks.k1.hive.database = my_database
a1.sinks.k1.hive.table = my_table
a1.sinks.k1.hive.partition = Asia,India,2030-05-26-01-21
a1.sinks.k1.callTimeout = 15000
a1.sinks.k1.batchSize = 20000
a1.sinks.k1.roundValue = 1
a1.sinks.k1.roundUnit = hour
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1