本文为尚硅谷Flume课程随堂笔记
一、 项目介绍
在本案例中使用flume接收数据,并给每条数据添加前缀,输出到控制台。前缀可从flume配置文件中配置。
整个架构大致如下图:
官方也提供了自定义source
的接口:
https://flume.apache.org/FlumeDeveloperGuide.html#source 根据官方说明自定义MySource
需要继承AbstractSource
类并实现Configurable
和PollableSource
接口。
二、 构建自定义Source代码
1.创建maven项目
<dependency>
<groupId>org.apache.flume</groupId>
<artifactId>flume-ng-core</artifactId>
<version>1.7.0</version>
</dependency>
2. 构建自定义类
首先创建自定义类继承AbstractSource
类并实现Configurable
和PollableSource
接口。
具体代码如下:
import org.apache.flume.Context;
import org.apache.flume.Event;
import org.apache.flume.EventDeliveryException;
import org.apache.flume.PollableSource;
import org.apache.flume.conf.Configurable;
import org.apache.flume.event.SimpleEvent;
import org.apache.flume.source.AbstractSource;
/**
* @author suiwo
* @title MySource
* @date 2020/6/2 13:19
* @description //todo
*/
public class MySource extends AbstractSource implements Configurable, PollableSource {
private String prefix;
private String subfix;
@Override
public void configure(Context context) {
prefix = context.getString("prefix");
subfix = context.getString("sub","noSubfix");
}
/**
* 1. 接收数据(for循环造数据)
* 2. 封装为时间
* 3. 将时间传给Channel
*/
@Override
public Status process() throws EventDeliveryException {
Status status = null;
// 1. 接受数据
try {
for (int i = 0; i < 5; i++) {
// 2. 构建事件对象
SimpleEvent event = new SimpleEvent();
// 3. 给事件设置值
event.setBody((prefix + "--" + i + "--" + subfix).getBytes());
// 4. 将时间传递给Channel
getChannelProcessor().processEvent(event);
status = Status.READY;
}
} catch (Exception e) {
status = Status.BACKOFF;
e.printStackTrace();
}
try {
Thread.sleep(2000);
} catch (InterruptedException e) {
e.printStackTrace();
}
return status;
}
@Override
public long getBackOffSleepIncrement() {
return 0;
}
@Override
public long getMaxBackOffSleepInterval() {
return 0;
}
}
3. maven打包
将项目打包,并将项目放至flume的lib目录下
三、编写Flume相关配置
1. 编写my-source.conf
# Name the components on this agent
a1.sources = r1
a1.sinks = k1
a1.channels = c1
# Describe/configure the source
a1.sources.r1.type = xyz.suiwo.flume.source.MySource
a1.sources.r1.prefix = suiwo
a1.sources.r1.subfix = zaixian
# Describe the sink
a1.sinks.k1.type = logger
# Use a channel which buffers events in memory
a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100
# Bind the source and sink to the channel
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1
四、 启动测试
执行下面指令启动服务
bin/flume-ng agent -c conf -f job/my-source.conf -n a1 -Dflume.root.logger=INFO,console
此时可以发现prefix参数获取成功,subfix因为配置文件中未配置,所以使用默认值