初识Kafka及实践

Kafka是一种高吞吐量的分布式订阅消息系统,这里我们将Kafka作为数据源,让Kafka产生数据发送给Spark Streaming应用程序,Spark Streaming应用程序再对接收到的数据进行实时处理,从而完成一个典型的流计算过程。
实验步骤如下:

./bin/zookeeper-server-start.sh config/zookeeper.properties

bin/kafka-server-start.sh config/server.properties

./bin/kafka-topics.sh  --create  --zookeeper  localhost:2181  \
>--replication-factor  1  --partitions  1  --topic  wordsendertest

可以用list列出所有创建的Topic，验证是否创建成功

./bin/kafka-topics.sh  --list  --zookeeper  localhost:2181

 ./bin/kafka-console-producer.sh  --broker-list  localhost:9092 \
>  --topic  wordsendertest

./bin/kafka-console-consumer.sh  --zookeeper  localhost:2181  \
> --topic  wordsendertest  --from-beginning

在生产者终端即数据输入端任意输入一些数据,即可在消费者终端即显示终端看到实时输入的数据了.