在上家公司工作时,设计的日志收集与实时分析架构,还是比较简单的:
创新互联建站企业建站,十年网站建设经验,专注于网站建设技术,精于网页设计,有多年建站和网站代运营经验,设计师为客户打造网络企业风格,提供周到的建站售前咨询和贴心的售后服务。对于网站设计制作、成都网站制作中不同领域进行深入了解和探索,创新互联在网站建设中充分了解客户行业的需求,以灵动的思维在网页中充分展现,通过对客户行业精准市场调研,为客户提供的解决方案。
flume-ng + rocketmq + storm + redis + 前端展示
消息队列部分,我们刚开始采用的是kafka,但 kafka在支持回溯消费和重复消费方面比较弱,同时在数据安全方面也相对弱一些,后来我们改为阿里的rocketmq。
考虑到我们的数据量也不是很大,已经能够足够支撑,但在rocketmq这层,有时会因为网络异常问题,会产生消息堆积,导致消息队列被冲爆,稳定性还不是非常高,后来咨询了其他部门的同事,他们的做法是,在消息队列这一层次,额外增加了一层MongoDB,消息队列这层仅保留消息的索引信息,消息的实体信息保存在mongodb中,可以很好地回避此问题,后来由于各种原因就没有再去尝试此方法......
其他一些常用方案:
logstash + elasticsearch + kibana
fluentd + influxdb + grafana
flume-ng + kafka + storm
kafka + spark streaming + redis
新闻标题:日志实时分析架构
本文路径:http://scpingwu.com/article/ishgeg.html