分类目录归档:大数据

flume时间戳插件

flume修改时间戳的插件,地址在这里: https://github.com/ … 继续阅读

发表在 大数据, 未分类 | 留下评论

从头开始写flume采样过滤器插件

flume提供了自己编写过滤器的机制,但是对于我等java hello worl … 继续阅读

发表在 大数据 | 留下评论

hadoop清理打开文件

最近有同学反馈在查询hive的时候会遇到如下报错: cause:java.io. … 继续阅读

发表在 大数据 | 留下评论

hive更换正则切分到分隔符

线上会把nginx日志送入hdfs中供hive查询,之前nginx的日志格式是传 … 继续阅读

发表在 大数据 | 留下评论

hive权限控制hdfs实现

hive权限控制可以使用hive自带的权限控制,也可以用hdfs来做权限控制 h … 继续阅读

发表在 大数据, 好玩的linux, 未分类 | 留下评论