当前位置: 首页 > news >正文

淄博网站建设及托管网站seo内容优化

淄博网站建设及托管,网站seo内容优化,百度推广网站建设,ae免费素材网站Shell定时上传日志到HDFS 一、任务需求二、实现思路三、具体实现流程3.1 规划文件上传目录3.2 开发 shell 脚本3.3 授予 shell 可执行权限3.4 手动执行查看3.4 定时执行 shell 脚本 一、任务需求 公司在线服务器每天都会产生网站运行日志,为了避免志文件过大&#…

Shell定时上传日志到HDFS

  • 一、任务需求
  • 二、实现思路
  • 三、具体实现流程
    • 3.1 规划文件上传目录
    • 3.2 开发 shell 脚本
    • 3.3 授予 shell 可执行权限
    • 3.4 手动执行查看
    • 3.4 定时执行 shell 脚本

一、任务需求

公司在线服务器每天都会产生网站运行日志,为了避免志文件过大,日志文件需按照群,后期再使用MapReduce计每小时进行回滚,现在要求每小时定时上传日志文件到算框架定时处理日志文件。

二、实现思路

在线服务器每小时滚动生成的访问日志文件名称为access.log,历史访问日志文件以时间为后缀精确到小时名称为access.log.2021-10-27-10。当前access.log会继续写入访问日志等待日志回滚,历史访问日志access.log.2021-10-27-10满足上传条件,可以先移动到待上传区间,然后再将待上传区间的文件上传至HDFS集群

三、具体实现流程

3.1 规划文件上传目录

  • 原始日志存放目录
[root@hadoop1 hadoop]# mkdir -p /usr/local/hadoop/data/tomcat/log/

在这里插入图片描述

  • 待传日志存放目录
[root@hadoop1 hadoop]# mkdir -p /usr/local/hadoop/data/unupload/log/

在这里插入图片描述

3.2 开发 shell 脚本

#!/bin/bash
#使得环境变量生效
source ~/.bashrc
#hadoop根目录
hadoop_home=/usr/local/hadoop/bin
#原始目录
log_src_dir=/usr/local/hadoop/data/tomcat/logs/
#待传目录
log_unupload_dir=/usr/local/hadoop/data/unupload/logs/
#hdfs日志存放路径
curDay=`date +%Y%m%d`
curHour=`date -d "1 hour ago" +"%H"`
hdfs_root_dir=/warehouse/web/ods/o_web_access_log_d/$curDay/$curHour/
#测试hdfs目录是否存在
$hadoop_home/hdfs dfs -test -e $hdfs_root_dir
if [ $? -eq 0 ] ;thenecho 'directory is exist'
else$hadoop_home/hdfs dfs -mkdir -p  $hdfs_root_dir
fi#第一步:将原始目录访问日志移动到待上传目录
ls $log_src_dir | while read logName
doif [[ "$logName" == access.log.* ]]; thensuffix=`date +%Y_%m_%d_%H_%M_%S`#将原始目录文件移动到待上传目录mv $log_src_dir$logName $log_unupload_dir#将待上传文件路径写入文件logUploadPath中echo $log_unupload_dir"$logName" >> $log_unupload_dir"logUploadPath."$suffixfi
done
#第二步:将待上传目录中的访问日志上传至HDFS
ls $log_unupload_dir | grep logUploadPath |grep -v "_Ready_" | grep -v "_Done_" | while read logName
do#将待上传logUploadPath文件更名为logUploadPath_Ready_mv $log_unupload_dir$logName $log_unupload_dir$logName"_Ready_"#循环将logUploadPath_Ready_文件内容,上传至hdfscat $log_unupload_dir$logName"_Ready_" |while read logNamedo$hadoop_home/hdfs dfs -put $logName $hdfs_root_dirdone    #将准备上传logUploadPath_Ready_文件名,改为logUploadPath_Done_mv $log_unupload_dir$logName"_Ready_"  $log_unupload_dir$logName"_Done_"
done

3.3 授予 shell 可执行权限

[root@hadoop1 bin]# chmod u+x uploadAccessLogToHDFS.sh 

在这里插入图片描述

3.4 手动执行查看

[root@hadoop1 bin]# ./uploadAccessLog2HDFS.sh 

在这里插入图片描述

3.4 定时执行 shell 脚本

[root@hadoop1 bin]# crontab -e

添加内容如下所示:

5 * * * * /usr/locl/shell/bin/uploadLog2HDFS.sh

http://www.hlhnt8889177.com/news/82.html

相关文章:

  • 网站备案代码生成免费个人网页制作
  • 教育机构网站代码优化设计答案大全英语
  • 网站开发视频转码全网营销推广方式
  • 动态网站开发感想谷歌网页版登录入口
  • 湖南专业做网站公司有哪些网站技术外包公司
  • js获取网站html快速排名方案
  • 做网站打广告舆情管理
  • h5手机网站模板下载网络营销案例ppt
  • 宁波做外贸网站推广百度快照优化排名推广怎么做
  • 做公司网站建设价格宁波百度关键词推广
  • 网站一定要公司吗搜索引擎优化是什么意思
  • 做私彩网站国内新闻大事
  • wordpress 搜索媒体库整站seo排名外包
  • 寿光市住房和城乡建设局网站bing搜索引擎
  • 网站分析软件做推广的公司一般都叫什么
  • 网站建设续费是什么费用如何打百度人工电话
  • 新手做网站需要什么统计工具
  • 免费高清图片素材网站有哪些上海培训机构排名
  • 万盛经开区建设局官方网站关键seo排名点击软件
  • 如何建立b2b网站酒店营销推广方案
  • 网站克隆下来了然后再怎么做百度客户端电脑版
  • 做网站算经商吗怎样推广品牌
  • 17一起做网店网站西地那非片吃了多久会硬起来
  • 吉林市建设委员会网站四年级新闻摘抄大全
  • 营销软件crm重庆seo主管
  • 网站建设在哪里的网络推广法
  • 做散热网站如何做好网络销售技巧
  • 深圳十大企业排名东莞seo收费
  • 一级a做爰全过程片视频网站网站seo优化推广外包
  • 免费网站建设怎样品牌推广策划方案怎么写