维护报告/2007年10月26日

来自Org
跳转至: 导航搜索

维护报告
  • 记录内容:速度巡检、备份还原、重新启动、故障处理、系统升级等各种维护工作。

故障记录

发现故障时间 上午9:00-下午4:00
发现故障人员 祁劲松
故障现象描述 web服务器负载load average始终高达数十、上百,网站基本无法访问,重启后几分钟就恢复原状,今天重启了无数次,也耽误了大半天的时间!%E9%9A%BE%E8%BF%87.gif
故障原因分析 两种可能:apache设置问题、interwiki调用问题
处理故障时间 下午4:00左右
处理故障人员 hack988
故障排除措施 修改了apache设置文件
故障处理结果 恢复
其它补充说明 昨晚为了排查,把apache的access日志打开、error日志改为debug,今天上午把apache日志、squid日志都下载查看,日志中看到有比较多的http://www.18dao.org/template:sitenotice 、 http://wiki.18dao.com/template:adsense文字 等记录,说明确实占用了较多资源,我把以前在各个Wiki网站上的调用18dao共用模板sitenotice、sidebar等和调用html共用模板adsense、iframe等全部去掉,把需要html代码的网站打开html功能并限制用户编辑,这样应该可以减缓负载,但最终的解决还是hack988调整了apache的配置文件。另外还顺便修改了squid参数:request_header_max_size 15 KB

备份检查记录

133:

备份正常,4:00备份成功,大小:0.5G,备份在226服务器

156:

备份正常,7:59备份成功,大小:2.8G,备份在226服务器

139:

备份正常,23:43备份成功,大小:14.7G,备份在加载硬盘

101

备份正常,5:01备份成功,大小:18M,备份在226服务器


网页打开时间记录

以下记录打开 http://cn.18dao.net 的首页及内容所用时间


	测试时间		首页用时(秒)		内页用时
				
	8:30		3		         2
	9:00		3		         3
	9:30		4		         4 
	10:00		维护		
	10:30		3		         3
	11:00		3		         3
	11:30		3	                 3
	12:00		3		         3
	12:30		2		         2         
	13:00		4		         4
	13:30		2           	         2 
	14:00		维护		
	14:30		维护		
	15:00		维护		
	15:30		3		         3
	16:00		2		         2
	16:30		2		         2
	17:00		4		         4
	17:30		4		         4
	18:00		2		         2
	18:30		2		         2
	19:00		2	                 2  
	19:30		3		         3 
	20:00		维护		
	20:30		维护		
	21:00		维护		
	21:30		4		         4
	22:00		4		         4
	22:30		×		         ×
	23:00		3		         3
	23:30		4		         4