分享是一种生活态度,求知,求真,分享工作,分享生活!
最近几年,中心devops发展的相当快,各种运维自动化系统非常完善,比如可以快速一键隔离网络故障的“战斧"系统,专门针对网工的可视化脚本“鲁班”系统等等。借用总监的一句话来说,“腾讯是国内网络自动化程度最xx的公司...”。
中心比较重视员工devops的能力培养,经常举办一些编程沙龙、培训等。同事平时也都经常编写一些网络脚本,大大提高了网络运维效率。往年举……继续阅读 »
因为公司网络运维需要,花了大概3周的时间,写了一个网络巡检系统,起了一个高端大气上凳次的名字,叫做黑鹰巡检分析系统。 听着貌似挺NB吧,可开发的过程真是一把鼻涕一把泪啊,为了赶进度,晚上写到11多,跟上公司的最后一班班车,周末还在加班。最终效果还可以 。
系统包含“网络巡检”、“数据分析”、“实时告警”三大主要功能。系统设计为框架式结构,通过导入巡检模板,……继续阅读 »
网络设备监控在很多公司都是很重视的,当网管出现故障可以及时的通知管理员处理,这个需求是一个朋友提出的,而且还是他们公司一直有需求的。
软件功能场景很简单,实时监视syslog服务器日志文件,如果出现告警或者匹配到特定关键字,发邮件通知管理员。
软件花了半天时间,用C#写了核心功能,界面是cli的,可以满足需求,等实际用的时候再定制。后期还可以添加微信提醒等。……继续阅读 »
最近,有一哥儿给我提了一个这样的需求,能否写个程序实现:不停向dhcp服务器发送ip请求,获取到ip之后再释放。我想估计是想测试一下dhcp服务器的稳定性和可靠性,因为有些大公司为了保证业务,会做大量的压力测试,只有满足需求后才会上线。
当时首先想到编程调用系统的api,模拟发送dhcp discover、request报文,获取到ip后,再发送dhcp r……继续阅读 »
最近有同事找到我帮忙编写一个巡检分析工具,主要是腾讯那边设备太多,巡检之后需要把结果做个分析,比如是否有光衰问题、ospf邻居数量、lldp邻居数量、设备启动文件版本等。如果这些东西都人工来一个一个分析,那估计蛋都碎了,因为文件太多,大量重复繁琐的劳动太累,而且还容易出错,实在是无意义!
于是抽空写了一个小工具,可以很快把需要检查的内容做个汇总,并做简单的分……继续阅读 »