形象好
知识丰富
会开车
技术精悍
有上进心
合肥工业大学
计算机科学与技术
本科
教育事业部运维主管
科大讯飞股份有限公司
1、承担教育产品事业部所有业务产品运行维护工作。
2、唯一运维人员并在此之后的5年成为运维部门负责人,从独自1人承担整个部门工作至创建部门专业运维部。
3、2012年 任职期间内完成部门55台服务器业务服务从单独服务改造成为集群模式并且升级至双业务主备模式。
4、 2013年完成事业部业务集群从全链路百兆升级至下联千兆上联万兆网络架构。
5、 2014年完成业务集群整体安全加固防御项目,前端双主热备山石网科防火墙+入口网络双主锐捷核心汇聚热备+入口nginx+keepalived业务入口主备集群模式。
教育事业部运维主管
科大讯飞股份有限公司
6、 团队人才培养:确保各业务人员至少双人主备。人员分层管理包括不限于技术骨干、支持人员、操作人员等。
7、 运维规范化制度建立:建立文档库实现经验传承积累。建立运维规范包括不限于操作规范、保障评级规范、现网操作标准、故障考核机制等。
工作业绩:
● 2015年完成1.2亿安徽省教育云平台项目,获得“年度优秀团队及个人”奖项
● 实现全国三地核心机房负载均衡,事业部云服务能力巨大提升。
● 荣获2014年度优秀团队及优秀员工(可提供原件及照片)
消费者BG语音云运维主管
科大讯飞股份有限公司
1. 实现业务在集群的持续稳定发布。
2. 运维标准化规范输出包括不限于组件、日志、上线、回滚、监控等环节,确保业务稳定运营。
3. 通过open-falcon监控业务组件存活、数据收集上报,kibanna与grafana进行数据抓取图形自动绘制,实现数据可视化。
4. 整合合肥、广州、北京 三地4中心机房业务公网入口负载均衡。主导牵头开展多机房容灾热备优化方案。
5. 完成自动化上线平台包构建、自动化发布、自动化回滚等功能。
6. 对研发人员进行自动化平台打包、代码集成等标准化功能培训。
消费者BG语音云运维主管
科大讯飞股份有限公司
7. 团队人才培养:确保各业务人员至少双人主备。人员分层管理包括不限于技术骨干、支持人员、操作人员等。
8. 运维规范化制度建立:建立文档库实现经验传承积累。建立运维规范包括不限于操作规范、保障评级规范、现网操作标准、故障考核机制等。
工作业绩:
● 将open-falcon监控推广至全部门3000台现网主机进行服务器硬软件数据收集汇总并可视化展示。
● 荣获2016“年度先进个人”称号(可提供原件及照片)
云计算研究院深度学习运维主管
科大讯飞股份有限公司
1. 现网HPC、hadoop、品高云集群保障。
2. 重点工作:每半年度度GPU集群扩容。
3. 重点工作:HPC集群OOM内存瓶颈。
4. 重点工作:HPC集群资源分配调优。
5. 重点工作:存储空间优化清理规则。
6. DLP1.0~DLP2.0内部产品迭代推动。
7. 重点工作:深度学习运维平台建设。
8. 服务器研发、现网集群整改迁移B3机房。
9. 团队人才培养:确保各业务人员至少双人主备。人员分层管理包括不限于技术骨干、支持人员、操作人员等。
10. 运维规范化制度建立:建立文档库实现经验传
云计算研究院深度学习运维主管
科大讯飞股份有限公司
10. 运维规范化制度建立:建立文档库实现经验传承积累。建立运维规范包括不限于操作规范、保障评级规范、现网操作标准、故障考核机制等。
工作业绩:
●现网HPC、hadoop集群从Ganglia老监控整体迁移至open-falcon
● 新增GPU 显存利用率、卡时监控。
● 每日自动监控发送恶意占用GPU资源行为。
● 新增GPU ECC错误监控,确保GPU资源正确释放可用。
● 完成GPU 集群月度分摊机制并精细化至各研发小组,将公司研发费用实行可追溯。
● 荣获2018年“月度之星”奖状(可提供原件
1、近10年IT运维从业经验,从最初的工程师技术演进、现网操作、保障业务高可用,到中期的集群规范化、核心冗余高可用,到后期全国三地4核心机房的集群高可用均逐步实现。
2、此过程中积累了大量的CDN、全国骨干网络业务建设、各设备厂商、IDC业务、阿里云等厂商沟通技巧,为公司经费开支节约近千万元。
3、2008年获得驾照,至今从未有过违章扣分处罚,累计行驶公里10万。
4、拥有ITIL 证书,国