大家好,又见面了,我是你们的朋友全栈君。
服务器上线搭建系统环境
1.根据现有结构部署工具(PXE+kickstart);
2.结合应用系统需求定制部署模版;
3.制作系统优化等一键执行脚本;
4.自动化部署实施;
5.根据定制的优化内容对自动化部署效果进行检验;
服务器上线搭建软件环境
1.在新批量部署的服务器上部署LNMP环境;
2.对批量化部署的环境进行效果检验;
3.编制Nginx配置文件并批量化部署;
4.根据需求做Nginx服务相关的优化(expires/gizp等)
Web服务器架构调整
方案需求:解决网站web服务器单点故障的问题;
工作职责:
1.研究多种负载均衡方案主要针对lvs+keepalived及nginx+keepalived进行研究;
2.编写新架构方案实施项目书与实施日程;
3.新系统部署与日常维护;
把公司原来的多数单点服务器变成了集群,提升了网站的稳定性与高并发的应用场景。
服务器用户权限管理改造方案与实施项目
方案需求:解决公司root权限泛滥问题
工作职责:
1,提出权限整改解决方案,改进公司root权限泛滥的现状;
2,召集大家开会商讨并确定方案后推进实施;
3,实施后使得公司的权限管理更加清晰了总结维护,从根本上降低了内部操作等不规范及安全隐患的发生;
你们公司是如何来管理用户权限的?
通过sudo来管理权限的,不论是运维还是开发,一般都不会给root权限,只有核心级开发或者研发总监或以上级别的我们才可能给相应服务器级别的权限;对核心运维或者运维总监才会给root权限。
在规划服务器的时候,在服务器上都跑几个普通用户?
普通用户是根据项目来的,在不同公司它的项目产品线不一样。我们公司只有十几个产品线,我们为每一个项目建立一个普通用户,因此不论nginx还是tomcat都是跑在普通用户下。
说说你对运维的看法?
我对运维的理解是,运维做运维的事情,开发做开发的事情。运维负责网络系统,只要系统没有故障,只要网络没有故障,只要系统资源还够用,那么我们运维的职责就到位了。而我们公司的理念是项目负责制,也就是说每个项目的责任人是开发,我们运维大概占30%-40%的责任。我们的开发占60%的责任。当进程上线的时候,这个服务是由普通用户跑的。它的每个站点目录都是普通用户的权限,也就是700的权限普通用户,这个是最安全的。无论是项目的启动,停止,以及代码上线,日志收集,日志分析都是通过我们进程跑的普通用户实现的。我们在管理这个项目的时候,我们可以把开发的用户加到这个项目组里面,这样负责相应项目的开发人员就有对应项目的所有权限。
服务器日志审计项目提出与实施
1.权限控制后进一步实施对所有用户日志记录方案;
2.通过sudo和rsyslog配合实现对所有用户进行日志审计并将记录集中管理;
3.实施后让所有运维和开发的所有执行的命令都有记录可查,杜绝了内部人员的操作安全隐患;
服务器数据批量分发与批量管理
方案需求:公司服务器逐渐增多,因此管理起来很麻烦,于是提出解决批量分发管理解决方案,进行全网服务器数据分发与管理;
工作职责:
1.针对ansible分发工具及ssh key+rsync两套分发管理方案研究,最终选择简单易于维护并且强大的ssh key+rsync方案.
2.找一台IDC内网服务器,作为分发机器,对固定普通用户做sshkey认证(注意不是root),需要root权限,通过sudo来控制,减少安全隐患。
3.对于分发机进行安全配置,例如,去掉外部IP,开启防火墙。实施完毕,运维管理的效率提高了很多。
服务器数据备份方案提出及负责实施
方案需求:为公司数据做一个完整的备份系统;
工作职责:
1.针对公司重要数据备份混乱状态和领导提出备份全网数据解决方案
2.通过本地打包备份,然后rsync结合inotify应用把全网数据统一备份到一个固定存储服务器,然后在存储服务器上通过脚本检查并报警管理员备份结果
3.定期将IDC机房的数据备份公司的内部服务器,防止地震火灾等问题导致的数据丢失。
MySQL实现主从同步,及完整备份解决方案
1.在进入公司之前前任运维丢失数据,因此老大很重视数据安全这方面;
2.提出并上线了MySQL数据库备份方案和MySQL架构方案;
3.方案主要是在从库上开启binlog及按天分库分表全备,推送到备份服务器;
4.将备份的数据定期恢复到测试库给开发使用;
5.制定人工更新数据库的流程及制度;
LNMP架构优化方案
1.公司使用LNMP架构,优化较少,运行效果不佳;
2.提出了LNMP架构的优化方案;
3.方案主要是Linux系统优化,nginx服务优化,php服务优化,MySQL优化;
4.优化完成后,LNMP架构性能有很大提高;
服务器监控解决方案实施
方案需求:到公司后,没有任何监控系统,每次故障无法报警,每次故障对公司的网站都造成了很大的影响,因此用自己已经掌握的监控技术,以及查询资料撰写解决方案,提交给公司领导,以改善服务器报警不及时的问题,最大限度的保证公司网站故障及时处理.
工作职责
1,根据需求选定最流行的监控软件zabbix进行研究。
2,根据不同服务器具体需求定制模版进行监控实时报警。
实施完毕后,做到了大部分的故障报警都能及时有效的汇报给管理员,为网站的稳定争取了时间。
改善服务器存储问题
1.Web前端存储使用NFS主备结构;
2.用户写入数据,存储到NFS主上面,用户的读访问NFS备;
3.NFS主备,使用rsync+inotify进行数据同步;
4.NFS存储数据量不大,采用rsync把数据推送到web前端,尽量较少前端服务访问后端服务器的请求,减轻NFS存储压力;
5.数据备份的安全有了保障,不用担心数据的丢失;
MySQL集群读写分离及高可用方案
需求分析:
1.新方案保证服务性能和I/O满足企业多台终端的快速响应需求。
2.保证系统长期不间断的稳定运行。保证成本合理性。
3.满足数据库系统的高可用性和可靠性。
解决方案:
1.底层5台MySQL数据库,一主两从. 开启半同步复制.提高数据安全;
2.使用中间件Atlas实现读写分离与读负载均衡,提高与程序端解耦;
3.在使用两台服务器搭建LVS+Keepalived 对Atlas服务器做负载均衡与高可用;
4.搭建一台主MHA服务器管理数据库主库热备问题;
5.该方案极大减少服务器资源浪费,实现故障30秒切换,极大保证数据库一致性;
责任描述:
主要负责所有服务器服务平台的搭建,方案设计,编写脚本;
往期精彩回顾
更多精彩,点击下方“阅读原文”查看。
发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/129756.html原文链接:https://javaforall.cn
【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛
【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...