运维经理的运维经验总结 - 阿里云开发者社区
文章推薦指數: 80 %
运维工作技术不是最重要的,因为这个职位现学现用也来得及,所以工作态度/为人和经验是最重要的。
服务器日志. 对服务器建立日志,所有服务器的所有操作都要有记录,并且写 ...
开发者社区>
晚来风急>
正文
运维经理的运维经验总结
2017-06-02
2398
简介:
+关注继续查看
域名
从买域名开始,要买多个域名,50个甚至100个。
分为主域名和推广域名(给推广链接用的)。
要从godaddy上买域名,因为这里的域名稳定,不会出现被攻击等事情。
同时还要买域名保护,这样互联网用户ping这个域名就解析不到真实的服务器地址。
同时域名解析的操作不要在godaddy上进行,要把解析的操作放在cloudflare上或者dnspod上进行操作,也可以放到zndns上(这个dns可以做到一个域名解析多个IP地址,根据就近原则,把最快的IP地址解析给用户。
)也可以自己搭建dns服务器,在godaddy上只想到自己搭建的dns服务器就可以了。
这样,修改dns指向的时候会更快。
CDN
一定要买cdn服务。
如果出现部分用户访问不了就使用cdn服务。
可以从cloudflare上购买cdn服务,这样域名解析到cdn上,然后cdn解析到肉盾击还是那个,然后肉盾击指向核心服务器上。
Cdn充当一个缓存和转发的作用,大流量攻击的时候他可以防御至少200G的攻击。
Cdn是全球缓存的。
图片服务器
在国内租用几台服务器做图片缓存服务器即可,这样提高访问速度。
其实nginx本身就是一个图片缓存服务器。
图片服务器和其他服务器要分开,肉盾击可做图片缓存。
服务器机房
选择机房太重要了,要服务质量好的,还要高防好的,还要可靠性高的,还要相应及时的,还要能随时可以查看服务器状态的,最重要还要服务态度好了。
机房要买香港九河(用户核心服务器),美国圣安娜机房(用于肉盾击)(虽然慢,但是安全高防做的真好,大流量攻击的时候,这里的机房还是可以访问,所以,鸡蛋不要放在一个篮子里头,要各个等级都有才叫好的,国内机房快,但是高防效果差,美国机房慢但是高防效果好)
主页
一个主页,就是招商或成为打广告的网站,可以租用云主机,这样被打死就被打死吧。
里面可以有一个链接,指向游戏首页,这个链接可以是带端口号的,那就简单了。
也可以是不带端口号的,这时候就一定要用cdn服务器,或者使用免备案机房,把肉盾击放在免备案机房,因为国内搭建网站都是要备案的,博彩这个行业是被禁止的,为了避免域名或者IP地址被和谐了(gwf)所以要用免备案机房。
或者就把肉盾击也放到香港或者台湾或者韩国等等机房。
这样用户可以不使用端口号,直接用域名就可以访问咱们的网站。
监控系统
要个网站要有监控系统,实时监控服务器是否有攻击,功过查看日志是否激增,还要把日志放到日志服务器上(syslog服务),使用cacti服务可以把日志放到cacti上。
网速是一定要查看的,网速激增则证明一定是有攻击。
每天要看日志,要用日志分析软件,看看访问源是单一访问源还是多个不同的访问源.监控服务器要有报警功能,一旦情况异常就要立刻报警,然后起床处理攻击。
防攻击
攻击一般看情况而定,一般的攻击都是直接攻击域名。
小量的攻击可以通过nginx和iptables本身的防御功能就防掉。
大量的攻击由于直接把网络带宽占用满了,服务器无法正常相应,只能依靠机房的高防了。
所以要买大量的高防,建议至少200G。
如果攻击源是单一IP或者几个IP,那么就让机房把这几个IP给屏蔽就可以了。
遇到cc或者ddos攻击,只能靠机房解决。
一台服务器被打死后,需要立刻把域名指向另一台服务器,(或者直接把域名指向百度)。
大量的攻击还要使用cdn,让cdn直接指向核心服务器就可以了,这样能快一点,让用户还可以玩。
总之大流量攻击是不能完全防止的。
冗余
一个网站一定要有冗余,比如现在是1000人同时访问的并发量,一定要让网站的负载达到2000人的并发量,要不然一搞活动,网站负载不了那么多人就完了。
服务器
服务器的配置,要用三网卡,一个用于用户连接,对外的访问(要好的网卡)。
一个用于内网服务器之间的访问使用。
一个用于ssh管理,这样大量攻击的时候咱们还可以操作服务器。
每个网卡还要多个IP地址,这样防止某个IP被屏蔽了。
国内网络和国外网络经常会有IP不好用的情况。
硬盘至少要镜像(raid1),cpu要两路的,双电源,总之不要有单点故障。
至于肉盾击的配置可以低一些,甚至台式机的配置都可以,但是网络一定要好,尤其是和核心服务器之间的网络一定要好。
数据库
数据库要做主从复制,要有异地备份,nginx服务器要做集群,就是upstream。
前台(提供用户访问页面)和后台(员工管理界面)要用两台不同的机器,不要互相影响。
其余的服务可以使用一台虚拟机完成。
这样可以省钱,邮箱直接买google的gmail企业邮箱就好了,非常好用,最好没人一个。
或者公司内部搭建自己的聊天软件(最好还钱买聊天软件)。
测试环境
测试环境要三套,开发人员电脑上自己的环境,要局域网一套测试环境,互联网一套测试环境,生产环境。
局域网的测试环境一定要稳定,可以买一个机柜等等的网络设备放在一起,不要用普通电脑。
局域网要有svn或git的代码管理工具。
充分测试后在上传到生产环境。
肉盾击和核心服务器
肉盾击和核心服务器之间一定要可以使用ping命令,这样可以看看那个IP地址不能使用了,网络连通性都可以看出来。
运维人员
至少两个,如果有运维经理一个运维人员就够了。
这样所有运维工作必须有操作文档,两个人互相协调工作,不需要倒班,但是24小时待命。
网管一个就够了。
普通的运维部门大概就这样,如果是大的网络架构,会有自己的数据中心机房到时候在安排人手。
Linux系统优化和安全
要有优化和安全配置,比如说nginx基于cpu的优化,每个程序基于cpu和内存的限制。
所有密码要有3个月就修改一次,尤其是域名的账号和邮箱密码,域名是最重要也是最脆弱的环节。
局域网
局域网一定要稳定,可以买两条网线,至少10M带宽,还要买一个移动wifi,给员工手机上网。
机房
如果是大型网络架构,那得有自己的核心机房,就不是租用机房了,每个岗位都是若干人组成的,包括运维工程师,数据库管理工程师,网络工程师,安全工程师,存储备份系统工程师,运维经历负责协调各个部门间的工作。
目前就是一个运维就能完成所有的工作。
运维工具
运维的工具要统一,比如连接数据库使用sqlyog工具,连接服务器使用crt工具,密码管理用keepass,上传服务器代码使用winscp工具,等等。
这样运维人员之间工作比较好协调。
另外运维一定要有大量时间学习,每天都要上网找新技术,好的资料,最好要懂英文,因为好的技术文档都是英文写的。
这样对运维工作很有帮助,而且运维技术实力会有很大的进步的,为迎接更大的需求做准备。
灾备预案
最后一定要有预案,就是服务器一旦出现重大问题,就是解决不了了,这个时候就不要去解决这台服务器,使用预案,把启用备用方案,尽快让网站可用。
平时多做预案演习,还要多做备份的还原操作,因为有的备份不可用,这是常见现象。
别到关键时刻备份不能用,整个网站就完了。
服务器安全
要有一整套的安全配置,包括用户安全,应用安全,系统安全,文件安全等。
这样防止服务器被黑客侵入。
高并发测试
一定要做高并发测试,模拟同时在线用户2000人,看服务器的负载情况,要有服务器高并发配置,网络方面是机房的事情,但是得选择最合适的IP地址,最适合的机房,及出口带宽。
高并发是服务器架构的事情,不是单单一台服务器的事情。
该花钱的地方一定要花,可以省钱的地方要知道怎么省钱。
运维信息
运维所有信息两个人共享,包括密码和服务器配置步骤,由运维经理带领团队,打造成一个互相学习,技术实力雄厚,目标一致的和谐团队。
让每个人在团队中都得到自己想要的。
运维经理的为人就很重要,要不然留不住人,大家心不往一起使劲。
运维工作技术不是最重要的,因为这个职位现学现用也来得及,所以工作态度/为人和经验是最重要的。
服务器日志
对服务器建立日志,所有服务器的所有操作都要有记录,并且写清时间操作内容。
对生产服务器操作之前一定要做风险评估及解决方案。
运维之道
网站可用性/监控与报警/容量规划/流程规范/知识管理与积累/自动化管理。
运维工作
应用上线后,运维工作才刚开始,具体工作可能包括:升级版本上线工作、服务监控、应用状态统计、日常服务状态巡检、突发故障处理、服务日常变更调整、集群管理、服务性能评估优化、数据库管理优化、随着应用PV增减进行应用架构的伸缩、安全、运维开发工作。
查看连接数
查看了连接数和当前的连接数,分别是netstat-ant|grep$ip:80|wc-lnetstat-ant|grep$ip:80|grepEST|wc-l
文章转载自开源中国社区[http://www.oschina.net]
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。
具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。
如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
运维
监控
安全
测试技术
数据库
运维总结
运维经验分享
使用运维总结
运维经验脚本
问题运维人员管理
开发者社区>
开发与运维
>
文章
作者高分内容
更多
中国云计算服务网:盛大云体验报告
7285
量子伟业打造P9为企业举档案工作之重
8257
永利博网络零售视频广告赢来跨越式发展
6138
万网域名阿里云计算产业链上的关键一环
6983
专为亚洲设计惠普发布HPt505瘦客户机
7086
相关文章
熊哥club
运维经理的运维经验总结(值得收藏)
1. 域名
从买域名开始,要买多个域名,50个甚至100个。
分为主域名和推广域名(给推广链接用的)。
要从godaddy上买域名,由于这里的域名稳固,不会出现被攻击等事变。
同时还要买域名保护,如许互联网用户ping这个域名就剖析不到真实的办事器地点。
同时域名解析的操纵不要在godaddy上举行,要把解析的操作放在cloudflare上大概dnspod上进行操作,也可以放到zndns上(这个dn
3045
0
玄学酱
四、运维经验总结
1208
0
技术小阿哥
运维面试经验
2682
0
橘子红了呐
[转]项目管理心得:一个项目经理的个人体会、经验总结
1115
0
白展糖
一个项目经理的经验总结
本人做项目经理工作多年,感到做这个工作最要紧的就是要明白什么是因地制宜、因势利导,只有最合适的,没有什么叫对的,什么叫错的,项目经理最忌讳的就是完美主义倾向,尤其是做技术人员出身的,喜欢寻找标准答案,耽误了工作进度,也迷茫了自己。
870
0
技术小甜
运维那点事
1379
0
中间件小哥
小红书消息中间件的运维实践与治理之路
近年来,消息领域的全面云原生化逐渐走向深入,比如RocketMQ5.0版本的存算分离设计和raft模式,再比如Kafka3.0引入了分层设计的方式(tieredstorage)和raft模式,以及近年来新崛起的Pulsar也开始采用云原生架构,在未来都可以针对具体业务需求引入进行功能迭代,发挥组件的最大价值。
331
0
阿里云云原生小助手
小红书消息中间件的运维实践与治理之路
近年来,消息领域的全面云原生化逐渐走向深入,比如RocketMQ5.0版本的存算分离设计和raft模式,再比如Kafka3.0引入了分层设计的方式(tieredstorage)和raft模式,以及近年来新崛起的Pulsar也开始采用云原生架构,在未来都可以针对具体业务需求引入进行功能迭代,发挥组件的最大价值。
2491
0
技术小阿哥
经验总结
863
0
程序员对白
授人以渔:分享我的文本分类经验总结(一)
授人以渔:分享我的文本分类经验总结(一)
18
0
+关注
晚来风急
9364
文章
243
问答
作者高分内容
更多
中国云计算服务网:盛大云体验报告
7285
量子伟业打造P9为企业举档案工作之重
8257
永利博网络零售视频广告赢来跨越式发展
6138
万网域名阿里云计算产业链上的关键一环
6983
专为亚洲设计惠普发布HPt505瘦客户机
7086
文章排行榜
最热
最新
1
函数计算HTTP触发器支持异步,解放双手搭建Web服务
34297
2
从这些云原生企业身上,我看到了数字化创新者该有的样子
32327
3
聊一聊并行文件系统的客户端优化之道
18427
4
IT人才能嗑到的这对CP,甜!
18178
5
[版本更新]PolarDB-XonOSS提供冷热数据分离存储
7905
6
开源之夏2022重磅来袭!欢迎报名阿里云PolarDB社区项目!
7600
7
PolarDB-X与X-DB、PolarDB
7227
8
不破不立!Fastjson2.0性能炸裂,为了下一个十年
8347
9
简历面试|不会讲故事的人到底有多吃亏
82405
10
当姿态估计算法遇上《本草纲目》,看“刘畊宏男孩”如何驱动虚拟人
4570
11
AliIAC智能音频编解码器:在有限带宽条件下带来更高质量的音频通话体验
4961
12
云开发两周年庆—游戏畅玩领好礼
17409
13
OpenYurt开源之夏开始申请啦
17443
14
【转载】大数据在线离线一体化解决方案最佳实践
13932
15
Zabbix对Tomcat的监控
27862
16
EMR-StarRocks白皮书来啦!
84003
17
AliAGC自动增益控制算法:解决复杂场景下的音量问题
3832
18
一个前端开发工程师的天猫精灵自定义技能开发评测报告
76689
19
第八届中国国际“互联网+”大学生创新创业大赛介绍
1914
20
阿里巴巴云数据仓库MaxCompute数据安全最佳实践
11173
1
SaaS云原生架构和传统架构
116
2
分享5款神级软件,体积小无广告且功能强大,堪称装机必备
144
3
发评测赢好礼|Serverless函数计算征集令
58
4
Flink引擎在快手的深度优化与生产实践
181
5
Dataphin权限体系(3):权限审计能力介绍【DataphinV3.5】
111
6
数据库原理知识及SQL语言知识拓展
66
7
新网温馨提示:当前链接地址或网站因含有违规内容,暂时无法访问的解决方案
78
8
一文了解SLS文本分析作业
94
9
分布式定时任务,你了解多少?基于Quartz实现分布式定时任务解决方案!
447
10
基于知识图谱的实时资讯流实践
58
11
推荐5款超实用的小软件,建议先收藏再下载
825
12
先进级!阿里云大数据+AI平台通过信通院数据平台整体解决方案最高等级评测
68
13
一个开发者自述:我是如何设计针对冷热读写场景的RocketMQ存储系统
59
14
全链路压测:影子库与影子表之争
68
15
谈谈讲清楚这件事的重要性
59
16
CustomContainer运行环境下的Gin自动部署
81
17
1行Python代码,拿到周杰伦新歌的MP3文件,终于可以免费听周杰伦了
173
18
如何把thinkphp5的项目迁移到阿里云函数计算来应对流量洪峰?
111
19
深度解读RocketMQ存储机制
134
20
基于Serverless函数计算FC一键搭建VUE3.0脚手架
127
推荐文章
最新的产品福利,顶级大咖观点,尽在《开发者评测局》
大咖圆桌会:产学研共话BizDevOps。
开发者评测局第五期—Severless征集令
乘风者计划邀您入驻社区,精彩权益即刻享
相关电子书
更多
JS零基础入门教程(上册)
立即下载
性能优化方法论
立即下载
手把手学习日志服务SLS,云启实验室实战指南
立即下载
延伸文章資訊
- 15年運維經驗分享:一個小白走向高階運維工程師之路 - 程式人生
我是Freeman,88年的,老家河南,來上海4年,O2O行業高階運維工程師,擁有5年運維經驗。 我目前維護上千臺伺服器,熟悉大型網站架構,熟悉叢集高 ...
- 2运维经理的运维经验总结 - 阿里云开发者社区
运维工作技术不是最重要的,因为这个职位现学现用也来得及,所以工作态度/为人和经验是最重要的。 服务器日志. 对服务器建立日志,所有服务器的所有操作都要有记录,并且写 ...
- 3运维工程师如何算有项目经验?
运维工程师如何算有项目经验? 热门回答:不加开发,不加测试,剩的就是运维的项目了。 大到:架构搭建,架构升级小到:网络配置,服务器巡检,故障排除,项目上线, ...
- 4Linux 輕鬆入門: 一線運維師實戰經驗獨家揭秘 - 天瓏
書名:Linux 輕鬆入門: 一線運維師實戰經驗獨家揭秘,ISBN:7515361921,作者:陳德全著,出版社:中國青年,出版日期:2021-01-01,分類:Linux.
- 5运维全球最大游戏网站过程中积累的SRE经验 - gists · GitHub
作者Ian Miell 通过本文探讨了自己在全球最大在线游戏网站的站点可靠性运维工作中积累的经验。本文最初发布于Ian Miell 的博客,经原作者授权由InfoQ 中文站翻译并分享 ...