刚接触 Linux 服务器的徒弟们,别慌。运维这事儿说难不难,说简单也不简单,关键是要养成好习惯。今天师傅就带你走一遍日常运维的基本功,让你少踩坑。 先说登录服务器。拿到一台新机器,第一件事不是急着操作,而是先看看系统啥情况。用 ssh 连上去之后,别直接敲命令,先执行 uptime 看看服务器运行了多久,负载高不高。要是负载数字超过 CPU 核心数,那就得警惕了。接着用 df -h 看看磁盘空间,很多新手就是不看这个,等磁盘满了服务挂了才着急。记住,根分区使用率超过百分之八十就要清理了。 查看进程是基本功。top 命令能让你实时看到哪些进程在吃资源,按 P 键可以按 CPU 使用率排序,按 M 键按内存排序。看到异常的进程,别急着 kill,先用 ps aux | grep 进程名 确认一下是啥。要是确定要结束,用 kill -15 先温柔地让它退出,不行再用 kill -9 强制杀掉。 日志是排查问题的宝贝。系统日志在 /var/log/messages 或者 /var/log/syslog,应用日志一般在 /var/log/ 下面的对应目录。查日志别用 cat 一口气全看完,用 tail -f 可以实时盯着日志输出,配合 grep 过滤关键字。比如 tail -f /var/log/nginx/error.log | grep “502” 就能实时看到 nginx 的 502 错误。 文件权限经常让人头疼。记住 chmod 的数字表示法:755 是所有者读写执行,其他人读执行;644 是所有者读写,其他人只读。chown 用来改所有者,比如 chown www:www /var/www/html 把网站目录交给 www 用户。权限给太大会出安全问题,给太小服务跑不起来,这个度要多练。 网络问题用 netstat -tlnp 看哪些端口在监听,ss -tlnp 是更现代的版本。想测试某个端口通不通,用 telnet IP 端口 或者 nc -zv IP 端口。要是服务器对外服务不正常,先检查防火墙,iptables -L 或者 firewall-cmd –list-all 看看规则。 最后说个保命技巧:执行危险命令之前,先 echo 一下看看会执行啥。比如 rm -rf 之前,先用 echo rm -rf /path/to/check 确认路径对不对。还有,重要的操作之前先备份,cp -r 目录 目录.bak 花不了几秒钟,但能救你一命。 运维这行,经验都是踩坑踩出来的。多动手,多记录,遇到问题别慌,按部就班排查。师傅领进门,修行在个人,剩下的路你自己走。