當主機開機後,系統會依序載入核心、啟動 systemd(或舊系統的 SysV init),然後再啟動各種服務。要確認這些服務是否有正常啟動,避免業務中斷。
使用 systemctl 查看自動啟動服務
查看所有已設定開機自動啟動的服務
systemctl list-unit-files --type=service | grep enabled
查看開機時實際有啟動成功的服務
systemctl list-units --type=service --state=running
看開機過程中的服務啟動狀態
journalctl -b
檢查是否有 failed 的紀錄
journalctl -b | grep failed
查看核心與驅動程式載入
dmesg | less
用途:
查看開機過程是否有硬體錯誤、驅動載入失敗。
部分服務啟動異常,可能源於硬體或模組沒載入。
除了系統服務外,還要檢查「業務程式」是否隨開機啟動:
檢查 /etc/systemd/system/ 下是否有自定義服務檔案。
查看 crontab 任務
每日檢查任務
用 systemctl list-unit-files 確認哪些服務是 enabled,是否符合需求。
用 journalctl -b 檢查開機過程有無 failed 服務。
確認業務系統(如 Web server、DB、應用程式)是否有正確啟動。
若有服務啟動失敗,進一步用:
systemctl status <服務名稱>
追蹤詳細錯誤原因。
還須了解不同角色主機有自己必須啟動的程式 / 服務
因為我負責的是網管業務,所以我會負責以下這幾種角色主機
1.Proxy 主機:通常用來做 HTTP/HTTPS 代理、快取、過濾:
squid → 常見的 Proxy server 軟體
nginx / apache → 若有反向代理或 Web 服務
iptables / firewalld → 防火牆規則
sshd → 遠端管理必備
2.DHCP 主機:負責自動分配 IP
dhcpd(ISC DHCP Server)
kea-dhcp4 / kea-dhcp6(新一代 ISC Kea DHCP Server)
rsyslog / journald(記錄租約分配日誌,方便追蹤)
sshd
3.DNS 主機:負責名稱解析
named(BIND DNS server)
unbound(輕量級 DNS server,若有用)
dnsmasq(小型環境常用,含 DNS + DHCP)
rsyslog / journald(記錄查詢)
sshd
4.網管相關主機(如SolarWinds):通常跑監控、日誌、管理系統:
SolarWinds Orion Module Engine:Orion 平台的核心引擎,負責模組間的整合與協調。
SolarWinds Information Service (SWIS):提供 API 與內部模組的資料存取服務。
SolarWinds Job Engine v2:處理排程與背景工作(像是輪詢、資料蒐集)。
SolarWinds Collector Service:負責從設備收集 SNMP、WMI、API 等監控數據。
SolarWinds Alerting Engine:負責告警通知(Email、SMS、Webhook 等)。
SolarWinds Orion Web Console:提供 Web UI 介面,通常跑在 IIS(Internet Information Services)上。
Microsoft IIS (W3SVC, WAS 等服務):Orion 的 Web 介面是透過 IIS 提供,IIS 必須正常運作。
MSSQLSERVER (SQL Server):Orion 後端資料庫,必須保持運行。
SNMP Trap Service(若有用 Trap 收集):處理設備送來的 SNMP Trap 訊息。
5.所有主機共通必備的基礎服務
network / NetworkManager → 網路連線
sshd → 遠端管理
crond → 排程工作
rsyslog / journald → 日誌收集
firewalld / iptables → 防火牆安全防護