• View
圖片

【教學】Prometheus AlertManager 的 group_wait、group_interval、repeat_interval 運作原理

假設我們今天有3台主機,並設定 group_by 是 alertname ,且這三台主機都有一個相同名稱的警告,叫 CPU Alert 。 ... 閱讀完整內容

圖片

【教學】如何計算 Prometheus 硬碟所需空間

Prometheus 如果要上到生產環境,一定會面臨的一個問題,那就是要給 Prometheus 多少使用空間做存儲。 ... 閱讀完整內容

圖片

【教學】如何在 AWS Load Balancer 上設定 HTTP 自動轉跳 HTTPS

在生產環境中,沒有使用 HTTPS 協定 ( 超文本傳輸安全協定 ) 進行通訊是相當危險的,沒有使用加密協定進行溝通,輕則資料外洩、不完整,重則密碼被有心駭客擷取,造成伺服器被入侵,演變成重大資安危機。 使用 HTTPS 協定進行溝通,能保障資料在網路上傳輸的隱私與完整性,但一般使用者在操作瀏覽... 閱讀完整內容

圖片

【教學】Ubuntu 16.04 / 18.04 還原指定版本 Kernel

實作環境: 平台: AWS OS: Ubuntu 18.04 Step 1. 使用指令查詢當前 Kernel 的 $menuentry_id_option 執行指令 grep submenu /boot/grub/grub.cfg ... 閱讀完整內容

圖片

【教學】 如何修改 visudo 的預設編輯器

輸入指令修改 Sudo 編輯器 sudo update-alternatives --config editor 選擇要使用的編輯器 輸入數字 " 3 "後,按 Enter。完成修改 There are 4 choices for the alternative editor (provid ... 閱讀完整內容

圖片

【教學】如何自動修復 AWS 上故障的 EC2 實例

只要是管理 AWS 多年的維運人員,多多少少都會遇到 AWS (Amazon Web Services) 底層主機故障的問題,這問題會造成 CPU異常、網路不通,等等奇怪現象。而唯一解決辦法就是關閉實例( EC2 ),並再次開啟,讓實例從異常底層轉移到正常主機。 雖然這問題發生的機率不大,處理起來... 閱讀完整內容

圖片

使用 Shell Script 大量新增 Linux 使用者

在日常維運中,我們常常需要為大量使用者創建帳號。為此,我們常要一個一個下指令新增使用者。不過,這方法既沒有效率,又容易出錯。最好的方法,還是使用Shell Script 腳本來新增使用,不但能大量節省時間,且人為失誤的問題也可以立即排除。而本篇就是示範如何運用簡單的 Bash 腳本來達成我們輕鬆工... 閱讀完整內容

圖片

如何正確修改 Ubuntu 18.04 的系統時區

在生產環境中,使用正確的時區是非常重要的,不當的配置,可能會造成人為誤判、或是資料庫寫入異常等其他嚴重問題,所以,為了讓我們日後的工作順利,學會正確的修改時區是非常重要的!! 而本篇就是教導大家,如何正確修改 Ubuntu 18.04 的系統時區,以及在不支援 timedatectl 指令的情況... 閱讀完整內容

圖片

【問題排除】WSUS 連線錯誤需重設伺服器節點

最近因公司內部需求,需要建置 WSUS ( Windows Server Update Services ) 提供內部主機做更新,但在設置時,一直出現 連線錯誤 ,需要 重設伺服器節點 的問題,參考了國外論壇的回答,會發生這問題,通常是 WsusPool 的 專用記憶體不足 ,照著調整了一... 閱讀完整內容