Khi số lượng ESXi host tăng lên, nâng cấp thủ công từng host bằng ISO hoặc command line dễ tạo ra tình trạng lệch phiên bản, thiếu driver hoặc không đồng bộ firmware. vSphere Lifecycle Manager giải quyết bài toán đó bằng cách đưa host và cluster về một trạng thái mong muốn có thể kiểm tra, remediation và báo cáo.
Baseline và image khác nhau thế nào
Baseline là cách quen thuộc để gắn các bản vá, extension hoặc upgrade baseline vào host rồi kiểm tra compliance. Mô hình này linh hoạt với môi trường cũ, nhưng khi cluster có nhiều host, việc đảm bảo toàn bộ host giống nhau về image, driver và add-on không phải lúc nào cũng đơn giản.
Image-based lifecycle management đi theo hướng khai báo một image mong muốn cho cả cluster: ESXi version, vendor add-on, firmware/driver add-on và component bổ sung. Khi đó Lifecycle Manager kiểm tra host nào lệch khỏi trạng thái chuẩn và giúp remediation có kiểm soát hơn.
Khi nào nên dùng image-based lifecycle
Nếu doanh nghiệp đang chuẩn hóa cụm vSphere 7/8, đặc biệt là cụm có phần cứng đồng nhất, image-based lifecycle là lựa chọn rất đáng cân nhắc. Nó giúp đội vận hành tránh kiểu "host này cài driver khác host kia", đồng thời dễ trình bày trạng thái compliance trong audit.
Ngược lại, với cụm có phần cứng pha trộn hoặc đang trong giai đoạn chuyển đổi, baseline vẫn có thể hữu ích. Điều quan trọng là không trộn lẫn tùy tiện: trước khi chuyển cluster sang image, cần hiểu rõ khả năng quay lại baseline và kế hoạch xử lý host không tương thích.
Quy trình nâng cấp ESXi có kiểm soát
Quy trình tốt bắt đầu từ kiểm kê: phiên bản ESXi, build, driver NIC/HBA, firmware, trạng thái vSAN nếu có, khả năng vMotion và mức dự phòng tài nguyên. Sau đó đồng bộ depot, chọn bản vá hoặc image, chạy compliance check, đưa từng host vào maintenance mode và remediation theo thứ tự.
Sau khi host quay lại cluster, cần xác nhận management network, storage path, datastore, vMotion, HA agent, vSAN health và trạng thái VM. Nếu cụm có workload nhạy cảm như SQL, Exchange hoặc hệ thống core banking, nên nâng từng host và chờ quan sát một khoảng trước khi xử lý host kế tiếp.
Lưu ý về firmware và driver
Một số lỗi sau nâng cấp ESXi không nằm ở hypervisor mà nằm ở driver hoặc firmware của NIC, RAID/HBA, iDRAC/iLO và BIOS. Vì vậy, khi lập kế hoạch vLCM, nên đưa vendor add-on hoặc firmware management vào phạm vi kiểm soát nếu môi trường hỗ trợ.
Checklist triển khai nhanh
- Kiểm tra khả năng vMotion để có thể đưa host vào maintenance mode an toàn.
- Đồng bộ depot và xác nhận bản vá hoặc image đích.
- Chạy compliance check trước remediation.
- Nâng từng host theo thứ tự, không remediation hàng loạt khi chưa có kinh nghiệm.
- Kiểm tra storage path, network uplink và HA agent sau mỗi host.
So sánh nhanh baseline và image
| Tiêu chí | Baseline | Image |
|---|---|---|
| Mức chuẩn hóa | Tốt cho bản vá riêng lẻ | Tốt cho trạng thái cluster đồng nhất |
| Phần cứng pha trộn | Linh hoạt hơn | Cần kiểm tra kỹ add-on và compatibility |
| Vận hành dài hạn | Dễ phát sinh lệch cấu hình | Dễ kiểm soát compliance hơn |