vCenter Server là điểm điều phối trung tâm của hạ tầng vSphere: inventory, quyền quản trị, cluster, DRS, HA, template, policy, vMotion và nhiều plugin đều đi qua đây. Vì vậy, nâng cấp vCenter cần được xem như một thay đổi hạ tầng cấp cao, có kế hoạch kiểm thử và phương án quay lui rõ ràng.
Vì sao không nên nâng cấp vCenter theo kiểu nóng vội
Một appliance vCenter lỗi có thể không làm máy ảo đang chạy tắt ngay, nhưng nó khiến đội vận hành mất quyền quản trị tập trung, không còn thao tác được cluster, không thay đổi được policy và không xử lý được một số tình huống khẩn cấp. Với doanh nghiệp dùng nhiều host ESXi, đây là rủi ro vận hành rất lớn.
Điểm cần nhớ là vCenter thường liên kết với nhiều thành phần bên ngoài: backup, monitoring, NSX, vSAN, identity provider, certificate authority, DNS, NTP và hệ thống ticket/change. Một bản nâng cấp thành công về mặt appliance nhưng làm hỏng plugin hoặc mất kết nối tới backup vẫn là một sự cố thay đổi.
Chuẩn bị trước khi nâng cấp
Bắt đầu bằng việc xác định phiên bản hiện tại, phiên bản đích, build number, compatibility matrix với ESXi host, plugin, backup software và storage integration. Nếu cụm đang có host cũ, driver đặc thù hoặc vSAN, nên rà thêm firmware và HCL trước khi quyết định lịch nâng cấp.
Tiếp theo là backup. Với vCenter Server Appliance, doanh nghiệp nên có file-based backup hợp lệ, kiểm tra credential lưu trữ backup, đồng thời ghi lại cấu hình SSO, DNS, NTP, certificate, proxy và tài khoản break-glass. Snapshot có thể dùng như một điểm bảo vệ ngắn hạn trước nâng cấp, nhưng không thay thế backup đầy đủ.
Quy trình triển khai khuyến nghị
Nên triển khai trong cửa sổ bảo trì có người phụ trách hạ tầng, mạng, backup và ứng dụng trực sẵn. Trước khi bắt đầu, dừng các job thay đổi lớn như vMotion hàng loạt, storage migration, backup full hoặc task provisioning tự động. Sau đó chạy pre-check, xác nhận cảnh báo không nghiêm trọng, ghi lại trạng thái service và bắt đầu nâng cấp appliance.
Sau nâng cấp, đừng chỉ đăng nhập được giao diện là kết luận xong. Cần kiểm tra inventory, health service, certificate, cluster HA/DRS, vSAN health nếu có, kết nối plugin, job backup, quyền người dùng và khả năng quản trị từng host. Một bài test nhỏ như tạo snapshot thử, vMotion một VM ít quan trọng hoặc đọc lại policy sẽ giúp phát hiện lỗi sớm.
Lỗi thường gặp
Nhiều sự cố đến từ những việc tưởng nhỏ: DNS đảo ngược sai, NTP lệch, certificate hết hạn, tài khoản backup không đủ quyền, plugin chưa tương thích hoặc không đủ dung lượng phân vùng appliance. Các lỗi này nên được loại bỏ trước ngày bảo trì, thay vì xử lý trong lúc hệ thống đang bị áp lực thời gian.
Checklist triển khai nhanh
- Xác nhận compatibility matrix giữa vCenter, ESXi, plugin, backup và storage.
- Tạo file-based backup vCenter và kiểm tra nơi lưu backup truy cập được.
- Ghi lại build number, IP, FQDN, DNS, NTP, certificate và tài khoản quản trị khẩn cấp.
- Dọn cảnh báo health nghiêm trọng trước khi nâng cấp.
- Kiểm tra lại HA, DRS, vMotion, plugin và job backup sau nâng cấp.
Bảng kiểm rủi ro trước nâng cấp
| Hạng mục | Câu hỏi cần trả lời | Rủi ro nếu bỏ qua |
|---|---|---|
| Backup | Có bản backup vCenter hợp lệ và biết cách restore không? | Mất khả năng quay lui khi appliance lỗi. |
| Tương thích | Plugin và ESXi host có hỗ trợ phiên bản đích không? | Plugin hỏng hoặc host không quản trị ổn định. |
| Danh tính | SSO, AD/LDAP và tài khoản break-glass còn hoạt động không? | Không đăng nhập được sau nâng cấp. |