CHECKLIST TẬP TRUNG LÀM VIỆC CHO QUẢN TRỊ VIÊN HỆ THỐNG/MẠNG

A. Thiết Lập Môi Trường Giám Sát

  • Cấu hình dashboard monitoring chính
    • System metrics (CPU, RAM, Disk)
    • Network metrics (Bandwidth, Latency)
    • Security alerts
    • Service status
  • Sắp xếp các màn hình hiển thị theo mức độ ưu tiên
  • Thiết lập các notification level phù hợp
  • Chuẩn bị các công cụ remote access
  • Đảm bảo backup tool hoạt động

B. Quản Lý Thời Gian Ứng Phó

  • Phân loại mức độ ưu tiên của sự cố
    • P1: Nguy cấp (< 15 phút)
    • P2: Cao (< 1 giờ)
    • P3: Trung bình (< 4 giờ)
    • P4: Thấp (< 24 giờ)
  • Lập lịch maintenance định kỳ
  • Đặt thời gian cụ thể cho công việc routine
  • Phân chia thời gian on-call
  • Lên kế hoạch dự phòng cho các tình huống khẩn cấp

C. Tổ Chức Không Gian Làm Việc

  • Thiết lập các terminal session chuyên biệt
    • Session 1: Monitoring
    • Session 2: Configuration
    • Session 3: Troubleshooting
    • Session 4: Documentation
  • Chuẩn bị các script shell thường dùng
  • Sắp xếp tài liệu tham khảo dễ truy cập
  • Tổ chức bookmark theo nhóm công việc
  • Cập nhật contact list cho các vendor/đối tác

D. Quy Trình Xử Lý Ticket

  • Phân loại ticket theo loại vấn đề
  • Tạo template câu trả lời chuẩn
  • Cập nhật status ticket kịp thời
  • Đặt reminder cho các ticket pending
  • Tổng hợp báo cáo định kỳ

E. Tối Ưu Quy Trình Làm Việc

  • Tự động hóa các task lặp lại
    • Backup check
    • Log rotation
    • System update
    • Health check
  • Tạo runbook cho các procedure phổ biến
  • Cập nhật documentation sau mỗi thay đổi
  • Lưu trữ script và config có tổ chức
  • Review log định kỳ

F. Quản Lý Tương Tác và Meeting

  • Block thời gian cho công việc cần tập trung
  • Sắp xếp lịch họp với các bên liên quan
  • Chuẩn bị báo cáo regular/weekly
  • Phân công người backup khi bận
  • Thiết lập quy trình escalation rõ ràng

G. Bảo Đảm An Toàn Thông Tin

  • Kiểm tra security alert thường xuyên
  • Review access log định kỳ
  • Cập nhật patches và firmware
  • Kiểm tra backup và DR plan
  • Test restore procedure

H. Quản Lý Sức Khỏe

  • Nghỉ giải lao sau mỗi incident
  • Thực hiện bài tập giãn cơ
  • Điều chỉnh ánh sáng màn hình
  • Uống nước đầy đủ
  • Đi bộ/vận động giữa các ca trực

I. Phát Triển Kỹ Năng

  • Theo dõi CVE và security advisory
  • Đọc tech blog và forum
  • Test các công nghệ mới trong lab
  • Tham gia các khóa training online
  • Chia sẻ kiến thức với team

J. Chuẩn Bị Cho Ca Trực

  • Kiểm tra hệ thống monitoring
  • Review các incident đang mở
  • Cập nhật thông tin từ ca trước
  • Chuẩn bị các công cụ cần thiết
  • Sạc pin các thiết bị liên lạc

K. Bàn Giao Ca

  • Tổng hợp các sự cố và xử lý
  • Cập nhật document và runbook
  • Liệt kê các task pending
  • Thông báo các vấn đề cần theo dõi
  • Kiểm tra backup status