Cần những gì để có thể xây dựng một hệ thống mạng luôn luôn hoạt động ổn định?

06/05/2013 17:53

Khái niệm “luôn luôn ổn định” là một khái niệm không có giới hạn, vì thế, tùy thuộc vào mức độ đầu tư cho một hệ thống, mà chúng ta sẽ có thể đạt đến mức độ ổn định như thế nào.

Nguồn điện:

Có thể xem đây là một vấn đề khá tiên quyết, vì nếu bạn có một hệ thống mạng ổn định đến mức tuyệt đối, mà nguồn điện bị gián đoạn thì xem như … chấm hết. Như vậy, một thiết bị muốn ổn định về nguồn điện phải có hai bộ cấp nguồn. Hầu hết các máy chủ và thiết bị mạng cao cấp đều cung cấp sẵn khả năng này. Nếu ta cắm và bật cả hai nguồn, thì trong lúc máy chủ đang hoạt động, ta có thể bất ngờ tắt bớt một nguồn, mà vẫn không ảnh hưởng gì đến hoạt động của thiết bị. Hai dây cáp nguồn này lại cần phải được cắm vào hai thiết bị tích điện (UPS) khác nhau, phòng khi có một bộ tích điện bị hỏng. Hai bộ tích điện phải có khả năng cung cấp nguồn điện để hệ thống hoạt động ít nhất từ 30-45 phút nếu công ty điện lực ngưng cung cấp điện. Tốt nhất là hai bộ tích điện phải được nối vào hai đường dây cấp của hai chi nhánh điện khác nhau. Và để đẩy độ ổn định về nguồn điện lên mức cao hơn nữa, thì bạn đừng quên trang bị một chiếc máy phát điện có đủ công suất!

Máy chủ:

Mỗi dịch vụ cần được xây dựng trên từng cụm, ít nhất hai máy chủ liên kết với nhau theo dạng Clustering. Nếu người dùng đang sử dụng dịch vụ, mà bất ngờ có một máy chủ trong cụm bị hỏng, thì họ cũng sẽ không thể nhận ra, vì máy chủ còn lại trong cụm sẽ vẫn tiếp tục phục vụ như bình thường. Hầu hết các hệ điều hành mạng như Linux hay Windows Server đều cung cấp sẵn tính năng và phương pháp cấu hình để tạo ra các cụm máy chủ. Một số phần mềm của hãng thứ ba, hoặc các hệ quản trị cơ sở dữ liệu cũng hỗ trợ việc tạo các cụm máy chủ dạng Clustering như thế.

Thiết bị lưu trữ:

Để hệ thống không bị ngừng hoạt động do đĩa cứng của máy chủ bị hỏng, hầu hết các máy chủ đều hỗ trợ sẵn tính năng RAID (Redundant Arrays of Independent Disks). Tùy thuộc vào các cấp độ RAID được dùng mà hệ thống có thể tiếp tục hoạt động khi có một, hoặc hai đĩa cứng bị hỏng. Có bảy cấp độ RAID đánh số từ 0 đến 6, hoạt động theo nguyên tắc ghi dư thừa dữ liệu, nên khi có sự cố xảy ra trên một ổ đĩa cứng bất kỳ, thì hệ thống RAID sẽ vẫn tính toán để tự khôi phục được phần dữ liệu còn thiếu đó. Các ổ cứng trong máy chủ theo chuẩn giao tiếp phần cứng SCSI, nên có thể tháo lắp nóng (hot swap). Sau khi thay ổ cứng hỏng bằng một cái mới, ta tiến hành tái tạo lại hệ thống đĩa RAID như ban đầu.

Bộ chuyển mạch mạng LAN:

Trong mạng LAN, các thiết bị hầu hết đều kết nối vào Switch. Do đó, chỉ cần một hư hỏng xảy ra tại thiết bị chuyển mạch mạng LAN này, thì mọi kết nối trong hệ thống xem như đểu hỏng. Để đảm bảo ổn định cho tầng thiết bị này, ta cũng cần có ít nhất hai Switch, cũng nối với nhau theo hình thức Clustering. Đồng thời, mỗi thiết bị hay máy chủ phải có hai kết nối đến hai Switch, bảo đảm rằng hệ thống vẫn ổn định khi có một Switch có vấn đề.

Tường lửa:

Đây là đầu mối giao tiếp chủ yếu giữa các phân vùng mạng bên trong và bên ngoài. Khi tường lửa có sự cố, mọi mối quan hệ giữa mạng LAN bên trong và mạng WAN bên ngoài hiển nhiên sẽ bị cắt đứt. Để giải quyết vấn đề này, tương tự như các thiết bị khác, ta cũng cần có ít nhất một cặp thiết bị tường lửa kết nối song song, phòng trường hợp một trong số chúng bị hỏng. Hai tường lửa phải chạy theo giải pháp Fail-over, nghĩa là tại một thời điểm chỉ có một tường lửa hoạt động, nhưng khi nó bị hỏng, tường lửa thứ hai sẽ chuyển sang trạng thái phục vụ ngay lập tức.

Tường lửa cũng có thể không hỏng nhưng lại bị vô hiệu hóa bởi các kẻ tấn công. Đó là trong trường hợp hacker sử dụng kỹ thuật tấn công chiếm quyền điều khiển, hoặc khi lỗi Zero-day xảy ra mà nhà sản xuất chưa kịp phát hiện hay vá lỗi. Muốn giải quyết tình trạng này, ta phải thiết kế tường lửa theo dạng hai lớp, như vậy nếu một lớp bị hỏng hay bị tấn công, thì mạng LAN bên trong vẫn an toàn, vì vẫn còn một lớp tường lửa thứ hai bảo vệ. Ta nên xây dựng hai lớp tường lửa bằng hai dòng sản phẩm của hai hãng khác nhau. Cách thiết kế hệ thống như vậy sẽ hạn chế được lỗi Zero-day, vì ít có khi nào cả hai dòng thiết bị lại xuất hiện lỗi bảo mật cùng một thời điểm. Khi Hacker sử dụng lỗi Zero-day để tấn công vào dòng thiết bị này, thì sẽ bị chặn bởi lớp tường lửa kia, và ngược lại.

Thiết bị định tuyến:

Là thiết bị chuyên để kết nối các điểm mạng WAN lại với nhau, một khi thiết bị định tuyến (Router) bị hỏng, thì xem như các đường kết nối WAN biến mất, và mạng máy tính của chúng ta chuyển thành các nút mạng cục bộ. Giải pháp hai Router đặt song song một lần nữa được sử dụng tại các vị trí này giúp giải quyết nguy cơ mất kết nối mạng WAN khi Router trục trặc. Do đặc điểm của thiết bị truyền dẫn mạng là định tuyến, nên hai Router được thiết kế trong hệ thống này phải được chạy một giao thức đặc biệt, nhằm đảm bảo nó vừa có tính dự phòng (Backup), vừa có tính cân bằng tải (Load balancing) trên hai đường truyền đang có.

Đường truyền:

Không một nhà cung cấp đường truyền nào dám khẳng định sẽ không có việc đứt kết nối, như vậy chúng ta phải tìm cách dự phòng đường kết nối bằng cách kéo ít nhất hai đường truyền của hai nhà cung cấp dịch vụ khác nhau. Hai đường truyền này sẽ được lắp vào hai Router khác nhau như thiết kế ở phía trên.

Hệ thống làm mát

Nhiệt độ cao sẽ làm các thiết bị hoạt động liên tục như Router hay máy chủ trục trặc hay hư hỏng. Bạn cần có một hệ thống làm mát tối ưu cho phòng thiết bị. Phải lắp đặt tối thiểu hai máy lạnh thay nhau hoạt động để phòng thiết bị luôn có một nhiệt độ ổn định và dự phòng khi một máy lạnh bị hỏng.

Phòng chống hỏa hoạn

Toàn bộ các máy chủ và thiết bị mạng phải được đặt trong một căn phòng có thiết bị phát hiện hỏa hoạn và chống cháy chuyên dụng. Việc chống cháy tự động không được phun nước hay hóa chất vì có thể làm hỏng thiết bị. Thông thường thiết bị phòng cháy an toàn sẽ sử dụng công nghệ khí trơ trong phòng kín. Khi nhiệt độ phòng thiết bị vượt quá ngưỡng cho phép, mạch bảo vệ bình khí trơ sẽ đứt và chất khí này sẽ hút sạch ô-xy trong phòng để lửa không còn nguyên liệu để gây cháy.

Phòng chống tấn công vật lý

Các loại khóa từ, kết hợp mở cửa bằng phím số, cũng như camera theo dõi phải luôn được lắp đặt để đảm bảo rằng không có các truy cập trái phép phòng thiết bị để đánh cắp hay gây tổn hại cho các thiết bị bên trong. Một hệ thống cảnh báo từ xa qua điện thoại di động khi có truy cập trái phép cũng sẽ là một phương tiện tối ưu giúp quản trị mạng theo dõi hệ thống 24/24.

Vị trí dự phòng:

Toàn bộ các giải pháp trên chỉ giúp tạo ra một nút mạng (site) có tính ổn định cao. Nhưng việc gì sẽ xảy ra nếu toàn bộ vị trí đó bị sự cố, như thiên tai, hỏa hoạn? Vì thế sẽ nảy sinh thêm nhu cầu tạo ra một vị trí khác có cấu hình tương đương để dự phòng. Để đảm bảo dữ liệu ở vị trí dự phòng cũng không khác biệt gì so với vị trí ban đầu, tiến trình sao lưu theo thời gian thực cần được thực hiện. Nghĩa là cứ có một loại dữ liệu gì được ghi xuống ở vị trí Site 1, thì nó cũng phải được ghi xuống tương tự ở vị trí Site 2. Điều đó có nghĩa là khi vị trí Site 1 gặp sự cố, thì vị trí Site 2 sẽ được sử dụng để thay thế mà không gây ra lỗi dữ liệu nào.

Tuy nhiên, việc chuyển người đang kết nối đến vị trí Site 1 này sang vị trí Site 2 sẽ đòi hỏi người quản trị thực hiện bằng tay, và gây gián đoạn cho việc phục vụ khách hàng trong môt thời gian ngắn. Ta vẫn có thể chọn lựa thêm giải pháp thiết bị dự phòng và cân bằng tải ở mức ứng dụng. Người dùng sẽ chỉ kết nối đến các thiết bị này, và nó sẽ kiểm tra xem vị trí Site 1 có đang hoạt động ổn định hay không, liên tục theo thời gian. Khi phát hiện ra sự cố, nó sẽ lặp tức chuyển người dùng sang vị trí Site 2, mà không đòi hỏi phải cấu hình gì lại. Những thiết bị dạng này thường có giá rất cao, cũng như đòi hỏi phải có nhiều kinh nghiệm trong việc cấu hình.

THANH DUY – TUYẾT PHONG

Ý kiến bạn đọc (0)
Tên   Email

Lên đầu trang