Glusterfs là gì? Cấu hình Glusterfs như nào - Phần 1
FASTER - STRONGER - SAVER
sales@vietdata.com.vn   0914 83 55 22
Trang Chủ > Kiến thức dịch vụ > Tin tức công nghệ nổi bật >Glusterfs là gì? Cấu hình Glusterfs như nào – Phần 1

Glusterfs là gì? Cấu hình Glusterfs như nào – Phần 1

Glusterfs là gì?

Khi các hệ thống lưu trữ ngày càng trở nên rộng lớn, thách thực được đặt ra là làm sao để nó vận hành được tối ưu và dễ dàng mở rộng thêm hơn nữa. Hãy tưởng tượng giờ ta có khoảng 10TB dung lượng lưu trữ trên một server storage, ở đó các các client kết nối vào, tất cả các hoạt động đọc ghi được thực hiện trên server lưu trữ này. Giả sử đến một thời điểm nào đó, tất cả các hoạt động đọc ghi trên server storage này đều đã quá tải, ta lại có một server tương tự đã chuẩn bị sẵn. Vậy cách nào để ghép thêm server storage mới này vào hoạt động cùng server storage cũ và chia sẻ tải I/O của nó. Đó là lúc ta cần đến Glusterfs.

Glusterfs thực hiện chính xác việc kết hợp nhiều server storage lại thành một khối storage lớn. Ưu điểm của glusterfs đó là:

. Glusterfs là một mã nguồn mở.

. Glusterfs dễ dàng triển khai trên các server phần cứng thông dụng.

. Gluster tuyến tính hóa giữa dung lượng và hiệu suất, có nghĩa là nếu đã mở rộng dung lượng thì hiệu suất cũng sẽ tăng theo.

. Glusterfs xử lý dễ dàng vài Petabyte, cung cấp truy nhập cho hàng ngàn server một lúc.

Để hiểu sâu hơn về Glusterfs, trước tiên ta cần hiểu về NFS, VFS

. NFS: là một kỹ thuật truy nhập vào vùng lưu trữ dữ liệu thông qua mạng TCP/IP. Nói đơn giản thì NFS cho ta một kết nối đến 1 vùng dữ liệu ở một máy tính khác như thể vùng này là các ổ đĩa hay partition trên máy hiện tại.

. VFS: là một giao tiếp giữa kernel và các filesystem khác nhau trong Linux cho phép các ứng dụng hoạt động mà không cần biết về loại của filesystem bên dưới. Các hoạt động đọc và ghi không được thực hiện bới VFS mà VFS chỉ chuyển giao các hoạt động được yêu cầu bới user/ ứng dụng này đến module filesystem bên dưới nằm trong kernel.

Bộ nhớ máy tính được chia thành 02 phân vùng gọi là User Space và Kernel Space. Hiện nay, hầu hết các filesystem nằm bên trong Kernel Space dưới dạng một module. Tuy nhiên có rất nhiều cách khác nhau để sử dụng các filesystem này mà không cần phải đụng đến kernel. Đó chính là FUSE (File System in User Space), cách thức cho phép sử dụng file system ngay trong User Space. FUSE cung cấp một cầu nối giữa file system và VFS, do đó chỉ cần các module FUSE là ta đã có thể sử dụng các loại filesystem khác nhau trên Linux. Các module phổ biến hiện nay là: NTFS 3g, SSHFS, HDFS, GluterFS.

Kiến trúc Gluster dựa trên bốn yếu tố chính:

. Node: các máy chủ lưu trữ được cài đặt Gluster.

. Brick: Là một folder / mount point / file system trên một node để chia sẻ với các node tin cậy khác trong hệ thống (trusted storage pool) – Trên một node có thể có nhiều Brick (s). – Brick được dùng để gán (assign) vào các vùng dữ liệu (volume). – Các brick trong một volume nên có dung lượng lưu trữ (size) bằng nhau.

. Volume: là một khối logic chứa nhiều Brick, Gluster đóng vai trò như một LVM (Logical Volume Manager) bằng cách quản lý các brick phân tán trên các máy chủ như là một điểm kết nối lưu trữ duy nhất trên mạng.

. Client: là các máy tính kết nối với hệ thống lưu trữ của Gluster. Đó có thể là các Windows client chuẩn (thông qua CIFS), NFS client, hay sử dụng Gluster client cải tiến hơn so với NFS, đặc biệt là tính sẵn sàng cao.

Các dạng Volume khác nhau trong hệ thống Distributed File System

1. Distributed Volume

Với kỹ thuật này, các files (data) sẽ được phân tán, lưu trữ rời rạc (distributed) trong các bricks khác nhau . Ví dụ, bạn có 100 files: file1, file2, file3…, file100. Thì file1, file2 lưu ở brick1, file3,4lưu ở brick2, etc. Việc phân bố các files trên brick dựa vào thuật toán hash.

Ưu điểm: Mở rộng được dung lượng lưu trữ nhanh chóng và dễ dàng, tổng dung lượng lưu trữ của volume bằng tổng dung lượng của các brick.

Nhược điểm: Khi một trong các brick bị ngắt kết nối, hoặc bị lỗi thì dữ liệu sẽ bị mất hoặc không truy vấn được.

2. Replicated Volume

Với kỹ thuật này, dữ liệu sẽ được copy sang các bricks trong cùng một volume. Nhìn vào hình, chúng ta thấy rõ ưu điểm đó là dữ liệu sẽ có tính sẵn sàng cao và luôn trong trạng thái dự phòng tương tự Raid 1.

3. Striped Volume

Với kỹ thuật này, dữ liệu được chia nhỏ thành những phần khác nhau và lưu trữ ở những brick khác nhau trong volume. Kỹ thuật này tương tự RAID 0.

Ưu điểm: Phù hợp với việc lưu trữ mà dữ liệu cần truy xuất với hiệu năng cao, đặc biệt là truy cập vào những tệp tin lớn.

Nhược điểm: Khi một trong những brick trong volume bị lỗi, thì volume đó không thể hoạt động được

4. Distributed Replicated Volume

Kỹ thuật này là sự kết hợp giữa kỹ thuật 1 (Distributed Volume) và kỹ thuật 2 (Replicated Volume). Các file được phân tán trên các Brick trong cùng một Volume. Ưu điểm là dữ liệu có tính sẵn sàng cao tuy nhiên nhược điểm là khi 1 volume có lỗi thì dữ liệu sẽ bị ảnh hưởng.

5. Distributed Striped Volume

Kết hợp kỹ thuật 1 (Distributed Volume) và kỹ thuật 3 (Striped Volume). Các file được phân tán trên các Brick nằm ở các Volume khác nhau. Kỹ thuật này không có tính sẵn sàng của dữ liệu mà chỉ có tác dụng phân tán dữ liệu với tốc độ truy xuất nhanh.

Trong phần tiếp theo chúng ta sẽ xem cách thức cài đặt và cấu hình GlusterFS trên CentOS.

—————————————————————

MỌI THÔNG TIN CHI TIẾT VUI LÒNG LIÊN HỆ

CÔNG TY CỔ PHẦN GIẢI PHÁP DỮ LIỆU TRỰC TUYẾN ANZ

Địa chỉ: Biệt thự 11 ngõ 233 đường Xuân Thủy, quận Cầu Giấy, Hà Nội

Email: info@1hosting.com.vn

Hotline: 0915 54 99 22