Mặc dù có nhiều thay đổi về lĩnh vực lưu trữ, nhưng vẫn có một số nguyên tắc cơ bản tồn tại và không thay đổi. Hãy cũng xem xét các đặc điểm chính và các trường hợp sử dụng của lưu trữ Block Storage, File Storage và Object Storage.
Sự phát triển của đám mây, sự xuất hiện của các hệ thống siêu hội tụ (HCI) và tốc độ cực nhanh của bộ nhớ NVMe có lẽ đã làm khuất đi một số nguyên tắc cơ bản của lưu trữ.
Tuy nhiên, ở gốc gác của vấn đề, tất cả các loại lưu trữ được phân loại thành Block, File hoặc Object, với các thuật ngữ đó bắt nguồn từ cách dữ liệu được truy cập trong mỗi chế độ.
Về cơ bản, bộ nhớ vật lý chứa dữ liệu có chung một đặc điểm. Cụ thể, nó bao gồm một phương tiện có thể đăng ký sự hiện diện hay không của các bit dữ liệu và điều đó giống nhau cho dù đó là các ổ cứng từ tính chậm nhất hay flash NVMe siêu nhanh.
Nơi mọi thứ bắt đầu khác nhau là ở cách thông tin mức bit-level tạo nên một phần của bức tranh lớn hơn và đó là nơi xuất hiện những khác biệt chính giữa Block storage, File storage và Object storage.
File và Block chia sẻ rất nhiều, cụ thể là trong mối quan hệ của chúng với File System. Object, ở một góc độ khác, được tạo ra từ một thứ hoàn toàn khác.
Quy tắc của File System, OK?
Hầu hết những gì chúng ta biết về cách dữ liệu được lưu trữ dựa trên khái niệm File System đã có từ vài thập kỷ. Block và File storage được xác định bởi mối quan hệ của chúng với nó.
Block access storage – như được triển khai trong hệ thống lưu trữ SAN (Storage Area Network) – chỉ cung cấp phương tiện để xác định các khối lưu trữ từ file system, database, v.v… Khi bạn mua hệ thống lưu trữ SAN / Block, bạn chỉ đơn thuần là mua mảng lưu trữ và khả năng định cấu hình khối lượng để cung cấp chúng cho các ứng dụng thông qua một file system thường trú ở nơi khác trong software stack.
File access storage – thường được sử dụng thông qua thiết bị lưu trữ gắn mạng (NAS) – là điều dễ hiểu nhất đối lập với điều trên. Nói cách khác, khi bạn mua một bộ NAS hoặc một cụm các node NAS mở rộng được liên kết với nhau, chúng đi kèm với file system của riêng chúng với phần lưu trữ được hiện diện cho các ứng dụng và người dùng ở dạng ký tự ổ đĩa quen thuộc. Mọi thứ SAN làm cũng được thực hiện trong hệ thống NAS, nhưng nó bị ẩn đi.
Object storage thì lại khác. Nó dựa trên cấu trúc “phẳng” với quyền truy cập vào các đối tượng thông qua các mã định danh duy nhất, hơi giống với cách các trang web được đánh địa chỉ trong hệ thống tên miền (DNS). Điều đó làm cho nó hoàn toàn không giống với cấu trúc File System phân cấp, theo cấu trúc cây.
File, Block, Object: Hiệu suất và các trường hợp ứng dụng
Cho dù là lưu trữ File, Block hoặc Object đi một chặng đường dài để xác định hiệu suất có thể xảy ra và các trường hợp sử dụng. Tuy nhiên, nó không phải là yếu tố quyết định duy nhất và với sự ra đời của bộ nhớ flash cực nhanh, các vết lõm hiệu suất nhỏ trước đây có thể được san phẳng.
Tuy nhiên, nói chung, mỗi chế độ lưu trữ đều có những đặc điểm chính cho dù được sử dụng tại chỗ hay trên đám mây.
Bộ nhớ file, như bạn mong đợi, tốt cho việc lưu trữ và truy cập file. Nói cách khác, sẽ tốt nếu bạn muốn truy cập toàn bộ file và điều đó cũng tốt cho việc lưu trữ file chung hoặc cho các khối lượng công việc chuyên biệt hơn yêu cầu quyền truy cập file, chẳng hạn như file phim. Nó cũng là một lựa chọn tốt cho dữ liệu ở đầu kia của thang kích thước nếu nó tồn tại dưới dạng các file nhỏ, chẳng hạn như trường hợp dữ liệu máy hoặc cảm biến mà bạn muốn chạy phân tích.
Lưu trữ file dưới dạng NAS cũng rất phù hợp để làm việc với các ứng dụng cần khóa file hoặc được viết dưới dạng ứng dụng tại chỗ “truyền thống”.
Đã nói tất cả những điều đó, lưu trữ đối tượng cũng cung cấp quyền truy cập ở cấp file, nhưng không có khóa file. Nó cũng ít có khả năng được giải quyết bởi nhiều ứng dụng trừ khi chúng được viết để sử dụng với lưu trữ đối tượng.
Block access qua SAN
Trong khi đó, lưu trữ khối cũng có thể làm tất cả những điều này. Xét cho cùng, nó hoạt động với một File System để cung cấp cho ứng dụng quyền truy cập vào dữ liệu.
Tuy nhiên, lưu trữ khối là tốt nhất khi cung cấp quyền truy cập vào các khối tạo thành một phần của các file lớn hơn. Một trường hợp sử dụng điển hình ở đây là truy cập cơ sở dữ liệu trong đó nhiều người dùng truy cập đồng thời những gì về cơ bản là cùng một file, nhưng các phần khác nhau của nó và với việc khóa hoạt động ở cấp file con.
Một đặc điểm chính của lưu trữ khối là hiệu suất của nó, có được từ việc tinh gọn và hiệu quả, đồng thời không phải xử lý siêu dữ liệu và thông tin File System, v.v. Vì vậy, nó lý tưởng cho độ trễ thấp, hiệu suất đầu vào / đầu ra ( I / O ) nhất quán cho các ứng dụng hướng cơ sở dữ liệu có thể bao gồm email, cũng như máy ảo (VM) và máy tính để bàn.
Giống như lưu trữ truy cập file, lưu trữ SAN truy cập theo khối có thể sẽ quen thuộc hơn với hầu hết các ứng dụng doanh nghiệp. Nó thường tạo thành nền tảng của các hệ thống lưu trữ cao cấp nhất và do đó đắt tiền nhất trong doanh nghiệp và thường là với phương tiện flash, và hiện nay thường là biến thể NVMe siêu nhanh của nó.
Các sản phẩm SAN thường có các yêu cầu về kỹ năng riêng, với các giao thức Fibre Channel và iSCSI là những giao thức thường được sử dụng.
Lưu trữ đối tượng
Lưu trữ đối tượng nổi lên như một đối thủ của lưu trữ truy cập file cho số lượng lớn dữ liệu phi cấu trúc khi các File System NAS mở rộng quy mô bắt đầu hoạt động kém theo số lượng file được lưu trữ.
Nơi lưu trữ truy cập file với cấu trúc file phân cấp của nó có thể trở nên cồng kềnh khi nó phát triển, lưu trữ đối tượng mang đến một cấu trúc “phẳng” với quyền truy cập bình đẳng vào tất cả các đối tượng được lưu giữ, làm cho nó đặc biệt phù hợp với khối lượng lớn dữ liệu phi cấu trúc.
Một đặc điểm khác là các đối tượng trong bộ lưu trữ đối tượng cũng có thể được đi kèm với một bộ siêu dữ liệu phong phú hơn so với trong File System truyền thống. Điều đó có khả năng làm cho dữ liệu trong bộ lưu trữ đối tượng cũng phù hợp với phân tích. Lưu trữ đối tượng cũng rất phù hợp với các hoạt động web và các ứng dụng gốc đám mây hơn là file và khối.
Hạn chế so với phương pháp tiếp cận dựa trên File System bao gồm lưu trữ đối tượng không có cơ chế khóa và nhiều ứng dụng hiện có không thể hoạt động dễ dàng với nó như chúng có thể với các chế độ truy cập truyền thống hơn.
Ngoài ra, lưu trữ đối tượng có xu hướng hoạt động kém nhất trong tất cả các chế độ lưu trữ một phần do chi phí siêu dữ liệu nặng hơn, mặc dù điều đó đang thay đổi .
Một nhược điểm có thể có khác khiến đối tượng không được điều chỉnh tốt cho các hoạt động quan trọng về thời gian hơn, và chắc chắn không phải là các quy trình giao dịch, đó là nó không nhất quán. Nói cách khác, việc lưu trữ đối tượng cuối cùng nhất quán giữa các bản sao được nhân đôi tồn tại.