Sáu “trụ cột” của tối ưu hóa chi phí đám mây

10:21 AM 18/06/2019 In bài viết

Hình ảnh có liên quan

Công ty của bạn đã chuyển một số hoặc tất cả các dự án cũng như ứng dụng sang đám mây công cộng và vì mọi thứ dường như đang hoạt động khá trơn tru, từ quan điểm sản xuất, nên hầu hết mọi người trong công ty đều cảm thấy hài lòng về quá trình chuyển.

Lời hứa về việc chuyển sang đám mây để cắt giảm chi phí đã không được thực hiện và việc cố gắng giải thích con số trong các hóa đơn hàng tháng từ nhà cung cấp đám mây khiến bạn bối rối.

Từ phí cho các phiên bản dự trữ, phiên bản theo yêu cầu đến tỷ lệ sử dụng trực tuyến, việc cố gắng hiểu ý nghĩa của những dòng phí này sẽ không khiến bạn biết được nơi bạn có thể tối ưu hóa chi tiêu của mình.

Nó không phải là về việc bộ phận kế toán cần phải nắm được toàn bộ cấu trúc giá hoặc chi tiết từng dịch vụ tổ chức đang sử dụng. Trên thực tế, có ít nhất 500.000 mã dịch vụ và kết hợp giá trong AWS! Vấn đề ở đây là nhóm của bạn có thể không đặt ra giới hạn về việc ai có thể kích hoạt tài nguyên đám mây hoạt động, đặc biệt là khi nhân viên của bạn để chúng chạy trong nền và khi đó đồng hồ tính tiền sẽ liên tục hoạt động.

Thực tế, giải quyết vấn đề phức tạp luôn chuyển động này không phải là một điều đơn giản và nó đòi hỏi một cách tiếp cận toàn diện và đặc thù, bắt đầu bằng việc hiểu được có nhiều cơ hội sẵn có để tối ưu hóa chi phí và hiệu suất. Đây là nơi mà sáu trụ cột tối ưu hóa đám mây của chúng ta xuất hiện.

Phiên bản dự trữ

Khác với phiên bản theo yêu cầu, trả tiền theo khối lượng sử dụng thực tế, hiểu một cách đơn giản, phiên bản dự trữ (Reserved Instance - RI) là khối lượng sử dụng bạn mua trước dựa trên ước tính của mình. Khối lượng sử dụng thực tế có thể ít hơn so RI bạn mua nhưng các RI thường đi kèm với ưu đãi tài chính tuyệt vời, ví dụ như RI của AWS có mức chiết khấu lớn lên đến 75% so với giá của phiên bản theo nhu cầu.

Các RI từ AWS, Azure hay Google Cloud đều cho phép bạn ước tính trước những gì mình sẽ sử dụng. Điều này cũng cho phép bạn giảm đáng kể chi phí cũng như nhận được những ưu đãi tài chính tuyệt vời.

Hầu hết các chiến lược tối ưu hóa chi phí trên đám mây bắt đầu và kết thúc tại đây, đó là một sai lầm. Quan trọng là bạn và tổ chức phải biết được mình cần bao nhiêu RI để đạt được điểm tối ưu. Hiện nay có rất nhiều công cụ giúp bạn ước tính số lượng RI cần mua được cung cấp trực tiếp bởi các nhà cung cấp đám mây hoặc thông qua các công cụ tối ưu hóa của bên thứ ba. Ví dụ: CloudHealth của VMware cung cấp một bức tranh rõ ràng về nơi bạn cần bổ sung RI dựa trên việc sử dụng đám mây hiện tại của bạn trong một số tháng và nó sẽ giúp bạn quản lý vòng đời RI của mình theo thời gian.

Hai trong số các yếu tố chính cần xem xét khi mua RI là mức độ chấp nhận rủi ro và danh mục quản lý RI tập trung.

  • Mức độ chấp nhận rủi ro đề cập đến việc xác định số tiền bạn sẵn sàng chi tiêu trước để tăng khả năng sinh lời hoặc thu hồi chi phí trong tương lai. Ví dụ: tổ chức của bạn có thể chấp nhận rủi ro và chi trả 70% khối lượng công việc của bạn với các RI không? Hay bạn đang lo lắng về mức tiêu thụ nên bạn muốn giới hạn ở mức khoảng 20-30%? Ngoài ra, bạn có thể lên kế hoạch trước được trong bao nhiêu năm? Một năm là ít rủi ro nhất, chắc chắn, nhưng ba năm, một cam kết tài chính lớn hơn, thường đi kèm với những khoản chi phí tiết kiệm được nhiều hơn.
  • Danh mục quản lý RI tập trung liên quan đến phạm vi RI bao phủ giữa các đơn vị tổ chức. Quản lý càng tập trung thì cơ hội tiết kiệm càng lớn hơn. Chẳng hạn, một nhóm ứng dụng đơn lẻ có thể bị giới hạn ngân sách để mua RI. Với cách tiếp cận tập trung, việc quản lý RI được thực hiện ở cấp độ toàn bộ tổ chức, bao gồm tất cả các phòng ban và nhóm cho tất cả các khối lượng công việc dựa trên các mục tiêu của công ty. Cách tiếp cận này, tất nhiên, cũng đòi hỏi sự liên lạc liên tục giữ các nhóm riêng biệt để hiểu được các nguồn lực hiện tại và tương lai cần thiết để tạo ra và triển khai một chương trình quản lý RI thành công

Khi bạn xác định được mức độ chấp nhận rủi ro của mình và mức độ quản lý RI tập trung, bạn có thể tận dụng tùy chọn tối ưu hóa này. Mặc dù vậy, một chiến lược tối ưu hóa chỉ nhìn vào RI là thiển cận. Nó chỉ cho phép bạn tận dụng các tùy chọn chiết khấu mà nhà cung cấp đám mây của bạn cung cấp. Điều quan trọng là kết hợp RI với năm trụ tối ưu hóa khác để đạt được hiệu quả cao nhất.

Tự động tắt nguồn

Một trong những lợi ích của đám mây là tăng/giảm khả năng điện toán của tài nguyên khi bạn cần. Tuy nhiên, nhược điểm của công nghệ ăn liền này là tạo ra rất ít động lực cho các thành viên trong nhóm kết thúc các quy trình sau khi hoàn thành công việc. Tự động tắt nguồn đề cập đến việc lập lịch trình tắt các tài nguyên trong thời gian nghỉ, một công cụ đặc biệt hữu ích cho môi trường phát triển và thử nghiệm. Xác định tài nguyên nhàn rỗi của bạn thông qua công cụ gắn thẻ mạnh mẽ là bước đầu tiên; điều này cho phép việc xác định chính xác các tài nguyên có thể tắt đi hiệu quả hơn. Bước thứ hai liên quan đến việc tự động hóa quá trình tăng/giảm khả năng điện toán. Các công cụ như ParkMyCloud, Trình lập lịch biểu AWS, Tự động hóa Azure và Trình lập lịch biểu đám mây của Google có thể giúp bạn quản lý toàn bộ quá trình tự động tắt.

Xác định đúng kích thước

Xác định đúng kích thước phiên bản là cách tốt nhất để đảm bảo bạn sử dụng chính xác những gì bạn cần, không quá ít hoặc quá nhiều. Có vẻ như việc kích hoạt tính năng đưa ra các gợi ý điều chỉnh kích thước ngay lập tức khi bạn bắt đầu sử dụng môi trường đám mây là điều hiển nhiên. Tuy nhiên, nếu đám mây không có khả năng phân tích mức tiêu thụ tài nguyên cũng như bồi hoàn thanh toán, điều chỉnh kích thước trở thành một khái niệm vô nghĩa. Các yêu cầu về hiệu năng và năng suất cho các ứng dụng đám mây thường thay đổi theo thời gian và điều này chắc chắn dẫn đến các tài nguyên nhàn rỗi hoặc chưa được sử dụng hết công suất.

Nhiều nhà cung cấp đám mây chia sẻ các thực tiễn tốt nhất về điều chỉnh kích thước nhưng chủ yếu họ dành thời gian để giải thích các tùy chọn kích thước trong quá trình di chuyển sang đám mây. Điều này thật đáng tiếc vì việc điều chỉnh kích thước phải là một hoạt động diễn ra liên tục, đòi hỏi tổ chức thực thi các chính sách và biện pháp bảo vệ để giảm thiểu việc cung cấp quá mức, gắn thẻ tài nguyên để kích hoạt các khoản bồi hoàn ở cấp bộ phận và giám sát đúng cách CPU, Bộ nhớ và I/O.

Điều chỉnh kích thước cũng phải tính đến các tài nguyên tự động tắt và RI có sẵn.

Làm mới loại phiên bản

Các nhà cung cấp thường phân loại phiên bản thành từng loại căn cứ vào phần cứng và mỗi loại phiên bản cũng cung cấp các tùy chọn thông số tính toán, bộ nhớ và lưu trữ khác nhau. Khi phần cứng cần thiết để duy trì hoạt động của một loại phiên bản được thay thế bằng công nghệ mới hơn, những phiên bản thuộc trong nhóm này thường bị ngừng hoặc chấm dứt hoạt động. Giá cả của đám mây thay đổi trực tiếp liên quan đến sự thay đổi của phần cứng. Điều này được gọi là làm mới loại phiên bản.

Cập nhật kiến thức về các loại phiên bản đang được sử dụng trong tổ chức của bạn là một bước quan trọng trong quá trình dự đoán khi nào chi phí của bạn sẽ biến động. Mặc dù vậy, với hơn 500.000 mã dịch vụ và kết hợp giá của bất kỳ nhà cung cấp đám mây nào, nhiệm vụ đó dường như hoàn toàn là không thể.

Tuy nhiên, có một số công cụ có thể giúp bạn theo dõi/ước tính việc làm mới phiên bản, mặc dù chúng thường không tính đến sự chồng chéo xảy ra với các RI hoặc khi bạn áp dụng bất kỳ trụ cột tối ưu hóa nào khác. Kết quả là, đối với nhiều tổ chức, việc ước tính làm mới phiên bản được thực hiện thủ công và tốn nhiều công sức.

Tài nguyên thải

Đồ thừa có vẻ như là một khái niệm trừu tượng khi nói về tài nguyên ảo, nhưng mỗi đơn vị lãng phí trong đám mây của bạn tương đương với hàng trăm đô la chi tiêu không có mục đích. Và, việc không có giới hạn về số lượng tài nguyên bạn có thể sử dụng (trong trường hợp bạn sử dụng phiên bản theo yêu cầu hoặc phiên bản dự trữ) đồng nghĩa với việc không có một động lực nào cho các cá nhân sử dụng tài nguyên tự điều chỉnh các phiên bản chưa sử dụng/không được tận dụng hết. Một số ví dụ về tài nguyên thải trong đám mây bao gồm:

  • Các phiên bản AWS RDS hoặc Azure SQL DB không có kết nối
  • Các phiên bản AWS EC2 không được sử dụng
  • Máy ảo Azure được tạo ra để đào tạo hoặc thử nghiệm
  • Các bản sao của ổ đĩa quá hạn đang chiếm không gian lưu trữ
  • Cân bằng tải nhàn rỗi
  • Các khối dữ liệu lượng không được gắn vào đâu

Xác định tài nguyên thải là việc cần phải có thời gian và báo cáo chính xác. Do vậy, đầu tư thời gian và công sức để phát triển một chiến lược gắn thẻ thích hợp là một quyết định sáng suốt vì khi đó bạn có thể truy xuất được nguồn gốc và nơi phát sinh tài nguyên thải, từ đó, dễ dàng đánh dấu chúng cho mục đích rà soát và/hoặc loại bỏ. Các công ty thường mua RI trước khi loại bỏ tài nguyên thải, điều này dẫn đến các khoản bội chi cho đám mây - ít nhất trong một năm.

Lưu trữ

Lưu trữ trong đám mây là một cách tuyệt vời để giảm chi tiêu cho các phần cứng tại chỗ. Tuy nhiên, vì tính dễ sử dụng của mình, lưu trữ đám mây có thể, trong một thời gian rất ngắn, mở rộng theo cấp số nhân, khiến cho bạn gần như không thể dự đoán chi tiêu chính xác cho đám mây của mình. Lưu trữ đám mây thường được tính phí theo bốn đặc điểm:

  • Kích thước - bạn cần bao nhiêu dung lượng?
  • Truyền dữ liệu (băng thông) - tần suất dữ liệu của bạn cần di chuyển từ vị trí này sang vị trí khác?
  • Thời gian truy xuất - bạn cần truy cập dữ liệu của mình nhanh như thế nào?
  • Yêu cầu truy xuất - bạn có thường xuyên truy cập dữ liệu của mình không?

Có nhiều tùy chọn phù hợp với các trường hợp sử dụng khác nhau như: nhiều dung lượng lưu trữ, tập trung vào cơ sở dữ liệu, sao lưu dữ liệu và/hoặc lưu trữ dữ liệu. Việc có một chính sách vòng đời dữ liệu chắc chắn sẽ giúp bạn ước tính được những con số này và đảm bảo bạn sử dụng tùy chọn phù hợp nhất với nhu cầu của tổ chức cũng như tận dụng được nhiều nhất khả năng của đám mây.

Vì vậy, bạn thấy đấy, sáu trụ cột tối ưu hóa này chứa nhiều bộ phận không ngừng chuyển động, đồng thời các nhà cung cấp đám mây công cộng cũng liên tục thay đổi dịch vụ và chính sách giá của mình, do vậy, việc thay đổi đám mây bướng bỉnh của bạn dường như là một cuộc chiến không hồi kết. Thêm vào đó, nếu bạn chỉ tối ưu hóa một trong những trụ cột này mà không xem xét các yếu tố khác thì hiệu quả bạn nhận được là rất ít, thậm chí trong thực tế, bạn còn có thể tốn nhiều tiền hơn. Một quy trình tối ưu hóa hiệu quả phải kết hợp tất cả các trụ cột, đồng thời tổ chức cũng phải đưa ra các chính sách và biện pháp bảo vệ phù hợp để đảm bảo kiểm soát được tất cả các phiên bản đám mây đang được sử dụng cũng như triển khai các công cụ phù hợp để cho phép các nhóm thường xuyên đưa ra quyết định sáng suốt.

Khi bạn đã hoàn thành đánh giá môi trường hiện tại của mình, xem xét các trụ cột và thực hiện các thay đổi cần thiết để tối ưu hóa đám mây, tìm ra cách để thực hiện quy trình này liên tục, lúc này, bạn có thể phát hiện ra các điểm tối ưu hóa thông qua cải tiến mã nguồn, tái cấu trúc ứng dụng, sử dụng các phiên bản dự trữ và kiến trúc không máy chủ.

Thùy Linh