Phân mảnh dữ liệu lớn và cách kiểm soát dữ liệu

02:56 PM 22/05/2019 In bài viết

Mass data fragmentation: take control of bad data image

Việc không nắm được nội dung dữ liệu cũng như vị trí của dữ liệu có thể gây ra lỗ hổng tuân thủ và rủi ro bảo mật. Kể từ khi quy định bảo vệ dữ liệu chung (GDPR) có hiệu lực, có những nguy cơ tiềm ẩn - đặc biệt là nếu bạn đang làm việc với các dữ liệu nhạy cảm như hồ sơ tài chính hoặc sức khỏe.

Không thể phủ nhận dữ liệu là một trong những tài nguyên quý giá nhất cho các tổ chức hiện nay. Là một yếu tố kinh doanh quan trọng trong các ngành, sự hiểu biết về dữ liệu, đặc biệt là phân tích dữ liệu đóng vai trò rất quan trọng cho sự thành công. Các doanh nghiệp hiện đại đang áp dụng công nghệ để tổ chức và hiểu được lượng thông tin khổng lồ mà họ hiện thu thập được. Nhưng khi các quyết định lớn được đưa ra, dựa trên các dữ liệu “xấu – không tốt” vì không có đủ các kỹ thuật quản trị phù hợp để đảm bảo chất lượng, điều đó có nghĩa gì đối với các doanh nghiệp sử dụng dữ liệu?

Phát hiện gần đây từ Experian nhấn mạnh rằng tham vọng trải nghiệm khách hàng đang bị thách thức bởi cái gọi là ‘dữ liệu xấu’ này. Các tổ chức nghi ngờ rằng gần 1/3 số dữ liệu của họ là không chính xác, và 70% nói rằng họ không có sự kiểm soát trực tiếp mà họ cần để ảnh hưởng đến mục tiêu chiến lược. Quyền sở hữu không chính xác (69%), thiếu niềm tin vào dữ liệu (49%) và quá tải thông tin (65%) là ba yếu tố phổ biến nhất ngăn doanh nghiệp sử dụng dữ liệu để tạo lợi thế cho họ.

Nói tóm lại, các quyết định kinh doanh đang bị ảnh hưởng bởi những gì được xem là chất lượng dữ liệu kém. Câu hỏi là, điều gì đang dẫn đến sự thiếu hụt về chất lượng?

Nguyên nhân chính của sự thiếu niềm tin vào dữ liệu

Điều quan trọng cần lưu ý là sự thiếu tin tưởng vào thông tin chi tiết hoặc “dữ liệu xấu” không nhất thiết là do chính bản thân dữ liệu, mà còn có thể là do cách dữ liệu được quản lý và thu thập. Trong lịch sử, các doanh nghiệp đã giải quyết rất chậm những vấn đề về chất lượng dữ liệu, thay vào đó họ thích chịu đựng những sự phiền toái và khắc phục các vấn đề một cách bị động. Trong thực tế, hiện tượng dữ liệu được gọi là phân mảnh dữ liệu hàng loạt (mass data fragmentation) đã được đặt ra thể hiện các vấn đề về chất lượng dữ liệu, cụ thể là phân mảnh dữ liệu.

Điều này đề cập đến dữ liệu bị bỏ qua, phân tán hoặc nằm trong nhiều bản sao trên toàn bộ hệ thống công nghệ thông tin của tổ chức, dẫn đến một cái nhìn không đầy đủ về dữ liệu, các thành phần của nó và không thể trích xuất giá trị thực từ dữ liệu. Các bộ dữ liệu này thường được đặt trên bộ lưu trữ thứ cấp, được sử dụng để sao lưu, lưu trữ, chia sẻ tệp, kiểm tra, phát triển và phân tích. Hơn nữa, phần lớn đây là dữ liệu kinh doanh - khoảng 80%.

Nghiên cứu của Experian: tại sao các tổ chức nghĩ rằng họ có dữ liệu xấu?

Dữ liệu như thế nào được coi là dữ liệu xấu? Trong quá khứ, dữ liệu xấu đã khiến các công ty lớn phá sản; chưa kể, theo một nghiên cứu gần đây từ Experian, nó đã phá hỏng trải nghiệm của khách hàng

Tuy nhiên, khi bị phân mảnh - có thể cực kỳ khó khăn để xác định vị trí, quản lý hoặc đưa dữ liệu vào sử dụng. Vì vậy, thực sự không có gì lạ khi nghiên cứu Experian đã tiết lộ rất nhiều tổ chức nghi ngờ nhiều dữ liệu của họ là không chính xác, “xấu” hay khó kiểm soát. Có lẽ họ không sai.

Nghiên cứu của 900 nhà lãnh đạo công nghệ thông tin của Cohesity cho thấy: nhiều nhà lãnh đạo doanh nghiệp nhận thấy dữ liệu thứ cấp của mình rất khó để quản lý, lưu trữ tốn kém, các rủi ro tuân thủ ngày càng tăng và thậm chí là mối đe dọa đối với tinh thần trong đội ngũ công nghệ thông tin. Cả hai chương trình nghiên cứu đều chứng minh rằng việc thiếu kiểm soát về quyền sở hữu dữ liệu không chỉ ảnh hưởng đến tham vọng chiến lược, đặc biệt là về trải nghiệm của khách hàng, mà còn cả sự linh hoạt, tăng trưởng và khả năng cạnh tranh của doanh nghiệp. Rõ ràng là các doanh nghiệp không thể đứng trước sự phân mảnh dữ liệu hàng loạt và xóa bỏ các vấn đề về chất lượng dữ liệu đó, đồng thời đối mặt với những bất lợi nghiêm trọng có thể gây nguy hiểm cho thành công của doanh nghiệp trong nhiều năm tới.

Dữ liệu xấu: không chỉ là vấn đề công nghệ thông tin

Có ba lý do cho việc này. Thứ nhất, theo quan điểm của các giám đốc công nghệ thông tin, việc không thể quản lý và khai thác thông tin chi tiết là một bất lợi cạnh tranh lớn khi nói đến sự hài lòng của khách hàng và sự phát triển của sản phẩm và dịch vụ. Thứ hai, việc không thể biết nội dung dữ liệu và vị trí của dữ liệu có thể gây ra lỗ hổng tuân thủ và rủi ro bảo mật. Kể từ khi quy định bảo vệ dữ liệu chung (GDPR) có hiệu lực, có những nguy cơ tiềm ẩn - đặc biệt là nếu bạn đang làm việc với các dữ liệu nhạy cảm như hồ sơ tài chính hoặc sức khỏe. Và thứ ba, việc đấu tranh và quản lý dữ liệu phân mảnh là một sự lãng phí thời gian và tài nguyên, và thời gian và tài nguyên này có thể được sử dụng tốt hơn ở nơi khác.

Vấn đề về dữ liệu xấu và phân mảnh dữ liệu hàng loạt không chỉ là mối quan tâm của công nghệ thông tin: nó là một vấn đề kinh doanh. Nghiên cứu của Experian đã nhấn mạnh rằng 75% người thực hành dữ liệu nghĩ rằng trách nhiệm đối với dữ liệu nên nằm ở nhiều bộ phận, với sự trợ giúp thường xuyên từ bộ phận công nghệ thông tin. Nhưng chỉ có 13% doanh nghiệp trên khắp Vương quốc Anh hiện đang triển khai công nghệ để hỗ trợ việc này. Nếu bộ phận công nghệ thông tin dự kiến ​​sẽ quản lý tất cả các ứng dụng và dữ liệu thứ cấp của tổ chức trên tất cả các địa điểm, nhưng công nghệ của tổ chức lại không sẵn sàng để thực hiện mục tiêu đó, các nhà lãnh đạo công nghệ thông tin sẽ phải lo lắng về một loạt các vấn đề lớn xảy ra ở một số khu vực khác nhau.

Nghiên cứu của Cohesity cho thấy có tới 38% các nhà lãnh đạo CNTT lo ngại doanh thu khổng lồ của các nhóm CNTT, 26% lo ngại rằng họ (hoặc các thành viên trong nhóm của họ) sẽ cân nhắc bỏ việc, 43% lo ngại văn hóa với nhóm CNTT sẽ bị loại bỏ và 42% lo ngại sự hài lòng và tinh thần của nhân viên sẽ giảm sút. Nhìn rộng hơn, nghiên cứu của Cohesity cho thấy hơn 90% những người ra quyết định CNTT cao cấp cho biết: nếu họ có thể tái phân bổ chỉ một nửa nguồn lực họ đã dành để quản lý dữ liệu thứ cấp của tổ chức cho các ưu tiên kinh doanh khác, thì nó sẽ có tác động lớn đến doanh thu trong giai đoạn 5 năm.

Cách giảm thiểu vấn đề “ngắt kết nối dữ liệu” (data disconnect) trong doanh nghiệp

Mặc dù công nghệ đóng vai trò chính trong quản lý dữ liệu và cải thiện chất lượng dữ liệu, nhưng những thay đổi trong quy trình làm việc và hành vi của nhân viên cũng rất quan trọng. Experian khuyến nghị rằng đối với các công ty thuê Giám đốc Dữ liệu (Chief Data Officer) để hỗ trợ các vấn đề về bảo trì dữ liệu, điều quan trọng là phải thực hiện các chiến lược phù hợp để củng cố cả vấn đề tuân thủ và bảo mật dữ liệu, cùng với việc cho phép truy cập nhanh vào dữ liệu để doanh nghiệp có thể sử dụng ngay lập tức.

Tương tự, nếu một giải pháp được triển khai mang lại cho bộ phận CNTT cách xử lý trực tiếp sự phân mảnh dữ liệu hàng loạt, những kiến ​​trúc có chất lượng dữ liệu kém, thì doanh nghiệp nên có phần thưởng xứng đáng, tuy nhiên, những giải pháp vẫn cần được đo lường và phân tích.

Tất nhiên, các giải pháp sẽ phải bao gồm một biện pháp phù hợp hơn để lưu trữ, quản lý, bảo vệ và trích xuất giá trị từ các nhóm dữ liệu thứ cấp trên phạm vi rộng. Phá vỡ các silo kinh doanh, giảm các bản sao và sử dụng công nghệ để giúp truy cập dữ liệu mà không cần mọi người tạo ra quá nhiều bản sao - nhờ đó giảm bớt các yêu cầu lưu trữ, một chiến thắng cho CNTT và các bộ phận mà nó phục vụ. Nhưng đây là một vấn đề về văn hóa và quá trình kinh doanh cũng như một vấn đề về đo lường và công nghệ.

Và cuối cùng, dữ liệu đáng tin cậy không chỉ cung cấp một nền tảng để đưa ra quyết định kinh doanh tốt hơn, nó có thể mang lại danh tiếng cho doanh nghiệp, như một đối tác đáng tin cậy. Trong thế giới kinh doanh hiện tại, điều đó là vô giá.

An Nhiên