Dữ liệu của bạn có giá trị thế nào đối với các công ty công nghệ thông tin?

09:52 AM 22/07/2019 In bài viết

Shutterstock photo

Đạo luật mới được đề ra bởi các thượng nghị sĩ Mỹ Mark R. Warner và Josh Hawley để bảo vệ quyền riêng tư bằng cách buộc các công ty công nghệ thông tin tiết lộ “giá trị thật” các dữ liệu của họ cho người dùng.

Đặc biệt, các công ty có hơn 100 triệu người dùng phải cung cấp cho mỗi người dùng đánh giá tài chính giá trị các dữ liệu của họ cũng như doanh thu được tạo ra bởi việc “thu thập, xử lý, bán, sử dụng hay chia sẻ dữ liệu người dùng”. Thêm nữa, bảng điều khiển thông tin kĩ thuật số Act cũng cung cấp cho người dùng quyền xóa dữ liệu của họ khỏi cơ sở dữ liệu của công ty.

Người thu thập dữ liệu

Dữ liệu được thu thập bởi các công ty công nghệ thông tin không chỉ là các thông tin cá nhân truyền thống như tên, tuổi, giới tính. Thay vào đó, như nhà sử học tại trường Harvard Rebecca Lemov đã đưa ra, nó bao gồm thông tin “Tweets, lượt thích trên Facebook, Twitches, thông tin tìm kiếm trên Google, bình luận trực tuyến, mua hàng bằng một lần nhấn chuột hay thậm chí xem lướt qua một bức ảnh trong bảng thông tin của bạn”.

Nói cách khác, dữ liệu lớn bao gồm các khoảng khắc thường ngày của mọi người. Và nếu Facebook lưu lại các tương tác của bạn với bạn bè và gia đình, Google lưu thông tin bạn tìm kiếm lúc đêm muộn hay Alexa lưu các lệnh bạn đưa ra cho phòng khách, bạn sẽ không muốn biết, như đạo luật đưa ra, dữ liệu của bạn có giá trị thế nào và nó sẽ được bán cho ai.

Tuy nhiên, việc tính giá trị dữ liệu của người dùng không hề đơn giản. Ước tính giá trị dữ liệu của người dùng rất lớn. Chúng bao gồm các đánh giá ít hơn 1 dollar cho dữ liệu của người bình thường đến 100 dollar cho người dùng Facebook. Một người dùng đã bán dữ liệu với giá 2,733 dollar trên Kickstarter. Để đạt được con số này, anh ta phải chia sẻ dữ liệu gồm việc gõ phím trên bàn phím, di chuyển con chuột và ảnh chụp màn hình thường xuyên.

Điều đáng buồn là đạo luật DASHBOARD không chỉ rõ làm thế nào để ước tính giá trị dữ liệu của người dùng. Thay vào đó, nó giải thích rằng Ủy ban Giao dịch và Bảo mật, một cơ quan chính phủ liên bang độc lập “sẽ phát triển một hay nhiều cách thức để tính giá trị dữ liệu của người dùng”.

Hơn cả vấn đề cá nhân

Mục đích của đạo luật được đưa ra là để cung cấp cho người sử dụng sự minh bạch. Tuy nhiên, tính riêng tư không còn là vấn đề dữ liệu cá nhân nữa. Dữ liệu được chia sẻ bởi vài người có thể cung cấp thông tin về cuộc sống của nhiều người.

Ví du, các lượt thích trên Facebook có thể giúp dự đoán mẫu người mà người sử dụng thích với mức độ chính xác cao. Người mua thông tin có thể sử dụng các dữ liệu mua được để dự đoán khách hàng nào đang mang thai. Trường hợp thu hút đông đảo sự chú ý là khi nhà bán lẻ phát hiện ra một cô gái trong tuổi vị thành niên mang thai trước khi bố cô ta biết chuyện.

Việc dự đoán các khả năng có nghĩa các thông tin riêng tư không chỉ được chứa đựng trong dữ liệu của người dùng. Các công ty có thể suy ra thông tin cá nhân của bạn dựa trên sự tương quan thống kê trong dữ liệu của nhiều người dùng. Làm thế nào các dữ liệu giá trị được chuyển thành tiền mặt?

Thêm nữa, khả năng sử dụng các phân tích thống kê này để xác định những người thuộc vào nhóm đặc thù có thể có ý nghĩa riêng tư sâu rộng. Nếu các nhà cung cấp dịch vụ sử dụng phân tích dự đoán để dự đoán mẫu người mà người dùng thích, chủng tộc, giới tính và niềm tin tôn giáo thì điều gì sẽ ngăn họ phân biệt đối xử dựa trên các cơ sở đó?

Các công nghệ dự đoán bị quản lý lỏng lẻo sẽ tiếp tục hoạt động ngay cả khi người dùng xóa một phần dữ liệu của họ đi.

Kiểm soát thông qua dữ liệu

Tính nhạy cảm của dữ liệu không phụ thuộc vào việc nó chứa đựng điều gì mà vào việc chính phủ và các công ty sử dụng nó như thế nào để gây ảnh hưởng.

Tác giả Shoshana Zuboff đã lập luận chủ nghĩa tư bản giám sát của Google, Amazon và Facebook cũng sử dụng dữ liệu dự đoán để điều chỉnh hành vi của chúng ta theo hướng có lợi nhất.

Vào năm 2014, những tiết lộ về cách thức Facebook thử nghiệm để tác động đến cảm xúc của người dùng đã kết thúc trong sự phản đối công khai. Tuy nhiên, ví dụ này chỉ cho thấy nền tảng kĩ thuật số nói chung có thể sử dụng dữ liệu như thế nào để giữ người dùng tiếp tục sử dụng và trong quá trình sử dụng lại tạo thêm nhiều dữ liệu.

Ai sẽ là người bị hại

Sự thật là việc dữ liệu hóa, cùng với tất cả ý nghĩa riêng tư của nó, không ảnh hưởng đến mọi người như nhau.

Các thành kiến và sự phân biệt đối xử trong dữ liệu vẫn tiếp tục tạo ra sự bất bình đẳng về giới, chủng tộc và giai cấp. Phụ nữ, dân tộc thiểu số và người nghèo phải chịu ảnh hưởng nặng nề nhất. Ví dụ, giáo sư tại đại học UCLA Safiya Umoja Noble đã chỉ ra các xếp hạng tìm kiếm của Google củng cố rập khuôn một cách tiêu cực về phụ nữ da màu như thế nào.  

Trong hoàn cảnh bất bình đẳng như vậy, làm thế nào một giá trị số có thể tìm ra được giá trị thực của dữ liệu người dùng?

Đạo luật được đưa ra thiếu tính cụ thể vì nó làm người ta bối rối. Tuy nhiên, điều rắc rối hơn chính là việc đạo luật nhấn mạnh sẽ đạt được sự minh bạch bằng cách đưa ra giá trị tiền tệ. Đánh giá giá trị tài chính bằng con số không phản ánh được việc sức mạnh dữ liệu có thể giúp dự đoán hành động hay hướng dẫn quyết định của chúng ta.

Mục đích của đạo luật DASHBOARD là muốn các doanh nghiệp có dữ liệu minh bạch hơn và trao quyền nhiều hơn cho người dùng. Nếu nhà làm luật muốn giải quyết quyền riêng tư dữ liệu, họ cần điều chỉnh không chỉ kiếm tiền từ dữ liệu mà còn giải quyết vấn đề giá trị và chi phí dữ liệu trong cuộc sống hàng ngày của mọi người.

Anh Học