Học máy có thể giúp ích cho nhân loại trong cuộc chiến chống gian lận

07:37 PM 07/03/2019 In bài viết

Kết quả hình ảnh cho Machine learning can help human rules combat fraud

Tuy nhiên, sự kết hợp giữa con người và máy móc là phù hợp nhất cho nhiều tổ chức để tối đa hóa hiệu suất.

Có một số người nhận định rằng các quy tắc gian lận không còn phù hợp. Suy cho cùng, một cách tiếp cận dựa trên dữ liệu, bất kể có sự tham gia của con người hay máy móc, là trạng thái mà các tổ chức cần phải chuyển đổi để tối đa hóa việc phát hiện gian lận trong hiện tại và để dễ dàng chuyển sang một tương lai dần dần do máy móc đảm nhiệm.

Các quy tắc được thực hiện thủ công thường được đưa ra để ngăn chặn các xu hướng lừa đảo trước đây hoặc được biết đến trong hiện tại, tránh việc làm tổn hại cho một tổ chức. Các quy tắc này vẫn phổ biến đối với các nhà quản lý gian lận vì chúng cho phép sự phản ứng kịp thời với các xu hướng lừa đảo mới nổi và dễ dàng cho mọi người nhận định.

Nhưng mô hình học máy cũng phản ứng tương tự. Hầu hết các phương pháp học máy hiện đại đều dựa vào các phương pháp được giám sát như XGBoost và Neural Networks, vì các phương pháp này cung cấp một cách tiếp cận hợp lý để phát hiện gian lận.

Các phương pháp học có giám sát dựa trên dữ liệu được đánh dấu là giao dịch thật hoặc lừa đảo. Do đó các thuật toán có thể hiểu các mẫu và phân biệt sự khác biệt. Không có gì lạ khi những đánh dấu dữ liệu này mất hàng tuần và đôi khi thậm chí hàng tháng để thực hiện, có nghĩa là hệ thống máy học không thể dễ dàng phát hiện các mẫu gian lận mới theo cách mà quy tắc thủ công có thể.

Bản chất của các phương pháp học máy, đặc biệt là các thuật toán phân nhánh, là chúng tạo thành một quy trình bên trong rất giống với một bộ quy tắc. Vì vậy, phương pháp này vẫn yêu cầu được đào tạo lại thường xuyên khi các mô hình gian lận thay đổi, giống như các quy tắc thủ công.

Cây quyết định (Decision tree) tạo một bộ quy tắc dựa trên một điều kiện bắt đầu duy nhất, chẳng hạn như số lượng ủy quyền mà thẻ tạo ra trong một thời gian nhất định. "Rừng ngẫu nhiên" (Random forests) là một kỹ thuật phổ biến để phát hiện gian lận, nhưng thường không được hiểu rằng chúng thuộc các nhóm của cây quyết định.

Nhiều kỹ thuật học máy đòi hỏi phải được cập nhật thường xuyên, giống như các quy tắc thủ công, để có thể thích ứng với việc thay đổi mô hình gian lận. Một điểm khác biệt cần làm là các kỹ thuật máy học khác, như mạng thần kinh và hồi quy logistic, là mô hình hộp đen, có nghĩa là lý do đằng sau điểm gian lận thường rất khó hiểu, vì đó là tất cả những gì được tạo ra từ một quyết định. Điều này làm cho chúng ít có khả năng phát hiện bởi các nhà quản lý gian lận.

Các bộ quy tắc truyền thống được thực hiện và duy trì theo các mô hình gian lận đang được trải nghiệm bởi doanh nghiệp. Bản thân các quy tắc không thể thích ứng với việc thay đổi các mẫu, nhưng chúng có ưu thế hơn về tốc độ thực hiện.

Các cuộc tấn công gian lận có thể được di chuyển cực kỳ nhanh chóng. Chẳng hạn, vào tháng 5 năm 2016, những kẻ lừa đảo đã có thể rút 1,4 tỷ yên từ máy rút tiền ở Nhật Bản bằng cách sử dụng dữ liệu thẻ tín dụng bị đánh cắp từ một ngân hàng Nam Phi. Tất cả các giao dịch xảy ra tại các máy rút tiền tại các cửa hàng 7-Eleven và khiến ngân hàng thiệt hại 19,25 triệu đô la. Điều cực kỳ quan trọng đối với các chiến lược gian lận là có một tùy chọn quy tắc thủ công, để các vấn đề mới nổi có thể được khắc phục ngay lập tức. Các quy tắc này sau đó có thể được gỡ bỏ, vì hoạt động gian lận được bao phủ bởi các mô hình học máy.

Hợp Trương