Computer >> Máy Tính >  >> Lập trình >> Lập trình

Các phương pháp phát hiện ngoại lệ là gì?

Có nhiều phương pháp phát hiện ngoại lệ như sau -

Phương pháp được giám sát - Phương pháp giám sát lập mô hình dữ liệu chuẩn và bất thường. Các chuyên gia miền kiểm tra và gắn nhãn một mẫu dữ liệu cơ bản. Phát hiện ngoại lệ có thể được mô hình hóa như một vấn đề phân loại. Dịch vụ này là để hiểu một bộ phân loại có thể xác định các ngoại lệ.

Mẫu có thể được sử dụng để đào tạo và thử nghiệm. Trong các ứng dụng khác nhau, các chuyên gia chỉ có thể gắn nhãn các đối tượng bình thường và một số đối tượng không kết nối với mô hình của các đối tượng bình thường được ghi lại là ngoại lệ. Có nhiều phương pháp khác nhau lập mô hình ngoại lệ và coi các đối tượng không kết nối mô hình ngoại lệ là bình thường.

Phương pháp không được giám sát - Trong các phương pháp ứng dụng khác nhau, các đối tượng được dán nhãn là “bình thường” hoặc “ngoại lệ” không được áp dụng. Do đó, phương pháp học tập không giám sát phải được sử dụng. Các phương pháp phát hiện ngoại lệ không được giám sát tạo ra một giả định ngầm chẳng hạn như các đối tượng bình thường được “nhóm lại” đáng kể.

Một phương pháp phát hiện ngoại lệ không được giám sát dự đoán rằng các đối tượng bình thường tuân theo một mô hình tổng quát hơn nhiều so với các ngoại lệ. Các đối tượng bình thường không phải suy giảm thành một nhóm chia sẻ sự tương đồng lớn. Thay vào đó, họ có thể tạo thành một số nhóm, trong đó mỗi nhóm có nhiều tính năng.

Giả định này không thể đúng vào một lúc nào đó. Các đối tượng bình thường không gửi một số mô hình mạnh mẽ. Thay vào đó, chúng được phân phối đồng đều. Các ngoại lệ tập thể, chia sẻ sự tương đồng lớn trong một khu vực nhỏ.

Các phương pháp không được giám sát không thể xác định các ngoại lệ như vậy một cách hiệu quả. Trong một số ứng dụng, các đối tượng bình thường được phân phối riêng biệt và một số đối tượng không tuân theo các mẫu mạnh. Ví dụ:trong một số vấn đề phát hiện xâm nhập và phát hiện vi-rút máy tính, các hoạt động bình thường là khác biệt và một số không suy giảm thành các cụm chất lượng cao.

Một số phương pháp phân cụm có thể được điều chỉnh để tạo điều kiện thuận lợi như các phương pháp phát hiện ngoại lệ không được giám sát. Ý tưởng chính là khám phá các cụm trước, và do đó các đối tượng dữ liệu không thuộc một số cụm được xác định là ngoại lai. Tuy nhiên, các phương pháp như vậy sẽ xấu đi do hai vấn đề. Đầu tiên, một đối tượng dữ liệu không thuộc một số cụm có thể gây nhiễu hơn là một ngoại lệ. Thứ hai, việc khám phá các cụm trước và sau đó phát hiện ra các điểm ngoại lệ sẽ rất tốn kém.

Phương pháp bán giám sát - Trong một số ứng dụng, mặc dù có thể lấy được một số cá thể được gắn nhãn, nhưng số lượng các cá thể được gắn nhãn như vậy là rất ít. Nó có thể gặp trường hợp chỉ một nhóm nhỏ các đối tượng bình thường và ngoại lệ được gắn nhãn, nhưng một số dữ liệu không được gắn nhãn. Các phương pháp phát hiện ngoại lệ bán giám sát được sản xuất để giải quyết các phương pháp đó.

Các phương pháp phát hiện ngoại lệ bán giám sát có thể được quan tâm như các ứng dụng của phương pháp tiếp cận học tập bán giám sát. Ví dụ, khi một số đối tượng bình thường được gắn nhãn có thể truy cập được, nó có thể sử dụng chúng với các đối tượng không được gắn nhãn ở gần đó, để đào tạo mô hình cho các đối tượng bình thường. Mô hình của các đối tượng bình thường được sử dụng để xác định các ngoại lệ — những đối tượng không phù hợp với mô hình của các đối tượng bình thường được xác định là ngoại lệ.