Computer >> Máy Tính >  >> Lập trình >> Lập trình

Các vấn đề của Phát hiện bất thường là gì?

Có nhiều vấn đề khác nhau về phát hiện bất thường như sau -

Số lượng thuộc tính được sử dụng để xác định điều bất thường - Câu hỏi về một trong hai đối tượng là dị thường phụ thuộc vào một thuộc tính riêng lẻ là một câu hỏi về việc liệu giá trị của đối tượng đối với thuộc tính đó có phải là dị thường hay không. Bởi vì một đối tượng có thể có một số thuộc tính, nó có thể có giá trị bất thường cho một số thuộc tính, nhưng giá trị bình thường cho nhiều thuộc tính.

Hơn nữa, một đối tượng có thể là bất thường ngay cả khi không có giá trị thuộc tính nào của nó là bất thường độc lập. Ví dụ, thông thường có người cao hai feet (trẻ em) hoặc nặng 300 pound, nhưng người cao hai feet nặng 300 pound là bất thường.

Mô tả về sự bất thường phải xác định cách các giá trị của nhiều thuộc tính được sử dụng để quyết định xem một đối tượng có phải là vật bất thường hay không. Đây là một vấn đề thiết yếu khi kích thước của dữ liệu lớn.

Phối cảnh toàn cầu so với cục bộ - Một đối tượng có thể xuất hiện bất thường liên quan đến tất cả các đối tượng, nhưng không liên quan đến các đối tượng trong vùng lân cận địa phương của nó. Ví dụ:một người có chiều cao 6 feet 5 inch là cực kỳ cao so với dân số chung, nhưng không liên quan đến các cầu thủ bóng rổ chuyên nghiệp.

Mức độ điểm bất thường - Việc đánh giá một đối tượng là dị thường được ghi lại bằng một số phương pháp theo kiểu nhị phân:Đối tượng là dị thường hoặc không. Nói chung, điều này không phản ánh thực tế cơ bản rằng một số vật thể có cường độ dị thường mạnh hơn những vật thể khác. Do đó, thật thú vị khi có nhiều đánh giá về mức độ dị thường của một vật thể. Đánh giá này được gọi là điểm bất thường hoặc điểm bất thường.

Xác định một điểm bất thường tại một thời điểm so với nhiều điểm bất thường cùng một lúc - Trong một số phương pháp, các dị thường được loại bỏ tại một thời điểm; tức là, các ví dụ bất thường nhất được nhận dạng và loại bỏ và sau đó quy trình lặp lại. Đối với nhiều kỹ thuật, một tập hợp các điểm bất thường được nhận ra cùng nhau.

Các kỹ thuật cố gắng nhận ra từng điểm bất thường tại một thời điểm thường phải đối mặt với một vấn đề được gọi là che dấu, trong đó sự hiện diện của nhiều điểm dị thường che dấu sự hiện diện của tất cả. Nói cách khác, các kỹ thuật xác định nhiều ngoại lệ cùng một lúc có thể gặp phải hiện tượng đầm lầy, trong đó các đối tượng bình thường được xác định là ngoại lệ. Trong phương pháp dựa trên mô hình, những hiệu ứng này có thể xuất hiện do sự bất thường làm thay đổi mô hình dữ liệu.

Hiệu quả - Có sự khác biệt quan trọng trong chi phí tính toán của một số chương trình phát hiện bất thường. Các lược đồ dựa trên phân loại có thể cần các nguồn lực thiết yếu để tạo mô hình phân loại, nhưng nhìn chung không tốn kém khi sử dụng. Tương tự như vậy, các phương pháp thống kê tạo ra một mô hình thống kê và có thể phân loại một phần tử trong thời gian không đổi.