Computer >> Máy Tính >  >> Lập trình >> Lập trình

Các loại ngoại lệ trong khai thác dữ liệu là gì?

Có nhiều loại ngoại lệ khác nhau trong khai thác dữ liệu như sau -

Ngoại lệ toàn cầu - Trong một tập dữ liệu nhất định, một đối tượng dữ liệu là một ngoại lệ toàn cầu nếu nó lệch về cơ bản so với phần còn lại của tập thông tin. Các ngoại lệ toàn cầu được gọi là dị thường điểm và là loại ngoại lệ dễ dàng nhất. Hầu hết các phương pháp phát hiện ngoại lệ đều nhằm mục đích phát hiện các ngoại lệ toàn cầu.

Nó có thể xác định các ngoại lệ toàn cầu, một vấn đề quan trọng là phát hiện ra một phép đo độ lệch thích hợp liên quan đến ứng dụng được đề cập. Có một số phép đo được đề xuất và phụ thuộc vào những phép đo này, các phương pháp tiếp cận phát hiện ngoại lệ được phân chia thành nhiều loại.

Phát hiện ngoại lệ toàn cầu là điều cần thiết trong một số ứng dụng. Ví dụ:hãy xem xét phát hiện xâm nhập trong mạng máy tính, nếu hành vi giao tiếp của máy tính khác với các thiết kế thông thường (ví dụ:một số lượng lớn các gói được quảng cáo trong thời gian ngắn), hành vi này có thể được coi là ngoại lệ toàn cầu và máy tính tương ứng là một nạn nhân nghi ngờ bị tấn công.

Ngoại lệ theo ngữ cảnh - Các ngoại lệ theo ngữ cảnh được gọi là ngoại lệ có điều kiện. Những loại ngoại lệ này xuất hiện nếu một đối tượng dữ liệu lệch khỏi nhiều điểm dữ liệu do một số điều kiện xác định trong một tập dữ liệu nhất định.

Có hai loại thuộc tính của đối tượng dữ liệu bao gồm thuộc tính ngữ cảnh và thuộc tính hành vi. Phân tích ngoại lệ theo ngữ cảnh cho phép người dùng xác định các ngoại lệ trong nhiều bối cảnh và điều kiện, điều này có thể có lợi trong một số ứng dụng.

Trong các thuộc tính Hành vi, nó có thể đại diện cho các đặc điểm của đối tượng và được sử dụng để tính xem đối tượng có phải là ngoại lệ trong ngữ cảnh mà đối tượng hiểu hay không. Trong trường hợp nhiệt độ, các thuộc tính hành vi có thể là nhiệt độ, độ ẩm và áp suất.

Các giá trị ngoại lai theo ngữ cảnh là sự khái quát các giá trị ngoại lai cục bộ, một khái niệm được giới thiệu trong phương pháp phân tích ngoại lệ dựa trên mật độ. Một đối tượng trong tập dữ liệu là ngoại lai cục bộ nếu mật độ của nó về cơ bản khác với khu vực cục bộ mà nó xuất hiện.

Phát hiện ngoại lệ toàn cầu có thể được coi là một phương pháp đặc biệt để phát hiện ngoại lệ theo ngữ cảnh trong đó nhóm các thuộc tính theo ngữ cảnh là rỗng. Nói cách khác, phát hiện ngoại lệ toàn cầu cần toàn bộ tập dữ liệu làm bối cảnh. Phân tích ngoại cảnh theo ngữ cảnh hỗ trợ tính linh hoạt cho người dùng trong đó người dùng có thể xác định ngoại lệ trong một số ngữ cảnh, điều này có thể mong muốn trong một số ứng dụng.

Người ngoài tập thể - Trong một tập hợp dữ liệu nhất định, khi một tập hợp các điểm dữ liệu lệch khỏi phần còn lại của tập thông tin được gọi là ngoại lệ tập thể. Do đó, tập hợp các đối tượng dữ liệu cụ thể không thể là ngoại lệ, nhưng khi nó có thể xem xét tổng thể các đối tượng dữ liệu, chúng có thể hoạt động như ngoại lệ.

Nó có thể nhận ra các kiểu của nhiều ngoại lệ, nó được yêu cầu phải xem qua dữ liệu nền về mối quan hệ giữa các hành vi của các ngoại lệ được hiển thị bởi nhiều đối tượng dữ liệu.