Trong phát hiện bất thường, mục tiêu là phát hiện các đối tượng khác với nhiều đối tượng. Thông thường, các đối tượng dị thường được gọi là ngoại lai, bởi vì trên biểu đồ phân tán của dữ liệu, chúng nằm cách xa nhiều điểm dữ liệu. Phát hiện bất thường được gọi là phát hiện độ lệch, bởi vì các đối tượng bất thường có các giá trị thuộc tính về cơ bản khác với các giá trị thuộc tính chung hoặc được mong đợi, hoặc như khai thác ngoại lệ, bởi vì các điểm bất thường là đặc biệt theo một số nghĩa.
Có nhiều ứng dụng phát hiện dị thường như sau -
Phát hiện gian lận - Hành vi mua của người giữ thẻ tín dụng khác với hành vi mua của người sở hữu ban đầu. Các công ty thẻ tín dụng cố gắng xác định hành vi trộm cắp bằng cách xem để mua các thiết kế đặc trưng cho hành vi trộm cắp hoặc bằng cách nhận biết sự thay đổi so với hành vi chung. Các phương pháp giống nhau được sử dụng cho các loại gian lận khác nhau.
Phát hiện xâm nhập - Thật không may, các cuộc tấn công vào hệ thống máy tính và mạng máy tính là thông lệ. Trong khi một số cuộc tấn công, bao gồm cả những cuộc tấn công được thiết kế để vô hiệu hóa hoặc áp đảo máy tính và mạng, là rõ ràng, các cuộc tấn công khác, bao gồm cả những cuộc tấn công được thiết kế để bí mật thu thập dữ liệu, rất phức tạp để xác định. Một số cuộc xâm nhập này có thể được xác định bằng cách quan sát hệ thống và mạng để tìm hành vi bất thường.
Rối loạn hệ sinh thái - Trong thế giới chung, có những sự kiện chung có thể có ảnh hưởng thiết yếu đến con người. Ví dụ có bão, lũ lụt, hạn hán, sóng nhiệt và hỏa hoạn. Mục tiêu là dự báo khả năng xảy ra những sự kiện này và nguyên nhân của chúng.
Sức khỏe cộng đồng - Ở một số quốc gia, các bệnh viện và phòng khám y tế báo cáo một số thống kê cho các tổ chức quốc gia để phân tích thêm. Ví dụ, nếu một số trẻ em trong thành phố được tiêm chủng cho một bệnh cụ thể, chẳng hạn như bệnh sởi, thì sự xuất hiện của một số trường hợp rải rác ở một số bệnh viện trong thành phố là một sự kiện bất thường có thể cho thấy có vấn đề với các chương trình tiêm chủng trong thành phố. .
Thuốc - Đối với một bệnh nhân cụ thể, các triệu chứng bất thường hoặc kết quả xét nghiệm có thể biểu thị các vấn đề sức khỏe tiềm ẩn. Tuy nhiên, một kết quả xét nghiệm cụ thể có bất thường hay không có thể dựa trên nhiều đặc điểm của bệnh nhân, bao gồm cả tuổi và giới tính. Hơn nữa, việc phân loại kết quả là bất thường hoặc không có được một số xét nghiệm khác không cần thiết nếu bệnh nhân đang hoạt động và có thể gây hại cho bệnh nhân nếu tình trạng không được chẩn đoán và không được điều trị.
Mặc dù một số mối quan tâm hiện nay về phát hiện bất thường đã được thúc đẩy bởi phần mềm trong đó các dị thường là mục tiêu, nhưng về mặt lịch sử, phát hiện bất thường được coi là một kỹ thuật để tăng cường phân tích các đối tượng dữ liệu chung.
Ví dụ:một số lượng nhỏ các giá trị ngoại lệ có thể thay đổi giá trị trung bình và độ lệch chuẩn của một nhóm giá trị hoặc thay đổi tập hợp các cụm được tạo bởi một thuật toán phân cụm. Do đó, phát hiện bất thường là một yếu tố của quá trình xử lý trước dữ liệu.