Computer >> Máy Tính >  >> Lập trình >> Lập trình

Kỹ thuật ngoại lệ tuần tự là gì?

Kỹ thuật ngoại lệ tuần tự mô phỏng phương pháp mà con người có thể phân biệt các tập hợp bất thường giữa một chuỗi các đối tượng được cho là giống nhau. Nó giúp dự phòng dữ liệu.

Cho một tập dữ liệu, D, gồm n đối tượng, nó xây dựng một chuỗi các tập con, {D 1 , D 2 , ..., D m }, trong số các đối tượng này có 2 ≤ m ≤ n bao gồm

$$ \ mathrm {D_ {j − 1} \ tập con D_ {j} \:\:trong đó \:D_ {j} \ subseteq D} $$

Sự khác biệt được đánh giá giữa các tập hợp con trong chuỗi. Kỹ thuật này tìm hiểu các thuật ngữ sau đây như sau -

Bộ ngoại lệ - Đây là tập hợp các độ lệch hoặc giá trị ngoại lai. Nó được định nghĩa là tập hợp con nhỏ nhất của các đối tượng mà việc loại bỏ dẫn đến giảm mức độ không giống nhau cao nhất trong tập hợp còn lại.

Chức năng khác biệt - Chức năng này không cần khoảng cách theo hệ mét giữa các đối tượng. Cho một tập hợp các đối tượng, khôi phục một giá trị thấp nếu các đối tượng giống nhau. Sự khác biệt giữa các đối tượng càng cao thì giá trị được trả về bởi hàm càng cao.

Sự khác biệt của một tập hợp con được tính toán từng bước phụ thuộc vào tập hợp con trước nó trong chuỗi. Cho một tập con gồm n số, {x 1 , ..., x n }, một hàm khác biệt có thể có là phương sai của các số trong tập hợp

$$ \ mathrm {\ frac {1} {n} \ displaystyle \ sum \ limit_ {i =1} ^ n (x_ {i} -x ^ {'}) ^ 2} $$

ở đâu x ' là giá trị trung bình của n số trong tập hợp. Đối với chuỗi ký tự, hàm khác biệt có thể nằm trong thiết kế chuỗi mẫu (ví dụ:bao gồm các ký tự đại diện) có thể bao gồm tất cả các chế độ xem mẫu cho đến nay. Sự khác biệt tăng lên khi mẫu bao phủ một số chuỗi trong D j − 1 không bao gồm một số chuỗi trong D j điều đó không có trong D j − 1 .

Chức năng số lượng - Đây thường là số lượng của nhiều đối tượng trong một tập hợp nhất định.

Yếu tố làm mịn - Hàm này được tính cho từng tập con trong dãy. Nó đánh giá mức độ khác biệt có thể được giảm bớt bằng cách loại bỏ tập hợp con khỏi tập đối tượng ban đầu. Giá trị này được tính theo số lượng của tập hợp. Tập hợp con có giá trị hệ số làm mịn cao nhất là tập hợp ngoại lệ.

Chức năng tìm một tập hợp ngoại lệ có thể là NP-hard (tức là không thể đọc được). Phương pháp tuần tự có thể tính toán được và có thể được thực thi bằng thuật toán tuyến tính.

Thay vì đánh giá sự khác biệt của tập con hiện tại liên quan đến tập bổ sung của nó, thuật toán chọn một loạt các tập con từ tập hợp để phân tích. Đối với mỗi tập hợp con, nó quyết định sự khác biệt không giống nhau của tập hợp con liên quan đến tập hợp con trước đó trong chuỗi.