Computer >> Máy Tính >  >> Lập trình >> Lập trình

Các giá trị ngoại lệ được tính như thế nào?

Có ba thước đo được sử dụng làm chỉ số ngoại lệ để hỗ trợ nhận biết các dị thường của dữ liệu. Các thước đo này biểu thị mức độ bất ngờ mà số lượng trong tế bào ảnh hưởng đến giá trị mong đợi của nó.

Các thước đo được tính toán và liên kết với mọi ô, cho tất cả các cấp độ tổng hợp. Chúng như sau, bao gồm các biện pháp SelfExp, InExp và PathExp dựa trên phương pháp tiếp cận số để phân tích bảng.

Giá trị ô được coi là một ngoại lệ phụ thuộc vào việc nó khác với giá trị kỳ vọng bao nhiêu, trong đó giá trị kỳ vọng của nó được quyết định bằng một mô hình thống kê. Sự khác biệt giữa giá trị ô nhất định và giá trị mong đợi của nó được gọi là giá trị còn lại.

Theo trực quan, phần dư càng cao, thì giá trị ô được cung cấp càng cao là một ngoại lệ. Việc so sánh các giá trị còn lại đòi hỏi chúng ta phải chia tỷ lệ các giá trị dựa trên độ lệch chuẩn dự kiến ​​liên quan đến các giá trị còn lại. Do đó, giá trị ô được coi là ngoại lệ nếu giá trị còn lại được chia tỷ lệ của nó vượt quá ngưỡng chỉ định trước.

Các biện pháp SelfExp, InExp và PathExp dựa trên phần dư được chia tỷ lệ này. Giá trị mong đợi của một ô nhất định là một dịch vụ của từng nhóm cấp lớn hơn của ô được cung cấp. Ví dụ:cho một hình lập phương có ba kích thước A, B và C, giá trị mong đợi cho một ô ở vị trí thứ i trong A, vị trí thứ j trong B và vị trí thứ k trong C là một hàm của γ, γAi, γBj, γCk, γ ABij, γ ACik và γ BCjk, là các hệ số của mô hình số được sử dụng.

Các hệ số theo sau mức độ khác nhau của các giá trị ở nhiều cấp hơn phụ thuộc vào số lần hiển thị tổng quát được hình thành bằng cách xem ở các tổng hợp cấp lớn hơn. Trong cách tiếp cận này, chất lượng ngoại lệ của một giá trị ô phụ thuộc vào các ngoại lệ của các giá trị theo sau nó. Do đó, khi xem một ngoại lệ, người dùng cần phân tích ngoại lệ bằng cách đi sâu vào.

Tính toán này bao gồm ba giai đoạn như sau -

  • Bước đầu tiên bao gồm việc tính toán các giá trị tổng hợp xác định khối lập phương, bao gồm tổng hoặc số, qua đó các ngoại lệ sẽ được phát hiện.

  • Giai đoạn thứ hai bao gồm điều chỉnh mô hình, trong đó các hệ số được xác định và sử dụng để tính toán các phần dư được tiêu chuẩn hóa. Giai đoạn này có thể bị trùng lặp với giai đoạn đầu tiên vì các tính toán giống nhau.

  • Giai đoạn thứ ba tính toán các giá trị SelfExp, InExp và PathExp, phụ thuộc vào phần dư được chuẩn hóa. Giai đoạn này về mặt tính toán tương đương với giai đoạn 1. Do đó, việc tính toán các khối dữ liệu để khám phá theo hướng khám phá có thể được hoàn thành một cách hiệu quả.