Khám phá theo hướng khám phá là một cách tiếp cận khám phá hình khối như vậy. Trong thăm dò theo hướng khám phá, các biện pháp được tính toán trước chỉ ra các ngoại lệ về dữ liệu được sử dụng để hướng dẫn người dùng trong quá trình phân tích dữ liệu, ở tất cả các cấp độ tổng hợp. Nó coi các thước đo này là các chỉ số ngoại lệ.
Theo trực giác, một ngoại lệ là giá trị ô dữ liệu khác biệt đáng kể với giá trị được dự đoán, dựa trên mô hình thống kê. Mô hình đã xử lý các biến thể và mẫu trong giá trị đo lường trên tất cả các thứ nguyên mà một ô áp dụng.
Ví dụ:nếu việc phân tích dữ liệu bán hàng thừa nhận doanh số bán hàng trong tháng 12 tăng so với vài tháng, thì điều này có thể xem như một ngoại lệ trong thứ nguyên thời gian. Tuy nhiên, sẽ không phải là ngoại lệ nếu xem xét thứ nguyên mặt hàng, vì doanh số bán các mặt hàng khác cũng tăng tương tự trong tháng 12.
Mô hình đã xử lý các ngoại lệ không xác định ở một số nhóm được tổng hợp theo từng khối dữ liệu. Các dấu hiệu trực quan bao gồm màu nền được sử dụng để theo dõi mức độ ngoại lệ của mỗi ô, phụ thuộc vào các chỉ số ngoại lệ được tính toán trước.
Ba thước đo được sử dụng làm chỉ số ngoại lệ để cung cấp các điểm bất thường về dữ liệu. Các phép đo này biểu thị mức độ bất ngờ mà số lượng trong ô ảnh hưởng, liên quan đến giá trị kỳ vọng của nó. Các thước đo được tính toán và liên kết với mọi ô, cho tất cả các cấp độ tổng hợp. Chúng như sau -
SelfExp - Điều này biểu thị mức độ bất ngờ của giá trị ô, được liên kết với các ô khác ở mức tổng hợp bằng nhau.
InExp - Điều này biểu thị mức độ ngạc nhiên ở đâu đó bên dưới ô, nếu nó có thể đi sâu vào từ đó.
PathExp - Điều này biểu thị mức độ bất ngờ đối với mọi đường dẫn chi tiết từ ô.
Ví dụ:giả sử bạn muốn phân tích doanh số hàng tháng tại AllElectronics dưới dạng phần trăm chênh lệch so với tháng trước. Các thứ nguyên bao gồm mục, thời gian và khu vực.
Để xem các chỉ báo ngoại lệ, bạn sẽ nhấp vào nút được đánh dấu các ngoại lệ được đánh dấu trên màn hình. Điều này diễn giải các giá trị SelfExp và InExp thành các dấu hiệu trực quan, được hiển thị với mỗi ô. Màu nền của mọi ô phụ thuộc vào giá trị SelfExp của nó.
Hơn nữa, một hộp được vẽ xung quanh mỗi ô, trong đó độ dày và màu sắc của hộp là một dịch vụ của giá trị InExp của nó. Hộp dày biểu thị giá trị InExp cao. Trong cả hai trường hợp, màu càng u ám thì mức độ ngoại lệ càng cao.
Chi tiết về mặt hàng dẫn đến kết quả trong phần khối lập phương hiển thị doanh số bán hàng theo thời gian cho mọi mặt hàng. Nó có thể được trình bày với một số giá trị bán hàng khác nhau để phân tích. Nó có thể được nhấn vào nút ngoại lệ đánh dấu, các dấu hiệu hình ảnh được hiển thị, mang lại sự tập trung cho các trường hợp ngoại lệ. "