Mỏ phân biệt hoặc so sánh phân biệt lớp để phân loại một lớp mục tiêu khỏi các lớp tương phản của nó. Các lớp mục tiêu và các lớp tương phản phải có thể so sánh được với điều kiện chúng có cùng kích thước và thuộc tính. Ví dụ, ba lớp, người, địa chỉ và phần tử, không thể so sánh được. Nhưng doanh số bán hàng trong ba năm qua là các hạng tương đương và ứng viên khoa học máy tính so với ứng viên vật lý cũng vậy.
Các kỹ thuật được phát triển có thể được tiếp tục để quản lý việc so sánh lớp trên nhiều lớp có thể so sánh được. Ví dụ, quá trình tổng quát hóa thuộc tính được xác định để mô tả đặc tính của lớp có thể được thay đổi để quá trình tổng quát hóa được thực hiện đồng bộ giữa tất cả các lớp được so sánh. Điều này cho phép các thuộc tính trong một số lớp được tổng quát hóa thành các mức trừu tượng tương tự.
Ví dụ, giả sử rằng nó được cung cấp dữ liệu AllElectronics cho doanh số bán hàng năm 2003 và doanh số bán hàng năm 2004 và có thể so sánh hai lớp này. Hãy xem xét các khu vực thứ nguyên có nội dung trừu tượng ở cấp thành phố, tỉnh hoặc tiểu bang và quốc gia. Mọi lớp dữ liệu phải được tổng quát hóa đến mức vị trí tương tự.
Có nghĩa là, chúng được tổng hợp một cách đồng bộ đến cấp thành phố, cấp trách nhiệm hoặc cấp nhà nước, hoặc cấp quốc gia. Điều này hữu ích hơn so với việc so sánh, chẳng hạn, doanh số bán hàng ở Vancouver năm 2003 với doanh số bán hàng ở Hoa Kỳ vào năm 2004 (tức là, nơi mọi tập hợp dữ liệu bán hàng được tổng hợp thành nhiều cấp).
Người dùng phải có tùy chọn ghi đè bao gồm so sánh đồng bộ, tự động với các lựa chọn của họ, khi được chọn. Có một số quy trình như sau -
-
Thu thập dữ liệu - Tập hợp các bản ghi có liên quan trong cơ sở dữ liệu được thu thập bằng cách xử lý truy vấn và được tách biệt tương ứng thành một lớp đích và một hoặc một tập hợp các lớp tương phản.
-
Phân tích mức độ liên quan của thứ nguyên - Nếu có nhiều thứ nguyên, thì phân tích mức độ liên quan của thứ nguyên phải được thực hiện trên các lớp này để chỉ chọn các thứ nguyên có liên quan cao để phân tích thêm.
-
Tổng quát hóa đồng bộ - Tổng quát hóa được thực hiện trên lớp mục tiêu đến mức được quản lý bởi ngưỡng thứ nguyên do người dùng hoặc chuyên gia chỉ định, điều này dẫn đến quan hệ lớp mục tiêu chính.
-
Trình bày về phép so sánh có nguồn gốc - Mô tả so sánh lớp kết quả có thể được dự đoán dưới dạng bảng, đồ thị và quy tắc. Phần trình bày này thường liên quan đến một thước đo "tương phản" bao gồm số% (số phần trăm) phản ánh sự so sánh giữa các lớp mục tiêu và các lớp tương phản.
Người dùng có thể điều chỉnh mô tả so sánh bằng cách sử dụng các thao tác tìm kiếm chi tiết, tổng hợp và các thao tác OLAP khác nhau cho mục tiêu và các lớp tương phản, như đã có.