Đây là một cách tiếp cận thống kê để xử lý trước dữ liệu để lọc ra các thuộc tính không liên quan hoặc xếp hạng thuộc tính có liên quan. Các biện pháp phân tích mức độ liên quan của thuộc tính có thể được sử dụng để nhận ra các thuộc tính không liên quan có thể không được phép từ quá trình mô tả khái niệm. Việc kết hợp bước tiền xử lý này vào việc so sánh hoặc mô tả đặc tính của lớp được định nghĩa là một đặc điểm phân tích.
Phân biệt dữ liệu tạo ra các quy tắc phân biệt là sự so sánh các đặc điểm chung của các đối tượng giữa hai lớp được định nghĩa là lớp đích và lớp tương phản.
Nó là sự so sánh các đặc điểm chung của việc nhắm mục tiêu các đối tượng dữ liệu lớp với các đặc điểm chung của các đối tượng từ một hoặc một tập hợp các lớp tương phản. Người dùng có thể xác định mục tiêu và các lớp tương phản. Các phương pháp được sử dụng để phân biệt dữ liệu rất giống với các phương pháp được sử dụng để mô tả đặc tính dữ liệu, ngoại trừ kết quả phân biệt dữ liệu bao gồm các biện pháp so sánh.
Lý do phân tích mức độ liên quan của thuộc tính
Có một số lý do để phân tích mức độ liên quan của thuộc tính như sau -
-
Nó có thể quyết định thứ nguyên nào phải được bao gồm.
-
Nó có thể tạo ra mức độ tổng quát hóa cao.
-
Nó có thể giảm số lượng thuộc tính hỗ trợ chúng ta đọc các mẫu một cách dễ dàng.
Khái niệm cơ bản đằng sau phân tích mức độ liên quan của thuộc tính là đánh giá một số thước đo có thể tính toán mức độ liên quan của một thuộc tính liên quan đến một lớp hoặc khái niệm nhất định. Các biện pháp như vậy liên quan đến mức độ thu thập thông tin, sự không rõ ràng và hệ số tương quan.
Phân tích mức độ liên quan thuộc tính cho mô tả khái niệm được thực hiện như sau -
Thu thập dữ liệu - Nó có thể thu thập dữ liệu cho cả lớp đích và lớp tương phản bằng cách xử lý truy vấn.
Phân tích mức độ liên quan sơ bộ sử dụng AOI thận trọng - Bước này công nhận một tập hợp các thứ nguyên và thuộc tính để sử dụng thước đo mức độ liên quan đã chọn.
AOI có thể được sử dụng để thực hiện phân tích sơ bộ trên dữ liệu bằng cách loại bỏ các thuộc tính có nhiều giá trị khác biệt. Có thể là thận trọng, AOI được triển khai nên sử dụng các ngưỡng tổng quát hóa thuộc tính được đặt lớn hợp lý để cho phép nhiều thuộc tính hơn được xử lý trong phân tích mức độ liên quan sâu hơn bằng thước đo đã chọn.
Xóa - Quá trình này loại bỏ các thuộc tính không liên quan và có liên quan yếu bằng cách sử dụng thước đo phân tích mức độ liên quan đã chọn.
Tạo mô tả khái niệm bằng AOI - Nó có thể triển khai AOI bằng cách sử dụng một bộ ngưỡng tổng quát hóa thuộc tính ít bảo thủ hơn. Nếu hàm khai thác mô tả là đặc tính của lớp, thì bây giờ chỉ có quan hệ làm việc của lớp đích ban đầu mới được đưa vào.
Nếu hàm khai thác mô tả là đặc tính của lớp, thì chỉ quan hệ làm việc của lớp đích ban đầu mới được đưa vào. Nếu hàm khai thác mô tả là đặc tính của lớp, thì chỉ quan hệ làm việc của lớp đích ban đầu mới được đưa vào. Nếu hàm khai thác mô tả là so sánh lớp, thì cả quan hệ làm việc của lớp đích ban đầu và quan hệ làm việc của lớp tương phản ban đầu đều được bao gồm.