Tổng quát hóa thuộc tính phụ thuộc vào quy tắc sau:Nếu có một tập hợp lớn các giá trị riêng biệt cho một thuộc tính trong quan hệ làm việc ban đầu và tồn tại một nhóm toán tử tổng quát hóa trên thuộc tính, do đó, một toán tử tổng quát hóa nên được chọn và sử dụng cho thuộc tính .
Quy tắc này phụ thuộc vào suy luận sau đây. Việc sử dụng các dịch vụ tổng quát hóa để tổng quát hóa một giá trị thuộc tính bên trong một bộ hoặc quy tắc, trong mối quan hệ làm việc sẽ tạo ra quy tắc bao phủ nhiều bộ dữ liệu ban đầu hơn, do đó khái quát hóa khái niệm mà nó xác định. Điều này tương ứng với quy tắc tổng quát hóa được định nghĩa là leo lên cây tổng quát hóa trong kiến thức từ các phiên bản hoặc tăng dần cây khái niệm.
Nó dựa trên các thuộc tính hoặc ứng dụng có trong đó, người dùng có thể thích một số thuộc tính duy trì ở phương pháp trừu tượng thấp vừa phải trong khi những thuộc tính khác được tổng quát hóa thành phương thức cao hơn. Việc kiểm soát mức độ cao của một thuộc tính nên được tổng quát hóa thường mang tính chủ quan. Kiểm soát của giai đoạn này được gọi là kiểm soát tổng quát hóa thuộc tính.
Nếu thuộc tính được tổng quát hóa "quá cao", nó có thể dẫn đến tổng quát hóa quá mức và các quy tắc kết quả không thể mô tả nhiều. Nói cách khác, nếu thuộc tính không được khái quát hóa đến “mức độ cao thích hợp”, thì việc tổng quát hóa có thể dẫn đến kết quả, trong đó các quy tắc thu được cũng không thể mang tính thông tin. Do đó, cần phải có được sự cân bằng trong quá trình tổng quát hóa theo hướng thuộc tính.
Có nhiều cách khả thi để kiểm soát quá trình tổng quát hóa như sau -
Kiểm soát ngưỡng tổng quát hóa thuộc tính - Kỹ thuật đầu tiên, được gọi là kiểm soát ngưỡng tổng quát hóa thuộc tính, đặt một ngưỡng tổng quát hóa cho một số thuộc tính hoặc đặt một ngưỡng cho mọi thuộc tính. Nếu nhiều giá trị khác biệt trong một thuộc tính cao hơn ngưỡng thuộc tính, thì việc loại bỏ thuộc tính hoặc tổng quát hóa thuộc tính phải được thực hiện.
Các hệ thống khai thác dữ liệu thường có giá trị ngưỡng thuộc tính mặc định thường nằm trong khoảng từ 2 đến 8 và phải cho phép các chuyên gia cũng như người dùng thay đổi giá trị ngưỡng. Nếu người dùng hiểu rằng mức độ tổng quát hóa đạt đến mức quá lớn đối với một thuộc tính cụ thể, thì ngưỡng này có thể được cải thiện.
Kiểm soát ngưỡng quan hệ tổng quát - Kỹ thuật thứ hai, được gọi là kiểm soát ngưỡng quan hệ tổng quát, quyết định một ngưỡng cho quan hệ tổng quát. Nếu nhiều bộ giá trị (riêng biệt) trong mối quan hệ tổng quát cao hơn ngưỡng, thì quá trình tổng quát hóa phải được thực hiện.
Do đó, không phải thực hiện tổng quát hóa nữa. Ngưỡng như vậy cũng có thể được đặt trước trong hệ thống khai thác dữ liệu (thường nằm trong phạm vi từ 10 đến 30), hoặc do chuyên gia hoặc người dùng đặt và phải có thể điều chỉnh được. Ví dụ:nếu người dùng hiểu rằng mối quan hệ tổng quát quá nhỏ, nó có thể tăng ngưỡng, điều này có nghĩa là đã giảm bớt.