Computer >> Máy Tính >  >> Lập trình >> Lập trình

Phân loại các ràng buộc trong khai thác dữ liệu là gì?

Các thuật toán dựa trên ràng buộc cần có các ràng buộc để giảm khu vực tìm kiếm trong giai đoạn tạo tập phổ biến (bước tạo quy tắc kết hợp chính xác với bước tạo quy tắc kết hợp của các thuật toán toàn diện).

Tầm quan trọng của các ràng buộc được xác định rõ ràng và chúng chỉ đưa ra các quy tắc kết hợp mà khách hàng quan tâm. Phương thức này khá đơn giản và vùng quy tắc bị giảm xuống, do đó các quy tắc còn lại sử dụng các ràng buộc.

Có ba loại ràng buộc như sau -

Ràng buộc đối với các trường hợp - Một ràng buộc về các cá thể xác định cách một cặp hoặc một tập các cá thể phải được nhóm trong phân tích cụm. Có hai loại ràng buộc từ danh mục này, chẳng hạn như -

  • Ràng buộc phải liên kết - Nếu một ràng buộc phải liên kết được xác định trên hai đối tượng x và y, do đó x và y phải được nhóm thành một cụm trong đầu ra của phân tích cụm. Các ràng buộc phải liên kết này có tính bắc cầu, tức là phải liên kết (x, y) và phải liên kết (y, z), sau đó phải liên kết (x, z).

  • Ràng buộc không thể liên kết - Ràng buộc không thể liên kết là sự đảo ngược của các ràng buộc phải liên kết. Nếu một ràng buộc không thể liên kết được xác định trên hai đối tượng, x và y, do đó, trong đầu ra của phân tích cụm, x và y phải thuộc một số cụm. Ràng buộc không thể liên kết có thể được kéo theo. Nếu không thể liên kết (x, y), phải liên kết (x, x ), và phải liên kết (y, y ), sau đó không thể liên kết (x , y ).

Ràng buộc trên các cụm - Một ràng buộc đối với các cụm xác định một yêu cầu đối với các cụm, có thể sử dụng các thuộc tính của các cụm. Ví dụ:một ràng buộc có thể xác định số lượng đối tượng tối thiểu trong một cụm, đường kính tối đa của một cụm hoặc hình dạng của một cụm (ví dụ:một khối lồi). Số lượng các cụm được xác định cho các phương pháp phân cụm phân vùng có thể được đánh dấu là một ràng buộc đối với các cụm.

Các hạn chế về đo lường mức độ tương tự - Một thước đo độ tương tự, bao gồm khoảng cách Euclide, được sử dụng để tính độ giống nhau giữa các đối tượng trong phân tích cụm. Trong các ứng dụng khác nhau, sử dụng ngoại lệ. Ràng buộc đối với phép đo độ tương tự xác định yêu cầu mà phép tính độ tương tự phải tuân theo.

Ví dụ:nó có thể tập hợp mọi người khi thay đổi các đối tượng trong một quảng trường, trong khi khoảng cách Euclid có thể tạo ra khoảng cách đi bộ giữa hai điểm, một hạn chế đối với phép đo độ tương đồng là quỹ đạo thực hiện khoảng cách ngắn nhất không thể vượt qua một bức tường.

Có một cách tiếp cận khác để phân loại các ràng buộc phân cụm xem xét mức độ nghiêm ngặt của các ràng buộc phải được tôn trọng. Một ràng buộc là khó nếu việc phân cụm làm gián đoạn ràng buộc là không thể chấp nhận được. Ràng buộc là mềm nếu việc phân cụm làm gián đoạn ràng buộc là không mong muốn nhưng có thể chấp nhận được khi không thể tìm ra giải pháp tốt hơn. Các ràng buộc mềm còn được gọi là tùy chọn.