Computer >> Máy Tính >  >> Lập trình >> Lập trình

Hoạt động của COWEB là gì?


COBWEB đưa dần các đối tượng vào một cây phân loại. COBWEB đi xuống cây dọc theo một đường dẫn cấp phát, làm mới số lượng dọc theo phương thức, để tìm kiếm "máy chủ lưu trữ tốt nhất" hoặc nút để xác định đối tượng.

Quyết định này phụ thuộc vào việc định vị tạm thời đối tượng trong mỗi nút và tính toán tiện ích loại của phép phân chia kết quả. Vị trí dẫn đến tiện ích phần tử cao nhất phải là máy chủ lưu trữ tốt nhất cho đối tượng.

COBWEB cũng tính toán tiện ích thể loại của phân vùng có thể dẫn đến nếu một nút mới được tạo cho đối tượng. Đối tượng nằm trong một lớp hiện tại hoặc một lớp mới được tạo cho nó, dựa trên phân vùng có giá trị tiện ích loại lớn nhất. COBWEB có khả năng tự động điều chỉnh nhiều lớp trong một phân vùng. Không bắt buộc phải dựa vào người dùng để đưa ra một tham số đầu vào như vậy.

COBWEB có hai toán tử giúp tạo ra nó ít nhạy cảm hơn với thứ tự đầu vào. Chúng đang kết hợp và phân tách. Khi một đối tượng được tích hợp, hai máy chủ tốt nhất sẽ được xử lý để kết hợp thành một lớp duy nhất.

Hơn nữa, COBWEB xem xét việc phân chia con cái của chủ nhà tốt giữa các loại hiện tại. Những quyết định này phụ thuộc vào tiện ích của danh mục. Ví dụ:các toán tử kết hợp và phân tách cho phép COBWEB triển khai tìm kiếm hai chiều, phép hợp nhất có thể hoàn tác việc tách trước đó.

Hạn chế của COWEB

Hạn chế của COWEB như sau -

Nó phụ thuộc vào giả định rằng các phân phối xác suất trên các thuộc tính độc lập tách biệt với nhau về mặt thống kê. Giả định này không phải lúc nào cũng đúng vì thường tồn tại mối tương quan giữa các thuộc tính.

Hơn nữa, mô tả phân phối xác suất của các cụm tạo ra việc làm mới và lưu trữ các cụm khá tốn kém. Điều này đặc biệt đúng khi các thuộc tính có một số lượng lớn giá trị vì sự phức tạp về thời gian và không gian không chỉ phụ thuộc vào một số thuộc tính mà còn phụ thuộc vào một số giá trị cho mỗi thuộc tính.

Hơn nữa, cây phân loại không được cân bằng chiều cao đối với các bản ghi đầu vào bị lệch, điều này có thể khiến độ phức tạp về thời gian và không gian giảm đáng kể.

CLASSIT là một phần mở rộng của COBWEB để phân nhóm gia tăng thông tin liên tục (hoặc có giá trị thực). Nó lưu phân phối chuẩn liên tục (nghĩa là trung bình và độ lệch chuẩn) cho từng thuộc tính đơn lẻ trong mỗi nút và cần một số đo tiện ích danh mục được sửa đổi là một phần tử trên các thuộc tính liên tục thay vì một tổng trên các thuộc tính rời rạc như trong COBWEB.