Computer >> Máy Tính >  >> Lập trình >> Lập trình

Dữ liệu hình chữ nhật trong cấu trúc dữ liệu

Dữ liệu mặt cắt đa biến (nghĩa là không phải chuỗi thời gian hoặc số đo lặp lại) được biểu thị bằng dữ liệu hình chữ nhật, trong đó mỗi cột là một biến (tính năng) và mỗi hàng là một trường hợp hoặc bản ghi.

Thủ tục đầu tiên của việc biểu diễn dữ liệu hình chữ nhật là ánh xạ nó lên dữ liệu điểm có chiều cao hơn và sử dụng các thủ tục cấu trúc dữ liệu dựa trên điểm như tệp lưới, cây tứ phân PR, cây tứ phân điểm và cây k-d. Thủ tục ánh xạ dữ liệu hình chữ nhật với một điểm bốn chiều có thể được thực hiện trong các kỹ thuật số như tọa độ x và y của các góc đối diện hoặc tọa độ x và y của một góc và chiều rộng và chiều cao, v.v. Hạn chế của dựa trên điểm các biểu diễn của dữ liệu hình chữ nhật có điểm là chúng thiếu để được hưởng lợi từ vị trí của dữ liệu để mang lại hiệu quả cho cả hoạt động lưu trữ và không gian.

Thủ tục thứ hai để biểu diễn dữ liệu hình chữ nhật là về các đường mà nó bao gồm và các thủ tục cấu trúc dữ liệu dựa trên dòng như PM quadtree, PMR quadtree, v.v. Hạn chế của các biểu diễn dựa trên đường đối với dữ liệu hình chữ nhật là một hoạt động không gian được chỉ định trong điều kiện các đoạn thẳng của nó có thể không đáp ứng các điều kiện của hoạt động nhưng hình chữ nhật mà chúng được tạo thành đáp ứng chúng.

Thủ tục thứ ba để biểu diễn dữ liệu hình chữ nhật là về diện tích mà nó chiếm. Các thủ tục chẳng hạn như tứ phân MX-CIF và R-Trees tổ chức dữ liệu hình chữ nhật trong các nhóm phân cấp của các hộp có giới hạn thấp nhất. Trong trường hợp MX-CIF quadtree triển khai dựa trên không gian

phân vùng quadtree trong đó mỗi hình chữ nhật được liên kết với khối quadtree bao quanh thấp nhất của nó. Trong hình chữ nhật R-Trees, dữ liệu được phân vùng thành các hộp có giới hạn thấp nhất lồng nhau theo thứ bậc. Hạn chế của R-Trees là ở đó dữ liệu không được triển khai.