Computer >> Máy Tính >  >> Lập trình >> Lập trình

STING là gì?

STING là viết tắt của Statistical Information Grid. STING là một phương pháp phân nhóm đa phân giải dựa trên lưới, trong đó khu vực không gian được chia thành các ô hình chữ nhật. Có một số phương pháp của các ô hình chữ nhật như vậy tương đương với nhiều phương pháp phân giải và các ô này tạo thành cấu trúc phân cấp mỗi ô ở cấp cao được tách ra để tạo thành một số ô ở cấp thấp hơn tiếp theo.

Dữ liệu thống kê về các thuộc tính trong mỗi ô lưới (bao gồm giá trị trung bình, giá trị lớn nhất và giá trị nhỏ nhất) được tính toán trước và lưu trữ. Các tham số thống kê của các ô cấp cao hơn có thể được tính toán một cách đơn giản từ các tham số của các ô cấp thấp hơn.

Các tham số này chứa các thông số sau - tham số độc lập thuộc tính, số lượng và các tham số phụ thuộc thuộc tính, giá trị trung bình, stdev (độ lệch chuẩn), min (tối thiểu), max (tối đa); và loại phân phối mà giá trị thuộc tính trong ô tuân theo, bao gồm bình thường, đồng nhất, hàm mũ hoặc không (nếu phân phối là ẩn danh).

Khi các bản ghi được tải vào cơ sở dữ liệu, các tham số đếm, trung bình, stdev, min và max của các ô cấp dưới cùng được tính trực tiếp từ các bản ghi. Giá trị của phân phối có thể được chỉ định bởi người dùng nếu loại phân phối được biết trước hoặc có được bằng các thử nghiệm giả thuyết bao gồm χ 2 kiểm tra.

Loại phân phối của ô cấp lớn hơn có thể được đánh giá dựa trên phần lớn các loại phân phối của ô cấp thấp hơn tương đương của nó cùng với quy trình lọc ngưỡng. Nếu phân phối của các ô cấp thấp hơn không đồng ý với nhau và từ chối kiểm tra ngưỡng, thì loại phân phối của ô cấp cao được đặt thành không.

Các phương pháp phân nhóm dựa trên lưới sử dụng cấu trúc dữ liệu lưới đa độ phân giải. Nó lượng tử hóa không gian đối tượng thành nhiều ô tạo thành cấu trúc lưới trên đó thực hiện một số hoạt động phân cụm. Lợi ích của phương pháp này là thời gian xử lý nhanh chóng, thường không phụ thuộc vào số lượng đối tượng dữ liệu, vẫn chỉ phụ thuộc vào nhiều ô trong mỗi chiều trong không gian lượng tử hóa.

Một ví dụ của phương pháp tiếp cận dựa trên lưới bao gồm STING, khám phá dữ liệu thống kê được lưu trữ trong các ô lưới, WaveCluster, phân cụm các đối tượng bằng cách sử dụng phương pháp biến đổi wavelet và CLIQUE, xác định phương pháp dựa trên lưới và mật độ để phân nhóm trong cao- vùng dữ liệu thứ nguyên.

Ưu điểm của cách tiếp cận này là cách tiếp cận độc lập với truy vấn vì thông tin thống kê tồn tại độc lập với các truy vấn. Đây là một mô tả thông thường về dữ liệu trong mỗi ô lưới, có thể được sử dụng để hỗ trợ trả lời một lớp truy vấn khổng lồ. Độ phức tạp tính toán là O (K), trong đó K là số ô lưới ở mức thấp nhất. Nó thường là K <