Computer >> Máy Tính >  >> Lập trình >> Lập trình

Thông tin thống kê này hữu ích như thế nào cho việc trả lời câu hỏi?

Các tham số thống kê có thể được sử dụng theo cách tiếp cận dựa trên lưới từ trên xuống như sau. Đầu tiên, một lớp trong kiến ​​trúc phân cấp được quyết định mà từ đó thủ tục trả lời truy vấn sẽ bắt đầu.

Lớp này thường bao gồm một số lượng nhỏ các tế bào. Đối với mọi ô trong lớp hiện tại, nó có thể tính toán khoảng tin cậy (hoặc phạm vi xác suất ước tính) phản ánh mức độ liên quan của ô với truy vấn nhất định.

Các tham số thống kê của các ô cấp cao hơn có thể được tính toán một cách đơn giản từ các tham số của các ô cấp thấp hơn. Các tham số này chứa các thông số sau - tham số độc lập thuộc tính, số lượng và các tham số phụ thuộc thuộc tính, giá trị trung bình, stdev (độ lệch chuẩn), min (tối thiểu), max (tối đa); và loại phân phối mà giá trị thuộc tính trong ô tuân theo, bao gồm bình thường, đồng nhất, hàm mũ hoặc không (nếu phân phối là ẩn danh).

Các ô không liên quan sẽ bị loại bỏ để xem xét thêm. Xử lý các bài kiểm tra cấp thấp hơn sau đây chỉ các ô có liên quan còn lại. Giai đoạn này được lặp lại cho đến khi có được lớp dưới cùng. Nếu mô tả truy vấn được đáp ứng, các vùng của ô có liên quan sử dụng truy vấn sẽ được khôi phục.

STING cung cấp một số lợi thế như sau -

  • Tính toán dựa trên lưới không phụ thuộc vào truy vấn, vì dữ liệu thống kê được lưu trong mỗi ô xác định các bản ghi tóm tắt của dữ liệu trong ô lưới, tách biệt với truy vấn.

  • Kiến trúc lưới hỗ trợ xử lý song song và làm mới gia tăng.

  • Hiệu quả kỹ thuật là một lợi ích chính. STING đi qua cơ sở dữ liệu vì nó có thể tính toán các tham số số của các ô và do đó độ phức tạp về thời gian của việc tạo các cụm là O (n), trong đó n là tổng số đối tượng.

  • Sau khi tạo kiến ​​trúc phân cấp, thời gian xử lý truy vấn là O (g), trong đó g là tổng số ô lưới ở mức thấp nhất, thường nhỏ hơn n.

  • Bởi vì STING cần một phương pháp đa phân giải để phân tích cụm, chất lượng của phân nhóm STING dựa trên mức độ chi tiết của mức thấp nhất của kiến ​​trúc lưới. Nếu độ hạt rất tốt, giá trị của quá trình chế biến sẽ cải thiện đáng kể; tuy nhiên, nếu cấp dưới cùng của kiến ​​trúc lưới quá thô, nó có thể làm giảm chất lượng phân tích cụm.

  • STING không xử lý mối quan hệ không gian giữa các tế bào con và các tế bào lân cận của chúng đối với sự phát triển của tế bào mẹ. Kết quả là, hình dạng của các cụm ra ngoài là đồng hình; tức là, một số ranh giới cụm là ngang hoặc dọc và không có ranh giới chéo nào được phát hiện. Điều này có thể làm giảm chất lượng và độ chắc chắn của các cụm bất chấp thời gian xử lý kỹ thuật nhanh chóng.