Làm thế nào kỹ thuật này có thể hữu ích cho việc giảm dữ liệu nếu dữ liệu được biến đổi wavelet có cùng độ dài với dữ liệu ban đầu?

Tiện ích nằm ở chỗ dữ liệu được chuyển đổi wavelet có thể bị giới hạn. Một thông tin gần đúng đã nén có thể được giữ lại bằng cách chỉ lưu một phần nhỏ hệ số chính của hệ số wavelet. Ví dụ:tất cả các hệ số wavelet cao hơn một số ngưỡng do người dùng xác định có thể được duy trì. Một số hệ số khác được đặt thành 0.

Mô tả dữ liệu kết quả là rất thưa thớt do đó các dịch vụ có thể tận dụng lợi ích của sự thưa thớt dữ liệu được tính toán rất nhanh nếu được thực hiện trong không gian wavelet. Phương pháp này cũng hoạt động để loại bỏ nhiễu mà không làm mịn các đặc điểm chính của dữ liệu, tạo ra hiệu quả cho việc làm sạch dữ liệu. Với một tập hợp các hệ số, có thể tạo ra một giá trị gần đúng của dữ liệu gốc bằng cách sử dụng đối diện với DWT được áp dụng.

DWT thường liên quan đến phép biến đổi Fourier rời rạc (DFT), một phương pháp xử lý tín hiệu chứa sin và cosin. Nói chung, DWT đạt được khả năng nén tổn hao tốt. Nếu một số hệ số tương tự được giữ cho DWT và DFT của một vectơ dữ liệu nhất định, thì phiên bản DWT sẽ hỗ trợ xấp xỉ hiệu quả hơn các bản ghi gốc.

Do đó, đối với cùng một giá trị gần đúng, DWT cần ít diện tích hơn DFT. Không giống như DFT, các wavelet được bản địa hóa hoàn toàn trong không gian, góp phần bảo tồn các yếu tố cục bộ. Chỉ có một DFT, nhưng có nhiều họ DWT.

Có các phép biến đổi wavelet nổi tiếng như các phép biến đổi Haar-2, Daubechies-4 và Daubechies-6. Quy trình chung để sử dụng biến đổi wavelet rời rạc tạo điều kiện thuận lợi cho thuật toán kim tự tháp phân cấp làm giảm một nửa bản ghi ở mỗi lần lặp, dẫn đến tốc độ tính toán nhanh chóng. Phương pháp như sau -

Độ dài, L, của vectơ dữ liệu đầu vào phải là lũy thừa số bằng 2. Điều kiện này có thể được lắp ráp bằng cách đệm vectơ dữ liệu bằng các số 0 là cần thiết (L ≥ n).
Mỗi phép biến đổi liên quan đến việc sử dụng hai hàm. Cách thứ nhất sử dụng nhiều cách làm mịn dữ liệu khác nhau, bao gồm tổng hoặc trung bình có trọng số. Cách thứ hai triển khai sự khác biệt có trọng số, tạo điều kiện thuận lợi cho việc đưa ra các đặc điểm chi tiết của dữ liệu.
Hai hàm được sử dụng cho các cặp điểm dữ liệu trong X, nghĩa là cho tất cả các cặp dữ liệu (x _2i , x _{2i + 1} ). Điều này dẫn đến hai bộ dữ liệu có độ dài L / 2. Nói chung, các bản ghi này xác định phiên bản tần suất thấp hoặc được làm mịn của các bản ghi đầu vào và nội dung tần số cao của nó, theo đó.
Hai hàm được sử dụng đệ quy cho các tập dữ liệu có được trong vòng lặp trước đó cho đến khi các tập dữ liệu kết quả thu được có độ dài là 2.
Nó có thể được chọn các giá trị từ các tập dữ liệu có được trong các lần lặp sau được định mệnh là hệ số wavelet của dữ liệu được chuyển đổi.