Sự khác biệt giữa Giảm kích thước và Giảm số lượng?

Giảm kích thước

Trong quá trình giảm kích thước, mã hóa hoặc biến đổi dữ liệu được sử dụng để truy cập mô tả giảm hoặc "nén" của dữ liệu gốc. Nếu dữ liệu gốc có thể được phục hồi từ dữ liệu nén mà không bị mất dữ liệu, thì việc giảm dữ liệu được gọi là mất dữ liệu. Nếu dữ liệu được tạo lại chỉ gần đúng với dữ liệu ban đầu thì việc giảm dữ liệu được gọi là mất mát.

DWT gần như được kết hợp với phép biến đổi Fourier rời rạc (DFT), một kỹ thuật xử lý tín hiệu chứa các sin và cosin. Nói chung, DWT đạt được khả năng nén tổn hao tốt hơn. Đó là nếu một số lượng hệ số tương tự được duy trì cho một DWT và một DFT của một vectơ dữ liệu nhất định, thì phiên bản DWT sẽ hỗ trợ một giá trị gần đúng chính xác hơn của dữ liệu gốc. Do đó, để có giá trị gần đúng tương đương, DWT cần ít diện tích hơn DFT.

Giảm số lượng

Trong phần giảm thiểu, khối lượng dữ liệu được giảm xuống bằng cách chọn một hình thức biểu diễn dữ liệu thay thế, nhỏ hơn. Các kỹ thuật này có thể là tham số hoặc phi tham số. Đối với phương pháp tham số, một mô hình có thể ước tính dữ liệu, do đó chỉ các tham số dữ liệu cần được lưu, thay vì dữ liệu thực, ví dụ, mô hình Log-tuyến tính. Các phương pháp phi tham số được sử dụng để lưu trữ phần đại diện ít hơn của dữ liệu, bao gồm biểu đồ, phân nhóm và lấy mẫu.

Hãy để chúng tôi xem so sánh giữa Giảm kích thước và Giảm số lượng.

Giảm kích thước	Giảm số lượng
Trong việc giảm kích thước, mã hóa hoặc chuyển đổi dữ liệu được áp dụng để có được sự trình bày giảm hoặc nén của dữ liệu gốc.	Khi giảm số lượng, khối lượng dữ liệu được giảm bằng cách chọn các hình thức biểu diễn dữ liệu nhỏ hơn, xen kẽ.
Trong giảm kích thước, biến đổi wavelet rời rạc (DWT) là một kỹ thuật xử lý tín hiệu tuyến tính, khi được sử dụng với véc tơ dữ liệu X, sẽ thay đổi nó thành một véc tơ khác về số, X ’, của hệ số sóng. Hai vectơ có cùng độ dài. Khi áp dụng kỹ thuật này để giảm dữ liệu, nó có thể coi mỗi tuple là một vectơ dữ liệu n chiều, nghĩa là, X =(x ₁ , x ₂ ,… X _n ) mô tả n phép đo được thực hiện trên bộ từ n thuộc tính cơ sở dữ liệu.	Trong quá trình giảm số lượng, các mô hình hồi quy và log-tuyến tính có thể được sử dụng để tính gần đúng dữ liệu đã cho. Trong hồi quy tuyến tính, dữ liệu được mô hình hóa để vừa với một đường thẳng. Ví dụ, một biến ngẫu nhiên, y (được gọi là biến đáp ứng), có thể được mô hình hóa dưới dạng hàm tuyến tính của một biến ngẫu nhiên khác, x (được gọi là biến dự báo), với phương trình y =wx + b, trong đó phương sai của y được giả định là không đổi.
Nó có thể được sử dụng để loại bỏ các thuộc tính không liên quan và dư thừa.	Nó chỉ là một kỹ thuật biểu diễn dữ liệu gốc sang một dạng nhỏ hơn.
Trong kỹ thuật này, một số dữ liệu có thể bị mất, điều này không phù hợp.	Trong phương pháp này, không mất dữ liệu nhưng toàn bộ dữ liệu được biểu diễn ở dạng nhỏ hơn.