Computer >> Máy Tính >  >> Lập trình >> Lập trình

Phân tích xu hướng là gì?

Phân tích xu hướng xác định các kỹ thuật trích xuất một mô hình hành vi trong một chuỗi thời gian có thể bị nhiễu nhẹ hoặc hoàn toàn bị che khuất. Các phương pháp phân tích xu hướng thường được sử dụng để phát hiện các đợt bùng phát và sự gia tăng hoặc giảm bất ngờ khi xuất hiện bệnh, theo dõi xu hướng của bệnh, đánh giá hiệu quả của các chương trình và chính sách kiểm soát dịch bệnh, đánh giá mức độ thành công của các chương trình và chính sách chăm sóc sức khỏe, v.v.

Các kỹ thuật khác nhau có thể được sử dụng để phát hiện xu hướng trong chuỗi mặt hàng. Làm mịn là một cách tiếp cận được sử dụng để loại bỏ các hành vi phi hệ thống được tìm thấy trong chuỗi thời gian. Làm mượt thường có dạng tìm kiếm đường trung bình động của các giá trị thuộc tính, được cung cấp cho một khoảng thời gian trong khoảng thời gian cụ thể.

Giá trị trung bình cục bộ của tất cả các giá trị thuộc tính được sử dụng thay vì giá trị cụ thể được tìm thấy tại thời điểm này. Giá trị trung vị trái ngược với giá trị trung bình thường được sử dụng vì nó ít nhạy cảm hơn với các giá trị ngoại lệ. Làm mịn có thể lọc ra tiếng ồn và các yếu tố ngoại lai. Nó có thể được sử dụng để dự đoán các giá trị trong tương lai vì dữ liệu kết quả dễ phù hợp hơn với một hàm đã biết (tuyến tính, logarit, hàm mũ, v.v.)

Việc phát hiện các mẫu theo mùa trong dữ liệu chuỗi thời gian khó hơn. Một phương pháp là tìm mối tương quan giữa các thuộc tính tại các khoảng thời gian phân bổ đều. Ví dụ:có thể tìm thấy mối tương quan giữa mọi giá trị thứ mười hai (trong dữ liệu bán hàng hàng tháng). Chênh lệch thời gian giữa các mục liên quan được gọi là độ trễ.

Các chức năng tự tương quan có thể được tạo ra để xác định mối tương quan giữa các giá trị dữ liệu ở các khoảng thời gian trễ khác nhau. Một chương trình tương quan hiển thị bằng đồ thị các giá trị tự tương quan cho một số giá trị độ trễ.

Hiệp phương sai đo lường cách hai biến thay đổi cùng nhau. Nó có thể được sử dụng làm cơ sở để xác định mối quan hệ giữa hai chuỗi thời gian hoặc xu hướng theo mùa trong một chuỗi thời gian. Hệ số tự tương quan, r k đo lường mối tương quan giữa các giá trị chuỗi thời gian cách nhau một khoảng cách nhất định, độ trễ k.

Một số cách tiếp cận đã được sử dụng cho tự tương quan. Các giá trị dương cho biết rằng cả hai biến tăng cùng nhau, trong khi các giá trị âm cho biết rằng khi một tăng thì biến kia giảm.

Giá trị gần bằng 0 chỉ ra rằng có rất ít mối tương quan giữa hai biến. Một công thức điển hình để tính toán độ tương quan là hệ số tương quan r, đôi khi được gọi là r của Pearson.

Cho hai chuỗi thời gian, X và Y, với nghĩa là X'và Y ', mỗi chuỗi có n phần tử, công thức của r là

$$ \ mathrm {\ frac {\ sum (x_i-X ') (y_i-Y')} {\ sqrt {\ sum (x_i-X) ^ 2 (y_i-Y ') ^ 2}}} $$

Nó được áp dụng để tìm hệ số tương quan với độ trễ của k, rk, trên chuỗi thời gian X =(x 1 , x 2 ,… X n ) là đơn giản. Chuỗi thời gian đầu tiên là X ′ =(x 1 , x 2 ,… X n − k ), trong khi chuỗi thời gian thứ hai là X '' =(x k + 1 , x k + 1 ,… X n ).