Computer >> Máy Tính >  >> Lập trình >> Lập trình

Khai thác dữ liệu tạm thời là gì?

Khai phá dữ liệu tạm thời xác định quá trình trích xuất dữ liệu không quan trọng, tiềm ẩn và có khả năng thiết yếu từ tập hợp lớn dữ liệu tạm thời. Dữ liệu tạm thời là một loạt các kiểu dữ liệu chính, thường là các giá trị số và nó liên quan đến việc thu thập kiến ​​thức có lợi từ dữ liệu tạm thời.

Mục tiêu của khai thác dữ liệu theo thời gian là tìm ra các mẫu thời gian, các xu hướng bất ngờ hoặc một số mối quan hệ ẩn trong dữ liệu tuần tự cao hơn, bao gồm một chuỗi các ký hiệu danh nghĩa từ bảng chữ cái được gọi là chuỗi thời gian và chuỗi liên tục thực- các thành phần có giá trị được gọi là chuỗi thời gian, bằng cách sử dụng một tập hợp các phương pháp tiếp cận từ công nghệ học máy, thống kê và cơ sở dữ liệu.

Khai thác dữ liệu tạm thời bao gồm ba công việc chính như mô tả dữ liệu tạm thời, biểu diễn các biện pháp tương tự và dịch vụ khai thác.

Khai thác dữ liệu tạm thời bao gồm chuỗi thời gian xử lý, nói chung là chuỗi dữ liệu, tính toán các giá trị của cùng một thuộc tính tại một chuỗi nhiều thời điểm. Đối sánh mẫu bằng cách sử dụng thông tin như vậy, nơi nó đang tìm kiếm các mẫu quan tâm cụ thể, đã thu hút được sự quan tâm đáng kể trong những năm hiện tại.

Khai thác dữ liệu tạm thời có thể bao gồm việc khai thác các kỹ thuật lưu trữ dữ liệu hiệu quả, xử lý nhanh và các phương pháp truy xuất nhanh đã được nâng cao cho cơ sở dữ liệu tạm thời.

Khai thác dữ liệu thời gian là một giai đoạn riêng lẻ trong quá trình khám phá kiến ​​thức trong cơ sở dữ liệu thời gian, tính toán các mẫu thời gian từ hoặc phù hợp với các mô hình, dữ liệu thời gian là một thuật toán khai thác dữ liệu tạm thời.

Khai thác dữ liệu thời gian liên quan đến việc phân tích dữ liệu thời gian và khám phá các mẫu thời gian và tính nhất quán trong các tập hợp thông tin tạm thời. Nó cũng cho phép khả năng khám phá dữ liệu tự động do máy tính điều khiển. Có nhiều nhiệm vụ khác nhau trong khai thác tạm thời như sau -

  • Mô tả và so sánh dữ liệu
  • Phân tích phân cụm
  • Phân loại
  • Quy tắc liên kết
  • Phân tích mẫu
  • Dự đoán và phân tích xu hướng

Khai thác dữ liệu tạm thời đã dẫn đến một cách mới để tương tác với cơ sở dữ liệu tạm thời và xác định các truy vấn ở mức trừu tượng hơn nhiều so với giấy phép ngôn ngữ truy vấn có cấu trúc tạm thời. Nó cũng tạo cơ sở cho việc thăm dò dữ liệu cho các vấn đề do đa chiều và đa chiều.

Mục tiêu cơ bản của phân loại thời gian là dự đoán các trường liên quan về mặt thời gian trong cơ sở dữ liệu thời gian dựa trên các trường khác. Nói chung, vấn đề được đưa ra khi quyết định giá trị chung của biến thời gian được dự đoán dựa trên các trường khác nhau, dữ liệu huấn luyện trong đó biến mục tiêu được cung cấp cho mỗi lần quan sát và một tập hợp các giả định thể hiện kiến ​​thức trước đây của một người về vấn đề . Các kỹ thuật phân loại theo thời gian có liên quan đến vấn đề phức tạp về ước tính mật độ.