Computer >> Máy Tính >  >> Lập trình >> Lập trình

Số liệu khai thác dữ liệu là gì?

Khai thác dữ liệu là một trong những dạng trí tuệ nhân tạo sử dụng các mô hình nhận thức, mô hình phân tích và nhiều thuật toán để mô phỏng các kỹ thuật của não người. Khai thác dữ liệu hỗ trợ máy móc đưa ra quyết định của con người và tạo ra các lựa chọn của con người.

Người sử dụng các công cụ khai thác dữ liệu sẽ phải chỉ đạo các quy tắc máy, tùy chọn và thậm chí cả kinh nghiệm để có các chỉ số hỗ trợ quyết định khai thác dữ liệu như sau -

Tính hữu ích - Tính hữu dụng liên quan đến một số số liệu cho chúng ta biết liệu mô hình có cung cấp dữ liệu hữu ích hay không. Ví dụ:mô hình khai thác dữ liệu tương quan giữa lưu vị trí với doanh số bán hàng có thể vừa chính xác vừa đáng tin cậy, nhưng không thể hữu ích, vì nó không thể tổng quát hóa kết quả đó bằng cách chèn thêm cửa hàng tại cùng một vị trí.

Hơn nữa, nó không trả lời câu hỏi kinh doanh cơ bản là tại sao các địa điểm cụ thể lại có nhiều doanh thu hơn. Nó cũng có thể thấy rằng một mô hình có vẻ thành công là vô nghĩa vì nó phụ thuộc vào các mối tương quan chéo trong dữ liệu.

Lợi tức đầu tư (ROI) - Các công cụ khai thác dữ liệu sẽ tìm ra các mẫu thú vị bị chôn vùi bên trong dữ liệu và phát triển các mô hình dự đoán. Các mô hình này sẽ có một số thước đo để biểu thị mức độ phù hợp của chúng với hồ sơ. Không rõ cách đưa ra quyết định dựa trên một số biện pháp được báo cáo như một yếu tố của phân tích khai thác dữ liệu.

Truy cập thông tin tài chính trong quá trình khai thác dữ liệu - Cách đơn giản nhất để lập khung các quyết định về mặt tài chính là tăng cường thông tin thô thường được khai thác để chứa cả dữ liệu tài chính. Một số tổ chức đang đầu tư và phát triển kho dữ liệu và siêu thị dữ liệu.

Thiết kế của một nhà kho hoặc siêu thị chứa đựng những cân nhắc về các loại phân tích và dữ liệu cần thiết cho các truy vấn dự kiến. Nó đang thiết kế nhà kho theo cách cho phép truy cập thông tin tài chính cùng với quyền truy cập vào dữ liệu điển hình hơn về thuộc tính sản phẩm, hồ sơ người dùng, v.v. có thể hữu ích.

Chuyển đổi các số liệu khai thác dữ liệu thành các điều khoản tài chính - Chỉ số khai thác dữ liệu chung là thước đo "Mức tăng". Mức tăng là thước đo những gì đạt được bằng cách sử dụng mô hình hoặc hình mẫu cụ thể liên quan đến tỷ lệ cơ bản mà mô hình đó không được sử dụng. Giá trị cao có nghĩa là đạt được nhiều điều. Có vẻ như sau đó người ta có thể chỉ cần đưa ra quyết định dựa trên Mức tăng.

Độ chính xác - Độ chính xác là thước đo mức độ tương quan của mô hình với các thuộc tính trong dữ liệu đã được hỗ trợ. Có một số thước đo độ chính xác, nhưng tất cả các thước đo độ chính xác đều phụ thuộc vào thông tin được sử dụng. Trong thực tế, các giá trị có thể bị thiếu hoặc gần đúng hoặc dữ liệu có thể bị thay đổi bởi một số quá trình.

Đây là quy trình thăm dò và phát triển, nó có thể quyết định chấp nhận một lượng lỗi cụ thể trong dữ liệu, đặc biệt nếu dữ liệu tương đối đồng nhất về các đặc điểm của nó. Ví dụ:một mô hình dự đoán doanh số bán hàng cho một cửa hàng cụ thể dựa trên doanh số bán hàng trong quá khứ có thể tương quan chặt chẽ và rất chính xác, ngay cả khi cửa hàng đó thường xuyên sử dụng các kỹ thuật kế toán sai. Do đó, các phép đo về độ chính xác nên được cân bằng bằng các đánh giá về độ tin cậy.