Quy trình tiêu chuẩn xuyên ngành để khai thác dữ liệu (CRISP-DM) được công nhận là một cách tiếp cận nhằm tiêu chuẩn hóa hơn nữa phương pháp M&V và cho phép ước tính hiệu quả hơn về tiết kiệm năng lượng. Có một số ứng dụng của CRISP-DM như sau -
Hiểu biết kinh doanh - Một cơ sở sản xuất y sinh được chọn làm nghiên cứu điển hình để tạo ra tính khả thi của việc ứng dụng DM để giúp M&V. Sự hiểu biết về chất lượng của doanh nghiệp đang được phân tích là rất quan trọng để thực hiện các kết quả ở giai đoạn mô hình hóa và đánh giá của quy trình. Điều này được thực hiện bằng cách thực hiện hướng dẫn quy trình, tìm hiểu sơ đồ quy trình cũng như sơ đồ đường ống và thiết bị đo đạc.
Giai đoạn này cần có kiến thức về các hệ thống trong phạm vi phân tích và nhóm kỹ sư của cơ sở sẽ hiểu thêm một số vấn đề. Ranh giới của phân tích là mức tiêu thụ năng lượng điện trên toàn bộ cơ sở sản xuất.
Hiểu dữ liệu - Quy trình hiểu dữ liệu của mô hình tham chiếu CRISP-DM được hoàn thành thông qua việc điều tra cơ sở hạ tầng công nghệ dữ liệu tại cơ sở. Có được sự hiểu biết về luồng dữ liệu tiêu thụ năng lượng và cơ sở dữ liệu lưu dữ liệu đó.
Chuẩn bị dữ liệu - Dữ liệu tiêu thụ năng lượng rất phức tạp để tính toán vì tính năng đo sáng. Đồng hồ đo tích lũy được sử dụng cho năng lượng điện và do đó, quá trình xử lý trước phải được hoàn thành trên dữ liệu đầu ra. Trong trường hợp đang được điều tra, điều này đã đạt được trước khi được xuất cho người dùng.
Nhưng bất kể việc làm sạch trước dữ liệu này như thế nào, các giá trị ngoại lệ vẫn còn trong tập dữ liệu vì quy trình làm sạch trước không loại bỏ tất cả các điểm bất thường. Do đó, giai đoạn chuẩn bị dữ liệu được sử dụng để loại bỏ một số ngoại lệ còn lại trong tập dữ liệu được cung cấp cho người dùng.
Hai nguồn dữ liệu được sử dụng để thu thập dữ liệu cần thiết cho toàn bộ phân tích về các hộ tiêu thụ năng lượng điện tại chỗ - ứng dụng quản lý năng lượng và ứng dụng quản lý tuabin gió.
Năng lượng điện được thu hút tại chỗ được tính bằng mét tích lũy kilowatt-giờ (kWh). Quá trình xử lý trước dữ liệu này bao gồm việc phát hiện các giá trị ngoại lệ do sai số công tơ tạo ra và chuyển đổi dữ liệu từ kWh sang phụ tải điện trung bình tính bằng kilowatt (kW). Bước thứ hai là cần thiết để phân tích một số dữ liệu ở định dạng và đơn vị bằng nhau.
Lập mô hình - Đầu ra của tập dữ liệu từ quy trình chuẩn bị dữ liệu ở định dạng sạch sẽ và có chức năng như một kết quả của quá trình làm sạch dữ liệu được thực hiện. Đối với nghiên cứu điển hình này, tải trọng khí nén là đại lượng được chọn để lập mô hình, vì nó là biến số phù hợp nhất để thể hiện sức mạnh của dữ liệu năng lượng sẵn có.
Khi phụ tải được coi là ở mức cao, không có mối tương quan rõ ràng và rõ ràng với những người sử dụng năng lượng thiết yếu khác tại chỗ. Những người sử dụng năng lượng thiết yếu khác dễ dự đoán hơn nhờ lên lịch cung cấp và sự hiện diện của quy trình vận hành tiêu chuẩn.