Xử lý trước dữ liệu về cơ bản đề cập đến nhiệm vụ tập hợp tất cả dữ liệu (được thu thập từ nhiều tài nguyên khác nhau hoặc một tài nguyên duy nhất) vào một định dạng chung hoặc thành các tập dữ liệu thống nhất (tùy thuộc vào loại dữ liệu). Vì dữ liệu trong thế giới thực không bao giờ là lý tưởng, nên có khả năng dữ liệu sẽ bị thiếu ô, lỗi, giá trị ngoại lai, sự khác biệt trong các cột và hơn thế nữa. Đôi khi, hình ảnh có thể không được căn chỉnh chính xác, hoặc có thể không rõ ràng hoặc có thể có kích thước rất lớn. Mục tiêu của quá trình xử lý trước là loại bỏ những sai lệch và lỗi này.
Để có được độ phân giải của hình ảnh, một hàm tích hợp có tên là "shape" được sử dụng. Sau khi hình ảnh được đọc, các giá trị pixel được lưu trữ dưới dạng một mảng. Mảng này không là gì khác ngoài một mảng Numpy. Sau khi hình ảnh được đọc và chuyển đổi thành một mảng, hàm hình dạng có thể được gọi trên hình ảnh này để hiểu độ phân giải của nó.
Hãy để chúng tôi lấy một ví dụ về việc tải lên một hình ảnh và nhận độ phân giải của hình ảnh trên bảng điều khiển bằng cách sử dụng thư viện scikit-learning -
Ví dụ
from skimage import io path = "path to puppy.PNG" img = io.imread(path) print("Image being read") io.imshow(img) print("Image printed on console") print("The image resolution is ") print(img.shape)
Đầu ra
Image being read Image printed on console The image resolution is (397, 558, 4)
Giải thích
- Các thư viện bắt buộc đã được nhập.
- Đường dẫn nơi lưu trữ hình ảnh được xác định.
- Hàm "imread" được sử dụng để truy cập đường dẫn và đọc hình ảnh.
- Chức năng 'imshow' được sử dụng để hiển thị hình ảnh trên bảng điều khiển.
- Hàm "shape" được sử dụng để nhận độ phân giải của hình ảnh.
- Giá trị thứ ba của đầu ra hiển thị 4, có nghĩa là nó có 4 kênh - các giá trị R, G, B và alpha.
- Dữ liệu được hiển thị trên bảng điều khiển.