Computer >> Máy Tính >  >> Lập trình >> Python

Tensorflow có thể được sử dụng như thế nào để chia tập dữ liệu hoa thành đào tạo và xác nhận?

Tập dữ liệu hoa có thể được chia thành tập hợp đào tạo và xác thực, bằng cách sử dụng API tiền xử lý keras, với sự trợ giúp của ‘image_dataset_from_directory’ yêu cầu chia tỷ lệ phần trăm cho tập xác thực.

Đọc thêm: TensorFlow là gì và cách Keras làm việc với TensorFlow để tạo Mạng thần kinh?

Bộ phân loại hình ảnh được tạo bằng mô hình keras.Sequential và dữ liệu được tải bằng preprocessing.image_dataset_from_directory . Dữ liệu được tải ra khỏi đĩa một cách hiệu quả. Việc trang bị quá nhiều được xác định và áp dụng các kỹ thuật để giảm thiểu nó. Những kỹ thuật này bao gồm tăng dữ liệu và bỏ cuộc. Có hình ảnh của 3700 bông hoa. Tập dữ liệu này có 5 thư mục con và có một thư mục con cho mỗi lớp. Đó là:hoa cúc, bồ công anh, hoa hồng, hoa hướng dương và hoa tulip.

Chúng tôi đang sử dụng Google Colaboratory để chạy đoạn mã dưới đây. Google Colab hoặc Colaboratory giúp chạy mã Python qua trình duyệt và không yêu cầu cấu hình cũng như quyền truy cập miễn phí vào GPU (Đơn vị xử lý đồ họa). Colaboratory đã được xây dựng trên Jupyter Notebook.

batch_size = 32
img_height = 180
img_width = 180
print("The data is being split into training and validation set")
train_ds = tf.keras.preprocessing.image_dataset_from_directory(
   data_dir,
   validation_split=0.2,
   subset="training",
   seed=123,
   image_size=(img_height, img_width),
   batch_size=batch_size)

Tín dụng mã:https://www.tensorflow.org/tutorials/images/classification

Đầu ra

The data is being split into training and validation set
Found 3670 files belonging to 5 classes.
Using 2936 files for training.

Giải thích

  • Những hình ảnh này được tải ra khỏi đĩa bằng tiện ích image_dataset_from_directory.
  • Thao tác này sẽ chuyển từ một thư mục hình ảnh trên đĩa sang tf.data.Dataset.
  • Sau khi dữ liệu được tải xuống, một số thông số sẽ được xác định cho trình tải.
  • Dữ liệu được chia thành tập hợp đào tạo và xác thực.