Computer >> Máy Tính >  >> Lập trình >> Python

Tensorflow và Python có thể được sử dụng như thế nào để tải xuống và chuẩn bị tập dữ liệu CIFAR?

Tập dữ liệu CIFAR có thể được tải xuống bằng phương thức ‘load_data’ có trong mô-đun ‘datasets’. Nó được tải xuống và dữ liệu được chia thành tập huấn luyện và tập xác nhận.

Đọc thêm: TensorFlow là gì và cách Keras làm việc với TensorFlow để tạo Mạng thần kinh?

Chúng tôi sẽ sử dụng API tuần tự Keras, hữu ích trong việc xây dựng mô hình tuần tự được sử dụng để làm việc với một chồng lớp đơn giản, trong đó mỗi lớp có chính xác một tensor đầu vào và một tensor đầu ra.

Một mạng nơ-ron chứa ít nhất một lớp được gọi là lớp xoay chiều. Một mạng nơ-ron tích tụ nói chung sẽ bao gồm một số kết hợp của các lớp được đề cập dưới đây:

  • Các lớp phù hợp
  • Nhóm các lớp
  • Các lớp dày đặc

Mạng nơ-ron hợp hiến đã được sử dụng để tạo ra kết quả tuyệt vời cho một loại vấn đề cụ thể, chẳng hạn như nhận dạng hình ảnh.

Chúng tôi đang sử dụng Google Colaboratory để chạy đoạn mã dưới đây. Google Colab hoặc Colaboratory giúp chạy mã Python qua trình duyệt và không yêu cầu cấu hình cũng như quyền truy cập miễn phí vào GPU (Đơn vị xử lý đồ họa). Colaboratory đã được xây dựng trên Jupyter Notebook.

import tensorflow as tf
from tensorflow.keras import datasets, layers, models
import matplotlib.pyplot as plt
print("The CIFAR dataset is being downloaded")
(train_images, train_labels), (test_images, test_labels) = datasets.cifar10.load_data()
print("The pixel values are normalized to be between 0 and 1")
train_images, test_images = train_images / 255.0, test_images / 255.0
class_names = ['airplane', 'automobile', 'bird', 'cat', 'deer','dog', 'frog', 'horse', 'ship', 'truck']

Mã tín dụng:https://www.tensorflow.org/tutorials/images/cnn

Đầu ra

The CIFAR dataset is being downloaded
Downloading data from https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz
170500096/170498071 [==============================] - 11s 0us/step
The pixel values are normalized to be between 0 and 1

Giải thích

  • Bộ dữ liệu CIFAR10 chứa 60.000 hình ảnh màu trong 10 lớp, với 6.000 hình ảnh trong mỗi lớp.
  • Tập dữ liệu này được chia thành 50.000 hình ảnh đào tạo và 10.000 hình ảnh thử nghiệm.
  • Các lớp loại trừ lẫn nhau và không có sự chồng chéo giữa chúng.
  • Tập dữ liệu này được tải xuống và dữ liệu được chuẩn hóa để nằm trong khoảng từ 0 đến 1.