Computer >> Máy Tính >  >> Lập trình >> Python

Làm cách nào để TensorFlow được sử dụng để tải xuống và khám phá tập dữ liệu Fashion MNIST bằng Python?


Tensorflow là một khuôn khổ học máy do Google cung cấp. Nó là một khung công tác mã nguồn mở được sử dụng cùng với Python để triển khai các thuật toán, ứng dụng học sâu và hơn thế nữa. Nó được sử dụng trong nghiên cứu và cho mục đích sản xuất.

Gói 'tensorflow' có thể được cài đặt trên Windows bằng dòng mã bên dưới -

pip install tensorflow

Tập dữ liệu ‘Fashion MNIST’ chứa hình ảnh về các loại quần áo khác nhau. Nó chứa hình ảnh thang độ xám của hơn 70 nghìn bộ quần áo thuộc 10 danh mục khác nhau. Những hình ảnh này có độ phân giải thấp (28 x 28 pixel).

Chúng tôi đang sử dụng Google Colaboratory để chạy đoạn mã dưới đây. Google Colab hoặc Colaboratory giúp chạy mã Python qua trình duyệt và không yêu cầu cấu hình cũng như quyền truy cập miễn phí vào GPU (Đơn vị xử lý đồ họa). Colaboratory đã được xây dựng trên Jupyter Notebook.

Sau đây là mã -

Ví dụ

import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt

print("The tensorflow version used is ")
print(tf.__version__)
print("The dataset is being loaded")
fashion_mnist = tf.keras.datasets.fashion_mnist
print("The dataset is being classified into training and testing data ")
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()
class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat', 'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']

print("The dimensions of training data ")          
print(train_images.shape)

print("The number of rows in the training data")
print(len(train_labels))

print("The column names of dataset")
print(train_labels)
print("The dimensions of test data ")          
print(test_images.shape)
print("The number of rows in the test data")
print(len(test_labels))

Mã tín dụng - https://www.tensorflow.org/tutorials/keras/classification

Đầu ra

The tensorflow version used is
2.4.0
The dataset is being loaded
The dataset is being classified into training and testing data
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
32768/29515 [=================================] - 0s 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz
26427392/26421880 [==============================] - 0s 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
8192/5148 [===============================================] - 0s 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz
4423680/4422102 [==============================] - 0s 0us/step
The dimensions of training data
(60000, 28, 28)
The number of rows in the training data
60000
The column names of dataset
[9 0 0 ... 3 0 5]
The dimensions of test data
(10000, 28, 28)
The number of rows in the test data
10000

Giải thích

  • Các gói bắt buộc được nhập.

  • Phiên bản của Tensorflow đang được sử dụng được xác định.

  • Tập dữ liệu Fashion MNIST được tải và có thể truy cập trực tiếp tập dữ liệu Fashion MNIST từ TensorFlow.

  • Tiếp theo, dữ liệu được chia thành các tập dữ liệu đào tạo và thử nghiệm.

  • Có tổng cộng 70000 hàng trong tập dữ liệu, trong đó 60 nghìn hình ảnh được sử dụng để đào tạo và 10 nghìn hàng được sử dụng để đánh giá mức độ học tập của mô hình để phân loại hình ảnh thành các nhãn khác nhau.

  • Đây là một vấn đề phân loại, trong đó mọi hình ảnh từ tập dữ liệu đều được gắn một nhãn cụ thể.

  • Những hình ảnh này là quần áo và các nhãn tương ứng được gán cho chúng.

  • Hình dạng, số hàng trong tập dữ liệu huấn luyện và kiểm tra cũng như tên cột trong tập dữ liệu được hiển thị trên bảng điều khiển.