Computer >> Máy Tính >  >> Lập trình >> Python

Làm cách nào để có thể nhập dữ liệu để dự đoán hiệu quả sử dụng nhiên liệu với bộ dữ liệu Auto MPG (hồi quy cơ bản) bằng cách sử dụng TensorFlow?


Tensorflow là một khuôn khổ học máy do Google cung cấp. Nó là một khung công tác mã nguồn mở được sử dụng kết hợp với Python để triển khai các thuật toán, ứng dụng học sâu và hơn thế nữa. Nó được sử dụng trong nghiên cứu và cho mục đích sản xuất.

Gói 'tensorflow' có thể được cài đặt trên Windows bằng dòng mã bên dưới -

pip install tensorflow

Tensor là một cấu trúc dữ liệu được sử dụng trong TensorFlow. Nó giúp kết nối các cạnh trong một sơ đồ luồng. Sơ đồ luồng này được gọi là 'Biểu đồ luồng dữ liệu'. Hàng căng không là gì ngoài mảng nhiều chiều hoặc một danh sách.

Mục đích đằng sau bài toán hồi quy là dự đoán đầu ra của một biến số liên tục hoặc rời rạc, chẳng hạn như giá cả, xác suất, liệu trời có mưa hay không, v.v.

Tập dữ liệu chúng tôi sử dụng được gọi là tập dữ liệu ‘Auto MPG’. Nó chứa hiệu suất nhiên liệu của ô tô những năm 1970 và 1980. Nó bao gồm các thuộc tính như trọng lượng, mã lực, dịch chuyển, v.v. Với điều này, chúng ta cần dự đoán hiệu quả sử dụng nhiên liệu của các loại xe cụ thể.

Chúng tôi đang sử dụng Google Colaboratory để chạy đoạn mã dưới đây. Google Colab hoặc Colaboratory giúp chạy mã Python qua trình duyệt và không yêu cầu cấu hình cũng như quyền truy cập miễn phí vào GPU (Đơn vị xử lý đồ họa). Colaboratory đã được xây dựng trên Jupyter Notebook.

Sau đây là mã để dự đoán hiệu suất nhiên liệu với bộ dữ liệu Auto MPG -

Ví dụ

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import seaborn as sns

np.set_printoptions(precision=3, suppress=True)

import tensorflow as tf

from tensorflow import keras
from tensorflow.keras import layers
from tensorflow.keras.layers.experimental import preprocessing
print("The version of tensorflow is ")
print(tf.__version__)

url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/auto-mpg/auto-mpg.data'
column_names = ['MPG', 'Cylinders', 'Displacement', 'Horsepower', 'Weight', 'Acceleration', 'Model Year', 'Origin']
print("The data is being loaded")
print("The column names have been defined")
raw_dataset = pd.read_csv(url, names=column_names, na_values='?', comment='\t', sep=' ', skipinitialspace=True)

dataset = raw_dataset.copy()
print("A sample of the dataset")
dataset.head(2)

Tín dụng mã - https://www.tensorflow.org/tutorials/keras/regression

Đầu ra

The version of tensorflow is
2.4.0
The data is being loaded
The column names have been defined
A sample of the dataset


sl. MPG Xi lanh Chuyển vị mã lực trọng lượng Tăng tốc Năm mô hình Nguồn gốc
0 18.0 8 307.0 130.0 3504.0 12.0 70 1
1 15.0 8 350.0 165.0 3693.0 11,5 70 1

Giải thích

  • Các gói bắt buộc được nhập và đặt bí danh.

  • Dữ liệu được tải và tên cột được xác định cho nó.

  • Một mẫu tập dữ liệu được hiển thị trên bảng điều khiển.