Tensorflow có thể được sử dụng với cây được tăng cường để cải thiện hiệu suất dự đoán của tập dữ liệu. Dữ liệu được tải và xử lý trước theo cách thường được thực hiện, nhưng khi dự đoán được thực hiện, nhiều mô hình được sử dụng cho các dự đoán và kết quả đầu ra của tất cả các mô hình này được kết hợp để đưa ra kết quả cuối cùng.
Đọc thêm: TensorFlow là gì và cách Keras làm việc với TensorFlow để tạo Mạng thần kinh?
Chúng tôi sẽ sử dụng API tuần tự Keras, hữu ích trong việc xây dựng mô hình tuần tự được sử dụng để làm việc với một chồng lớp đơn giản, trong đó mỗi lớp có chính xác một tensor đầu vào và một tensor đầu ra.
Mạng nơ-ron chứa ít nhất một lớp được gọi là lớp chập. Chúng ta có thể sử dụng Mạng thần kinh hợp pháp để xây dựng mô hình học tập.
Chúng tôi đang sử dụng Google Colaboratory để chạy đoạn mã dưới đây. Google Colab hoặc Colaboratory giúp chạy mã Python qua trình duyệt và không yêu cầu cấu hình cũng như quyền truy cập miễn phí vào GPU (Đơn vị xử lý đồ họa). Colaboratory đã được xây dựng trên Jupyter Notebook.
Chúng ta sẽ xem cách một mô hình tăng độ dốc có thể được đào tạo bằng cách sử dụng cây quyết định và API tf.estimator. Mô hình Boosted Trees được coi là cách tiếp cận máy học phổ biến và hiệu quả nhất để hồi quy cũng như phân loại. Nó là một kỹ thuật tổng hợp kết hợp các dự đoán từ nhiều (10 hoặc 100 hoặc 1000) mô hình cây. Chúng giúp đạt được hiệu suất ấn tượng cùng với việc điều chỉnh siêu thông số tối thiểu.
Ví dụ
import numpy as np import pandas as pd from IPython.display import clear_output from matplotlib import pyplot as plt print("Load the dataset") dftrain = pd.read_csv('https://storage.googleapis.com/tf-datasets/titanic/train.csv') dfeval = pd.read_csv('https://storage.googleapis.com/tf-datasets/titanic/eval.csv') print("Delete the column 'survived'") y_train = dftrain.pop('survived') y_eval = dfeval.pop('survived') import tensorflow as tf tf.random.set_seed(123)
Mã tín dụng −https://www.tensorflow.org/tutorials/estimator/boosted_trees
Đầu ra
Load the dataset Delete the column 'survived'
Giải thích
- Các gói dữ liệu bắt buộc đã được nhập.
- Tập dữ liệu đã được tải.
- Nó được đọc dưới dạng tệp csv.
- Cột "tồn tại" đã bị xóa.