Computer >> Máy Tính >  >> Lập trình >> Python

Làm cách nào để dữ liệu văn bản có thể được nhúng vào vectơ chiều bằng Python?

Tensorflow là một khuôn khổ học máy được cung cấp bởi Google. Nó là một khung công tác mã nguồn mở được sử dụng kết hợp với Python để triển khai các thuật toán, ứng dụng học sâu và hơn thế nữa. Nó được sử dụng trong nghiên cứu và cho mục đích sản xuất.

Keras được phát triển như một phần của nghiên cứu cho dự án ONEIROS (Hệ điều hành Robot thông minh điện tử thần kinh mở). Keras là một API học sâu, được viết bằng Python. Đây là một API cấp cao có giao diện hiệu quả giúp giải quyết các vấn đề về máy học. Nó chạy trên khuôn khổ Tensorflow. Nó được xây dựng để giúp thử nghiệm một cách nhanh chóng. Nó cung cấp các khối xây dựng và trừu tượng thiết yếu cần thiết trong việc phát triển và đóng gói các giải pháp học máy.

Keras đã có trong gói Tensorflow. Nó có thể được truy cập bằng cách sử dụng dòng mã dưới đây.

 import tensorflowf from tensorflow import keras 

API chức năng Keras giúp tạo các mô hình linh hoạt hơn so với các mô hình được tạo bằng API tuần tự. API chức năng có thể hoạt động với các mô hình có cấu trúc liên kết phi tuyến tính, có thể chia sẻ các lớp và hoạt động với nhiều đầu vào và đầu ra. Mô hình học sâu thường là một đồ thị xoay chiều có hướng (DAG) chứa nhiều lớp. API chức năng giúp xây dựng biểu đồ của các lớp.

Chúng tôi đang sử dụng Google Colaboratory để chạy đoạn mã dưới đây. Google Colab hoặc Colaboratory giúp chạy mã Python qua trình duyệt và không yêu cầu cấu hình cũng như quyền truy cập miễn phí vào GPU (Đơn vị xử lý đồ họa). Colaboratory đã được xây dựng trên Jupyter Notebook. Sau đây là đoạn mã, trong đó chúng tôi sẽ nhúng mọi từ trong tiêu đề vào một vectơ 64 chiều -

Ví dụ

 print ("Số lượng thẻ vấn đề duy nhất") num_tags =12print ("Kích thước của từ vựng trong khi xử lý trước dữ liệu văn bản") num_words =10000print ("Số lớp cho các gợi ý") num_classes =4title_input =keras.Input (shape =( Không,), name ="title") print ("Độ dài biến int chuỗi") body_input =keras.Input (shape =(None,), name ="body") tags_input =keras.Input (shape =(num_tags,) , name ="tags") print ("Nhúng từng từ trong tiêu đề vào vectơ 64 chiều") title_features =layer.Embedding (num_words, 64) (title_input) print ("Nhúng từng từ vào vectơ 64 chiều" ) body_features =layer.Embedding (num_words, 64) (body_input) print ("Giảm trình tự các từ được nhúng thành một vectơ 128 chiều") title_features =layer.LSTM (128) (title_features) print ("Giảm trình tự các từ được nhúng vào vectơ 132 chiều đơn ") body_features =layer.LSTM (32) (body_features) print (" Hợp nhất các đối tượng có sẵn thành một vectơ duy nhất bằng cách nối nó ") x =layer.concatenate ([title_features, body_fea tures, tags_input]) print ("Sử dụng hồi quy logistic để dự đoán các tính năng") priority_pred =lớp.Dense (1, name ="priority") (x) Department_pred =lớp.Dense (num_classes, name ="class") (x ) print ("Khởi tạo mô hình dự đoán mức độ ưu tiên và lớp") model =keras.Model (input =[title_input, body_input, tags_input], outputs =[priority_pred, Department_pred],) 

Tín dụng mã - https://www.tensorflow.org/guide/keras/f Chức năng

Đầu ra

 Số lượng thẻ vấn đề duy nhấtKích thước từ vựng trong khi xử lý trước dữ liệu văn bảnSố lớp cho các dự đoánĐộ dài thay đổi trong dãy intĐèn mọi từ trong tiêu đề thành một vectơ 64 chiều Nhúng mọi từ vào một vectơ 64 chiều Giảm chuỗi các từ được nhúng thành một vectơ 128 chiều Giảm chuỗi các từ được nhúng vào một vectơ 132 chiều Hợp nhất các tính năng có sẵn thành một vectơ duy nhất bằng cách nối nó Sử dụng hồi quy logistic để dự đoán các tính năng 

Giải thích

  • API chức năng có thể được sử dụng để làm việc với nhiều đầu vào và đầu ra.

  • Điều này không thể được thực hiện với API tuần tự.