Computer >> Máy Tính >  >> Lập trình >> Python

Tensorflow có thể được sử dụng như thế nào để chuẩn bị tập dữ liệu với các câu hỏi về stackoverflow bằng Python?

Tensorflow là một khuôn khổ học máy được cung cấp bởi Google. Nó là một khung công tác mã nguồn mở được sử dụng kết hợp với Python để triển khai các thuật toán, ứng dụng học sâu và hơn thế nữa. Nó được sử dụng trong nghiên cứu và cho mục đích sản xuất.

Gói 'tensorflow' có thể được cài đặt trên Windows bằng dòng mã bên dưới -

 pip cài đặt tensorflow 

Tensor là một cấu trúc dữ liệu được sử dụng trong TensorFlow. Nó giúp kết nối các cạnh trong một sơ đồ luồng. Sơ đồ luồng này được gọi là 'Biểu đồ luồng dữ liệu'. Hàng căng không là gì ngoài mảng nhiều chiều hoặc một danh sách. Chúng tôi đang sử dụng Google Colaboratory để chạy đoạn mã dưới đây. Google Colab hoặc Colaboratory giúp chạy mã Python qua trình duyệt và không yêu cầu cấu hình cũng như quyền truy cập miễn phí vào GPU (Đơn vị xử lý đồ họa). Colaboratory đã được xây dựng trên Jupyter Notebook. Sau đây là đoạn mã -

Ví dụ

 VOCAB_SIZE =10000print ("Quá trình xử lý trước văn bản bắt đầu") binary_vectorize_layer =TextVectorization (max_tokens =VOCAB_SIZE, output_mode ='binary') MAX_SEQUENCE_LENGTH =250int_vectorize_layer =TextVectorization (max_mỹ_nguyên_nguyên_nghiệp) / pre> 

Tín dụng mã - https://www.tensorflow.org/tutorials/load_data/text

Đầu ra

 Quá trình xử lý trước văn bản bắt đầu 

Giải thích

  • Dữ liệu được chuẩn hóa, mã hóa và vector hóa bằng cách sử dụng lớp ‘TextVectorization’.

  • Tiêu chuẩn hóa liên quan đến việc xử lý trước văn bản và xóa dấu câu và phần tử HTML.

  • Mã hóa liên quan đến việc tách các câu thành các từ, bằng cách tách khoảng trắng.

  • Vectơ hóa liên quan đến việc chuyển đổi các mã thông báo thành số để có thể hiểu được mạng lưới thần kinh khi được cung cấp cho nó.

  • Mô hình nhị phân sử dụng mô hình nhiều từ để xây dựng mô hình.