Computer >> Máy Tính >  >> Lập trình >> Python

Tensorflow có thể được sử dụng như thế nào để làm việc với chuỗi ký tự con trong Python?

Các chuỗi ký tự con có thể được sử dụng với Tensorflow bằng cách sử dụng phương thức ‘substr’ có trong mô-đun ‘chuỗi’ của Tensorflow. Sau đó, nó được chuyển đổi thành một mảng Numpy và sau đó được hiển thị.

Đọc thêm: TensorFlow là gì và cách Keras làm việc với TensorFlow để tạo Mạng thần kinh?

Chúng ta sẽ xem cách biểu diễn các chuỗi Unicode bằng Python và thao tác với các chuỗi sử dụng Unicode tương đương. Đầu tiên, hãy tách các chuỗi Unicode thành các mã thông báo dựa trên việc phát hiện tập lệnh với sự trợ giúp của các mã Unicode tương đương với các mã chuỗi chuẩn.

Chúng tôi đang sử dụng Google Colaboratory để chạy đoạn mã dưới đây. Google Colab hoặc Colaboratory giúp chạy mã Python qua trình duyệt và không yêu cầu cấu hình cũng như quyền truy cập miễn phí vào GPU (Đơn vị xử lý đồ họa). Colaboratory đã được xây dựng trên Jupyter Notebook.

 print ("Đơn vị mặc định là byte") print ("Khi len là 1, một byte duy nhất được trả về") tf.strings.substr (cảm ơn, pos =7, len =1) .numpy () print ( "Đơn vị được chỉ định là UTF8_CHAR") print ("Nó chiếm 4 byte") print (tf.strings.substr (cảm ơn, pos =7, len =1, unit ='UTF8_CHAR'). Numpy ())  

Tín dụng mã:https://www.tensorflow.org/tutorials/load_data/unicode

Đầu ra

 Đơn vị mặc định là byte Khi len là 1, một byte đơn được trả về Đơn vị được chỉ định là UTF8_CHAR Nó chiếm 4 byteb '' 

Giải thích

  • Phép toán tf.strings.substr nhận tham số "unit".
  • Sau đó, nó sử dụng điều này để xác định loại hiệu số mà các đơn vị đo lường "pos" và "len" sẽ chứa.