Bigram được hình thành bằng cách tạo một cặp từ cứ hai từ liên tiếp trong một câu đã cho. Trong python, kỹ thuật này được sử dụng nhiều trong phân tích văn bản. Dưới đây, chúng tôi thấy hai cách tiếp cận về cách đạt được điều này.
Sử dụng liệt kê và chia nhỏ
Sử dụng hai phương pháp này, trước tiên, chúng ta chia câu thành nhiều từ và sau đó sử dụng chức năng liệt kê để tạo một cặp từ từ các từ liên tiếp.
Ví dụ
list =['Dừng lại. nhìn trái phải. go '] print ("Danh sách đã cho là:\ n" + str (list)) # Sử dụng enumerate () và split () cho Bigram formationoutput =[(k, m.split () [n + 1]) cho m in list for n, k in enumerate (m.split ()) if nĐầu ra
Chạy đoạn mã trên cho chúng ta kết quả sau -
Danh sách đã cho là:['Dừng lại. nhìn trái phải. go " go ')]Sử dụng zip () và split ()
Chúng ta cũng có thể tạo biagram bằng cách sử dụng chức năng zip và split. Hàm zip () đặt các từ theo thứ tự được tạo từ câu bằng cách sử dụng split ().
Ví dụ
list =['Dừng lại. nhìn trái phải. go '] print ("Danh sách đã cho là:\ n" + str (danh sách)) # Sử dụng zip () và split () cho Bigram formationoutput =[m for n in list for m in zip (n.split ("" ) [:- 1], n.split ("") [1:])] print ("Hình thành Bigram từ danh sách đã cho là:\ n" + str (output))Đầu ra
Chạy đoạn mã trên cho chúng ta kết quả sau -
Danh sách đã cho là:['Dừng lại. nhìn trái phải. go " go ')]