Tài liệu Word chứa văn bản được định dạng được bao bọc trong ba cấp độ đối tượng. Cấp thấp nhất- Đối tượng chạy, Cấp giữa- Đối tượng đoạn và Cấp cao nhất- Đối tượng tài liệu.
Vì vậy, chúng tôi không thể làm việc với các tài liệu này bằng trình soạn thảo văn bản thông thường. Nhưng chúng tôi có thể thao tác các tài liệu từ này trong python bằng mô-đun python-docx.
- Bước đầu tiên là cài đặt mô-đun bên thứ ba này là python-docx. Bạn có thể sử dụng pip “pip install python-docx”
- Sau khi cài đặt, hãy nhập “docx” KHÔNG PHẢI “python-docx”.
- Sử dụng lớp “docx.Document” để bắt đầu làm việc với tài liệu word.
Ví dụ
# import docx NOT python-docximport docx # tạo một phiên bản của từ documentdoc =docx.Document () # thêm tiêu đề cấp 0 (tiêu đề lớn nhất) doc.add_heading ('Tiêu đề cho tài liệu', 0) # thêm một đoạn văn và lưu trữ # đối tượng trong một variabledoc_para =doc.add_paragraph ('Đoạn văn của bạn ở đây,') # thêm một đoạn chạy tức là kiểu như # bold, nghiêng, gạch dưới, v.v.doc_para.add_run ('này, in đậm here '). bold =Truedoc_para.add_run (', and ') doc_para.add_run (' những từ này được in nghiêng '). italic =True # thêm dấu ngắt trang để bắt đầu một trang mới .add_page_break () # thêm tiêu đề cấp 2doc.add_heading ('Heading level 2', 2) # ảnh cũng có thể được thêm vào tài liệu word của chúng tôi # width is optionaldoc.add_picture ('path_to_picture') # bây giờ hãy lưu tài liệu vào locationdoc.save ('path_to_document')