Trong bài viết này, chúng ta sẽ tìm hiểu về Unicodedata - Cơ sở dữ liệu Unicode trong Python 3.x. Hoặc sớm hơn.
Các mô-đun Cơ sở dữ liệu ký tự Unicode cung cấp tất cả các tính năng của Unicode cho ký tự. Mô-đun sử dụng các tên và ký hiệu giống hệt nhau như đã đề cập trong quy tắc.
Bây giờ chúng ta hãy xem xét một số chức năng có sẵn trong mô-đun.
Chức năng tra cứu
Hàm này cho phép chúng ta lấy ký hiệu cho tên tương ứng được chuyển vào đầu vào.
Ví dụ
import unicodedata print (unicodedata.lookup('HYPHEN')) print (unicodedata.lookup('HIGH VOLTAGE SIGN') ) print (unicodedata.lookup('NO ENTRY') )
Đầu ra
- ⚡
Chức năng đặt tên
Điều này cho phép chúng tôi tìm nạp tên của ký hiệu tương ứng được chuyển vào đầu vào.
Ví dụ
import unicodedata print (unicodedata.name(u'&')) print (unicodedata.name(u'@') ) print (unicodedata.name(u'`') )
Đầu ra
AMPERSAND COMMERCIAL AT GRAVE ACCENT
Chức năng danh mục
Điều này cho phép chúng tôi phát hiện danh mục của ký hiệu / chữ cái / số nguyên được chuyển làm đầu vào.
Ví dụ
import unicodedata print (unicodedata.category(u'&')) print (unicodedata.category(u'1') ) print (unicodedata.category(u'a') )
Đầu ra
Po Nd Ll
Kết luận
TRONG bài viết này, chúng ta sẽ tìm hiểu về cơ sở dữ liệu ký tự Unicode và một số hàm liên quan.