Unicodedata - Cơ sở dữ liệu Unicode trong Python

Trong bài viết này, chúng ta sẽ tìm hiểu về Unicodedata - Cơ sở dữ liệu Unicode trong Python 3.x. Hoặc sớm hơn.

Các mô-đun Cơ sở dữ liệu ký tự Unicode cung cấp tất cả các tính năng của Unicode cho ký tự. Mô-đun sử dụng các tên và ký hiệu giống hệt nhau như đã đề cập trong quy tắc.

Bây giờ chúng ta hãy xem xét một số chức năng có sẵn trong mô-đun.

Chức năng tra cứu

Hàm này cho phép chúng ta lấy ký hiệu cho tên tương ứng được chuyển vào đầu vào.

Ví dụ

import unicodedata
print (unicodedata.lookup('HYPHEN'))
print (unicodedata.lookup('HIGH VOLTAGE SIGN') )
print (unicodedata.lookup('NO ENTRY') )

Đầu ra

-
⚡
฀

Chức năng đặt tên

Điều này cho phép chúng tôi tìm nạp tên của ký hiệu tương ứng được chuyển vào đầu vào.

Ví dụ

import unicodedata
print (unicodedata.name(u'&'))
print (unicodedata.name(u'@') )
print (unicodedata.name(u'`') )

Đầu ra

AMPERSAND
COMMERCIAL AT
GRAVE ACCENT

Chức năng danh mục

Điều này cho phép chúng tôi phát hiện danh mục của ký hiệu / chữ cái / số nguyên được chuyển làm đầu vào.

Ví dụ

import unicodedata
print (unicodedata.category(u'&'))
print (unicodedata.category(u'1') )
print (unicodedata.category(u'a') )

Đầu ra

Po
Nd
Ll

Kết luận

TRONG bài viết này, chúng ta sẽ tìm hiểu về cơ sở dữ liệu ký tự Unicode và một số hàm liên quan.