Computer >> Máy Tính >  >> Lập trình >> Python

Phân tích dữ liệu bằng Python Pandas

Trong hướng dẫn này, chúng ta sẽ xem phân tích dữ liệu bằng thư viện gấu trúc Python. Thư viện gấu trúc được viết bằng C . Vì vậy, chúng tôi không gặp bất kỳ vấn đề gì về tốc độ. Nó nổi tiếng về phân tích dữ liệu. Chúng tôi có hai loại cấu trúc lưu trữ dữ liệu ở gấu trúc. Chúng là Dòng DataFrame . Hãy xem từng cái một.

1. Phần tiếp theo

Chuỗi là một mảng 1D với chỉ mục và giá trị tùy chỉnh. Chúng tôi có thể tạo đối tượng Dòng bằng cách sử dụng pandas.Series (dữ liệu, chỉ mục) lớp. Chuỗi sẽ lấy số nguyên, danh sách, từ điển làm dữ liệu. Hãy xem một số ví dụ.

Ví dụ

 # nhập thư viện gấu trúc nhập khẩu gấu trúc dưới dạng pd # datadata =[1, 2, 3] # tạo đối tượng Series # Series tự động lấy indexseries mặc định =pd.Series (data) print (series) 

Đầu ra

Nếu bạn chạy chương trình trên, bạn sẽ nhận được kết quả sau.

 0 11 22 3dtype:int64 

Làm thế nào để có một chỉ mục tùy chỉnh? Xem ví dụ.

Ví dụ

 # nhập thư viện gấu trúc nhập khẩu gấu trúc dưới dạng pd # datadata =[1, 2, 3] # indxindex =['a', 'b', 'c'] # create Series objectseries =pd.Series (data, index) print (loạt) 

Đầu ra

Nếu bạn chạy chương trình trên, bạn sẽ nhận được kết quả sau.

 a 3dtype 1b 2c:int64 

Khi chúng tôi cung cấp dữ liệu dưới dạng từ điển cho Chuỗi lớp, sau đó nó lấy các khóa làm chỉ mục và các giá trị làm dữ liệu thực tế. Hãy xem một ví dụ.

Ví dụ

 # nhập thư viện gấu trúc nhập khẩu gấu trúc dưới dạng pd # datadata ={'a':97, 'b':98, 'c':99} # create Series objectseries =pd.Series (data) print (series)  

Đầu ra

Nếu bạn chạy chương trình trên, bạn sẽ nhận được kết quả sau.

 loại 97b 98c 99:int64 

Chúng tôi có thể truy cập dữ liệu từ Sê-ri bằng cách sử dụng một chỉ mục. Hãy xem các ví dụ.

Ví dụ

 # nhập thư viện gấu trúc nhập khẩu gấu trúc dưới dạng pd # datadata ={'a':97, 'b':98, 'c':99} # create Series objectseries =pd.Series (data) # truy cập dữ liệu từ Chuỗi sử dụng dấu chỉ mục (loạt ['a'], loạt ['b'], loạt ['c']) 

Đầu ra

Nếu bạn chạy đoạn mã trên, bạn sẽ nhận được kết quả sau.

 97 98 99 

2.Pandas

Chúng tôi có cách sử dụng lớp Series ở gấu trúc. Hãy xem cách sử dụng DataFrame lớp. DataFrame lớp cấu trúc dữ liệu trong gấu trúc có chứa hàng và cột.

Chúng tôi có thể tạo DataFrame các đối tượng sử dụng danh sách, từ điển, Sê-ri, vv .., Hãy tạo DataFrame bằng cách sử dụng danh sách.

Ví dụ

 # nhập thư viện gấu trúc nhập khẩu gấu trúc dưới dạng pd # listnames =['Tutorialspoint', 'Mohit', 'Sharma'] age =[25, 32, 21] # tạo DataFramedata_frame =pd.DataFrame ({'Name':tên, 'Age':age}) # đang in DataFrameprint (data_frame) 

Đầu ra

Nếu bạn chạy chương trình trên, bạn sẽ nhận được kết quả sau.

 Tên Age0 Hướng dẫn Điểm 251 Mohit 322 Sharma 21 

Hãy xem cách tạo đối tượng khung dữ liệu bằng Series.

Ví dụ

 # nhập thư viện gấu trúc nhập khẩu gấu trúc dưới dạng pd # Series_1 =pd.Series ([1, 2, 3]) _ 2 =pd.Series ([1, 4, 9]) _ 3 =pd.Series ([1, 8 , 27]) # tạo DataFramedata_frame =pd.DataFrame ({"a":_ 1, "b":_ 2, "c":_ 3}) # in DataFrameprint (data_frame) 

Đầu ra

Nếu bạn chạy đoạn mã trên, bạn sẽ nhận được kết quả sau.

 a b c0 1 1 11 2 4 82 3 9 27 

Chúng tôi có thể truy cập dữ liệu từ DataFrames bằng cách sử dụng tên cột. Hãy xem một ví dụ.

Ví dụ

 # nhập thư viện gấu trúc nhập khẩu gấu trúc dưới dạng pd # Series_1 =pd.Series ([1, 2, 3]) _ 2 =pd.Series ([1, 4, 9]) _ 3 =pd.Series ([1, 8 , 27]) # tạo DataFramedata_frame =pd.DataFrame ({"a":_ 1, "b":_ 2, "c":_ 3}) # truy cập toàn bộ cột có tên 'a'print (data_frame [' a ' ]) 

Đầu ra

Nếu bạn chạy đoạn mã trên, bạn sẽ nhận được kết quả sau.

 0 11 22 3Name:a, dtype:int64 

Kết luận

Nếu bạn có bất kỳ nghi ngờ nào trong hướng dẫn, hãy đề cập đến chúng trong phần bình luận.