Trong hướng dẫn này, chúng ta sẽ tìm hiểu về phân tích và trực quan hóa dữ liệu bằng cách sử dụng các mô-đun như pandas và matplotlib bằng Python . Python là một sự phù hợp tuyệt vời cho những thứ phân tích dữ liệu. Cài đặt các mô-đun gấu trúc và matplotlib bằng cách sử dụng các lệnh sau.
pip install pandas
pip install matplotlib
Bạn sẽ nhận được thông báo thành công sau khi hoàn tất quá trình cài đặt. Đầu tiên chúng ta sẽ tìm hiểu về gấu trúc và sau đó sẽ thấy matplotlib .
gấu trúc
Pandas là một thư viện mã nguồn mở của Python cung cấp các công cụ phân tích dữ liệu. Chúng ta sẽ xem một số phương pháp hữu ích từ gấu trúc để phân tích dữ liệu.
Tạo DataFrames
Chúng tôi cần nhiều hàng để tạo DataFrame . Hãy xem cách thực hiện.
Ví dụ
# importing the pands package import pandas as pd # creating rows hafeez = ['Hafeez', 19] aslan = ['Aslan', 21] kareem = ['Kareem', 18] # pass those Series to the DataFrame # passing columns as well data_frame = pd.DataFrame([hafeez, aslan, kareem], columns = ['Name', 'Age']) # displaying the DataFrame print(data_frame)
Đầu ra
Nếu bạn chạy chương trình trên, bạn sẽ nhận được kết quả sau.
Name Age 0 Hafeez 19 1 Aslan 21 2 Kareem 18
Nhập dữ liệu bằng gấu trúc
Truy cập liên kết và tải xuống CSV tập tin. Dữ liệu trong CSV sẽ nằm trong các hàng được phân tách bằng dấu phẩy (,). Hãy xem cách nhập và sử dụng dữ liệu bằng pandas .
Ví dụ
# importing pandas package import pandas as pd # importing the data using pd.read_csv() method data = pd.read_csv('CountryData.IND.csv') # displaying the first 5 rows using data.head() method print(data.head())
Đầu ra
Nếu bạn chạy chương trình trên, bạn sẽ nhận được kết quả sau.
Hãy xem có bao nhiêu hàng và cột bằng cách sử dụng biến hình dạng.
Ví dụ
# importing pandas package import pandas as pd # importing the data using pd.read_csv() method data = pd.read_csv('CountryData.IND.csv') # no. of rows and columns print(data.shape)
Đầu ra
Nếu bạn chạy chương trình trên, bạn sẽ nhận được kết quả sau.
(29, 16)
Chúng tôi có một phương thức được gọi là description () tính toán các thống kê khác nhau ngoại trừ NaN . Hãy xem nó một lần.
Ví dụ
# importing pandas package import pandas as pd # importing the data using pd.read_csv() method data = pd.read_csv('CountryData.IND.csv') # no. of rows and columns print(data.describe())
Đầu ra
Nếu bạn chạy chương trình trên, bạn sẽ nhận được kết quả sau.
Lập sơ đồ dữ liệu
Chúng tôi có gói matplotlib để tạo đồ thị bằng cách sử dụng dữ liệu. Hãy xem cách tạo nhiều loại biểu đồ khác nhau bằng cách sử dụng matplotlib .
Ví dụ
# importing the pyplot module to create graphs import matplotlib.pyplot as plot # importing the data using pd.read_csv() method data = pd.read_csv('CountryData.IND.csv') # creating a histogram of Time period data['Time period'].hist(bins = 10)
Đầu ra
Nếu bạn chạy chương trình trên, bạn sẽ nhận được kết quả sau.
<matplotlib.axes._subplots.AxesSubplot at 0x25e363ea8d0>
Chúng tôi có thể tạo các loại biểu đồ khác nhau bằng cách sử dụng matplotlib gói hàng.
Kết luận
Nếu bạn có bất kỳ nghi ngờ nào về hướng dẫn, hãy đề cập đến chúng trong phần bình luận.