Computer >> Máy Tính >  >> Lập trình >> Python

Phân tích dữ liệu và trực quan hóa với chương trình Python

Trong hướng dẫn này, chúng ta sẽ tìm hiểu về phân tích và trực quan hóa dữ liệu bằng cách sử dụng các mô-đun như pandas matplotlib bằng Python . Python là một sự phù hợp tuyệt vời cho những thứ phân tích dữ liệu. Cài đặt các mô-đun gấu trúc matplotlib bằng cách sử dụng các lệnh sau.

pip install pandas


pip install matplotlib

Bạn sẽ nhận được thông báo thành công sau khi hoàn tất quá trình cài đặt. Đầu tiên chúng ta sẽ tìm hiểu về gấu trúc và sau đó sẽ thấy matplotlib .

gấu trúc

Pandas là một thư viện mã nguồn mở của Python cung cấp các công cụ phân tích dữ liệu. Chúng ta sẽ xem một số phương pháp hữu ích từ gấu trúc để phân tích dữ liệu.

Tạo DataFrames

Chúng tôi cần nhiều hàng để tạo DataFrame . Hãy xem cách thực hiện.

Ví dụ

# importing the pands package
import pandas as pd
# creating rows
hafeez = ['Hafeez', 19]
aslan = ['Aslan', 21]
kareem = ['Kareem', 18]
# pass those Series to the DataFrame
# passing columns as well
data_frame = pd.DataFrame([hafeez, aslan, kareem], columns = ['Name', 'Age'])
# displaying the DataFrame
print(data_frame)

Đầu ra

Nếu bạn chạy chương trình trên, bạn sẽ nhận được kết quả sau.

Name Age
0 Hafeez 19
1 Aslan 21
2 Kareem 18

Nhập dữ liệu bằng gấu trúc

Truy cập liên kết và tải xuống CSV tập tin. Dữ liệu trong CSV sẽ nằm trong các hàng được phân tách bằng dấu phẩy (,). Hãy xem cách nhập và sử dụng dữ liệu bằng pandas .

Ví dụ

# importing pandas package
import pandas as pd
# importing the data using pd.read_csv() method
data = pd.read_csv('CountryData.IND.csv')
# displaying the first 5 rows using data.head() method
print(data.head())

Đầu ra

Nếu bạn chạy chương trình trên, bạn sẽ nhận được kết quả sau.

Phân tích dữ liệu và trực quan hóa với chương trình Python

Hãy xem có bao nhiêu hàng và cột bằng cách sử dụng biến hình dạng.

Ví dụ

# importing pandas package
import pandas as pd
# importing the data using pd.read_csv() method
data = pd.read_csv('CountryData.IND.csv')
# no. of rows and columns
print(data.shape)

Đầu ra

Nếu bạn chạy chương trình trên, bạn sẽ nhận được kết quả sau.

(29, 16)

Chúng tôi có một phương thức được gọi là description () tính toán các thống kê khác nhau ngoại trừ NaN . Hãy xem nó một lần.

Ví dụ

# importing pandas package
import pandas as pd
# importing the data using pd.read_csv() method
data = pd.read_csv('CountryData.IND.csv')
# no. of rows and columns
print(data.describe())

Đầu ra

Nếu bạn chạy chương trình trên, bạn sẽ nhận được kết quả sau.

Phân tích dữ liệu và trực quan hóa với chương trình Python

Lập sơ đồ dữ liệu

Chúng tôi có gói matplotlib để tạo đồ thị bằng cách sử dụng dữ liệu. Hãy xem cách tạo nhiều loại biểu đồ khác nhau bằng cách sử dụng matplotlib .

Ví dụ

# importing the pyplot module to create graphs
import matplotlib.pyplot as plot
# importing the data using pd.read_csv() method
data = pd.read_csv('CountryData.IND.csv')
# creating a histogram of Time period
data['Time period'].hist(bins = 10)

Đầu ra

Nếu bạn chạy chương trình trên, bạn sẽ nhận được kết quả sau.

<matplotlib.axes._subplots.AxesSubplot at 0x25e363ea8d0>

Phân tích dữ liệu và trực quan hóa với chương trình Python

Chúng tôi có thể tạo các loại biểu đồ khác nhau bằng cách sử dụng matplotlib gói hàng.

Kết luận

Nếu bạn có bất kỳ nghi ngờ nào về hướng dẫn, hãy đề cập đến chúng trong phần bình luận.