Computer >> Máy Tính >  >> Lập trình >> Python

Làm cách nào để tạo khung dữ liệu bằng cách sử dụng từ điển Chuỗi trong Python?

Dataframe là cấu trúc dữ liệu hai chiều, nơi dữ liệu được lưu trữ ở định dạng bảng, dưới dạng hàng và cột.

Nó có thể được hình dung như một bảng dữ liệu SQL hoặc một biểu diễn trang tính excel. Nó có thể được tạo bằng cách sử dụng hàm tạo sau -

pd.Dataframe(data, index, columns, dtype, copy)

Hãy để chúng tôi hiểu cách tạo khung dữ liệu bằng cách sử dụng từ điển Series.

  • Chuỗi là cấu trúc dữ liệu một chiều có trong thư viện 'Pandas'.

  • Nhãn trục được gọi chung là chỉ mục.

  • Cấu trúc chuỗi có thể lưu trữ bất kỳ loại dữ liệu nào, chẳng hạn như các đối tượng số nguyên, float, chuỗi, python, v.v.

Hãy để chúng tôi xem một ví dụ -

Ví dụ

import pandas as pd
my_data = {'ab' : pd.Series([1, 2, 3], index=['a', 'b', 'c']),
'mn' : pd.Series([56, 78, 13, 13], index=['a', 'b', 'c', 'd'])}
my_df = pd.DataFrame(my_data)
print("The dataframe created from dictionary of series : ")
print(my_df)

Đầu ra

The dataframe created from dictionary f series :
   ab   mn
a  1.0  56
b  2.0  78
c  3.0  13
d  NaN  13

Giải thích

  • Các thư viện bắt buộc được nhập và đặt tên bí danh để dễ sử dụng.

  • Các giá trị từ điển bao gồm khóa và giá trị được tạo, trong đó giá trị thực sự là cấu trúc dữ liệu chuỗi.

  • Chuỗi từ điển này sau đó được chuyển dưới dạng tham số cho hàm ‘Dataframe’ có trong thư viện ‘pandas’

  • Khung dữ liệu được tạo bằng cách chuyển từ điển chuỗi dưới dạng tham số cho nó.

  • Khung dữ liệu được in trên bảng điều khiển.

Lưu ý - Từ ‘NaN’ đề cập đến ‘Không phải số’, có nghĩa là giá trị [hàng, cột] cụ thể không có bất kỳ mục nhập hợp lệ nào.