Computer >> Máy Tính >  >> Lập trình >> Python

Làm cách nào để tạo một cột mới cho khung dữ liệu bằng cách sử dụng các cột đã có trong Python?

Dataframe là một cấu trúc dữ liệu hai chiều, nơi dữ liệu được lưu trữ dưới dạng bảng, dưới dạng hàng và cột. Nó có thể được hình dung dưới dạng bảng dữ liệu SQL hoặc biểu diễn trang tính excel.

Nó có thể được tạo bằng cách sử dụng hàm tạo sau -

pd.Dataframe(data, index, columns, dtype, copy)

Trước đây chúng ta đã thấy một phương pháp trong đó một cột mới được tạo dưới dạng cấu trúc dữ liệu Chuỗi. Điều này đã được lập chỉ mục vào khung dữ liệu ban đầu và do đó được thêm vào khung dữ liệu.

Hãy để chúng tôi sử dụng cách chúng tôi có thể tạo một cột bằng cách sử dụng các cột hiện có của khung dữ liệu. Điều này hữu ích khi chúng ta cần thực hiện một số tính toán trên các cột đã có và lưu trữ kết quả của chúng trong một cột mới -

Ví dụ

import pandas as pd
my_data = {'ab' : pd.Series([1, 8, 7], index=['a', 'b', 'c']),
'cd' : pd.Series([1, 2, 0, 9], index=['a', 'b', 'c', 'd']),
'ef' :pd.Series([56, 78, 32],index=['a','b','c'])}
my_df = pd.DataFrame(my_data)
print("The dataframe is :")
print(my_df)
my_df['gh'] = my_df['ab'] + my_df['ef']
print("After adding column 0 and 2 to the dataframe, :")
print(my_df)

Đầu ra

The dataframe is :
   ab   cd  ef
a  1.0  1  56.0
b  8.0  2  78.0
c  7.0  0  32.0
d NaN 9 NaN
After adding column 0 and 2 to the dataframe, :
   ab   cd  ef    gh
a  1.0  1   56.0  57.0
b  8.0  2   78.0  86.0
c  7.0  0   32.0  39.0
d  NaN  9   NaN   NaN

Giải thích

  • Các thư viện bắt buộc được nhập và đặt tên bí danh để dễ sử dụng.

  • Các giá trị từ điển bao gồm khóa và giá trị được tạo, trong đó giá trị thực sự là cấu trúc dữ liệu chuỗi.

  • Nhiều giá trị từ điển như vậy được tạo.

  • Từ điển này sau đó được chuyển dưới dạng tham số cho hàm ‘Dataframe’ có trong thư viện ‘pandas’

  • Khung dữ liệu được tạo bằng cách chuyển từ điển dưới dạng tham số cho nó.

  • Cột mới được lập chỉ mục vào khung dữ liệu và cột thứ 0 và cột thứ 2 được thêm vào để tạo cột mới này.

  • Khung dữ liệu được in trên bảng điều khiển.

Lưu ý - Từ ‘NaN’ đề cập đến ‘Không phải số’, có nghĩa là giá trị [hàng, cột] cụ thể không có bất kỳ mục nhập hợp lệ nào.