Computer >> Máy Tính >  >> Lập trình >> Python

Làm cách nào để thêm một cột mới vào khung dữ liệu hiện có trong Python?

Dataframe là cấu trúc dữ liệu hai chiều, nơi dữ liệu được lưu trữ ở định dạng bảng, dưới dạng hàng và cột.

Nó có thể được hình dung như một bảng dữ liệu SQL hoặc một biểu diễn trang tính excel. Nó có thể được tạo bằng cách sử dụng hàm tạo sau -

pd.Dataframe(data, index, columns, dtype, copy)

Một cột mới có thể được thêm vào khung dữ liệu theo nhiều cách khác nhau.

Hãy để chúng tôi xem một trong những cách, trong đó một cột mới được tạo bằng cách đầu tiên tạo cấu trúc dữ liệu chuỗi và chuyển cột này làm cột bổ sung vào khung dữ liệu hiện có.

Hãy để chúng tôi xem mã đang hoạt động -

Ví dụ

import pandas as pd
my_data = {'ab' : pd.Series([1, 8, 7], index=['a', 'b', 'c']),
'cd' : pd.Series([1, 2, 0, 9], index=['a', 'b', 'c', 'd'])}
my_df = pd.DataFrame(my_data)
print("The dataframe is :")
print(my_df)
print ("Adding a new column to the dataframe by passing it as a Series structure :")
my_df['ef']=pd.Series([56, 78, 32],index=['a','b','c'])
print("After adding a new column to the dataframe, :")
print(my_df)

Đầu ra

The dataframe is :
   ab   cd
a  1.0  1
b  8.0  2
c  7.0  0
d  NaN  9
Adding a new column to the dataframe by passing it as a Series structure :
After adding a new column to the dataframe, :
    ab  cd  ef
a  1.0  1   56.0
b  8.0  2  78.0
c  7.0  0  32.0
d  NaN  9  NaN

Giải thích

  • Các thư viện bắt buộc được nhập và đặt tên bí danh để dễ sử dụng.

  • Một cấu trúc dữ liệu từ điển được tạo, trong đó một cặp khóa-giá trị có trong một từ điển.

  • Bằng cách này, nhiều từ điển được tạo và lưu trữ trong một danh sách.

  • 'Giá trị' trong cặp giá trị khóa thực sự là cấu trúc dữ liệu Chuỗi.

  • Chỉ mục cũng là một danh sách các giá trị được tùy chỉnh.

  • Từ điển này sau đó được chuyển dưới dạng tham số cho hàm "Dataframe" có trong thư viện "pandas"

  • Khung dữ liệu được tạo bằng cách chuyển danh sách các giá trị từ điển làm tham số cho nó.

  • Một cột mới khác được tạo và các giá trị được khởi tạo trong đó.

  • Cột mới này được lập chỉ mục vào khung dữ liệu ban đầu.

  • Bằng cách này, cột mới được liên kết với khung dữ liệu.

  • Khung dữ liệu được in trên bảng điều khiển.

Lưu ý - Từ ‘NaN’ đề cập đến ‘Không phải số’, có nghĩa là giá trị [hàng, cột] cụ thể không có bất kỳ mục nhập hợp lệ nào.