Để nối các hàng của một khung dữ liệu này với các hàng của khung dữ liệu khác, chúng ta có thể sử dụng hàm Pandas append (). Với sự trợ giúp của append (), chúng ta cũng có thể nối thêm các cột. Hãy lấy một ví dụ và xem cách sử dụng phương pháp này.
Các bước
- Tạo dữ liệu dạng bảng hai chiều, có thể thay đổi kích thước, có khả năng không đồng nhất, df1.
- In DataFrame đầu vào, df1.
- Tạo một DataFrame khác, df2, có cùng tên cột và in nó.
- Sử dụng phương thức nối thêm, df1.append (df2, ignore_index =True), để nối các hàng của df2 với df2.
- In kết quả DataFrame.
Ví dụ
import pandas as pd
df1 = pd.DataFrame({"x": [5, 2], "y": [4, 7], "z": [9, 3]})
df2 = pd.DataFrame({"x": [1, 3], "y": [1, 9], "z": [29, 30]})
print "Input DataFrame 1 is:\n", df1
print "Input DataFrame 2 is:\n", df2
df3 = df1.append(df2, ignore_index=True)
print "After appending, DataFrame is: \n", df3 Đầu ra
Input DataFrame 1 is: x y z 0 5 4 9 1 2 7 3 Input DataFrame 2 is: x y z 0 1 1 29 1 3 9 30 After appending, DataFrame is: x y z 0 5 4 9 1 2 7 3 2 1 1 29 3 3 9 30
Bây giờ, hãy sử dụng các tên cột khác nhau cho các khung dữ liệu và sử dụng hàm append () mà không có tham số ignore_index. Giá trị mặc định của ignore_index là False.
import pandas as pd
df1 = pd.DataFrame({"x": [5, 2], "y": [4, 7], "z": [9, 3]})
df2 = pd.DataFrame({"a": [1, 3], "b": [1, 9], "c": [29, 30]})
print "Input DataFrame 1 is:\n", df1
print "Input DataFrame 2 is:\n", df2
df3 = df1.append(df2)
print "After appending, DataFrame is: \n", df3 Bây giờ, nó sẽ tạo ra kết quả sau
Input DataFrame 1 is: x y z 0 5 4 9 1 2 7 3 Input DataFrame 2 is: a b c 0 1 1 29 1 3 9 30 After appending, DataFrame is: x y z a b c 0 5.0 4.0 9.0 NaN NaN NaN 1 2.0 7.0 3.0 NaN NaN NaN 0 NaN NaN NaN 1.0 1.0 29.0 1 NaN NaN NaN 3.0 9.0 30.0