Dataframe là một cấu trúc dữ liệu 2D. Dataframe được sử dụng để biểu diễn dữ liệu ở định dạng bảng trong các hàng và cột. Nó giống như một bảng tính hoặc một bảng sql. Dataframe là một đối tượng Pandas.
Để tạo khung dữ liệu, chúng ta cần nhập gấu trúc. Dataframe có thể được tạo bằng hàm dataframe (). Dataframe () nhận một hoặc hai tham số. Dữ liệu đầu tiên là dữ liệu sẽ được điền vào bảng khung dữ liệu. Dữ liệu có thể ở dạng danh sách danh sách hoặc từ điển danh sách. Trong trường hợp danh sách dữ liệu danh sách, tham số thứ hai là tên cột.
Tạo khung dữ liệu từ danh sách từ điển
import pandas as pd data={'Name':['Karan','Rohit','Sahil','Aryan'],'Age':[23,22,21,24]} df=pd.dataframe(data) df #print the dataframe
Kết quả đầu ra sẽ là một bảng có hai cột có tên là "Tên" và "Tuổi" với dữ liệu được cung cấp được đưa vào bảng.
Tạo khung dữ liệu từ danh sách các danh sách
import pandas as pd data=[[‘Karan’,23],[‘Rohit’,22],[‘Sahil’,21],[‘Aryan’,24]] df=pd.dataframe(data,columns=[‘Name’,’Age’]) df
Điều này cũng cho kết quả tương tự. Sự khác biệt duy nhất là ở hình thức cung cấp dữ liệu. Vì tên cột không được chỉ định trước đó, nên cần phải chuyển tên cột làm đối số trong hàm dataframe ().
Tạo khung dữ liệu chỉ mục tùy chỉnh
import pandas as pd data={'Name':['Karan','Rohit','Sahil','Aryan'],'Age':[23,22,21,24]} df=pd.dataframe(data,index=[‘No.1’,’No.2’,’No.3’,’No.4’]) df
Điều này tạo ra cùng một khung dữ liệu với các chỉ mục như đã đề cập trong danh sách chỉ mục.