Thủ Thuật
  • TOP Thủ Thuật
    • Thủ Thuật Internet
    • Thủ Thuật Máy Tính
    • Thủ Thuật Tiện Ích
    • Thủ Thuật Phần Mềm
  • Chia Sẻ Kiến Thức
    • Học Excel
    • Học Word
    • Học Power Point
  • Games
  • Kênh Công Nghệ
  • Facebook
  • WordPress
  • SEO
No Result
View All Result
Thủ Thuật
  • TOP Thủ Thuật
    • Thủ Thuật Internet
    • Thủ Thuật Máy Tính
    • Thủ Thuật Tiện Ích
    • Thủ Thuật Phần Mềm
  • Chia Sẻ Kiến Thức
    • Học Excel
    • Học Word
    • Học Power Point
  • Games
  • Kênh Công Nghệ
  • Facebook
  • WordPress
  • SEO
No Result
View All Result
Thủ Thuật
No Result
View All Result
Home Chia Sẻ Kiến Thức Học Excel

Tổng Hợp Code Pandas Python Xử Lý Dữ Liệu Bảng Hiệu Quả

Tổng Hợp Code Pandas Python Xử Lý Dữ Liệu Bảng Hiệu Quả
6k
SHARES
19.5k
VIEWS
Share on FacebookShare on Twitter

Nội Dung Bài Viết

Toggle
  • Mở Đầu
  • Đọc Dữ Liệu với Pandas
    • Đọc file CSV
    • Đọc file TSV
    • Đọc file Excel
    • Đọc từ cơ sở dữ liệu SQL
    • Đọc từ JSON
    • Đọc từ HTML
    • Đọc từ Clipboard
    • Đọc từ Dictionary Python
  • Xuất Dữ Liệu với Pandas
    • Xuất sang CSV
    • Xuất sang Excel
    • Xuất sang SQL
    • Xuất sang JSON
  • Tạo Dữ Liệu Test
    • Tạo DataFrame với Numpy
    • Tạo Series từ List
    • Tạo Index dạng ngày tháng
  • Xem và Kiểm Tra Dữ Liệu
    • Xem n dòng đầu
    • Xem n dòng cuối
    • Lấy kích thước DataFrame
    • Xem thông tin DataFrame
    • Thống kê mô tả
    • Đếm giá trị duy nhất (Series)
    • Đếm giá trị duy nhất (DataFrame)
  • Trích Xuất Dữ Liệu
    • Lấy một cột (Series)
    • Lấy nhiều cột (DataFrame)
    • Lấy theo vị trí (Series)
    • Lấy theo index (Series)
    • Lấy dòng đầu tiên
    • Lấy phần tử dòng 1, cột 1
  • Làm Sạch Dữ Liệu
    • Đổi tên cột
    • Kiểm tra giá trị null
    • Kiểm tra giá trị khác null
    • Xóa dòng có null
    • Xóa cột có null
    • Xóa dòng có nhiều hơn n giá trị null
    • Thay null bằng x
    • Thay null bằng mean
    • Chuyển kiểu dữ liệu sang float
    • Thay giá trị
    • Thay nhiều giá trị
    • Đổi tên cột với lambda
    • Đổi tên cột cụ thể
    • Đặt index
    • Đổi tên index với lambda
  • Lọc, Sắp Xếp, Nhóm Dữ Liệu
    • Lọc dữ liệu
    • Sắp xếp dữ liệu
    • Nhóm dữ liệu
    • Pivot Table
    • Tính mean tất cả cột
    • Tính max mỗi dòng
  • Nối và Gộp Dữ Liệu
    • Nối theo chiều dọc
    • Nối theo chiều ngang
    • Join kiểu SQL
  • Thống Kê Dữ Liệu
    • Thống kê mô tả
    • Tính mean
    • Tính correlation
    • Đếm giá trị khác null
    • Tìm giá trị lớn nhất
    • Tìm giá trị nhỏ nhất
    • Tìm median
    • Tìm độ lệch chuẩn
  • Kết Luận

Pandas là thư viện Python mạnh mẽ giúp xử lý dữ liệu dạng bảng một cách hiệu quả. Nếu bạn mới bắt đầu với Pandas, bài viết này sẽ cung cấp bảng tóm tắt các đoạn code Pandas thường dùng, giúp bạn tra cứu nhanh chóng. Hãy lưu lại bài viết để tiện sử dụng khi cần.

Xem thêm:  Cách Tạo Biểu Đồ Trong Excel

pandas dataframepandas dataframe

Mở Đầu

Bạn có thể dễ dàng tra cứu code bằng cách sử dụng chức năng tìm kiếm (Ctrl + F hoặc ⌘ + F trên Mac). Trước khi bắt đầu, hãy import các thư viện cần thiết:

import pandas as pd
import numpy as np

Trong bài viết, chúng ta sẽ sử dụng các biến viết tắt sau:

  • df: DataFrame trong Pandas
  • s: Series trong Pandas

Đọc Dữ Liệu với Pandas

Pandas hỗ trợ đọc dữ liệu từ nhiều nguồn khác nhau:

Đọc file CSV

pd.read_csv(filename)

Đọc file TSV

pd.read_table(filename)

Đọc file Excel

pd.read_excel(filename)

Đọc từ cơ sở dữ liệu SQL

pd.read_sql(query, connection_object)

Đọc từ JSON

pd.read_json(json_string)

Đọc từ HTML

pd.read_html(url)

Đọc từ Clipboard

pd.read_clipboard()

Nội dung Clipboard sẽ được truyền vào read_table().

Đọc từ Dictionary Python

pd.DataFrame(dict)

Xuất Dữ Liệu với Pandas

Pandas cũng cho phép xuất dữ liệu sang nhiều định dạng:

Xuất sang CSV

df.to_csv(filename)

Xuất sang Excel

df.to_excel(filename)

Xuất sang SQL

df.to_sql(table_name, connection_object)

Xuất sang JSON

df.to_json(filename)

Tạo Dữ Liệu Test

Bạn có thể tạo dữ liệu test bằng Numpy:

Tạo DataFrame với Numpy

pd.DataFrame(np.random.rand(23,4))

Code này tạo DataFrame 23 dòng, 4 cột với giá trị ngẫu nhiên.

Tạo Series từ List

pd.Series(my_list)

Tạo Index dạng ngày tháng

df.index = pd.date_range('1999/1/31', periods=df.shape[0])

Xem và Kiểm Tra Dữ Liệu

Xem n dòng đầu

df.head(n)

Xem n dòng cuối

df.tail(n)

Lấy kích thước DataFrame

df.shape

Xem thông tin DataFrame

df.info()

Thống kê mô tả

df.describe()

Đếm giá trị duy nhất (Series)

s.value_counts(dropna=False)

Đếm giá trị duy nhất (DataFrame)

df.apply(pd.Series.value_counts)

pandas seriespandas series

Trích Xuất Dữ Liệu

Lấy một cột (Series)

df[col]

Lấy nhiều cột (DataFrame)

df[[Col1, Col2]]

Lấy theo vị trí (Series)

s.iloc[0]

Lấy theo index (Series)

s.loc['index_one']

Lấy dòng đầu tiên

df.iloc[0,:]

Lấy phần tử dòng 1, cột 1

df.iloc[0,0]

Làm Sạch Dữ Liệu

Đổi tên cột

df.columns = ['a','b','c']

Kiểm tra giá trị null

pd.isnull()

Kiểm tra giá trị khác null

pd.notnull()

Xóa dòng có null

df.dropna()

Xóa cột có null

df.dropna(axis=1)

Xóa dòng có nhiều hơn n giá trị null

df.dropna(axis=1, thresh=n)

Thay null bằng x

df.fillna(x)

Thay null bằng mean

s.fillna(s.mean())

Chuyển kiểu dữ liệu sang float

s.astype(float)

Thay giá trị

s.replace(1,'one')

Thay nhiều giá trị

s.replace([1,3],['one','three'])

Đổi tên cột với lambda

df.rename(columns=lambda x: x + 1)

Đổi tên cột cụ thể

df.rename(columns={'old_name': 'new_name'})

Đặt index

df.set_index('column_one')

Đổi tên index với lambda

df.rename(index=lambda x: x + 1)

Lọc, Sắp Xếp, Nhóm Dữ Liệu

Lọc dữ liệu

df[df[col] > 5]
df[(df[col] > 100) & (df[col] < 200)]

Sắp xếp dữ liệu

df.sort_values(col1)
df.sort_values(col2, ascending=False)
df.sort_values([col1,col2],ascending=[True,False])

Nhóm dữ liệu

df.groupby(col1)

Pivot Table

df.pivot_table(index=col1,values=[col2,col3],aggfunc='mean')

Tính mean tất cả cột

df.apply(np.mean)

Tính max mỗi dòng

df.apply(np.max,axis=1)

nhom du lieu pandasnhom du lieu pandas

Nối và Gộp Dữ Liệu

Nối theo chiều dọc

df1.append(df2)

Nối theo chiều ngang

pd.concat([df1, df2],axis=1)

Join kiểu SQL

df1.join(df2,on=col1,how='inner')

Thống Kê Dữ Liệu

Thống kê mô tả

df.describe()

Tính mean

df.mean()

Tính correlation

df.corr()

Đếm giá trị khác null

df.count()

Tìm giá trị lớn nhất

df.max()

Tìm giá trị nhỏ nhất

df.min()

Tìm median

df.median()

Tìm độ lệch chuẩn

df.std()

Kết Luận

Bài viết này đã tổng hợp các đoạn code Pandas Python hữu ích cho việc xử lý dữ liệu bảng. Hy vọng bài viết sẽ giúp bạn làm việc hiệu quả hơn với Pandas. Hãy khám phá thêm các tài nguyên khác để nâng cao kỹ năng Pandas của bạn! Tìm hiểu thêm về cách tối ưu công việc với Python và Excel.

Đánh Giá Bài Viết
Tuyết Nhi

Tuyết Nhi

Tôi là Tuyết Nhi - Nữ phóng viên trẻ đến từ Hà Nội. Với niềm đam mê công nghệ, khoa học kỹ thuật, tôi yêu thích và muốn chia sẻ đến mọi người những trải nghiệm, kinh nghiệm về các lĩnh vực công nghệ, kỹ thuật... Rất mong được quý độc giả đón nhận ❤️.

Related Posts

Tách Ô trong Excel bằng Công Thức: Hướng Dẫn Chi Tiết
Học Excel

Tách Ô trong Excel bằng Công Thức: Hướng Dẫn Chi Tiết

Nâng Cao Hàm IF trong Excel: Điều Kiện Lồng Nhau, Mảng và Xử Lý Lỗi
Học Excel

Nâng Cao Hàm IF trong Excel: Điều Kiện Lồng Nhau, Mảng và Xử Lý Lỗi

Tính Khoảng Cách Levenshtein và Ứng Dụng Tìm Chuỗi Gần Giống Nhau trong Excel
Học Excel

Tính Khoảng Cách Levenshtein và Ứng Dụng Tìm Chuỗi Gần Giống Nhau trong Excel

Tạo Phím Tắt Ẩn/Hiện Thanh Công Thức trong Excel
Học Excel

Tạo Phím Tắt Ẩn/Hiện Thanh Công Thức trong Excel

Discussion about this post

Trending.

Chuyển Số Âm Thành Số Dương Trong Excel: Hướng Dẫn Chi Tiết

Chuyển Số Âm Thành Số Dương Trong Excel: Hướng Dẫn Chi Tiết

Cách Xóa Dấu Nháy Đơn (‘) Trong Excel

Cách Xóa Dấu Nháy Đơn (‘) Trong Excel

Chia đôi màn hình Excel: So sánh dữ liệu dễ dàng với Split

Chia đôi màn hình Excel: So sánh dữ liệu dễ dàng với Split

Tạo Dữ Liệu Ngẫu Nhiên trong Excel với Hàm RANDBETWEEN và VLOOKUP

Tạo Dữ Liệu Ngẫu Nhiên trong Excel với Hàm RANDBETWEEN và VLOOKUP

Thủ Thuật Excel: Giữ, Hiển Thị, Xóa và Ẩn Số 0 Đầu Chuỗi

Thủ Thuật Excel: Giữ, Hiển Thị, Xóa và Ẩn Số 0 Đầu Chuỗi

Giới Thiệu

Thủ Thuật

➤ Website đang trong quá trình thử nghiệm AI biên tập, mọi nội dung trên website chúng tôi không chịu trách nhiệm. Bạn hãy cân nhắc thêm khi tham khảo bài viết, xin cảm ơn!

Chuyên Mục

➤ TOP Thủ Thuật

➤ Chia Sẻ Kiến Thức

➤ Kênh Công Nghệ

➤ SEO

➤ Games

Liên Kết

➤

➤

➤

➤

➤

Liên Hệ

➤ TP. Hải Phòng, Việt Nam

➤ 0931. 910. JQK

➤ Email: [email protected]

Website này cũng cần quảng cáo, không có tiền thì viết bài làm sao  ” Đen Vâu – MTP ”

DMCA.com Protection Status

© 2025 Thủ Thuật - Website chia sẻ kiến thức công nghệ hàng đầu Việt Nam

No Result
View All Result
  • TOP Thủ Thuật
    • Thủ Thuật Internet
    • Thủ Thuật Máy Tính
    • Thủ Thuật Tiện Ích
    • Thủ Thuật Phần Mềm
  • Chia Sẻ Kiến Thức
    • Học Excel
    • Học Word
    • Học Power Point
  • Games
  • Kênh Công Nghệ
  • Facebook
  • WordPress
  • SEO

© 2025 Thủ Thuật - Website chia sẻ kiến thức công nghệ hàng đầu Việt Nam