Thủ Thuật
  • TOP Thủ Thuật
    • Thủ Thuật Internet
    • Thủ Thuật Máy Tính
    • Thủ Thuật Tiện Ích
    • Thủ Thuật Phần Mềm
  • Chia Sẻ Kiến Thức
    • Học Excel
    • Học Word
    • Học Power Point
  • Games
  • Kênh Công Nghệ
  • Facebook
  • WordPress
  • SEO
No Result
View All Result
Thủ Thuật
  • TOP Thủ Thuật
    • Thủ Thuật Internet
    • Thủ Thuật Máy Tính
    • Thủ Thuật Tiện Ích
    • Thủ Thuật Phần Mềm
  • Chia Sẻ Kiến Thức
    • Học Excel
    • Học Word
    • Học Power Point
  • Games
  • Kênh Công Nghệ
  • Facebook
  • WordPress
  • SEO
No Result
View All Result
Thủ Thuật
No Result
View All Result
Home Chia Sẻ Kiến Thức Học Excel

Tính Khoảng Cách Levenshtein và Ứng Dụng Tìm Chuỗi Gần Giống Nhau trong Excel

Tính Khoảng Cách Levenshtein và Ứng Dụng Tìm Chuỗi Gần Giống Nhau trong Excel
6k
SHARES
19.5k
VIEWS
Share on FacebookShare on Twitter

Nội Dung Bài Viết

Toggle
  • Khoảng Cách Levenshtein là gì?
  • Công Thức Tính Khoảng Cách Levenshtein
  • Áp Dụng Tìm Chuỗi Gần Giống Nhau trong Excel
    • Bước 1: Nhập Chuỗi
    • Bước 2: Tạo Bảng Tính
    • Bước 3: Tách Ký Tự
    • Bước 4: Điền Giá Trị Levenshtein
    • Bước 5: Tính Tỷ Lệ Trùng Khớp
  • Kết Luận

Trong công việc, việc xử lý dữ liệu thường gặp phải tình huống cần chỉnh sửa các từ hoặc cụm từ gần giống nhau. Nguyên nhân có thể do nhập liệu sai, nhập liệu không thống nhất từ nhiều nguồn, hoặc do cách viết tắt, bỏ dấu khác nhau. Vậy làm thế nào để tự động phát hiện và chỉnh sửa những điểm không nhất quán này? Bài viết này trên Thủ Thuật sẽ giới thiệu về khoảng cách Levenshtein (Levenshtein distance) và cách ứng dụng nó để tìm chuỗi gần giống nhau trong Excel, giúp bạn tối ưu hóa quy trình xử lý dữ liệu.

Nếu bạn đã quen thuộc với Levenshtein Distance và muốn tìm hiểu cách sử dụng VBA để so sánh nhiều chuỗi cùng lúc, hãy tham khảo bài viết So sánh, tìm chuỗi gần đúng với Levenshtein trong VBA.

Khoảng Cách Levenshtein là gì?

Khoảng cách Levenshtein, hiểu đơn giản, là số đo sự khác biệt giữa hai chuỗi ký tự. Cụ thể hơn, nó là số lượng thao tác tối thiểu cần thực hiện (xóa, chèn hoặc thay thế ký tự) để biến đổi chuỗi này thành chuỗi kia.

Khoảng cách Levenshtein giữa hai chuỗi là số lượng thao tác xóa, chèn hoặc thay thế ký tự đơn lẻ tối thiểu cần thiết để biến đổi chuỗi này thành chuỗi kia.

Ví dụ:

  • Chuỗi 1: mèo; Chuỗi 2: mẹo
    Khoảng cách Levenshtein là 1 vì chỉ cần thay thế ký tự “è” bằng “ẹ”.

  • Chuỗi 1: FPT; Chuỗi 2: FPT Software
    Khoảng cách Levenshtein là 8 vì cần thêm 8 ký tự ” Software”.

Xem thêm:  Tạo Phiếu Thu Chi Chuyên Nghiệp trên Excel

Công Thức Tính Khoảng Cách Levenshtein

Công thức tính khoảng cách Levenshtein được biểu diễn như sau:

Công thức LevenshteinCông thức Levenshtein

Minh họa LevenshteinMinh họa Levenshtein

Trong đó:

  • a, b: Hai chuỗi cần so sánh.
  • i, j: Vị trí ký tự trong chuỗi (tính từ 1).

Giải thích:

  • Nếu i hoặc j bằng 0, khoảng cách Levenshtein bằng giá trị lớn nhất của i và j.
  • Trường hợp khác, khoảng cách Levenshtein là giá trị nhỏ nhất trong ba trường hợp sau:
    1. lev(i-1, j) + 1 (Xóa ký tự thứ i của chuỗi a)
    2. lev(i, j-1) + 1 (Chèn ký tự thứ j của chuỗi b vào chuỗi a)
    3. lev(i-1, j-1) + cost (Thay thế ký tự thứ i của chuỗi a bằng ký tự thứ j của chuỗi b nếu chúng khác nhau, cost = 1; giữ nguyên nếu chúng giống nhau, cost = 0).

Ví dụ:

Ví dụ tính LevenshteinVí dụ tính Levenshtein

Bắt đầu từ lev(a, b)(1, 1) và kết thúc tại lev(a, b)(3, 3).

Áp Dụng Tìm Chuỗi Gần Giống Nhau trong Excel

Dựa trên khoảng cách Levenshtein, ta có thể xây dựng mô hình so sánh hai chuỗi trong Excel.

Bước 1: Nhập Chuỗi

Nhập chuỗi cần so sánh vào hai ô, ví dụ A1 và A2.

Nhập chuỗiNhập chuỗi

Bước 2: Tạo Bảng Tính

Tạo bảng tính với ký tự “#” tại D2 và C3 để đánh dấu vị trí bắt đầu.

Tạo bảngTạo bảng

Bước 3: Tách Ký Tự

Tách các ký tự của chuỗi và điền vào bảng. Sử dụng công thức =MID(A1,ROW(INDIRECT("1:"&LEN(A1))),1) tại C4 và =TRANSPOSE(MID(A2,ROW(INDIRECT("1:"&LEN(A2))),1)) tại E2 (đối với Excel 365). Đối với phiên bản Excel khác, có thể sử dụng công thức mảng.

Xem thêm:  Hàm COUNTIF trong Excel: Hướng Dẫn Chi Tiết và Ví Dụ Thực Tế

Tách ký tựTách ký tự

Bước 4: Điền Giá Trị Levenshtein

  • Ô D3: Điền giá trị 0.
  • Cột D (từ D4) và hàng E (từ E3): Điền dãy số tự nhiên bắt đầu từ 1.
  • Các ô còn lại: Sử dụng công thức =IF(ISTEXT($C4)*ISTEXT(E$2),IF(MIN($D4,E$3)=0,MAX($D4,E$3),MIN(D4+1,E3+1,IF(EXACT(LOWER($C4),LOWER(E$2)),D3,D3+1))),"") tại E4 và kéo thả cho các ô còn lại. Hàm LOWER giúp xử lý trường hợp ký tự hoa/thường.

Điền giá trịĐiền giá trị

Bước 5: Tính Tỷ Lệ Trùng Khớp

Tính tỷ lệ trùng khớp bằng công thức: =(LEN(A1)+LEN(A2)-INDIRECT("R"&LEN(A1)+3&"C"&LEN(A2)+4,FALSE))/(LEN(A1)+LEN(A2))

Kết quảKết quả

Kết Luận

Hy vọng bài viết này trên Thủ Thuật đã giúp bạn hiểu rõ về khoảng cách Levenshtein và cách áp dụng nó để tìm chuỗi gần giống nhau trong Excel. Bạn có thể áp dụng phương pháp này để so sánh dữ liệu, kiểm tra chính tả, và nhiều ứng dụng khác trong công việc. Tham khảo thêm bài viết về Group đối tượng sử dụng Fuzzy Matching trong Power Query để tìm hiểu thêm về các kỹ thuật xử lý dữ liệu tương tự.

Đánh Giá Bài Viết
Tuyết Nhi

Tuyết Nhi

Tôi là Tuyết Nhi - Nữ phóng viên trẻ đến từ Hà Nội. Với niềm đam mê công nghệ, khoa học kỹ thuật, tôi yêu thích và muốn chia sẻ đến mọi người những trải nghiệm, kinh nghiệm về các lĩnh vực công nghệ, kỹ thuật... Rất mong được quý độc giả đón nhận ❤️.

Related Posts

Hàm ROUND trong Excel: Hướng dẫn làm tròn số chi tiết
Học Excel

Hàm ROUND trong Excel: Hướng dẫn làm tròn số chi tiết

Xóa Ký Tự Trong Chuỗi Văn Bản Excel: Hướng Dẫn Chi Tiết
Học Excel

Xóa Ký Tự Trong Chuỗi Văn Bản Excel: Hướng Dẫn Chi Tiết

Hướng Dẫn Tạo Biểu Đồ Kết Hợp Trong Excel
Học Excel

Hướng Dẫn Tạo Biểu Đồ Kết Hợp Trong Excel

Hướng Dẫn Lọc Trùng Trong Excel Đơn Giản Và Nhanh Chóng
Học Excel

Hướng Dẫn Lọc Trùng Trong Excel Đơn Giản Và Nhanh Chóng

Discussion about this post

Trending.

Chuyển Số Âm Thành Số Dương Trong Excel: Hướng Dẫn Chi Tiết

Chuyển Số Âm Thành Số Dương Trong Excel: Hướng Dẫn Chi Tiết

Cách Xóa Dấu Nháy Đơn (‘) Trong Excel

Cách Xóa Dấu Nháy Đơn (‘) Trong Excel

Chia đôi màn hình Excel: So sánh dữ liệu dễ dàng với Split

Chia đôi màn hình Excel: So sánh dữ liệu dễ dàng với Split

Tạo Dữ Liệu Ngẫu Nhiên trong Excel với Hàm RANDBETWEEN và VLOOKUP

Tạo Dữ Liệu Ngẫu Nhiên trong Excel với Hàm RANDBETWEEN và VLOOKUP

Thủ Thuật Excel: Giữ, Hiển Thị, Xóa và Ẩn Số 0 Đầu Chuỗi

Thủ Thuật Excel: Giữ, Hiển Thị, Xóa và Ẩn Số 0 Đầu Chuỗi

Giới Thiệu

Thủ Thuật

➤ Website đang trong quá trình thử nghiệm AI biên tập, mọi nội dung trên website chúng tôi không chịu trách nhiệm. Bạn hãy cân nhắc thêm khi tham khảo bài viết, xin cảm ơn!

Chuyên Mục

➤ TOP Thủ Thuật

➤ Chia Sẻ Kiến Thức

➤ Kênh Công Nghệ

➤ SEO

➤ Games

Liên Kết

➤

➤

➤

➤

➤

Liên Hệ

➤ TP. Hải Phòng, Việt Nam

➤ 0931. 910. JQK

➤ Email: [email protected]

Website này cũng cần quảng cáo, không có tiền thì viết bài làm sao  ” Đen Vâu – MTP ”

DMCA.com Protection Status

© 2025 Thủ Thuật - Website chia sẻ kiến thức công nghệ hàng đầu Việt Nam

No Result
View All Result
  • TOP Thủ Thuật
    • Thủ Thuật Internet
    • Thủ Thuật Máy Tính
    • Thủ Thuật Tiện Ích
    • Thủ Thuật Phần Mềm
  • Chia Sẻ Kiến Thức
    • Học Excel
    • Học Word
    • Học Power Point
  • Games
  • Kênh Công Nghệ
  • Facebook
  • WordPress
  • SEO

© 2025 Thủ Thuật - Website chia sẻ kiến thức công nghệ hàng đầu Việt Nam