Thủ Thuật
  • TOP Thủ Thuật
    • Thủ Thuật Internet
    • Thủ Thuật Máy Tính
    • Thủ Thuật Tiện Ích
    • Thủ Thuật Phần Mềm
  • Chia Sẻ Kiến Thức
    • Học Excel
    • Học Word
    • Học Power Point
  • Games
  • Kênh Công Nghệ
  • Facebook
  • WordPress
  • SEO
No Result
View All Result
Thủ Thuật
  • TOP Thủ Thuật
    • Thủ Thuật Internet
    • Thủ Thuật Máy Tính
    • Thủ Thuật Tiện Ích
    • Thủ Thuật Phần Mềm
  • Chia Sẻ Kiến Thức
    • Học Excel
    • Học Word
    • Học Power Point
  • Games
  • Kênh Công Nghệ
  • Facebook
  • WordPress
  • SEO
No Result
View All Result
Thủ Thuật
No Result
View All Result
Home Chia Sẻ Kiến Thức Học Excel

Tính Khoảng Cách Levenshtein và Ứng Dụng Tìm Chuỗi Gần Giống Nhau trong Excel

Tính Khoảng Cách Levenshtein và Ứng Dụng Tìm Chuỗi Gần Giống Nhau trong Excel
6k
SHARES
19.5k
VIEWS
Share on Facebook

Nội Dung Bài Viết

Toggle
  • Khoảng Cách Levenshtein là gì?
  • Công Thức Tính Khoảng Cách Levenshtein
  • Áp Dụng Tìm Chuỗi Gần Giống Nhau trong Excel
    • Bước 1: Nhập Chuỗi
    • Bước 2: Tạo Bảng Tính
    • Bước 3: Tách Ký Tự
    • Bước 4: Điền Giá Trị Levenshtein
    • Bước 5: Tính Tỷ Lệ Trùng Khớp
  • Kết Luận

Trong công việc, việc xử lý dữ liệu thường gặp phải tình huống cần chỉnh sửa các từ hoặc cụm từ gần giống nhau. Nguyên nhân có thể do nhập liệu sai, nhập liệu không thống nhất từ nhiều nguồn, hoặc do cách viết tắt, bỏ dấu khác nhau. Vậy làm thế nào để tự động phát hiện và chỉnh sửa những điểm không nhất quán này? Bài viết này trên Thủ Thuật sẽ giới thiệu về khoảng cách Levenshtein (Levenshtein distance) và cách ứng dụng nó để tìm chuỗi gần giống nhau trong Excel, giúp bạn tối ưu hóa quy trình xử lý dữ liệu.

Nếu bạn đã quen thuộc với Levenshtein Distance và muốn tìm hiểu cách sử dụng VBA để so sánh nhiều chuỗi cùng lúc, hãy tham khảo bài viết So sánh, tìm chuỗi gần đúng với Levenshtein trong VBA.

Khoảng Cách Levenshtein là gì?

Khoảng cách Levenshtein, hiểu đơn giản, là số đo sự khác biệt giữa hai chuỗi ký tự. Cụ thể hơn, nó là số lượng thao tác tối thiểu cần thực hiện (xóa, chèn hoặc thay thế ký tự) để biến đổi chuỗi này thành chuỗi kia.

Khoảng cách Levenshtein giữa hai chuỗi là số lượng thao tác xóa, chèn hoặc thay thế ký tự đơn lẻ tối thiểu cần thiết để biến đổi chuỗi này thành chuỗi kia.

Ví dụ:

  • Chuỗi 1: mèo; Chuỗi 2: mẹo
    Khoảng cách Levenshtein là 1 vì chỉ cần thay thế ký tự “è” bằng “ẹ”.

  • Chuỗi 1: FPT; Chuỗi 2: FPT Software
    Khoảng cách Levenshtein là 8 vì cần thêm 8 ký tự ” Software”.

Xem thêm:  Làm Chủ Thời Gian trong Excel: Định Dạng, Chèn và Tính Toán

Công Thức Tính Khoảng Cách Levenshtein

Công thức tính khoảng cách Levenshtein được biểu diễn như sau:

Công thức LevenshteinCông thức Levenshtein

Minh họa LevenshteinMinh họa Levenshtein

Trong đó:

  • a, b: Hai chuỗi cần so sánh.
  • i, j: Vị trí ký tự trong chuỗi (tính từ 1).

Giải thích:

  • Nếu i hoặc j bằng 0, khoảng cách Levenshtein bằng giá trị lớn nhất của i và j.
  • Trường hợp khác, khoảng cách Levenshtein là giá trị nhỏ nhất trong ba trường hợp sau:
    1. lev(i-1, j) + 1 (Xóa ký tự thứ i của chuỗi a)
    2. lev(i, j-1) + 1 (Chèn ký tự thứ j của chuỗi b vào chuỗi a)
    3. lev(i-1, j-1) + cost (Thay thế ký tự thứ i của chuỗi a bằng ký tự thứ j của chuỗi b nếu chúng khác nhau, cost = 1; giữ nguyên nếu chúng giống nhau, cost = 0).

Ví dụ:

Ví dụ tính LevenshteinVí dụ tính Levenshtein

Bắt đầu từ lev(a, b)(1, 1) và kết thúc tại lev(a, b)(3, 3).

Áp Dụng Tìm Chuỗi Gần Giống Nhau trong Excel

Dựa trên khoảng cách Levenshtein, ta có thể xây dựng mô hình so sánh hai chuỗi trong Excel.

Bước 1: Nhập Chuỗi

Nhập chuỗi cần so sánh vào hai ô, ví dụ A1 và A2.

Nhập chuỗiNhập chuỗi

Bước 2: Tạo Bảng Tính

Tạo bảng tính với ký tự “#” tại D2 và C3 để đánh dấu vị trí bắt đầu.

Tạo bảngTạo bảng

Bước 3: Tách Ký Tự

Tách các ký tự của chuỗi và điền vào bảng. Sử dụng công thức =MID(A1,ROW(INDIRECT("1:"&LEN(A1))),1) tại C4 và =TRANSPOSE(MID(A2,ROW(INDIRECT("1:"&LEN(A2))),1)) tại E2 (đối với Excel 365). Đối với phiên bản Excel khác, có thể sử dụng công thức mảng.

Xem thêm:  [Complete Guide] How to Adjust Margins in Word for Professional Documents

Tách ký tựTách ký tự

Bước 4: Điền Giá Trị Levenshtein

  • Ô D3: Điền giá trị 0.
  • Cột D (từ D4) và hàng E (từ E3): Điền dãy số tự nhiên bắt đầu từ 1.
  • Các ô còn lại: Sử dụng công thức =IF(ISTEXT($C4)*ISTEXT(E$2),IF(MIN($D4,E$3)=0,MAX($D4,E$3),MIN(D4+1,E3+1,IF(EXACT(LOWER($C4),LOWER(E$2)),D3,D3+1))),"") tại E4 và kéo thả cho các ô còn lại. Hàm LOWER giúp xử lý trường hợp ký tự hoa/thường.

Điền giá trịĐiền giá trị

Bước 5: Tính Tỷ Lệ Trùng Khớp

Tính tỷ lệ trùng khớp bằng công thức: =(LEN(A1)+LEN(A2)-INDIRECT("R"&LEN(A1)+3&"C"&LEN(A2)+4,FALSE))/(LEN(A1)+LEN(A2))

Kết quảKết quả

Kết Luận

Hy vọng bài viết này trên Thủ Thuật đã giúp bạn hiểu rõ về khoảng cách Levenshtein và cách áp dụng nó để tìm chuỗi gần giống nhau trong Excel. Bạn có thể áp dụng phương pháp này để so sánh dữ liệu, kiểm tra chính tả, và nhiều ứng dụng khác trong công việc. Tham khảo thêm bài viết về Group đối tượng sử dụng Fuzzy Matching trong Power Query để tìm hiểu thêm về các kỹ thuật xử lý dữ liệu tương tự.

Đánh Giá Bài Viết
Tuyết Nhi

Tuyết Nhi

Tôi là Tuyết Nhi - Nữ phóng viên trẻ đến từ Hà Nội. Với niềm đam mê công nghệ, khoa học kỹ thuật, tôi yêu thích và muốn chia sẻ đến mọi người những trải nghiệm, kinh nghiệm về các lĩnh vực công nghệ, kỹ thuật... Rất mong được quý độc giả đón nhận ❤️.

Related Posts

How to Generate Unique Random Numbers in Excel: A Comprehensive Guide
Học Excel

How to Generate Unique Random Numbers in Excel: A Comprehensive Guide

Master the Excel ERROR.TYPE Function to Categorize and Fix Formula Errors
Học Excel

Master the Excel ERROR.TYPE Function to Categorize and Fix Formula Errors

How to Print A5 Pages on A4 Paper: A Complete Guide
Học Excel

How to Print A5 Pages on A4 Paper: A Complete Guide

How to Create a Professional Plan vs. Actual Chart in Excel
Học Excel

How to Create a Professional Plan vs. Actual Chart in Excel

Discussion about this post

Trending.

Trích Xuất Dữ Liệu từ Báo Cáo Power BI Đã Xuất Bản Trên Web

Trích Xuất Dữ Liệu từ Báo Cáo Power BI Đã Xuất Bản Trên Web

Hướng Dẫn Cách Livestream Trên Facebook Bằng Điện Thoại Và Máy Tính Đơn Giản, Sắc Nét Từ A-Z

Hướng Dẫn Cách Livestream Trên Facebook Bằng Điện Thoại Và Máy Tính Đơn Giản, Sắc Nét Từ A-Z

World War 2: Strategy Games – Game Chiến Thuật Thế Chiến II Hấp Dẫn Trên Mobile

World War 2: Strategy Games – Game Chiến Thuật Thế Chiến II Hấp Dẫn Trên Mobile

Download Your Uninstaller Pro 7.5 Full Key 2025 – Giải Pháp Gỡ Cài Đặt Phần Mềm Tận Gốc

Download Your Uninstaller Pro 7.5 Full Key 2025 – Giải Pháp Gỡ Cài Đặt Phần Mềm Tận Gốc

Hướng Dẫn Tích Hợp Akismet Vào Contact Form 7: Giải Pháp Chống Spam “Tàng Hình” Hiệu Quả Nhất

Hướng Dẫn Tích Hợp Akismet Vào Contact Form 7: Giải Pháp Chống Spam “Tàng Hình” Hiệu Quả Nhất

Giới Thiệu

Thủ Thuật

➤ Website đang trong quá trình thử nghiệm AI biên tập, mọi nội dung trên website chúng tôi không chịu trách nhiệm. Bạn hãy cân nhắc thêm khi tham khảo bài viết, xin cảm ơn!

Chuyên Mục

➤ TOP Thủ Thuật

➤ Chia Sẻ Kiến Thức

➤ Kênh Công Nghệ

➤ SEO

➤ Games

Liên Kết

➤ Ketquaxskt.com

➤ TOP Restaurants

➤ Here Restaurant

➤

➤

Liên Hệ

➤ TP. Hải Phòng, Việt Nam

➤ 0931. 910. JQK

➤ Email: [email protected]

Website này cũng cần quảng cáo, không có tiền thì viết bài làm sao  ” Đen Vâu – MTP ”

DMCA.com Protection Status

© 2025 Thủ Thuật - Website chia sẻ kiến thức công nghệ hàng đầu Việt Nam

No Result
View All Result
  • TOP Thủ Thuật
    • Thủ Thuật Internet
    • Thủ Thuật Máy Tính
    • Thủ Thuật Tiện Ích
    • Thủ Thuật Phần Mềm
  • Chia Sẻ Kiến Thức
    • Học Excel
    • Học Word
    • Học Power Point
  • Games
  • Kênh Công Nghệ
  • Facebook
  • WordPress
  • SEO

© 2025 Thủ Thuật - Website chia sẻ kiến thức công nghệ hàng đầu Việt Nam