Bổ sung các biến thể sai chính tả đ thành dd, dđ; ô thành oo, oô; ê thành ee, eê; â thành aâ, aa

Trên một số ứng dụng như thanh tìm kiếm trình duyệt, Excel người dùng có thể gặp lỗi này thường xuyên. Do vậy tạo các thêm các biến thể sai chính tả cho một từ đúng có thể giúp chúng ta tìm các từ sai chính tả dễ dàng hơn. Giải quyết vấn đề này khá đơn giản, chúng ta chỉ cần tách chuỗi gốc thành các chữ cái, so nó với đ, ô, ê, â rồi tạo biến thể dd, oo, ee, aa, cuối cùng ghép lại thành chuỗi mới. Đoạn mã PHP như sau: Ví dụ đầu vào …

Đọc thêm

Hàm PHP hoàn chỉnh về để sửa từ tiếng Việt đặt sai dấu thanh

Bản nâng cấp của hàm này đã có ở trang này: freehost.page/php-chuyen-dau-thanh-v12/ Chuỗi đầu vào cần được sửa các lỗi chính tả cơ bản trước, ví dụ như lỗi dính từ. Trước khi chuyển bạn nên xác thực trước nó có vấn đề hay không bằng hàm được viết ở đây. Việc chỉnh sửa dấu thanh được thực hiện theo tiêu chuẩn cũ cũng là chuẩn phổ biến hơn. Ví dụ về dấu thanh sẽ được hàm bắt lỗi và sửa: Dấu thanh đặt lỗi Được sửa thành hoạ họa hòang hoàng thuỵ thụy hừơng hường cứơi cưới cươì cười …

Đọc thêm

Tạo các biến thể sai chính tả của một từ bất kỳ có thể giúp ích trong việc phát hiện và sửa lỗi

Xử lý lỗi chính tả tên người chúng ta cần xử lý các trường hợp đặc thù trước. Lỗi chính tả tên người rất phong phú và đa dạng, bắt lỗi có thể không quá khó, nhưng sửa như thế nào lại là vấn đề, vì tùy tình huống bối cảnh khác nhau mà cách xử lý cũng không thể giống nhau được. Trong lỗi chính tả có những trường hợp đặc thù mà chúng ta cần xử lý trước, vì các trường hợp như vậy việc nhận biết và hướng giải quyết cũng đơn giản hơn, chẳng hạn như: …

Đọc thêm

Hàm PHP dùng để kiểm tra một từ nào đó có cần chuyển vị trí dấu thanh hay không

Phiên bản nâng cấp cho hàm chuyển dấu tiếng Việt đã có ở đây: Viết lại hàm PHP chuyển dấu thanh cho từ tiếng Việt (v1.2) Trong bài viết này tôi sẽ nói về 2 hàm bắt lỗi thả dấu thanh trong tiếng Việt. Đầu vào là từ đơn. Trong trường hợp bạn bắt lỗi một chuỗi thì cần tách nó ra rồi đưa vào hàm. Hàm thứ nhất sử dụng Regex, nó như sau: Biến đầu vào được đặt tên là $str; Biến $bat_loi mặc định để là 0 (không có lỗi). Khi so khớp thấy lỗi biến này …

Đọc thêm

Xây dựng các hàm căn bản để xử lý chuỗi họ tên người nói riêng và tiếng Việt nói chung

PHP có nhiều hàm hay để xử lý chuỗi, tuy nhiên nó vẫn mạnh và có các hàm phổ biến xử lý cho tiếng Tây tốt hơn là tiếng Việt. Trong ngày hôm nay tôi sẽ thử viết một số hàm xử lý cơ bản hoặc thực hiện một nhiệm vụ đặc thù để quá trình viết mã được nhanh hơn và hạn chế lỗi do dùng nhầm hàm không xử lý tốt tiếng Việt. Biến đầu vào tên $str đại diện cho chuỗi. Quy định về viết tên hàm (đây là rule riêng của tôi thôi, các bạn không …

Đọc thêm

Viết hàm xử lý lỗi dính từ trong họ tên người, ví dụ dính đệm vào tên hoặc dính họ vào tên thực

Bản nâng cấp của hàm này đã có ở trang: freehost.page/php-dinh-ho-ten-nguoi/ Chỉnh sửa theo hướng đơn giản hóa hơn trong mã và tăng độ chính xác, tránh tối đa trường hợp tách nhầm. Nghe ghê vậy chứ hóa ra hàm này khá đơn giản, có tỷ lệ phân tách chính xác rất cao. Trong một mẫu dữ liệu lớn về họ tên, bạn sẽ thấy lỗi này tuy có tỷ lệ không lớn (không quá 0,5% trong mẫu dữ liệu tôi có), nhưng số lượng thì cũng không nhỏ. Ví dụ các tên bị lỗi dính từ: MỹLinh HằngNga YếnNhi …

Đọc thêm

Câu lệnh Regex để bắt lỗi đặt dấu thanh trong tiếng Việt

Trong bài viết này tôi sử dụng quy tắc đặt dấu thanh kiểu cũ, chúng ta tạm đặt ra bên ngoài các tranh cãi về mặt ngôn ngữ học. Lý do chủ yếu tôi chọn cách này, vì nó phổ biến hơn, đây cũng là quy tắc mặc định trong trình hỗ trợ gõ tiếng Việt phổ biến là Unikey. Quy tắc là thế này: Nếu trong từ có dấu, và nó có một nguyên âm, thì dấu phải đặt ở nguyên âm đó, ví dụ như mẹ, lẹ, có, càng; Nếu nó chỉ có 2 nguyên âm mà ở …

Đọc thêm

Các mảng (array) trong PHP để tiện làm việc với tiếng Việt và họ tên người

Đây là các mảng tôi thường dùng để kiểm tra họ tên người. Lưu lại ở đây để nếu bạn nào cần có thể dùng luôn. Hiện đã có các bản nâng cấp cho nội dung này: Các hàm PHP chuyển đổi mã hex ký tự tiếng Việt; Các mảng PHP căn bản cho nguyên âm và phụ âm; Các ký tự tiếng Việt viết thường (không có f, j, w, z): Có cả f, j, w, z: Theo vần: Theo dấu: Hàm để chuyển chữ cái dạng mã hóa ít dùng về dạng phổ thông (ví dụ mã hóa …

Đọc thêm

Câu lệnh Regex để nhận biết các ký tự chú thích cuối tên và dùng PHP để xử lý

Dữ liệu thu thập có thể có những tên như thế này: Hàm PHP phát hiện các ký tự lạ trong họ tên người Việt Nam (v1.2) Đây là các chú thích phổ biến khi mà trong danh sách có những người cùng tên để phân biệt người nọ với người kia (ví dụ trong lớp học, trong nhóm ngoại khóa, vân vân) hoặc để bổ sung thông tin đặc biệt cho tên. Nhiệm vụ của chúng ta là nhận biết các ký tự dư và loại bỏ nó đi. Câu lệnh regex (biểu thức chính quy) để làm điều …

Đọc thêm

Khắc phục lỗi Error: MySQL shutdown unexpected làm bạn không khởi động được MySQL trên XAMPP

Đây là thông báo lỗi đầy đủ của nó: Error: MySQL shutdown unexpectedly. This may be due to a blocked port, missing dependencies, improper privileges, a crash, or a shutdown by another method. Press the Logs button to view error logs and check the Windows Event Viewer for more clues. If you need more help, copy and post this entire log window on the forums. Một trong các cách phổ biến tìm thấy trên mạng là xóa file ibdata1, nhưng điều này rất may rủi, có thể thành công mà cũng có thể mất hết dữ liệu. Cách hay hơn …

Đọc thêm