Các mảng (array) trong PHP để tiện làm việc với tiếng Việt và họ tên người

Đây là các mảng tôi thường dùng để kiểm tra họ tên người. Lưu lại ở đây để nếu bạn nào cần có thể dùng luôn. Hiện đã có các bản nâng cấp cho nội dung này: Các hàm PHP chuyển đổi mã hex ký tự tiếng Việt; Các mảng PHP căn bản cho nguyên âm và phụ âm; Các ký tự tiếng Việt viết thường (không có f, j, w, z): Có cả f, j, w, z: Theo vần: Theo dấu: Hàm để chuyển chữ cái dạng mã hóa ít dùng về dạng phổ thông (ví dụ mã hóa …

Đọc thêm

Câu lệnh Regex để nhận biết các ký tự chú thích cuối tên và dùng PHP để xử lý

Dữ liệu thu thập có thể có những tên như thế này: Hàm PHP phát hiện các ký tự lạ trong họ tên người Việt Nam (v1.2) Đây là các chú thích phổ biến khi mà trong danh sách có những người cùng tên để phân biệt người nọ với người kia (ví dụ trong lớp học, trong nhóm ngoại khóa, vân vân) hoặc để bổ sung thông tin đặc biệt cho tên. Nhiệm vụ của chúng ta là nhận biết các ký tự dư và loại bỏ nó đi. Câu lệnh regex (biểu thức chính quy) để làm điều …

Đọc thêm

Khắc phục lỗi Error: MySQL shutdown unexpected làm bạn không khởi động được MySQL trên XAMPP

Đây là thông báo lỗi đầy đủ của nó: Error: MySQL shutdown unexpectedly. This may be due to a blocked port, missing dependencies, improper privileges, a crash, or a shutdown by another method. Press the Logs button to view error logs and check the Windows Event Viewer for more clues. If you need more help, copy and post this entire log window on the forums. Một trong các cách phổ biến tìm thấy trên mạng là xóa file ibdata1, nhưng điều này rất may rủi, có thể thành công mà cũng có thể mất hết dữ liệu. Cách hay hơn …

Đọc thêm

Viết hàm thông báo giá trị hiếm gặp trong bảng dữ liệu về năm sinh

Giá trị biệt lệ trong dữ liệu thường là giá trị cực đoan cả ở 2 khía cạnh tích cực và tiêu cực: Nếu nó là thật, nó sẽ tiết lộ cho chúng ta thấy nhiều cái thú vị ở đời; Nhưng trường hợp thứ hai cũng rất dễ xảy ra: giá trị quá khác biệt cũng thường là dữ liệu không chính xác; Trong bài viết này, tôi sẽ viết hàm thống kê số lần lặp lại của năm sinh nào đó. Điều này sẽ cho chúng ta cái nhìn tổng quan về phổ phân tán dữ liệu trong …

Đọc thêm

Tại sao internal link lại quan trọng trong SEO?

Trước khi nội dung của bạn có khả năng được xếp hạng cao, nó cần các liên kết. Google tìm thấy bài đăng của bạn dễ dàng nhất khi bài viết đó được liên kết từ đâu đó trên thế giới web. Internal link (còn gọi là liên kết nội bộ) cũng kết nối các nội dung của bạn và cung cấp cho Google ý tưởng về cấu trúc trang web. Chúng (internal links) có thể tạo thành một hệ thống phân cấp (hierarchy) trên website, cho phép bạn đưa ra các trang và bài đăng quan trọng nhất có …

Đọc thêm

Xác thực ngày tháng năm sinh là ngày tháng năm tồn tại thực trong PHP

Vậy là chúng ta đã tiến một bước khá dài trong việc xử lý, chuẩn hóa lượng lớn dữ liệu ngày tháng thông qua bài viết về phân tích dữ liệu thô và viết hàm xử lý tổng quát. Nhưng có một thiếu sót khá nghiêm trong trong các bài viết đó, đấy là nó xác thực được và đồng bộ cấu trúc ngày tháng năm, nhưng vẫn chưa chắc chắn được đó có phải là ngày tháng năm thực hay không. Điều này dễ xảy ra với số lượng không nhỏ trong một tệp dữ liệu lớn, dù tôi …

Đọc thêm

Nếu đã biết cấu trúc dữ liệu của ngày tháng năm sinh, chúng ta có thể xử lý thêm gì nữa

Trong bài viết trước, tôi đã viết 2 hàm xử lý ngày tháng năm dạng thô. Nó có tác dụng rất tốt trong việc thống kê tổng thể dữ liệu của chúng ta. Cho ta biết cấu trúc dữ liệu chủ yếu của nó, cũng như xuất ra các dữ liệu không hợp chuẩn. Bây giờ câu hỏi là: giả sử chúng ta biết được cấu trúc dữ liệu của ngày tháng năm rồi, chúng ta nên làm gì tiếp? Có mấy vấn đề: Đối xử thế nào với dữ liệu sai? Đối xử thế nào với dữ liệu khác …

Đọc thêm

Bài toán phân tích dữ liệu ngày tháng năm sinh để báo cáo sơ bộ các kiểu dữ liệu hiện có

Phiên bản nâng cấp của bài viết này đã có ở đây: Hàm PHP thông báo đặc điểm dữ liệu ngày tháng sinh đầu vào với lượng dữ liệu lớn (v1.2). Trong bài viết trước tôi có lảm nhảm về chuyện viết mã quá cẩn thận dẫn đến việc xử lý chậm dữ liệu ngày tháng. Tuy nhiên khi nhìn lại đống dữ liệu hiện có thì quả là việc sử dụng mã tổng quát rất quan trọng. Ít nhất cũng trong giai đoạn phân tích dữ liệu ban đầu để đề ra phương hướng giải quyết chuẩn xác. Vì …

Đọc thêm

Thực hành RegEx cơ bản trong PHP

Chúng ta đã tìm hiểu cú pháp cơ bản của RegEx trong bài viết này, hôm nay tôi và các bạn sẽ tìm hiểu việc áp dụng nó trong PHP. Tài liệu tham khảo dễ hiểu là W3School và các tài liệu khác tôi tìm thấy trên mạng. Trong phần đầu W3School định nghĩa Regular Expression (biểu thức chính quy) như thế này: Regex là một chuỗi các ký tự tạo thành mẫu tìm kiếm. Khi bạn tìm kiếm dữ liệu trong một văn bản (text), bạn có thể sử dụng mẫu tìm kiếm để mô tả bạn muốn tìm …

Đọc thêm

Liên kết nội bộ hay Internal link là gì, có khó làm không?

Vài lời của người dịch: liên kết nội bộ là các liên kết giữa các trang trong cùng website, đây là một trong những biện pháp SEO onpage hiệu quả nhất, đặc biệt với những ai có khiếu viết. Để hiệu quả bạn cần phân cấp chủ đề lớn muốn SEO thành các chủ để nhỏ hơn rồi viết các bài viết với sự lựa chọn từ khóa cũng như tiêu đề khéo léo là bạn thành công được 50% rồi. Tiếp đó bạn cần thực hiện liên kết các trang có liên quan với nhau với văn bản neo …

Đọc thêm