Categories Static website

Khắc phục một số thiếu sót của website tĩnh được tạo từ plugin Simply Static

Trong bài viết trước đây tôi đã thử tạo một website tĩnh hoàn toàn từ trang WordPress động thông qua plugin Simply Static.

Tuy nhiên nó có một số nhược điểm, đó là không có file robots.txt và không có sitemap (dạng XML).

Để khắc phục điều đó bạn làm như sau:

  • Với file robots.txt bạn chỉ cần lưu nó từ trang dev (trang động để xuất ra trang tĩnh) rồi đẩy lên thư mục gốc của hosting trang tĩnh, hoặc cách tốt hơn là bạn tự lưu sử dụng mẫu mặc định sau để cho phép tất cả bọ tìm kiếm vào được website:
User-agent: *
Allow: /

hoặc bạn cũng có thể dùng mẫu sau:

User-agent: *
Disallow: /wp-admin/
  • Với sitemap, bạn kiếm một ứng dụng trực tuyến miễn phí (ví dụ như trang này: https://www.xml-sitemaps.com/) để tạo sitemap cho bạn, sau đó cũng đẩy file này lên hosting gốc, và nhập thông tin sitemap mới vào Google Search Console.

Tuy nhiên cách tạo sitemap như vậy có thể có giới hạn, chẳng hạn trang trên chỉ cho phép bạn quét 500 bài, nếu website ít bài sẽ ổn, nhiều hơn sẽ gặp vấn đề.

Cách khắc phục là bạn tìm ứng dụng nào đó cho phép bạn quét không giới hạn số lượng trang với từ khóa kiểu như: “sitemap generator online free unlimited pages”. Tôi đã tìm được trang không giới hạn số lượng: http://www.check-domains.com/sitemap/index.php


Demo minh họa

Demo sitemap: https://bầu.com/robots.txt. Với trang tĩnh chính thức bạn nên để file robots.txt như sau:

User-agent: *
Allow: /

Demo sitemap: https://bầu.com/seri_names_sitemap2.txt

Thế còn các vấn đề như chuyển từ http sang https hoặc từ có-www sang không-có-www.

Những cái này bạn có thể dùng control panel hoặc DNS để thực hiện, ví dụ tôi thi thoảng vẫn dùng DNS để chuyển trang có-www về dạng không-có-www. Còn http sang https thì tôi hay dùng control panel để bật luôn (ví dụ cPanel).

Bạn có thể dùng công cụ https://www.redirect-checker.org/index.php để kiểm tra các chuyển hướng.


Về file .htaccess thì sao?

File .htaccess có vai trò quan trọng trong việc:

  • Tạo ra chuyển hướng cho một URL nào đó trên trang;
  • Ngăn hotlinking;
  • Và quan trọng nhất với tôi là để có được cache phía trình duyệt chuẩn chỉnh;

Bạn tạo một file .htaccess chuẩn (lúc ban đầu, tốt nhất là bạn copy file .htaccess của trang động, sau khi đã vô hiệu hóa các plugin không cần thiết) rồi đẩy lên hosting của trang tĩnh.


Giảm thiểu tối đa tài nguyên dư thừa

Trước khi chuyển một trang động thành website tĩnh hoàn toàn bạn nên tắt bỏ các chức năng không cần thiết hoặc không thể thực hiện được trên website tĩnh đơn thuần, ví dụ:

  • Loại bỏ toàn bộ các theme không sử dụng;
  • Loại bỏ toàn bộ các ảnh dư thừa, các file backup không cần thiết trên website;
  • Tắt tính năng bình luận, tìm kiếm trên trang;
  • Loại bỏ các plugin không cần thiết;

Về việc loại bỏ ảnh dư thừa bạn nên sử dụng kết hợp 2 plugin sau (nhưng nhớ backup toàn bộ website trước khi sử dụng):

  • Media Cleaner: giúp tìm và loại bỏ các ảnh dư thừa trên trang, đặc biệt phù hợp với các website đã được phát triển thời gian dài, và trước đó bạn đã tách một phần nội dung của website sang tên miền khác, khi đó khả năng cao bạn có rất nhiều tài nguyên ảnh không sử dụng.
  • Broken link checker: tuy nhiên Media Cleaner không phải lúc nào cũng loại bỏ chính xác 100%, đôi khi nó loại bỏ ảnh thực sự vẫn đang dùng! Để chữa cháy cho trường hợp đó bạn cần dùng plugin kiểm tra liên kết gãy này trước khi tạo trang tĩnh. Nhờ nó bạn sẽ phát hiện ra các ảnh trên trang đang dùng mà bị xóa mất, rồi dùng file backup mà bạn có khi này, bổ sung ảnh vào thư mục wp-content.

Về vấn đề kết hợp trang tĩnh với BunnyCDN

Trang tĩnh có thể được đẩy lên hosting thông thường, nhưng tối ưu hơn bạn nên đẩy nó lên các CDN, vì lúc đó cả chi phí và hiệu suất sẽ tốt hơn cho bạn.

Tuy nhiên với các CDN bạn cần lưu ý một số điểm sau:

  • File sitemap nên để dạng .txt thay vì .xml vì nhiều CDN trong đó có BunnyCDN chỉ chấp nhận giới hạn một số file tĩnh nhất định. Nên dùng các công cụ như http://www.check-domains.com/sitemap/index.php để tạo sitemap dạng này, vì nó không giới hạn số lượng link, cũng như có đa dạng định dạng sitemap cho bạn lựa chọn.
  • Nên để đường dẫn website là dạng tuyệt đối thay vì tương đối, sẽ tốt cho SEO hơn.

Một số lưu ý khác

Lúc đầu tôi cứ tưởng là plugin SimplyStatic sẽ múc toàn bộ ảnh ở thư mục wp-content để làm trang tĩnh, nhưng hóa ra không phải. Nó chỉ lấy các ảnh có trong nội dung của bài viết, tức là mặc định những ảnh không dùng sẽ không lấy, bao gồm cả các ảnh nhỏ được tạo ra từ ảnh ban đầu (như mấy cái ảnh thumbnail cỡ 150px mà giao diện bạn không dùng thì SimplyStatic sẽ không lấy). Tương tự như vậy, chỉ có các bài viết gồm cả post và page mà nó tìm được thì nó mới tải về, nó không sử dụng sitemap để tìm mà sẽ dò từ trang chủ, do vậy mà nhưng post / page nào không có trang nào link đến nó cũng không tải về!

Back to Top