Categories SEO

Hơn 200 yếu tố xếp hạng của Google (phiên bản đầy đủ)

yếu tố xếp hạng c Google

Có thể bạn đã nghe nói đến chuyện Google sử dụng đến hơn 200 yếu tố xếp hạng trong thuật toán của họ…

Nhưng rốt cuộc thì đó là các yếu tố nào vậy?

Bạn sẽ cảm thấy choáng ngợp, vì tôi sẽ đưa ra bản danh sách đầy đủ trong bài viết này!

Một số cái đã được chứng minh rồi. Một số cái hẵn còn đang gây tranh cãi. Những cái khác thì là sự suy đoán của những kẻ chuyên nghiên cứu SEO.

Tất cả chúng được tập hợp hết ở đây. Cùng đào sâu xem nào!


Vài lời của người dịch: Đây là nội dung rất dài và tổng hợp hầu hết các chủ đề trong lĩnh vực SEO, nên sẽ có nhiều thuật ngữ mà người mới làm quen sẽ thấy lạ lẫm (ngay cả người dịch cũng biết được rất nhiều khái niệm mới qua bài này).

Để các bạn hiểu rõ hơn, trong các phần mà tôi cảm thấy cần chú thích sẽ bổ sung thêm dấu (*) và giải thích ngay bên dưới nội dung đó luôn.

Ngoài ra trong nội dung tiếng Anh gốc có nhiều hình chụp màn hình, ở bài dịch tương ứng, để nội dung thân thiện hơn, tôi chụp màn hình các thao tác tương tự nhưng trên máy tìm kiếm Google Việt Nam. Đôi khi tôi cũng bổ sung thêm hình khác để các bạn thấy nội dung dễ tiếp cận.

Cuối cùng là một số thuật ngữ rất hay được sử dụng trong bài tôi sẽ giải thích luôn ở phần mở đầu này:

  • SERP: nghĩa là trang kết quả máy tìm kiếm trả về, mỗi trang theo mặc định của Google có 10 kết quả
  • Site hoặc Website: là chỉ chung cả website bao gồm tất cả các trang (pages) trên website đó
  • Liên kết nội bộ (internal link): chỉ liên kết giữa các trang (pages) trên cùng website
  • Liên kết ngoài (external link): chỉ liên kết giữa các trang thuộc các website khác nhau
  • Backlink: nếu website A trỏ tới website B, thì website B được nói là có backlink từ website A trỏ đến. Hoặc cũng có thể nói website A có một liên kết ngoài (external link) trỏ đến website B.
  • Authority: tính thẩm quyền, ở đây đồng nghĩa với PageRank, một khái niệm tuy xưa cũ trong SEO, nhưng vẫn có nhiều giá trị. Bạn nào muốn biết cách tính PageRank, có thể đọc bài này.

Các yếu tố liên quan đến tên miền

1. Tuổi tên miền: Trong video này, Matt Cutts (từng làm trưởng bộ phận chống spam của Google) nói rằng:

Sự khác biệt giữa tên miền sáu tháng tuổi và tên miền một năm tuổi là không thực sự lớn.

Nói cách khác, họ có sử dụng tuổi của tên miền trong thuật toán…nhưng nó có tầm quan trọng rất thấp.

P/S: đây là một trong các lý do xuất hiện thị trường chuyên mua bán các tên miền cũ. Có những người lọc lõi chuyên săn tên miền hết hạn có giá trị và mua lại để chính họ dùng hoặc bán cho người khác. Lý do là vì các tên miền có tuổi đời cao thường có giá trị nhiều hơn trong mắt Google, do nó tích lũy được nhiều nội dung và backlink. Tuy nhiên không phải không có rủi ro trong chuyện này, ở những phần kế tiếp bạn sẽ hiểu vì sao.

2. Từ khóa xuất hiện trong tên miền cấp cao nhất: Điều này không có tác dụng thúc đẩy thứ hạng như trước kia. Nhưng có từ khóa trong tên miền gốc vẫn thể hiện là một tín hiệu có liên quan…Một nghiên cứu của Verisign cho thấy, tên miền có từ khóa, ảnh hưởng tích cực đến tỷ lệ click trên SERP.

3. Từ khóa là từ đầu tiên trong tên miền: Tên miền bắt đầu với từ khóa nhắm đến có lợi thế hơn các tên miền không có từ khóa (hoặc có từ khóa nhưng nó nằm giữa, hoặc cuối tên miền).

4. Thời hạn còn lại của tên miền: Một bằng sáng chế của Google tuyên bố:

Các tên miền có giá trị (hợp pháp) thường mua tên miền trước vài năm, trong khi các tên miền bất hợp pháp hiếm khi sử dụng hơn một năm. Vì lý do đó, số ngày còn lại trước khi tên miền hết hạn có thể được sử dụng như một yếu tố trong việc dự đoán tính hợp pháp của một tên miền (legitimacy of a domain).

P/S: Trong những thứ liên quan đến web, tên miền là một trong những cái có giá trị nhất, nhưng lại có giá thành rẻ nhất. Giá thuê tên miền một năm có thể chỉ ngang bằng (hoặc thậm chí là thấp hơn) giá thuê hosting một tháng (thực tế đó là chuyện xảy ra với trang web Kiến càng, tiền thuê host cho trang này xấp xỉ 300K / tháng, ngang ngửa tiền tên miền một năm). Vì thế bạn không nên tiếc tiền mua tên miền trong dài hạn, nhất là với các tên miền đã phát triển chắc chắn. Việc mất tên miền do quên không gia hạn không phải chuyện quá hiếm, và cái giá để lấy lại tên miền bị người khác mua mất thì không hề rẻ một chút nào. Lời khuyên của tôi là mua trước ít nhất 2 – 3 năm, và trong phần thanh toán bạn nhớ thiết lập thanh toán tự động, còn trong phần email thông báo nhớ chọn email bạn thường xuyên kiểm tra, để khi nhà cung cấp dịch vụ tên miền gửi thông tin, bạn sẽ nhanh chóng biết được.

Cá nhân tôi thì thế nào, tôi mua trước tên miền ducanhplus.com trước 5 năm:

mua trước tên miền một thời gian dài

5. Từ khóa trong subdomain: Các chuyên gia của Moz cho rằng từ khóa xuất hiện trong subdomain có thể làm tăng thứ hạng.

từ khóa xuất hiện trong subdomain

6. Lịch sử tên miền: Một website có quyền sở hữu không ổn định (volatile ownership) hoặc bị drop vài lần có thể khiến Google hiểu rằng công cụ tìm kiếm này cần “reset” lại lịch sử website, xóa bỏ các liên kết trỏ đến tên miền. Hoặc trong một số trường hợp, phạt tên miền có thể xảy ra với người mua mới.

P/S: đây là lý do vì sao trước khi mua tên miền mới, bạn cần kiềm tra lịch sử của nó, xem ai đã từng mua nó rồi và họ đăng nội dung gì trên đó. Sẽ rất nguy hiểm nếu bạn mua một tên miền trước đây chuyên làm việc gì đó xấu trong mắt của Google. Để biết lịch sử nội dung của trang web nào đó, bạn có thể sử dụng web.archive.org, chẳng hạn đây là giao diện trang web của tôi cách đây 5 năm:

kiểm tra giao diện cũ của website Kiến càng

7. Tên miền khớp chính xác từ khóa: Tên miền khớp chính xác từ khóa (Exact Match Domains)* có thể vẫn cho bạn lợi thế nhỏ. Nhưng nếu trang EMD của bạn có chất lượng thấp, nó có thể bị ảnh hưởng bởi cập nhật EMD.

(*): Ví dụ về tên miền EMD như chẳng hạn bạn muốn bán sách chuyên về kinh tế và bạn mua tên miền sachkinhte.com (ngoài lề: khi tôi thử kiểm tra thì tên miền này đã có người sở hữu rồi, họ mua từ năm 2007)

tên miền sachkinhte chấm com đã được mua

8. Thông tin WhoIs công khai hoặc bảo mật: Thông tin WhoIs (*) bảo mật là một tín hiệu cho thấy “có điều gì đó cần phải giấu đi”. Matt Cutts từng nói về chuyện này như sau:

…Khi tôi kiểm tra thông tin whois của các trang này, tất cả đều ghi “dịch vụ bảo vệ thông tin whois riêng tư”. Đây là điều tương đối bất thường…Việc bạn bật dịch vụ bảo vệ thông tin whois không được mặc định xem là xấu, nhưng một khi bạn thấy các yếu tố này xuất hiện cùng nhau, bạn có thể đoán rằng đây là một người quản trị web rất khác so với những người chỉ có một website.

(*): WhoIs là dịch vụ cung cấp thông tin chủ sỡ hữu tên miền, thường bao gồm các thông tin như: Họ tên, địa chỉ, số điện thoại, email. Luật mới yêu cầu thông tin chủ sỡ hữu WhoIs phải chính xác, cập nhật, nếu không có thể bị thu hồi tên miền. Thông thường thông tin WhoIs thì công khai, nhưng vì nhiều lý do (ngoài chuyện có thể website đó có ý đồ xấu nên phải giấu thông tin chủ sở hữu) mà chủ website có thể không muốn công khai thông tin này. Nguyên nhân hợp lý (hợp pháp) khác liên quan đến chuyện ẩn WhoIs bao gồm tránh lộ thông tin cá nhân để bị lợi dụng hoặc làm phiền. Bản thân Google Domains, một dịch vụ bán tên miền cung cấp miễn phí ẩn thông tin WhoIs theo mặc định.

9. Phạt chủ sở hữu Whois: Nếu Google phát hiện một cá nhân cụ thể nào đó là spammer, Google có khả năng sẽ kiểm tra cẩn thận các website khác cũng được sở hữu bởi người chuyên đi spam này (*).

(*): Đây là lý do nếu bạn giao website cho bên thứ ba quản trị, bạn cần giao cho người có trách nhiệm, để tránh trường hợp lợi dụng trục lợi và gây ảnh hưởng tiêu cực đến bạn và các website khác mà bạn có. Điều tương tự với hosting cũng thế, hãy thuê nơi chất lượng, để yên tâm về đội ngũ đứng đằng sau, cũng như hạn chế tối đa trường hợp bị hack (dù hiếm).

10. Tên miền quốc gia cấp cao nhất: Việc có được tên miền quốc gia cấp cao nhất (chẳng hạn như .vn, .cn, .sg) có thể giúp website thăng hạng trong đất nước cụ thể đó…nhưng nó có thể giới hạn khả năng trang được xếp hạng ở nơi khác (và trên toàn cầu nói chung)*.

(*): Ngoài ưu điểm trên, tên miền quốc gia còn có 2 tính chất đáng quan tâm: (1) nó nếu không may bị chiếm đoạt trái phép bạn dễ lấy lại hơn, (2) có rất nhiều tên miền đẹp có thể lựa chọn, vì không gian tên miền của nó còn dư thừa rất nhiều so với các đuôi phổ thông quốc tế mà ai cũng đăng ký được như là .com, .net, .org.

P/S: Bạn muốn đặt tên miền hay và tốt cho SEO thì tham khảo bài viết này nhé: kiencang.net/cach-chon-ten-mien-hay/ (nếu tôi viết bài này sớm hơn, khả năng cao là tôi sẽ chọn tên miền khác cho website bạn đang đọc!)


Các yếu tố ở cấp độ trang (page)

11. Từ khóa xuất hiện trong thẻ tiêu đề (title tag): Mặc dù không còn quan trọng như trước đây, thẻ tiêu đề của bạn vẫn là tín hiệu SEO onpage quan trọng.

từ khóa xuất hiện trong thẻ tiêu đề

P/S: bạn có thể muốn xem bài cách viết tiêu đề SEO hiệu quả.

12. Thẻ tiêu đề bắt đầu với từ khóa: Theo Moz, thẻ tiêu đề bắt đầu với từ khóa có xu hướng tốt hơn so với thẻ tiêu đề có từ khóa xuất hiện ở cuối thẻ.

13. Từ khóa xuất hiện trong thẻ mô tả description: Google không sử dụng thẻ mô tả description như một tín hiệu xếp hạng trực tiếp. Dầu vậy, thẻ description có thể ảnh hưởng đến tỷ lệ click (CTR), cái vốn là yếu tố xếp hạng quan trọng.

14. Từ khóa xuất hiện trong thẻ H1: Thẻ H1 là “thẻ tiêu đề thứ hai”. Bên cạnh thẻ tiêu đề của bạn, Google sử dụng thẻ H1 như tín hiệu liên quan thứ cấp, theo như kết quả từ một nghiên cứu tương quan (correlation study)*:

từ khóa trong thẻ H1

(*): Nghiên cứu tương quan là nghiên cứu cho biết 2 sự kiện thường xuyên xảy ra cùng nhau ở tỷ lệ nào, và nó có thể là thông tin gợi ý cho mối quan hệ nhân quả. Dù vậy thì tương quan vẫn khác nhân quả, theo nghĩa là mối quan hệ ấy không chắc chắn là nhân quả.

15. TF-IDF: Một câu nói quen thuộc: “từ đó xuất hiện bao nhiêu lần trong tài liệu?”. Một từ càng xuất hiện nhiều trên một trang, từ đó càng có khả năng mang ý nghĩa quan trọng với trang đó. Google có khả năng sử dụng một phiên bản rất tinh tế về TF-IDF(*).

(*): TF-IDF là một phương pháp thống kê dùng để xác định mức độ quan trọng của từ trong văn bản, mà bản thân văn bản đang xét nằm trong tập hợp văn bản lớn hơn. Những từ có TF-IDF cao là những từ xuất hiện nhiều trong văn bản này nhưng xuất hiện ít trong văn bản khác. Chẳng hạn từ “và” có thể không có TF-IDF cao trong văn bản này vì mặc dù nó xuất hiện nhiều, nhưng tần số của nó cũng rất nhiều ở văn bản khác. Ngược lại từ “SEO” có thể có TF-IDF cao trong văn bản bạn đang đọc, vì đây là từ không xuất hiện nhiều trong các văn bản khác.

16. Độ dài nội dung: Nội dung dài hơn (nhiều từ hơn) có thể bao trùm chủ đề rộng hơn và có vẻ như được thuật toán ưu ái hơn khi so sánh với nội dung ngắn, hoặc các bài viết hời hợt. Thực vậy, một nghiên cứu gần đây về các yếu tố xếp hạng phát hiện ra rằng nội dung dài có tương quan với vị trí trên SERP.

độ dài nội dung

17. Mục lục nội dung: Sử dụng các liên kết trong mục lục của nội dung (*) có thể giúp Google hiểu nội dung của bạn rõ ràng hơn. Nó cũng có thể giúp bạn có sitelink (những liên kết nhỏ xuất hiện ngay bên dưới kết quả tìm kiếm):

mục lục biến thành sitelink

(*): Mục lục nội dung thường xuất hiện ở đầu bài, và rất có tác dụng trong các bài viết dài, nó giúp độc giả nhanh chóng nắm được nội dung tổng quát, cũng như đến được phần nội dung nào họ thích xem trước một cách dễ dàng. Nếu dùng WordPress, bạn có thể sử dụng plugin Table of Contents Plus hoặc Easy Table of Contents.

18. Mật độ từ khóa: Mặc dù không còn quan trọng như trước kia, Google có thể sử dụng nó để xác định chủ đề của trang web. Nhưng nếu bạn lạm dụng, nó có thể gây tác dụng ngược(*). Một trong các cập nhật thuật toán quan trọng của Google là Penguin liên quan đến chuyện phạt các website nhồi nhét từ khóa, điều quan trọng cần rút ra ở đây là bạn cần viết bài thật tự nhiên.

(*): Nếu bạn nào dùng Yoast SEO trên WordPress, bạn có thể để ý đến thông báo về mật độ từ khóa quá cao hoặc quá thấp.

19. Từ khóa ngữ nghĩa tiềm ẩn trong nội dung (LSI): Các từ khóa LSI có thể giúp máy tìm kiếm xuất được ý nghĩa từ các từ có nhiều hơn một nghĩa (ví dụ như Apple chỉ đến công ty sản xuất iphone, hoặc cũng là Apple nhưng có nghĩa là quả táo). Sự hiện diện/vắng mặt của LSI có thể cũng hoạt động như một tín hiệu về chất lượng nội dung.

20. Từ khóa LSI trong thẻ tiêu đề và thẻ mô tả: Cũng như với nội dung trang, các từ khóa LSI trong thẻ meta của trang có thể giúp Google phân biệt giữa các từ có nhiều nghĩa. Nó cũng có thể hoạt động như một tín hiệu liên quan.

21. Trang bao gồm chủ đề chuyên sâu: Có một mối tương quan giữa độ sâu của chủ đề và xếp hạng trên Google. Vì thế, các trang bao gồm mọi khía cạnh của chủ đề có khả năng có lợi thế so với các trang chỉ hàm chứa một chủ đề cụ thể.

22. Tốc độ tải trang thông qua HTML: Cả Google và Bing đều sử dụng tốc độ trang như yếu tố xếp hạng. Bọ máy tìm kiếm có thể ước tính tốc độ trang web của bạn khá chính xác dựa trên mã HTML trang.

tốc độ trang

23. Tốc độ tải trang thông qua trình duyệt Chrome: Google sử dụng dữ liệu của người dùng Chrome để xử lý tốt hơn vấn đề tốc độ tải trang. Bằng cách này họ có thể đo được tốc độ tải trang thực tế của người dùng.

24. Sử dụng AMP: Đây không phải là tín hiệu xếp hạng trực tiếp của Google, AMP có thể là yêu cầu để được dùng để xếp hạng trong phiên bản di động của Google News Carousel.

25. Khớp chính xác thực thể: Có phải nội dung của trang khớp chính xác “thực thể”(*) mà người dùng tìm kiếm? Nếu đúng, trang có thể được thăng hạng (ranking bost) cho từ khóa đó.

(*): Khi nào tìm hiểu rõ về khái niệm thực thể mình sẽ trình bày cho các bạn.

26. Google Hummingbird: Thuật toán này giúp Google vượt qua giới hạn của từ khóa. Cảm ơn Hummingbird, nhờ nó Google có thể hiểu rõ hơn chủ đề của website.

27. Nội dung trùng lắp: Nội dung giống hệt nhau trên cùng website (thậm chí là có khác nhau đôi chút) có thể ảnh hưởng tiêu cực đến khả năng xuất hiện trên máy tìm kiếm của trang.

28. Rel=Canonical: Khi được sử dụng đúng cách, thẻ này có thể ngăn Google phạt website của bạn vì lý do trùng lặp nội dung. Một trong những ví điển hình về việc sử dụng thẻ này là trong CDN.

29. Tối ưu hóa ảnh: Hình ảnh cung cấp cho máy tìm kiếm các tín hiệu quan trọng thông qua tên file, nội dung alt, tiêu đề (title) ảnh, mô tả và caption (chú thích). Bạn có thể tìm hiểu thêm về SEO ảnh ở đây.

30. Nội dung tươi mới: Phiên bản cập nhật Google Caffeine ưa thích các bài đăng mới hoặc cập nhật nội dung, đặc biệt là cho các tìm kiếm nhạy cảm với thời gian. Để làm nổi bật tầm quan trọng của đặc điểm này, Google hiển thị ngày cập nhật trang gần đây nhất cho một trang nào đấy.

ngày tháng của nội dung

31. Mức độ cập nhật nội dung: Trang được cập nhật nhiều hay ít cũng được xem là một yếu tố tươi mới. Thêm hoặc loại bỏ hoàn toàn một phần nội dung nào đó có nhiều ảnh hưởng hơn là chỉ sửa lỗi đánh máy hoặc thay đổi thứ tự vài từ.

32. Lịch sử cập nhật của trang: Trang của bạn được cập nhật thường xuyên đến mức nào? Hàng tháng, hàng năm, hay 5 năm một lần? Tần số cập nhật cũng đóng vai trò quan trọng trong tính tươi mới.

33. Sự nổi bật của từ khóa: Từ khóa xuất hiện trong 100 từ đầu tiên(*) trên trang có tương quan với xếp hạng trên Google.

(*): Bạn nào dùng Yoast SEO trên WordPress sẽ thường thấy dấu tick xanh, vàng, đỏ liên quan đến chuyện này.

34. Từ khóa trong thẻ H2, H3: Từ khóa xuất hiện trong các tiêu đề phụ H2 hoặc H3 có thể là một tín hiệu liên quan yếu khác. Trong thực tế John Mueller nói rằng:

Những thẻ tiêu đề này trong HTML giúp chúng tôi hiểu cấu trúc của trang.

35. Chất lượng của liên kết trỏ ra bên ngoài: Nhiều người làm SEO nghĩ rằng các liên kết ngoài trỏ tới các trang có thẩm quyền có thể gửi các tín hiệu tin cậy đến Google. Và tuyên bố này được dựa trên một nghiên cứu gần đây.

36. Chủ đề của liên kết trỏ ra bên ngoài: Theo thuật toán Hillop, Google có thể sử dụng nội dung của các trang bạn liên kết đến như một tín hiệu liên quan. Lấy ví dụ, nếu bạn có trang web về ô tô liên kết đến các trang liên quan đến phim ảnh, điều này có thể nói cho Google hiểu rằng trang của bạn là bộ phim về ô tô, chứ không phải xe ô tô.

37. Ngữ pháp và chính tả: Ngữ pháp và chính tả chuẩn là một tín hiệu về chất lượng cao, mặc dù Matt Cutts đưa ra nhiều thông điệp lẫn lộn cách đây vài năm về chuyện liệu nó có quan trọng hay không.

P/S: làm thế nào để cải thiện được ngữ pháp và chính tả. Một trong những cách chất lượng nhất là đọc sách nhiều, chọn các nhà xuất bản uy tín vì độ chính xác của họ rất cao. Đề xuất của mình là sách của Nhã Nam. Nếu bạn lười hơn, có thể đọc báo điện tử, tuy nhiên độ chính xác của họ không cao bằng, ngoài ra mức đa dạng từ vựng cũng thấp hơn nhiều.

38. Nội dung syndicated (sao chép): Nội dung trên trang có phải là nội dung gốc hay không? Nếu nó là nội dung sao chép từ trang đã được lập chỉ mục thì nó sẽ không có thứ hạng tốt…hoặc thậm chí là có thể không được lập chỉ mục luôn.

39. Cập nhật thân thiện với di động: Thường được đề cập với tên gọi là “Mobilegeddon”, cập nhật này thưởng cho các trang đã được tối ưu hóa chuẩn cho thiết bị di động.

40. Tính khả dụng trên di động: Website mà người dùng di động có thể sử dụng dễ dàng có thể có lợi thế hơn trong xu hướng ưu tiên “chỉ mục di động trước” của Google.

P/S: nếu tính khả dụng là từ lạ tai với bạn, hãy tham khảo bài viết này nhé: kiencang.net/tinh-kha-dung-la-gi/

41. Nội dung ẩn trên thiết bị di động: Nội dung ẩn trên thiết bị di động có thể không được lập chỉ mục (hoặc không được đánh giá cao như nó có thể) so với nội dung hiển thị đầy đủ. Dù vậy, một nhân viên của Google mới đây tuyên bố rằng nội dung ẩn là OK. Tuy nhiên cũng trong video đó, ông ấy nói rằng, “…nếu đó là nội dung quan trọng thì nó phải hiển thị ra ngoài…”(*)

(*): Chúng ta có thể hiểu là nếu ẩn, thì chỉ ẩn những thông tin không quan trọng mà thôi. Nội dung ẩn không phải là điều hiếm khi xảy ra. Chẳng hạn để tối ưu sự tiện dụng và tốc độ, tôi (Đức Anh) thường ẩn một số thông tin cột phải trên di động (mà bình thường trên máy bàn sẽ hiển thị). Lý do là vì các thông tin ở cột phải đó rất hiếm khi được xem trên di động. Ngay cả chuyện đọc hết nội dung chính đã là hiếm rồi, chưa nói đến chuyện người dùng kéo chuột đến tận cùng để xem các thông tin như vậy.

42. “Nội dung bổ sung” hữu ích: Theo tài liệu hướng dẫn công khai của Google, các nội dung bổ sung hữu ích là dấu chỉ của chất lượng trang (và vì thế được Google thăng hạng). Các ví dụ bao gồm chuyển đổi tiền tệ, tính toán lãi vay và các nội dung tương tác khác.

Trang web của ngân hàng Techcombank có ứng dụng hữu ích liên quan đến lãi suất gửi tiết kiệm

43. Nội dung ẩn bên dưới các tab: Có phải người dùng cần click vào một tab nào đấy để mở nội dung nằm trên trang? Nếu vậy, Google từng nói rằng, nội dung đó “có thể không được lập chỉ mục”.

44. Số lượng liên kết trỏ ra bên ngoài: Có quá nhiều liên kết trỏ ra bên ngoài dạng dofollow có thể làm “rò rỉ” PageRank, có có thể làm ảnh hưởng xấu đến thứ hạng của trang.

45. Tài nguyên đa phương tiện: Ảnh, video và các nội dung đa phương tiện khác có thể có tác dụng như một tín hiệu về chất lượng nội dung. Lấy ví dụ, một nghiên cứu SEO phát hiện ra có mối tương quan giữa nội dung đa phương tiện và thứ hạng:

nội dung đa phương tiện và thứ hạng

PS: ngày này cơ hội để chúng ta có được nội dung đa phương tiện rất nhiều, ví dụ ảnh, các bạn có thể có được rất nhiều ảnh miễn phí thú vị để làm minh họa. Podcast cũng là một xu hướng và có nhiều ứng dụng hỗ trợ. Các thiết bị quay, chỉnh sửa video cũng dễ tiếp cận hơn nhờ giá thân thiện và dễ dùng. Quan trọng là chúng ta cần chịu khó đầu tư, và làm cho người dùng chứ không phải chỉ cho có. “Cho có” tương đương với không làm gì, thậm chí còn tệ hơn không làm gì, bạn cần khắc cốt ghi tâm điều đó.

46: Số lượng các liên kết nội bộ trỏ đến trang: Số lượng các liên kết nội bộ trỏ tới trang chỉ ra mức độ quan trọng tương đối của trang so với các trang khác trên website (nhiều liên kết nội bộ hơn = quan trọng hơn).

PS: liên kết nội bộ là một trong các việc dễ làm nhất khi SEO onpage, nhất là khi bạn có số lượng bài viết đủ lớn. Nếu dùng WordPress thì plugin Link Whisper là công cụ hữu ích. Ngoài ra phần mềm SEO như Screaming Frog có thể hữu ích với mọi kiểu CMS, mỗi tội giá hơi chát.

47. Chất lượng của các liên kết nội bộ trỏ đến trang: Các liên kết nội bộ đến từ các trang có thẩm quyền trên tên miền có ảnh hưởng mạnh mẽ hơn so với các trang không có hoặc có PageRank thấp.

48. Các liên kết gãy: Có quá nhiều liên kết gãy trên trang có thể là một tín hiệu cho thấy trang bị bỏ bê không có ai chăm sóc. Tài liệu hướng dẫn của Google sử dụng các liên kết gãy như một trong các tiêu chí để đánh giá chất lượng trang chủ.

49. Mức độ khó đọc: Không có gì phải nghi ngờ chuyện Google ước tính mức độ khó đọc của các trang web. Trong thực tế Google từng cung cấp cho chúng ta thống kê về các cấp độ đọc:

thống kế về cấp độ đọc

Tuy nhiên họ làm gì với thông tin đó thì vẫn còn đang được tranh luận. Một số nói rằng cấp độ đọc cơ bản sẽ giúp bạn xếp hạng tốt hơn bởi vì nó sẽ phù hợp với số đông. Nhưng một số người khác liên hệ cấp độ đọc cơ bản với các xưởng nội dung kiểu như Ezine Articles.

Ngoài lề: Bạn có thể tìm hiểu chủ đề Cloze test về khả năng đọc hiểu. Nó không giống với cái của Google đưa ra, nhưng nó có thể giúp bạn có khái niệm tốt hơn về chuyện này.

50. Các liên kết affiliate: Các liên kết affiliate bản thân chúng có lẽ không gây tổn hại đến thứ hạng của bạn. Nhưng nếu bạn có quá nhiều liên kết kiểu như vậy, thuật toán của Google có thể để ý hơn đến các tín hiệu chất lượng khác để đảm bảo bạn không phải là trang liên kết nghèo nàn.

51. HTML bị lỗi/Xác nhận của W3C: Có nhiều lỗi HTML hoặc code (viết mã) trang cẩu thả có thể là dấu hiệu của website chất lượng kém. Ngược lại, nhiều người làm SEO cho rằng trang được viết mã tốt là một tín hiệu về chất lượng, mặc dù điều này vẫn còn đang gây tranh cãi.

52. Thẩm quyền của tên miền: Khi mọi thứ đều ngang bằng, trang nằm trên tên miền có thẩm quyền sẽ có thứ hạng cao hơn trang nằm trên tên miền ít thẩm quyền hơn (*).

thẩm quyền của tên miền

(*): Một so sánh khá thô, trình độ cầu thủ Messi thì vẫn vậy, nhưng giờ nếu M10 chuyển sang câu lạc bộ nào đó ở Nhật (nền bóng đá cũng ưu kỹ thuật) thì Messi sẽ không thể nổi tiếng như ở Barcenola được.

53. PageRank của trang: Tuy không phải là tương quan hoàn hảo, nhưng các trang có nhiều thẩm quyền hơn có xu hướng có thứ hạng tốt hơn.

54. Độ dài URL: URL quá dài có thể ảnh hưởng tiêu cực đến khả năng hiển thị của trang trên máy tìm kiếm. Trong thực tế, một số nghiên cứu trong ngành phát hiện ra rằng URL ngắn có xu hướng có một lợi thế nhỏ trong trang kết quả tìm kiếm của Google.

số lượng ký tự trong URL

55. Đường dẫn URL: Trang gần hơn với trang chủ có thể nhận được tính thẩm quyền cao hơn một chút so với các trang bị vùi sâu bên dưới cấu trúc website.

56. Được biên tập bởi con người: Mặc dù không bao giờ được xác nhận chính thức, Google đã nộp một bằng sáng chế cho một hệ thống cho phép các biên tập bởi con người ảnh hưởng đến SERP.

57. Trang thư mục: Thư mục mà trang thuộc về là một tín hiệu liên quan. Một trang là một phần của danh mục liên quan gần gũi có thể nhận được sự gia tăng liên quan khi so sánh với trang thuộc về một thư mục không liên quan.

58. Các thẻ tag của WordPress: Thẻ là tín hiệu liên quan dành riêng cho WordPress. Theo Yoast.com:

Cách duy nhất để cải thiện SEO của bạn đó là để nội dung này liên quan đến nội dung khác, và cụ thể hơn là nhóm các bài viết khác nhau lại với nhau.

59. Từ khóa trong URL: Một tín hiệu liên quan khác. Một đại diện của Google gần đây nói rằng đây là “một tín hiệu xếp hạng rất nhỏ”.

60. Chuỗi URL: Các thư mục trong chuỗi URL được đọc bởi Google và có thể cung cấp tín hiệu về chủ đề của trang:

chuỗi URL

61. Tài liệu tham khảo và nguồn: Trích dẫn tài liệu tham khảo và nguồn, giống như cách các tài liệu nghiên cứu vẫn làm, có thể là tín hiệu chất lượng. Hướng dẫn về chất lượng của Google tuyên bố rằng người đánh giá, tìm hiểu nên chú ý đến các nguồn khi đọc một bài viết nào đó: “Đây là một chủ đề mà tính chuyên gia và/hoặc thẩm quyền của nguồn là quan trọng…”. Dù vậy, Google từ chối xác nhận rằng họ sử dụng các liên kết ngoài như một tín hiệu để xếp hạng.

62. Danh sách dạng chấm tròn và số: Danh sách dạng chấm tròn và số có thể giúp nội dung của bạn thân thiện hơn với người dùng. Google có khả năng đồng ý về vấn đề này và có thể thích nội dung có danh sách dạng chấm tròn và số hơn.

63. Mức ưu tiên của trang trong Sitemap (sơ đồ trang web): Tính ưu tiên của trang được đưa ra trong file sitemap.xml có thể ảnh hưởng đến việc xếp hạng.

64. Quá nhiều liên kết trỏ ra bên ngoài: Trích dẫn trực tiếp từ tài liệu đánh giá chất lượng ở trên:

Một số trang có quá nhiều liên kết, làm người dùng bị phân tán khỏi nội dung chính.

65. Số lượng các từ khóa khác mà trang có thứ hạng: Nếu trang có thứ hạng cho một số từ khóa khác, nó có thể cung cấp cho Google một dấu hiệu nội bộ về chất lượng.

66. Tuổi của trang / post / page: Mặc dù Google thích nội dung tươi mới, các trang có tuổi thường xuyên cập nhật có thể vượt trội hơn so với các trang mới.

67. Giao diện, bố cục thân thiện người dùng: Trích dẫn từ tài liệu hướng dẫn chất lượng của Google một lần nữa:

Giao diện, bố cục trang có chất lượng cao làm cho nội dung chính được hiển thị rõ trước mắt người dùng.

68. Parked domain: Bản cập nhật của Google vào tháng 12 năm 2011 làm giảm cơ hội hiển thị trên máy tìm kiếm của parked domain (*).

(*): Parked domain là tên miền chạy chung dữ liệu với tên miền chính. Thí dụ bạn có tên miền chính là example.com, và bạn có tên miền khác là example.net và khi truy cập vào thì hiển thị nội dung, cấu trúc giống hệt example.com, thế thì example.net gọi là paked domain.

69. Nội dung hữu ích: Google có thể phân biệt được giữa nội dung “chất lượng” và nội dung “hữu ích”.


Các yếu tố cấp độ website

70. Nội dung cung cấp giá trị và quan điểm độc đáo: Google tuyên bố rằng họ rất thoải mái khi phạt các trang không đem lại bất kỳ điều gì mới hoặc hữu dụng, đặc biệt là các trang “thin affiliate(*)”.

(*): Thin affiliate là những trang hầu như không cung cấp giá trị gì cho người dùng, nó chỉ nhăm nhăm kiếm tiền nhờ vào các link tiếp thị liên kết.

71. Trang liên hệ với chúng tôi: Như đã nói ở trên, Tài liệu Tiêu chuẩn chất lượng của Google tuyên bố rằng họ thích trang “có lượng thông tin liên hệ phù hợp”. Cần phải đảm bảo rằng thông tin liên kệ của bạn khớp với thông tin WhoIs.

72. Domain Trust/TrustRank: Nhiều người làm SEO tin rằng “TrustRank” là yếu tố xếp hạng rất quan trọng. Và một bằng sáng chế mới nộp gần đây của Google có tiêu đề là “Xếp hạng kết quả tìm kiếm dựa trên sự tin cậy”, cái dường như là bằng chứng cho niềm tin này.

sự tin cậy của trang

73. Cấu trúc website: Kiến trúc trang web kết hợp tốt (ví dụ cấu trúc silo) có thể giúp Google sắp xếp nội dung trên website của bạn theo chủ đề (thematically). Nó cũng có thể giúp Googlebot truy cập và lập chỉ mục tất cả các trang trên website của bạn.

74. Cập nhật website: Nhiều người làm SEO tin rằng website được cập nhật – và đặc biệt là khi nội dung mới được thêm vào trang – sẽ đem lại cho website các yếu tố cho thấy sự tươi mới rộng. Mặc dù mới đây Google từ chối xác nhận rằng họ sử dụng “tần số xuất bản nội dung” trong thuật toán xếp hạng.

75. Có sitemap: Sitemap có thể giúp máy tìm kiếm lập chỉ mục trang của bạn dễ dàng hơn, đầy đủ hơn và cải thiện khả năng hiển thị.

76. Uptime của trang: Trang web bị downtime (gián đoạn) nhiều lần vì lý do bảo trì hoặc vấn đề máy chủ(*) có thể gây ảnh hưởng xấu đến thứ hạng (và thậm chí còn có thể bị xóa bỏ chỉ mục tìm kiếm nếu không được sửa).

(*): Do vậy hãy chọn hosting tốt nhất trong khả năng của bạn, và khi mua host hãy đặc biệt chú ý đến thông tin công khai về thời gian uptime. Hiện tượng gián đoạn ngoài lý do vì hosting, còn có thể tại đường truyền nữa. Chẳng hạn khi bị đứt cáp, dẫn đến tình trạng nghẽn cổ chai (băng thông bị bóp) làm cho thời gian phản hồi rất chậm đối với những trang sử dụng hosting bên ngoài. Bạn nên cân nhắc sử dụng CDN chất lượng tốt có PoP ở Việt Nam trong trường hợp này.

77. Vị trí của máy chủ: Vị trí của máy chủ ảnh hưởng thứ hạng trang web của bạn ở các khu vực địa lý khác nhau. Điều đặc biệt quan trọng cho các tìm kiếm nhắm theo khu vực địa lý cụ thể (geo-specific searches).

78. Chứng chỉ SSL: Google xác nhận rằng sử dụng HTTPS là một tín hiệu được dùng để xếp hạng.

Tuy nhiên, theo Google, HTTPS chỉ đóng vai trò giống như “tiebreaker”(*).

(*): Một từ hay nghe thấy trong môn tennis (vận động viên ưa thích của tôi là Novak Djokovic). Ý là chỉ được dùng khi mọi thứ khác là ngang bằng nhau, và lúc đó HTTPS sẽ được đưa ra để xem trang nào tốt hơn. Điều này giống thi đấu trong tennis khi loạt tiebreaker diễn ra khi cả 2 vận động viên cùng có được 6 game. HTTPS là điều bạn nên triển khai, nó miễn phí, và chỉ mất của bạn khoảng 5 phút mà thôi.

79. Trang điều khoản dịch vụ và chính sách bảo mật: Hai trang này nói cho Google biết rằng website là một thành viên đáng tin cậy trên internet. Chúng có thể cũng giúp cải thiện E-A-T(*) của website.

(*): E-A-T lần lượt là các từ viết tắt của Expertixe (chuyên môn), Authority (thẩm quyền), Trustworthiness (đáng tin cậy).

80. Trùng lặp thông tin thẻ meta trên trang: Trùng lặp thông tin thẻ meta trên website của bạn có thể làm hạ thấp toàn bộ khả năng có mặt trên kết quả trả về của máy tìm kiếm. Trong thực tế, Google Search Console (trang quản trị web miễn phí của Google) sẽ cảnh báo bạn nếu bạn có quá nhiều vấn đề này.

81. Điều hướng breadcrumb: Đây là kiểu cấu trúc trang web thân thiện với người dùng, giúp người dùng (và máy tìm kiếm) biết được họ đang ở đâu trên trang:

điều hướng breadcrumb

Google tuyên bố rằng:

Google tìm kiếm sử dụng mã đánh dấu breadcrumb trong nội dung của trang web để sắp xếp thông tin từ trang trong các kết quả tìm kiếm.

82. Tối ưu hóa trên di động: Với trên một nửa lượng tìm kiếm được thực hiện từ thiết bị di động, Google muốn thấy trang của bạn được tối ưu hóa cho người dùng di động. Trong thực tế, ở thời điểm hiện tại Google phạt các website không thân thiện với người dùng di động.

83. YouTube: Không còn nghi ngờ gì nữa, các video trên YouTube được ưu tiên hiển thị trên SERP (có thể vì Google sở hữu nó):

trailer phim vua sư tử

84. Tính khả dụng của website: Một website khó sử dụng hoặc khó điều hướng có thể gây ảnh hưởng xấu đến thứ hạng theo cách không trực tiếp thông qua việc thời gian trên trang, số lượt xem trang, và tỷ lệ thoát trang bị ảnh hưởng tiêu cực (nói cách khác, là các yếu tố xếp hạng RankBrain).

85. Sử dụng Google Analytics và Google Search Console: Một số người nghĩ rằng sử dụng hai chương trình này trên website có thể cải thiện chỉ mục của bạn. Chúng cũng có thể ảnh hưởng trực tiếp đến thứ hạng thông qua cách cung cấp cho Google nhiều dữ liệu để xử lý hơn (ví dụ như tỷ lệ thoát trang chính xác hơn, bất kể là bạn có nhận được lưu lượng truy cập giới thiệu từ backlink của bạn hay không). Tuy nhiên, Google đã phủ nhận điều này.

PS: rất hợp lý khi cho rằng sử dụng Google Analytics và Google Search Console có thể cải thiện chỉ mục bao gồm tốc độ lập chỉ mục cho trang mới, số lượng chỉ mục, và các vấn đề liên quan khác. Nhưng rõ ràng Google sẽ không sử dụng chúng để có thông tin xếp hạng, vì điều này sẽ vi phạm nghiêm trọng chính sách, và càng làm họ dễ bị các cáo buộc về độc quyền. Điều này cũng đúng với Google Adsense, có mã đó không giúp bạn có thứ hạng cao hơn.

86. Người dùng đánh giá/Website danh tiếng: Mức độ nổi tiếng của website trên những trang như Yelp.com có khả năng đóng một vai trò quan trọng trọng thuật toán của Google. Google thậm chí còn đăng một bài phác thảo hiếm khi thẳng thắn đến vậy về cách họ sử dụng thông tin đánh giá trực tuyến sau khi một trang bị phát hiện đã cố tình lừa khách hàng để được báo chí bàn đến và có được nhiều liên kết (nhằm có được thứ hạng tốt hơn trên web).


Các yếu tố backlink

87. Tuổi đời tên miền của liên kết: Các baclink từ tên miền có tuổi đời cao có thể hiệu quả lớn hơn so với các tên miền mới.

88. Số lượng tên miền gốc trỏ đến: Số lượng tên miền gốc trỏ đến (root domain) là một trong các yếu tố xếp hạng quan trọng nhất trong thuật toán của Google, như bạn có thể thấy từ nghiên cứu hơn 1 triệu kết quả tìm kiếm từ Google.

số lượng tên miền gốc trỏ đến

89. Số lượng liên kết đến từ các IP lớp C riêng biệt: Các liên kết đến từ các địa chỉ IP lớp C riêng biệt là một tín hiệu cho thấy mức độ rộng của các liên kết trỏ đến bạn, đây là điều có thể giúp bạn thăng hạng.

90. Số lượng các trang trỏ đến bạn: Tổng số lượng các liên kết trỏ đến trang của bạn – thậm chí ngay cả khi chúng đến từ cùng một tên miền – có ảnh hưởng đến thứ hạng.

91. Văn bản neo của backlink: Đây là một lưu ý trong phần mô tả nằm trong tài liệu gốc về thuật toán xếp hạng của Google:

Điều đầu tiên, văn bản neo thường cung cấp nhiều mô tả chính xác hơn về trang web so với mô tả của chính bản thân trang web đó.

Rõ ràng là giờ văn bản neo không còn được coi trọng như trước đây nữa (và, khi được tối ưu hóa quá mức, nó có thể bị xem như một tín hiệu spam). Nhưng văn bản neo giàu từ khóa vẫn gửi tín hiệu cho thấy có sự liên quan mạnh mẽ.

92. Thẻ ALT (với các liên kết dạng ảnh): văn bản trong thẻ alt hoạt động như văn bản neo với link ảnh.

93. Các liên kết từ tên miền .edu hoặc .gov: Matt Cutts từng tuyên bố rằng tên miền cấp cao nhất (TLD) không phải là một yếu tố để xếp hạng mức độ quan trọng của website. Và Google đã nói rằng họ bỏ qua rất nhiều liên kết dạng .edu. Dù vậy thì điều đó không làm giới SEO ngừng cho rằng tên miền .gov và .edu có một vị trí đặc biệt trong thuật toán xếp hạng.

PS: giới SEO có lý do của họ, vì các đuôi tên miền .gov và .edu thường yêu cầu rất khắt khe khi đăng ký, tuy vậy không phải là không có hiện tượng spam xảy ra với các đuôi này, dù là dạng không chủ động từ người chủ chính thức (người quản trị website có thể lợi dụng vị trí của họ để kiếm thêm thu nhập qua các hình thức spam mà không thông qua chủ website).

94. Tính thẩm quyền của trang trỏ đến: Tính thẩm quyền (PageRank) của trang trỏ đến là yếu tố xếp hạng vô cùng quan trọng kể từ khi Google mới thành lập cho đến tận thời điểm hiện tại.

95. Tính thẩm quyền của tên miền trỏ đến: Tính thẩm quyền của tên miền trỏ đến có thể đóng vai trò độc lập trong giá trị của liên kết.

96. Các liên kết từ đối thủ cạnh tranh: Các liên kết từ các trang khác cũng được xếp hạng trên cùng SERP có thể có giá trị hơn với xếp hạng của trang cho một từ khóa cụ thể.

97. Liên kết từ các website được mong đợi: Mặc dù chỉ là phỏng đoán, một số người làm SEO tin rằng Google không hoàn toàn tin tưởng website của bạn cho đến khi bạn nhận được liên kết từ một nhóm các website trong ngành của bạn.

98. Liên kết từ những người láng giềng xấu bụng: Liên kết từ những trang được gọi là “láng giềng xấu bụng” có thể ảnh hưởng xấu đến trang của bạn.

99. Bài viết khách mời (guest post): Mặc dù các liên kết đến từ bài viết khách mời vẫn truyền giá trị, chúng có vẻ như không có được sức mạnh thực sự như các liên kết biên tập từ những bài viết thông thường (thêm nữa, việc áp dụng bài viết khách mời trên quy mô lớn có thể làm trang của bạn gặp rắc rối).

100. Các liên kết từ quảng cáo: Theo Google, các liên kết từ quảng cáo phải được để là nofollow. Dù vậy, có vẻ như Google có khả năng xác định được các link này và chủ động lọc các link quảng cáo ra khỏi link followed.

101. Thẩm quyền của trang chủ: Liên kết đến từ trang chủ của trang giới thiệu có thể đóng một vai trò đặc biệt quan trọng trong việc đánh giá website cũng như giá trị của một liên kết.

102. Các liên kết nofollow: Đây là một trong những chủ đề gây tranh cãi nhiều nhất trong SEO. Google tuyên bố chính thức về vấn đề này như sau:

Nói chung, chúng tôi không đi theo các liên kết đó.

– Google

Điều này nói rằng họ sẽ làm như vậy…ít nhất là trong một số trường hợp. Với một tỷ lệ % các liên kết nofollow nào đó, nó cũng có thể chỉ ra hồ sơ liên kết là tự nhiên hay không tự nhiên.

103. Sự đa dạng của các kiểu liên kết: Có một tỷ lệ phần trăm lớn không tự nhiên đến từ một nguồn duy nhất (ví dụ như hồ sơ trên các diễn đàn, bình luận blog) có thể là dấu hiệu của webspam. Mặt khác, các liên kết đến từ đa dạng các nguồn là dấu hiệu của hồ sơ liên kết tự nhiên.

104. “Liên kết được tài trợ” hoặc các từ khác tương tự xung quanh liên kết: Các từ như “tài trợ”, “đối tác liên kết” và “các liên kết được tài trợ” có thể làm giảm giá trị của liên kết.

105. Các liên kết theo ngữ cảnh: Các liên kết được nhúng bên trong nội dung của trang được xem là có nhiều sức mạnh hơn so với các liên kết trên các trang trống hoặc được tìm thấy ở mọi chỗ trên trang.

106. Chuyển hướng 301 quá mức đến trang: Các backlink đến từ chuyển hướng 301 làm loãng ít nhiều PageRank.

107. Văn bản neo của liên kết nội bộ: Văn bản neo của liên kết nội bộ là tín hiệu liên quan khác. Tuy nhiên cần phải nói rằng nó có trọng số thấp hơn nhiều so với văn bản neo đến từ các website bên ngoài.

108. Thuộc tính title của liên kết: Title của liên kết (văn bản xuất hiện khi bạn hover qua liên kết) cũng có thể được sử dụng như một tín hiệu liên quan yếu.

109. Tên miền quốc gia cấp cao nhất của tên miền trỏ đến: Nhận được các liên kết trỏ đến từ tên miền quốc gia cấp cao nhất (ví dụ .vn, .cn, .co.uk) có thể giúp thứ hạng của bạn tốt hơn trong quốc gia đó.

110. Vị trí của liên kết trong nội dung: Các liên kết ở phần đầu của nội dung có thể có trọng số cao hơn một chút so với các liên kết được đặt ở phía cuối nội dung.

link có vị trí cao hơn trong văn bản sẽ giúp có thứ hạng tốt hơn

111. Vị trí của liên kết trên trang: Vị trí liên kết xuất hiện trên trang là quan trọng. Nhìn chung, một liên kết được nhúng trong nội dung trang đem lại nhiều sức mạnh hơn so với liên kết ở chân trang hoặc khu vực sidebar.

112. Liên kết từ tên miền liên quan: Một liên kết từ website cùng ngành đem lại nhiều sức mạnh hơn đáng kể so với một liên kết từ site hoàn toàn không liên quan.

113. Mức độ liên quan ở cấp độ trang: Một liên kết từ trang (page) liên quan cũng truyền nhiều giá trị hơn.

114. Từ khóa trong tiêu đề: Tiêu đề của liên kết mà chứa “từ khóa trang của bạn đang nhắm tới” sẽ được Google yêu thích hơn (“Chuyên gia liên kết đến chuyên gia”).

115. Vận tốc liên kết tích cực (mức độ tăng trưởng liên kết trỏ đến lành mạnh): Một trang có vận tốc liên kết tích cực thường được đẩy thứ hạng trên SERP vì điều đó cho thấy trang của bạn đang gia tăng sự phổ biến.

tốc độ liên kết tích cực

116. Tốc độ liên kết tiêu cực: Ở mặt đối lập, tốc độ liên kết tiêu cực có thể làm giảm thứ hạng đáng kể vì nó là tín hiệu cho thấy sự phổ biến bị suy giảm.

117. Liên kết từ các trang “Hub / Ổ nội dung”: Thuật toán Hilltop gợi ý rằng nhận được các liên kết từ những trang được coi là nguồn hàng đầu (hoặc các ổ nội dung) về một chủ đề nào đó sẽ nhận được xử lý đặc biệt.

118. Liên kết từ các trang có thẩm quyền: Liên kết từ các website được đánh giá là “có thẩm quyền” có khả năng chuyển nhiều sức mạnh hơn một liên kết đến từ website nhỏ và ít được biết đến.

119. Được liên kết đến từ các nguồn như là Wikipedia: Mặc dù các liên kết này là nofollow, nhiều người nghĩ rằng có được liên kết từ Wikipedia giúp bạn có thêm một chút tin cậy và thẩm quyền trong mắt máy tìm kiếm.

120. Các từ đồng xuất hiện: Các từ có xu hướng hay xuất hiện quanh backlink của bạn giúp Google biết được trang nói về điều gì.

121. Tuổi của Backlink: Theo một bằng sáng chế của Google, các backlink cũ hơn có nhiều sức mạnh thăng hạng hơn so với các backlink mới có.

122. Liên kết đến từ các website thực và “Splogs”: Vì lý do có sự sinh sôi nảy nở mạnh của các mạng lưới blog, Google có khả năng gán trọng số cao hơn cho các liên kết đến từ “các website thực” hơn là các blog giả (fake). Họ có khả năng sử dụng thương hiệu và các tín hiệu tương tác của người dùng để phân biệt giữa hai kiểu trang này.

123. Hồ sơ liên kết tự nhiên: Một website có hồ sơ liên kết “tự nhiên” sẽ được xếp hạng cao, bền hơn cũng như ổn định hơn mỗi lần Google cập nhật so với trang sử dụng các chiến lược back hat (SEO mũ đen) để xây dựng liên kết.

124. Các liên kết đối ứng: Trang nói về mưu đồ liên kết của Google liệt kê “các biện pháp trao đổi liên kết quá mức” là một dạng mưu đồ liên kết cần tránh.

125. Người dùng tạo ra nội dung chứa liên kết (UGC): Google có thể xác định được nội dung do người dùng tạo và nội dung được xuất bản bởi chủ thực sự của website. Lấy ví dụ, họ biết được rằng liên kết đến từ website chính thức của WordPress.com thì rất khác so với liên kết đến từ besttoasterreviews.wordpress.com

126. Các liên kết đến từ chuyển hướng 301: Các liên kết đến từ chuyển hướng 301 có thể mất một chút sức mạnh so với liên kết trực tiếp. Dầu vậy, Matt Cutts nói rằng liên kết 301 là tương đương với các liên kết trực tiếp.

127. Sử dụng Schema.org: Các trang hỗ trợ vi định dạng (microformat) có thể được xếp hạng cao hơn các trang không có. Điều này có thể có tác dụng thúc đẩy trực tiếp hoặc thực tế là các trang có vi định dạng có tỷ lệ CTR trên SERP cao hơn:

vi định dạng
Nhiều thông tin quan trọng được rút trích khi sử dụng Schema để đưa lên kết quả tìm kiếm

128. TrustRank của Website liên kết: Mức độ đáng tin cậy của website liên kết đến trang của bạn sẽ xác định mức độ “TrustRank” mà bạn nhận được.

129. Số lượng liên kết trỏ ra ngoài của trang (ý là trang đang trỏ đến trang của bạn): PageRank là có hạn. Một liên kết nằm trên trang có hàng trăm liên kết ngoài sẽ truyền ít PageRank hơn so với trang có ít liên kết ngoài hơn.

130. Backlink từ diễn đàn: Vì mức độ spam ở quy mô công nghiệp, Google có thể giảm giá trị đáng kể các liên kết đến từ các diễn đàn (forum*).

(*): Đây cũng là nơi thường xuyên có nội dung do người dùng tạo, liên quan ít nhiều đến mục 125

131. Số từ của trang nội dung liên kết đến: Một liên kết đến từ bài viết vài ngàn từ thường có giá trị nhiều hơn so với liên kết đến từ một bài viết ngắn cỡ 200 từ.

132. Chất lượng nội dung của trang liên kết đến: Các liên kết từ bài viết chất lượng thấp hoặc nội dung nhào nặn, xáo xào không chuyển nhiều giá trị như các liên kết đến từ nội dung được viết tốt.

133. Các liên kết cấp độ website (Sitewide links): Đây là các liên kết xuất hiện trên mọi trang của website, ví dụ như các link ở footer (chân trang). Matt Cutts đã xác nhận rằng các liên kết cấp độ website được tính chỉ như là một liên kết riêng lẻ mà thôi.


Tương tác của người dùng

134. RankBrain: RankBrain là thuật toán trí thông minh nhân tạo của Google. Nhiều người tin rằng mục đích chính của nó là đo đạc mức độ tương tác của người dùng với các kết quả tìm kiếm (và thăng hạng các kết quả phù hợp).

135. Tỉ lệ click tự nhiên (CTR) cho một từ khóa: Theo Google, các trang nhận được nhiều click hơn (dưới thuật ngữ CTR) có thể được thăng hạng trên SERP cho từ khóa cụ thể đó.

136. CTR tự nhiên cho tất cả các từ khóa: CTR tự nhiên cho tất cả các từ khóa được xếp hạng của một website có thể là tín hiệu về tương tác người dùng dựa trên con người (nói cách khác, một điểm số chất lượng cho các kết quả tự nhiên).

137: Tỷ lệ thoát trang: Không phải tất cả những người làm SEO đều đồng ý về thông số tỷ lệ thoát trang, nhưng nó có thể là cách Google tận dụng người dùng của họ như một bài kiểm tra chất lượng (suy cho cùng, trang có tỷ lệ thoát cao có khả năng không phải là kết quả tốt cho từ khóa đó). Tương tự, một nghiên cứu gần đây của SEMRush phát hiện ra mối tương quan giữa tỷ lệ thoát trang và thứ hạng trên Google.

tỷ lệ thoát trang có liên quan đến SEO

138. Lưu lượng truy cập trực tiếp: Điều này đã được xác nhận, Google sử dụng dữ liệu từ Google Chrome để xác định có bao nhiêu người ghé thăm trang (và ghé thăm đều đặn như thế nào). Các trang có nhiều lưu lượng truy cập trực tiếp có khả năng có chất lượng cao hơn trang có lưu lượng truy cập trực tiếp thấp. Trong thực tế, nghiên cứu của SEMRush tôi vừa trích dẫn tìm thấy mối tương quan đáng kể giữa lưu lượng truy cập trực tiếp và thứ hạng trên Google.

139. Lưu lượng truy cập lặp lại: Các website nhận được truy cập lặp lại có thể nhận được thứ hạng tốt hơn trên Google.

140. Pogosticking: “Pogosticking” là một dạng thoát trang đặc biệt. Trong trường hợp này, người dùng click vào kết quả đầu tiên nhưng nội dung không được như ý, họ quay trở lại trang tìm kiếm và click vào kết quả thứ hai, tương tự, cũng không được như ý, và phải đến khi click vào kết quả thứ ba thì mới hợp ý người dùng.

Pogosticking

Hệ quả của chuyện này là các liên kết đầu tiên bị Pogostick (*) có thể bị giảm thứ hạng đáng kể với truy vấn đó (vì nó có khả năng cao không làm hài lòng người dùng).

(*): Một hiện tượng cũng có thể xếp vào Pogostick, đó là những trang web mà bạn đã ghé thăm vào buổi sáng cho từ khóa nào đấy có thể sẽ bị tụt hạng nếu buổi chiều (hoặc hôm nào khác) bạn cũng tìm kiếm từ khóa đó (nhưng thường chỉ là tạm thời và dành riêng cho bạn mà thôi, khi tìm kiếm ẩn danh, trang web buổi sáng sẽ trở về vị trí cũ). Có thể Google cho rằng bạn tìm kiếm lại vào buổi chiều có nghĩa là kết quả buổi sáng không làm bạn hài lòng.

141. Các website bị chặn: Google đã ngừng tính năng này trên Chrome. Dù vậy, Panda đã từng sử dụng tính năng này như một tín hiệu về chất lượng. Vì vậy Google có thể vẫn sử dụng một biến thể của nó.

142. Bookmarks trên Chrome: Chúng ta biết rằng, Google thu thập dữ liệu duyệt web của người dùng trên trình duyệt Chrome. Các trang được đánh dấu (bookmark) trên Chrome có thể được đẩy thứ hạng.

143. Số lượng bình luận: Các trang có nhiều bình luận có thể là một tín hiệu về tương tác người dùng và chất lượng. Trong thực tế một nhân viên của Google từng nói rằng các bình luận (*) có thể giúp tăng thứ hạng “rất nhiều”.

(*): Trong WordPress, người ta cho rằng hệ thống bình luận mặc định của nó sẽ giúp SEO website tốt hơn các hệ thống của bên thứ ba như là bình luận Facebook hoặc Disqus. Để tìm hiểu nhiều hơn bình luận trên WordPress hãy truy cập vào liên kết tôi vừa dẫn.

144. Dwell Time: Google bỏ ra rất nhiều chú ý vào “dwell time”: đây chính là khoảng thời gian mọi người xem trên trang của bạn rồi quay trở lại công cụ tìm kiếm Google. Điều này đôi khi còn được đề cập dưới tên gọi “click dài và click ngắn”. Tóm lại: Google đo khoảng thời gian người tìm kiếm bỏ ra trên trang của bạn. Thời gian này càng dài thì càng tốt.

Ý kiến: để tăng dwell time bạn nên viết nội dung rõ ràng, đủ dài và tập trung vào mục đích của người dùng.


Các thuật toán đặc biệt của Google

145. Truy vấn phù hợp với nội dung tươi mới: Với một số truy vấn nhất định(*), Google đẩy thứ hạng của các trang mới hơn lên.

(*): Hãy xem ví dụ với từ khóa “Chiến tranh thương mại Trung Mỹ”:

từ khóa cần nội dung mới

Google đẩy các bài viết mới nhất lên đầu trang kết quả tìm kiếm. Có thể hiểu rằng với những sự kiện kéo dài liên tục từ quá khứ đến hiện tại, thì với các truy vấn cho sự kiện đó, người dùng có xu hướng muốn biết thông tin ở thời điểm hiện tại hơn, do vậy mà Google có ưu tiên như thế.

146. Truy vấn cần sự đa dạng hóa: Google có thể thêm sự đa dạng hóa cho SERP với các từ khóa mơ hồ, có nghĩa chưa rõ ràng(*).

(*): Những từ khóa mơ hồ là các từ khóa mà ý nghĩa của nó chưa thực sự rõ ràng, thí dụ như ai đó tra từ khóa “cầu” (**), thì không rõ người đó muốn tìm “cầu” liên quan đến thể thao (cầu thủ, cầu lông) hay soi cầu hay cầu đường bộ, vân vân. Vì thế Google sẽ đa dạng hóa các ngữ nghĩa này trong kết quả, có thể hiểu là họ muốn giảm thiểu khả năng lọt mất ý định thực sự của người tìm kiếm.

(**): Có thể bạn ngạc nhiên khi ai đó tra từ khóa kiểu này, nhưng thực sự là kiểu từ khóa này có tồn tại, dù tỷ lệ không lớn.

147. Lịch sử duyệt web của người dùng: Điều này chắc bạn đã quan sát thấy rồi: các trang web mà bạn ghé thăm thường xuyên có được thứ hạng trên SERP cao hơn(*).

(*): Google có thể cho rằng trang web đó phù hợp hơn với bạn.

148. Lịch sử tìm kiếm của người dùng: Chuỗi tìm kiếm ảnh hưởng đến kết quả tìm kiếm của tìm kiếm cuối cùng. Lấy ví dụ, nếu bạn tìm kiếm “reivew/đánh giá” rồi sau đó bạn tìm kiếm “điều hòa nhiệt độ”, Google có khả năng xếp hạng các trang về đánh giá điều hòa nhiệt độ cao hơn trong SERP.

149. Đoạn trích nổi bật: Theo nghiên cứu của SEMRush, Google lựa chọn nội dung cho đoạn trích nổi bật dựa trên các kết hợp của độ dài nội dung, định dạng, thẩm quyền của trang và sử dụng HTTPs.

150. Nhắm mục tiêu theo địa lý: Google ưu tiên cho các trang có IP máy chủ địa phương và tên miền quốc gia cấp cao nhất theo quốc gia của người tìm kiếm.

PS: cái này có thể là lý do để bạn muốn lựa chọn các tên miền .vn và các công ty hosting trong nước nếu muốn nhắm đến người dùng Việt Nam.

151. Tìm kiếm an toàn: Các kết quả tìm kiếm chứa nội dung là các từ tục tĩu hoặc dành cho người lớn không được hiển thị nếu người dùng sử dụng chế độ tìm kiếm an toàn(*).

(*): Chế độ tìm kiếm an toàn thường được sử dụng trong các gia đình có trẻ nhỏ, để ngăn các em tiếp xúc với nội dung không hợp độ tuổi. Youtube thậm chí còn xây dựng một ứng dụng dành riêng cho trẻ nhỏ vì nội dung trên Youtube thông thường dễ chứa nhiều hình ảnh không thích hợp. Một số người còn sử dụng các phần mềm / DNS chặn lọc chuyên nghiệp để ngăn các website nhất định.

152. Vòng kết nối Google+: Mặc dù Google+ sẽ sớm bị loại bỏ, Google vẫn hiển thị các kết quả của các tác giả và website mà bạn đã thêm vào trong vòng kết nối Google Plus cao hơn thông thường.

153. Các từ khóa “YMYL”: Google yêu cầu tiêu chuẩn chất lượng nội dung cao hơn với các từ khóa YMYL / Your Money or Your Life / Tiền của bạn hoặc Cuộc sống của bạn (*)

(*): Các trang YMYL là các trang như thế nào, nói một cách nôm na thì đó là những trang có thể ảnh hưởng đến hạnh phúc của bạn ở hiện tại hoặc tương lai (lời khuyên từ các trang luyện tập thể chất, tài chính, bảo hiểm, vân vân). Chúng ta có thể hiểu là Google không muốn các trang có chất lượng thấp có thể gây hại với người dùng của họ trong một số lĩnh vực quan trọng của cuộc sống.

154. Trang bị khiếu nại DMCA: Google làm giảm thứ hạng của các trang bị khiếu nại DMCA (*) chính xác.

(*): DMCA là viết tắt của cụm từ Digital Millennium Copyright Act – nghĩa là đạo luật bản quyền kỹ thuật số thiên niên kỷ. Nó có nhiệm vụ hạn chế các website vi phạm bản quyền có được thứ hạng cao, qua đó giúp người dùng tránh vi phạm liên đới do sử dụng các sản phẩm vi phạm từ những trang đó.

Ví dụ khi tìm kiếm trên Google với từ khóa “phần mềm microsoft office” có thể bạn sẽ thấy thông báo như bên dưới:

thông báo xóa nội dung vi phạm bản quyền

Thông tin trên có thể được tạm dịch như sau:

Để đáp ứng các khiếu nại mà chúng tôi nhận được theo đạo luật bản quyền kỹ thuật số thiên niên kỷ Hoa Kỳ, chúng tôi đã loại bỏ 1 kết quả khỏi trang này. Nếu bạn muốn, bạn có thể đọc khiếu nại DMCA dẫn đến hành động xóa trên trang LumenDatabase.org

155. Đa dạng tên miền: Cái còn được gọi là “Cập nhật Bigfoot”, nó được cho là bổ sung thêm nhiều tên miền hơn vào trang SERP (trang kết quả tìm kiếm).

156. Tìm kiếm giao dịch: Google đôi khi hiển thị kết quả khác cho từ khóa liên quan đến việc mua sắm, chẳng hạn như việc tìm kiếm chuyến bay.

157. Tìm kiếm địa phương: Với một số tìm kiếm địa phương, Google thường để kết quả địa phương nằm trên các kết quả tìm kiếm tự nhiên “thông thường”.

tìm kiếm địa phương

158. Hộp câu chuyện hàng đầu (top stories box): Một số từ khóa kích hoạt hộp câu chuyện hàng đầu:

từ khóa cháy rừng amazon kích hoạt hộp câu chuyện hàng đầu

159. Ưa thích thương hiệu lớn: Sau cập nhật Vince, Google bắt đầu đẩy các thương hiệu lớn lên thứ hạng cao hơn cho một số từ khóa nhất định.

PS: các thương hiệu lớn có một đặc điểm quan trọng: uy tín, ít khi dám thao túng và thường chú ý đến chất lượng hơn. Đặc biệt với các từ khóa ảnh hưởng đến người dùng (ví dụ các thông tin tài chính, sức khỏe) khả năng Google ưu tiên các thương hiệu lớn sẽ cao hơn.

160. Các kết quả dạng shopping: Google đôi khi hiển thị các kết quả shopping (mua hàng) trong trang kết quả tìm kiếm thông thường:

hiển thị kết quả shopping trong trang kết quả trả về

161. Các kết quả là ảnh: Các kết quả là ảnh đôi khi xuất hiện trong các kết quả tìm kiếm thông thường.

hình ảnh xuất hiện trong tìm kiếm thông thường với từ khóa phố cổ Hà Nội

PS: cái này có thể hiểu là với một số truy vấn, người dùng ưa thích việc xem ảnh. Google biết điều đó, và để đáp ứng người dùng, họ đưa thêm các kết quả này vào dù bạn đang thực hiện tìm kiếm chung. Điều đó một lần nữa cho thấy hiểu ý định của người tìm kiếm quan trọng như thế nào. Nếu bạn đáp ứng được, bạn sẽ được đánh giá tốt hơn.

162. Các kết quả kiểu trứng phục sinh: Google có hàng tá kết quả kiểu trứng phục sinh. Lấy ví dụ, khi bạn tìm kiếm từ khóa “Atari Breakout” trong tìm kiếm hình ảnh của Google, kết quả tìm kiếm sẽ trả về một trò chơi giao diện web mà bạn có thể chơi được(!)

tôi chơi thử trò Atari Breakout

163. Một website đơn lẻ có thể có nhiều kết quả hiển thị trên trang tìm kiếm cho từ khóa thương hiệu: Từ khóa nhắm đến tên miền hoặc thương hiệu có thể hiển thị nhiều kết quả của cùng một website trên trang kết quả tìm kiếm (*)

(*): Trước thời điểm cập nhật, Google chỉ cho phép tối đa 2 kết quả từ cùng một tên miền hiển thị trên một trang kết quả trả về. Giờ thì họ cho phép nhiều hơn, và thậm chí có thể chiếm áp đảo trang tìm kiếm.

164. Cập nhật cho vay lãi ngày (*): Đây là thuật toán đặc biệt được thiết kế để loại bỏ các truy vấn cực kỳ spam.

(*): Tôi dịch sát nghĩa thôi, chứ cập nhật này không chỉ liên quan đến mỗi truy vấn của vay lãi ngày. Tên tiếng Anh gốc của nó là Payday Loans Update.


Các tín hiệu đến từ thương hiệu

165. Văn bản neo dạng tên thương hiệu: Văn bản neo tên thương hiệu tuy đơn giản nhưng lại là tín hiệu về thương hiệu mạnh mẽ.(*)

(*): Chẳng hạn nếu có một website nào đó trỏ đến website của tôi với văn bản neo là Kiến càng (văn bản trong liên kết), thì điều đó là tín hiệu thương hiệu rất tốt.

166. Tìm kiếm thương hiệu: Mọi người tìm kiếm thương hiệu. Nếu mọi người tìm kiếm thương hiệu của bạn trên Google, điều đó cho Google thấy trang của bạn là thương hiệu thực sự (*).

(*): Chuyện này rất dễ hiểu đúng không, giờ thử nghĩ đến điện thoại, các tên thương hiệu nào xuất hiện trong đầu bạn? Và bạn có hay tìm kiếm các tên thương hiệu đó hay không?

167. Thương hiệu + Từ khóa tìm kiếm: Có phải mọi người tìm kiếm sử dụng một từ khóa cụ thể bên cạnh thương hiệu của bạn (*) (lấy ví dụ: “Các yếu tố thăng hạng Google Kiến càng” hoặc “Kiến càng SEO”)? Nếu có, Google có thể đẩy thứ hạng của bạn lên khi mọi người tìm kiếm cũng từ khóa đó nhưng không kèm thương hiệu.

(*) Bạn sẽ thấy chuyện này xảy ra rất thường xuyên. Một ví dụ gần gũi là nếu bạn làm quen với WordPress một thời gian rồi thì thương hiệu ThachPham có thể đang nằm trong suy nghĩ:

Từ khóa WordPress Thạch Phạm

168. Webiste có trang Fanpage và có nhiều like: Các thương hiệu thường có xu hướng có trang Fanpage Facebook với rất nhiều lượt like.

169. Website có hồ sơ Twitter với nhiều người theo dõi: Hồ sơ Twitter với rất nhiều người theo dõi là tín hiệu cho thấy sự phổ biến của thương hiệu.

170. Trang công ty trên chính thức trên Linkedin: Hầu hết các doanh nghiệp thực đều có trang công ty của họ trên Linkedin.

171. Authorship: Vào tháng hai, năm 2013, CEO của Google là Eric Schmidt nói rằng:

Trong kết quả tìm kiếm, thông tin gắn liền với các hồ sơ trực tuyến đã được xác nhận sẽ có thứ hạng cao hơn so với nội dung không có xác nhận như vậy, điều này sẽ dẫn đến kết quả là hầu hết người dùng sẽ tự nhiên click vào các kết quả trên đầu mà đã được xác nhận.

172. Tính hợp pháp của các tài khoản mạng xã hội: Một tài khoản mạng xã hội có hơn 10 ngàn người theo dõi với chỉ 2 bài đăng có thể được xem là rất khác so với một tài khoản có 10 ngàn người theo dõi với rất nhiều tương tác. Trong thực tế, Google đã nộp một bằng sáng chế về việc phát hiện một tài khoản mạng xã hội nào đó là thực hay giả.

173. Đề cập đến thương hiệu trên Top Stories (các câu chuyện hàng đầu): Các thương hiệu thực sự lớn nhận được đề cập trên các câu chuyện hàng đầu vào mọi khung thời gian.

thương hiệu lớn thường xuyên xuất hiện trên tin bài hàng đầu

Trong thực tế, một số thương hiệu thậm chí còn có nguồn cấp tin tức từ trang riêng của họ, trên trang đầu tiên.

đề cập đến thương hiệu, trang lớn

174. Các đề cập đến thương hiệu không có liên kết: Nhiều khi các thương hiệu nhận được đề cập trong nội dung mà không nhận được các liên kết trỏ đến. Google có khả năng để ý đến các đề cập không liên kết (non-hyperlinked brand) này dưới dạng một tín hiệu thương hiệu(*).

(*): Một nội dung nào đó có chứa từ SamSung, mà không liên kết đến website của công ty SamSung hay bất cứ website nào khác, hẳn là Google vẫn đủ thông minh để biết được rằng văn bản đó đang nhắc đến thương hiệu nào.

175. Vị trí cửa hàng/văn phòng thực tế: Các thương hiệu thực có văn phòng. Có khả năng Google thu thập các dữ liệu vị trí/địa phương để xác định liệu một trang web nào đó có phải là thương hiệu lớn hay không(*).

(*): Nếu bạn có cửa hàng thực tế, tìm hiểu về Local SEO sẽ rất hữu ích. Các tìm kiếm kiểu địa phương rất phổ biến, và nó thường được ưu tiên đẩy lên vị trí cao hơn thông thường.


Các yếu tố webspam trên trang (on-site)

176. Nhận trừng phạt Panda: Các trang có chất lượng thấp (đặc biệt là các trang content farms*) sẽ bị hiển thị ít hơn trong kết quả của máy tìm kiếm sau khi nhận trừng phạt Panda.

(*): Content farms còn được gọi là Content mill hoặc Content factories là những trang có nội dung kém (có thể do chất lượng bài viết hoặc do chuyên đi sao chép từ các trang khác) nhưng do áp dụng thành thạo các thủ thuật SEO mà có thứ hạng cao trên máy tìm kiếm, và thậm chí còn cao hơn nội dung gốc.

177. Liên kết đến những người láng giềng xấu: Liên kết trỏ tới “người láng giềng xấu bụng” – chẳng hạn các trang bán dược phẩm hoặc cho vay lãi ngày chuyên đi spam – có thể ảnh hưởng xấu đến khả năng hiển thị trên máy tìm kiếm.

(*): Chúng ta có thể hiểu ngắn gọn câu này có nghĩa là: “chọn bạn mà chơi”. Nếu bạn bắt buộc phải đề cập đến các nội dung có vấn đề hãy cảnh báo người dùng ngay trong nội dung và để nofollow cho liên kết đó.

178. Các chuyển hướng: Chuyển hướng lén lút là điều cần phải tránh xa. Nếu phát hiện website nào áp dụng, nó có thể không chỉ bị phạt, mà còn bị loại khỏi chỉ mục.

179. Các Popup hoặc “các quảng cáo gây mất tập trung”: Tài liệu hướng dẫn chính thức từ Google nói rằng các popup và quảng cáo gây phân tán là tín hiệu cho thấy chất lượng website thấp. Xem thêm: những kỹ thuật quảng cáo trực tuyến bị người dùng căm ghét nhất.

180. Popups bật lên xen kẽ: Google có thể trừng phạt các trang hiển thị toàn trang cho người dùng di động kiểu popup “bật lên xen kẽ”.

popup bật lên xen kẽ

181. Tối ưu hóa quá mức: Đúng vậy, Google trừng phạt những ai tối ưu hóa quá mức trang web của họ. Điều này bao gồm: nhồi nhét từ khóa, nhồi nhét thẻ tiêu đề, nhấn mạnh hình thức từ khóa quá mức (excessive keyword decoration)*.

(*): Nhấn mạnh hình thức từ khóa quá mức giống như kiểu bạn muốn SEO cho từ khóa “bán sách cũ” và bạn làm như thế này:

quá nhấn mạnh vào từ khóa

Nhấn mạnh từ khóa thì tốt thôi, nhưng quá mức thì không.

182. Các nội dung khó hiểu/vô nghĩa: Một bằng sáng chế của Google phác thảo cách Google xác định được các nội dung “khó hiểu/vô nghĩa”, điều này có thể giúp lọc bỏ các nội dung tạo tự động khỏi chỉ mục của họ(*).

(*): Đã từng xảy ra chuyện người nào đó (vì lý do nào đó) sử dụng Google dịch để dịch nguyên trang từ nước ngoài rồi đăng bài, và nó vẫn có thứ hạng thuộc top 10 máy tìm kiếm. Hiện tượng đó giờ tôi không còn thấy xảy ra nhiều nữa.

183. Các trang ngõ: Google muốn trang bạn hiển thị cho Google cũng chính là trang mà người dùng nhìn thấy. Nếu trang của bạn chuyển hướng người dùng đến trang khác, điều đó được gọi là trang ngõ / doorway page. Khỏi phải nói, Google không ưa các trang sử dụng trang ngõ

184. Quảng cáo nằm trên đường biên fold: Thuật toán layout trang phạt các trang có quá nhiều quảng cáo (và không có nhiều nội dung) nằm trên đường biên fold (thuộc màn hình đầu tiên – nơi được người duyệt web xem nhiều nhất)

185. Ẩn các đường link tiếp thị liên kết: Nếu bạn đi quá xa trong việc cố gắng ẩn các link tiếp thị liên kết (đặc biệt là với kỹ thuật cloaking) điều đó có thể dẫn đến các hình phạt.

186. Fred: Một nickname (biệt danh) dành cho một chuỗi cập nhật của Google vào năm 2017. Theo thông tin từ trang Search Engine Land, Fred “nhắm đến các trang có nội dung chất lượng thấp đặt doanh thu lên trên việc giúp ích cho người dùng của họ”.

187. Các website affiliate: Chẳng có gì bất ngờ khi biết rằng Google không phải là người hâm mộ các trang affiliates (*). Và nhiều người nghĩ rằng các trang kiếm tiền nhờ các chương trình tiếp thị liên kết có thể bị đặt dưới quá trình kiểm tra kỹ lưỡng.

(*): Các website Affiliate bản chất không có gì xấu, khi ở đó, người chủ website giới thiệu các sản phẩm mà họ cho là tốt (nhờ tổng hợp thông tin hoặc do kinh nghiệm sử dụng) để người khác có thể mua, và nếu giao dịch diễn ra, người bán hàng sẽ chiết khấu hoa hồng cho chủ trang Affiliate. Tuy nhiên một số người sa đà vào lợi nhuận và chỉ có lợi nhuận nên bỏ rơi khách hàng, họ sẵn sàng bán bất cứ sản phẩm nào, điều đó dẫn đến việc các công cụ như Google muốn kiểm tra chúng kỹ hơn.

188. Tự động tạo nội dung: Google ghét nội dung được tạo tự động(*). Nếu họ nghi ngờ rằng website của bạn đẩy ra các nội dung được tạo tự động bởi máy tính, nó có thể trừng phạt hoặc loại bỏ chỉ mục.

(*): Nội dung tạo tự động thường được làm bằng cách sao chép nội dung của các trang khác về, trộn nội dung với nhau, sử dụng các từ đồng nghĩa, gần nghĩa để gia tăng sự khác biệt với nội dung gốc nhằm đánh lừa máy tìm kiếm. Nội dung tạo tự động có thể mạnh về hiệu suất nhưng chất lượng thường rất kém (nhất là với nội dung phức tạp) vì không được tự nhiên.

189. Lạm dụng điều chỉnh dòng chảy PageRank: Nếu bạn đi quá xa trong chuyện lạm dụng dòng chảy PageRank(*) bằng cách để nofollowing tất cả các liên kết trỏ ra bên ngoài – điều này có thể là tín hiệu cho thấy bạn đang thực hiện hành vi thao túng kết quả tìm kiếm.

(*): Xem thêm bài viết về PageRank của Ahrefs để hiểu hơn về điều chỉnh dòng chảy nghĩa là gì.

190. Địa chỉ IP bị gắn cờ là spam: Nếu IP máy chủ của bạn bị gắn cờ là spam(*), nó có thể ảnh hưởng lên tất cả các trang trên máy chủ đó.

(*): Đây là lý do vì sao bạn nên chọn nhà cung cấp dịch vụ hosting uy tín nhằm hạn chế tối đa nguy cơ kiểu như thế này. Nếu đang tìm hosting chuyên cho WordPress, bạn có thể tham khảo bài này.

191. Thẻ meta bị spam: Nhồi nhét từ khóa cũng có thể xảy ra trong thẻ meta. Nếu Google nghĩ rằng bạn thêm từ khóa vào thẻ tiêu đề và thẻ mô tả để thao túng thuật toán, họ có thể phạt trang web của bạn.


Các yếu tố webspam ngoài trang (off-site)

192. Website bị hack: Nếu website của bạn bị hack, nó có thể bị loại khỏi các kết quả tìm kiếm. Trong thực tế, trang web Search Engine Land (*) đã bị loại bỏ hoàn toàn chỉ mục sau khi Google cho rằng nó bị hack.

Search Engine Land bị hack
Tiêu đề của bài viết là: Điều chúng tôi học được sau khi Google loại bỏ chỉ mục website của chúng tôi trong vòng một ngày

(*) Search Engine Land là một chuyên trang về SEO. Các websie bị hacked thường được dùng để lợi dụng người dùng, do vậy để bảo vệ, các bộ máy tìm kiếm sẽ loại bỏ nó (ít nhất là tạm thời) khỏi chỉ mục để hạn chế rủi ro.

Giảm thiểu nguy cơ bị hack bằng cách:

  • Tránh gây thù chuốc oán;
  • Sử dụng hosting tốt;
  • Dùng mật khẩu khó đoán;

193. Hàng loạt các liên kết không tự nhiên: Hàng loạt các liên kết bất chợt xuất hiện (và không tự nhiên) là dấu hiệu chắc chắn của kiểu liên kết giả mạo.

194. Hình phạt Penguin: Các trang từng bị phạt bởi Google Penguin ít hiển thị hơn đáng kể trên máy tìm kiếm. Mặc dù Peguin tập trung nhiều hơn vào việc lọc bỏ các liên kết xấu và trừng phạt toàn bộ website.

195. Hồ sơ liên kết có tỷ lệ cao các liên kết chất lượng thấp: Nhiều liên kết từ các nguồn phổ biến được sử dụng bởi người làm SEO kiểu black hat (giống như bình luận blog hoặc hồ sơ diễn đàn*) có thể là dấu hiệu của việc hệ thống đang bị thao túng.

(*): Ở thời điểm hiện tại vẫn rất nhiều người spam bình luận để kiếm backlink. Rất may là nhiều hệ thống quản trị nội dung trong đó có WordPress có các plugin rất hiệu quả để chống spam kiểu này (ví dụ plugin Akismet Anti-Spam). Ngoài ra, bình luận của WordPress mặc định được để là nofollow làm giảm mức độ hấp dẫn của việc kiếm backlink qua bình luận.

Ở chiều ngược lại, nếu bình luận của bạn là tự nhiên, việc bạn bình luận trên các website khác và để lại tên miền của bản thân lên đó không làm sao cả, vì đó không phải là spam…Hồ sơ diễn đàn cũng không hề xấu, nếu bạn đăng ký và tạo các bài viết hữu ích trên diễn đàn. Đừng đăng ký chỉ để có chữ ký về website rồi để đấy chẳng dùng gì.

196. Các liên kết từ các website không liên quan: Một tỷ lệ cao các backlink từ các website có chủ đề không liên quan có thể làm tăng khả năng website bị phạt.

197. Cảnh báo các liên kết không tự nhiên: Google gửi đi hàng ngàn thông điệp đến Google Search Console “lưu ý về việc phát hiện các liên kết không tự nhiên”. Điều này thường đi kèm và xuất hiện trước việc thứ hạng bị rớt, mặc dù điều này không phải lúc nào cũng xảy ra.

198. Liên kết từ các thư mục chất lượng thấp: Theo Google, các backlink từ những thư mục chất lượng thấp có thể dẫn đến việc bị Google phạt.

199. Các liên kết Widget. Google cẩn trọng với các liên kết được tạo tự động khi người dùng nhúng “widget”(*) trên trang của họ.

(*): Widget thường là ứng dụng của bên thứ ba được nhúng vào trang web của chủ sở hữu, và các liên kết trên widget có thể không nằm trong tầm kiểm soát của chủ trang web mà loại thuộc quyền của người phát triển widget, do vậy nó có thể bị lạm dụng vào việc spam liên kết.

200. Các liên kết từ cùng địa chỉ IP lớp C: Nhận được một lượng liên kết không tự nhiên từ các website trên cùng địa chỉ IP có thể giúp Google xác định rằng liên kết của bạn đến từ một mạng lưới blog.

201. Văn bản neo “độc hại”: Việc có các văn bản neo “độc hại” (đặc biệt là các từ khóa liên quan đến dược phẩm) trỏ đến website của bạn có thể là tín hiệu cho thấy website là dạng spam hoặc đã bị hack. Dù thế nào, nó đều có thể gây tổn hại cho thứ hạng của bạn.

202. Các liên kết tăng đột biến không tự nhiên: Năm 2013, bằng sáng chế của Google mô tả cách Google có thể xác định liệu một dòng liên kết tới một trang có phải là hợp lệ hay không. Những liên kết không tự nhiên này có thể bị làm giảm giá trị.

203. Liên kết từ các bài báo và thông cáo báo chí: Các bài báo và thông cáo báo chí bị lạm dụng đến mức mà Google giờ xem xét hai chiến lược xây dựng liên kết này là “mưu đồ liên kết” trong rất nhiều trường hợp.

204. Thao tác thủ công: Có một số kiểu khác nhau, nhưng hầu hết liên quan đến xây dựng liên kết kiểu mũ đen (black hat).

205. Bán liên kết: Nếu bạn bán liên kết, điều đó có thể ảnh hưởng xấu đến khả năng hiển thị trên máy tìm kiếm.

206. Google Sandbox: Các website mới bỗng dưng nhận được nhiều liên kết trỏ đến đôi khi sẽ bị đưa vào Google Sandbox, cái này sẽ giới hạn khả năng được hiển thị trên tìm kiếm.

207. Google Dance: Google Dance có thể tạm thời làm đảo lộn thứ hạng. Theo một bằng sáng chế của Google, điều này là cách họ sử dụng để xác định liệu một trang có đang cố gắng thao túng thuật toán hay không.

208. Công cụ Disavow: Sử dụng công cụ Disavow có thể giúp loại bỏ trừng phạt từ thuật toán hoặc theo cách thủ công cho các trang là nạn nhân của SEO tiêu cực.

209. Yêu cầu xem xét lại: Yêu cầu xem xét lại thành công có thể giúp website gỡ bỏ được hình phạt từ Google.

210. Âm mưu liên kết tạm thời: Google còn phạt những người tạo – và nhanh chóng xóa – các liên kết spam. Còn được biết đến với tên gọi âm mưu liên kết tạm thời.


Kết luận

Một danh sách khá dài đúng không ạ.

Dưới đây là tóm tắt các yếu tố xếp hạng quan trọng nhất trên Google:

  • Tên miền giới thiệu
  • Tỷ lệ click tự nhiên
  • Thẩm quyền của tên miền
  • Tính khả dụng trên thiết bị di động
  • Dwell time
  • Tổng số lượng backlink
  • Chất lượng nội dung
  • SEO onpage

Giờ tôi muốn đọc bình luận của các bạn.

Yếu tố xếp hạng SEO nào trong danh sách này là mới đối với bạn?

Hoặc tôi có quên mất thông tin quan trọng nào không.

Hãy để lại bình luận ở phía bên dưới nhé. Xin chào và hẹn gặp lại.

(Dịch từ bài viết Google’s 200 Ranking Factors: The Complete List của Brian Dean, website Backlinko)

Back to Top