PageRank là gì và tại sao nó vẫn quan trọng trong SEO

bởi Nguyễn Đức Anh
Google PageRank là gì

Nếu bạn làm SEO một thời gian rồi thì chắc bạn vẫn còn nhớ thanh công cụ màu xanh của Google PageRank.

Nó trông giống như thế này:

Thanh công cụ của Google PageRank

Nguồn ảnh: Search Engine Land

Nó hiển thị giá trị Google PageRank của từng trang bạn ghé thăm dựa trên một thang đo logarit có giá trị từ 0 đến 10.

Google chính thức tuyên bố ngừng hỗ trợ thanh công cụ PageRank trong năm 2016, nhưng trong khoảng thời gian dài nhiều năm trước đó họ cũng đã ngừng cập nhật cho nó rồi. Vì lý do này, một số người làm SEO cho rằng PageRank đã lỗi thời (outdated) và đây là chỉ số không có ý nghĩa (irrelevant metric) trong lĩnh vực SEO hiện đại ngày nay.

Nhưng sự thật thì: PageRank vẫn đóng vai trò quan trọng trong thuật toán xếp hạng (ranking algorithm) của Google.

Làm sao tôi biết được điều đó? Chính Google đã nói vậy.

Nhưng nội dung chia sẻ của tweet đó không phải là bằng chứng duy nhất tôi có. Cách đây một tháng, Gary Illyes là diễn giả trong một hội thảo ở Singapore mà tôi cũng tham dự. Trong bài nói đó, anh ấy nhắc lại với thính giả rằng PageRank vẫn đóng vai trò trong thuật toán của họ (Gary Illyes làm việc cho Google); điều khác chỉ là các chỉ số công khai (chẳng hạn như thanh công cụ PageRank) giờ không còn tồn tại nữa.

Mục đích của bài viết này bao gồm:

  1. Nói thẳng, nói thật về tầm quan trọng và mức độ liên quan của PageRank ở thời điểm hiện tại;
  2. Giải thích căn bản về công thức của PageRank;
  3. Thảo luận các chỉ số tương tự đang tồn tại, những cái có thể là sự thay thế thích hợp cho chỉ số PageRank.

Google PageRank là gì?

PageRank (PR) là công thức toán học dùng để đánh giá “giá trị của một trang / value of a page” bằng cách xem xét số lượngchất lượng của các trang khác trỏ đến nó (other pages that link to it). Mục tiêu của pagerank là xác định được tầm quan trọng tương đối của một trang cho trước trong hệ thống mạng (ví dụ thế giới web toàn cầu).

Co-founders (đồng sáng lập) của Google là Sergey BrinLarry Page phát minh ra PageRank vào năm 1997, nó là một phần trong dự án nghiên cứu tại đại học Stanford. Họ mô tả động lực của sáng tạo này như sau:

Mục tiêu chính của chúng tôi là cải thiện chất lượng của các máy tìm kiếm trên web

Điều đó đưa chúng ta đến điểm quan trọng: Máy tìm kiếm khi xưa không phải lúc nào cũng hoạt động hiệu quả như Google làm được ngày nay. Những máy tìm kiếm thời kỳ đầu như Yahoo và Altavista hoạt động không tốt chút nào. Mức độ liên quan của các kết quả tìm kiếm trả về không đáp ứng được nhiều so với kỳ vọng.

Đây là điều mà Sergey và Larry đã nói về tình hình các máy tìm kiếm thời đó trong tài liệu gốc phát minh của họ:

Bất kỳ ai đã từng sử dụng máy tìm kiếm trong khoảng thời gian gần đây đều có thể làm chứng rằng chỉ mục đầy đủ không phải là yếu tố duy nhất trong chất lượng của kết quả tìm kiếm. “Các kết quả rác” thường làm mọi người thất vọng.

PageRank hướng đến việc giải quyết vấn đề này bằng cách sử dụng “biểu đồ trích dẫn của thế giới web”, mà bộ đôi này mô tả là “một tài nguyên quan trọng mà phần lớn không được sử dụng trong các máy tìm kiếm hiện có”.

Ý tưởng được lấy từ cách các nhà khoa học đánh giá “tầm quan trọng” của các báo cáo khoa học. Đó là dựa vào số lượng các bài báo khoa học khác trích dẫn (referencing) chúng. Sergey và Larry đưa ý tưởng này vào áp dụng nó trong việc theo dõi các trích dẫn (liên kết) giữa các trang web.

Nó rất hiệu quả, và đã trở thành nền tảng của máy tìm kiếm mà chúng ta biết ngày nay với tên gọi Google, và thuật toán này hiện vẫn rất giá trị.

Cách Google PageRank làm việc?

Dưới đây là công thức PageRank đầy đủ (kèm giải thích) từ ấn bản gốc được công bố vào năm 1997:

Chúng tôi giả định trang A có các trang từ T1 đến Tn trỏ đến nó (ví dụ, là các trích dẫn). Tham số d là hệ số giảm (damping factor), cái có giá trị được thiết lập trong khoảng từ 0 đến 1. Chúng tôi thường để giá trị d là 0,85. Có thêm thông tin chi tiết về d trong phần kế. C(A) được định nghĩa là số lượng liên kết đi ra ngoài (link going out) trang A. PageRank của trang A có công thức như sau:

PR(A) = (1‑d) + d (PR(T1)/C(T1) + … + PR(Tn)/C(Tn))

Lưu ý rằng PageRank tạo thành phân phối xác suất trên các trang web, vì thế tổng PageRank của tất cả các trang web phải là một.

Bạn thấy rắc rối phải không? Hãy đơn giản hóa cho dễ hiểu hơn.

Google đưa vào ba yếu tố khi tính toán PageRank của một trang web, chúng là:

  • Số lượng và chất lượng của các liên kết trỏ đến (ví dụ T1, T2,…Tn)
  • Số lượng của các liên kết trỏ ra bên ngoài (ví dụ C(T1)) của từng liên kết trỏ đến (ví dụ của T1)
  • PageRank của từng liên kết trỏ đến (ví dụ PR(T1))

Như vậy một trang có PR cao khi:

  • Nó có nhiều liên kết trỏ đến (T1,..,Tn)
  • PR của các liên kết trỏ đến cao (PR(T1))
  • Bản thân các liên kết trỏ đến không có nhiều liên kết trỏ ra ngoài để sức mạnh nó truyền cho mỗi liên kết không bị phân tán quá nhiều

Giả sử trang C có hai liên kết: một từ trang A và một từ trang B. Trang A mạnh hơn trang B, và cũng có ít liên kết trỏ ra bên ngoài hơn trang B. Đưa thông tin này vào thuật toán PageRank, và bạn sẽ nhận được giá trị PageRank của trang C.

cách PageRank làm việc

Giá trị PageRank được chia đều dựa vào tổng số các liên kết trên trang

Hãy cùng giải thích tại sao trang C có PageRank = 2,5

Lý do là vì trang C có trang A và trang B truyền giá trị cho, trong đó:

  • Trang A có PR = 4 và nó trỏ 2 liên kết ra bên ngoài (trong đó có một liên kết đến trang C), do vậy giá trị mà trang C nhận được từ trang A là 4/2 = 2
  • Tương tự trang B có PR = 2 và nó trỏ 4 liên kết ra bên ngoài (trong đó có một liên kết đến trang C), do vậy giá trị mà trang C nhận được từ trang B là 2/4 = 0,5

Tổng kết, trang C được truyền PR từ A và B, do vậy PR(C) = 2 + 0.5 = 2,5

Công thức PageRank cũng có cái gọi là “hệ số giảm / damping factor”, cái mô phỏng xác suất người dùng ngẫu nhiên tiếp tục click vào các liên kết họ duyệt trên web. Điều này được coi là giảm với mỗi lần click vào liên kết.

Hãy nghĩ về điều đó giống như thế này: Xác suất bạn click vào liên kết trong trang đầu tiên bạn ghé thăm có thể khá cao. Nhưng khả năng bạn click vào liên kết trên trang kế tiếp thì thấp hơn một chút, và cứ tiếp tục giảm dần như vậy.

Với suy nghĩ đó, tổng số “phiếu bầu” của một trang được nhân với “hệ số giảm” (thường được giả định là 0,85) với mỗi lần lặp của thuật toán PageRank.

Nếu trang BBC liên kết đến một trang thông qua bốn “bước nhảy liên kết/link-hops”, giá trị của liên kết sẽ được “giảm xuống” đến mức mà trang cuối cùng khó mà cảm nhận được lợi ích. Nhưng nếu chúng liên kết đến cùng trang đó chỉ thông qua hai link-hops, liên kết sẽ có được ảnh hưởng mạnh mẽ lên trang.

hệ số giảm PageRank

Lưu ý của biên tập viên

Bạn có thể tự hỏi:

Điều gì xảy ra khi chúng ta không biết PageRank của trang A hoặc trang B?

Điều đó cũng giống như hỏi câu sau đây:

Nếu Sergey đưa cho Larry một nửa số tiền của anh ấy, số tiền của Larry có sẽ là bao nhiêu?

Bạn không thể trả lời câu hỏi này vì thông tin quan trọng bị thiếu: Ngay lúc đầu, chúng ta không biết số tiền mà Sergey có.

Thí dụ trên là một so sánh thô thiển, đúng vậy, nhưng nó liên quan đến thuật toán PageRank, bởi vì để tính toán PageRank của tất cả các trang trong mạng lưới, điều đầu tiên bạn cần là phải biết được PageRank của ít nhất một trang nào đấy chứ, chẳng phải vậy sao?

Vậy Google làm thế nào để vượt qua được vấn đề này?

Dưới đây là một đoạn trích khác từ tài liệu gốc về PageRank:

PageRank hoặc PR(A) có thể được tính toán bằng cách sử dụng một thuật toán lặp đơn giản và tương ứng với hàm riêng của ma trận liên kết chuẩn hóa của web.

Rất khó hiểu đúng không, vì họ nói bằng ngôn ngữ quá chuyên môn (gobbledygook).

Về cơ bản, điều này có nghĩa là thuật toán của Google PageRank có thể tính toán PR của một trang mà không cần biết PageRank của các trang liên kết đến nó. Nguyên nhân là vì PageRank không thực sự là một “chỉ số” tuyệt đối, mà là một thước đo tương đối về chất lượng trang khi so sánh từng trang khác nhau trên hệ thống sơ đồ liên kết (ví dụ, web).

P/S: Bạn có thể đọc được nhiều ví dụ chi tiết về cách tính PageRank ở bài này.

Tại sao Google loại bỏ chỉ số PageRank công khai?

Phát ngôn viên của Google đã nói điều này trong năm 2016:

Khi internet và sự hiểu biết của chúng ta về internet phát triển ngày một tinh vi, chỉ số của thanh công cụ PageRank trở nên kém hữu dụng cho người dùng dưới dạng là một chỉ số cô lập đơn lẻ. Thông qua việc ngừng hiển thị PageRank trên thanh công cụ sẽ giúp người dùng và người quản trị web không bị bối rối, nhầm lẫn về tầm quan trọng của số liệu.

Nhưng gần như chắc chắn có một yếu tố khác góp phần vào quyết định này: liên kết spam.

Công bằng mà nói, người làm SEO đã bị ám ảnh từ lâu với PageRank như một chỉ số xếp hạng, có lẽ bởi vì thanh công cụ PageRank đưa ra thông số rất trực quan, theo nghĩa đen về giá trị xếp hạng của một trang web.

Không có một thông số trực quan nào như vậy dành cho bất kỳ một yếu tố xếp hạng nào khác, điều đó làm cho PageRank trông có vẻ như là một yếu tố quan trọng duy nhất. Hệ quả là, mọi người nhanh chóng sa vào việc mua và bán các liên kết có “PR cao”. Nó trở thành một ngành kinh doanh lớn và bây giờ vẫn vậy.

mua bán liên kết

Một số liên kết PR cao được bán trên Fiverr

Chính Google cũng từng nói rằng họ tiếc vì lỡ xuất bản chi tiết thuật toán PageRank, khiến nhiều kẻ xấu lợi dụng thao túng:

Việc ngăn chặn spam để giữ cho web an toàn và hữu ích là một thử thách hàng ngày. Mặc dù thực sự muốn minh bạch về cách hoạt động của Tìm kiếm, chúng tôi cũng phải cẩn thận để không tiết lộ quá nhiều chi tiết mà sẽ giúp người khác lợi dụng kết quả tìm kiếm của chúng tôi và làm suy giảm trải nghiệm cho mọi người. Chúng tôi đã học được bài học này nhờ một trải nghiệm không hề dễ chịu. Trong năm 1999, các nhà sáng lập Google đã xuất bản tài liệu đào tạo về PageRank, một đổi mới chủ chốt trong thuật toán của Google. Khi tài liệu đó được xuất bản, những kẻ xấu đã tìm cách lợi dụng Google bằng cách trả tiền cho nhau để có được liên kết.

Có lẽ bạn tự hỏi làm thế nào mà những người bán liên kết xây dựng được các liên kết có “PR cao” ngay từ lúc ban đầu? Thực ra có nhiều cách. Khoảng giữa thập kỷ đầu những năm 2000s, một trong những chiến thuật chính để kiếm PR cao là để lại bình luận trên blog.

Với Google, đây là một rắc rối lớn. Các liên kết lúc ban đầu là một chỉ tiêu đánh giá tốt về chất lượng trang bởi vì chúng đưa ra một cách tự nhiên (naturally) cho các trang xứng đáng (deserving pages). Các liên kết không tự nhiên (unnatural links) làm cho thuật toán của họ giảm công năng (hiệu quả) phân biệt được các trang chất lượng cao từ các trang chất lượng thấp.

Sự ra đời của “nofollow”

Vào năm 2005, Google cộng tác với các máy tìm kiếm quan trọng khác để giới thiệu, đưa ra thuộc tính “nofollow”. Điều này giúp giải quyết các bình luận spam, bằng cách cho phép người quản trị web ngăn không chuyển PageRank đến các liên kết cụ thể nào đấy (chẳng hạn bình luận trên blog).

Dưới đây là trích dẫn từ tuyên bố chính thức của Google khi giới thiệu “nofollow”:

Nếu bạn là blogger (hoặc là người đọc blog), có lẽ bạn đã quen thuộc với trải nghiệm khó chịu mà những người sở hữu website khác cố gắng có được thứ hạng cao hơn trên máy tìm kiếm bằng cách đẩy các bình luận chứa liên kết kiểu như “Ghé thăm trang bán điện thoại siêu giảm giá của chúng tôi”. Đây gọi là các bình luận spam, chúng tôi cũng không thích gì chúng cả, và chúng tôi vừa mới kiểm tra một thẻ mới để ngăn chặn nó. Kể từ bây giờ, khi Google thấy thuộc tính (rel=”nofollow”) ở trên các siêu liên kết, những liên kết này sẽ không nhận được bất kỳ “sức mạnh” nào để giúp nó có được thứ hạng cao hơn trên máy tìm kiếm của chúng tôi.

Ở thời điểm hiện tại, hầu hết các CMS (hệ quản trị nội dung cho website), theo mặc định đã để phần liên kết ở khu vực bình luận là “nofollow”.

Nhưng khi Google giải quyết được một vấn đề, thì một vấn đề khác vô tình lại trở nên tệ hơn.

Điều chỉnh dòng chảy PageRank

Công thức gốc của PageRank nói rằng PageRank được chia đều giữa các liên kết trỏ ra ngoài trên web. Vì thế nếu PageRank của một trang là y và trang đó có 10 liên kết trỏ ra bên ngoài, giá trị của PageRank chuyển cho mỗi liên kết là y/10.

Nhưng điều gì sẽ xảy ra nếu bạn thêm thuộc tính “nofollow” vào 9 trong 10 liên kết? Chắc chắn nó sẽ ngừng chuyển PageRank cho chín trang kia, để lại giá trị PageRank đầy đủ chuyển cho chỉ một liên kết trên trang đúng không?

không chuyển PageRank có liên kết nofollow

Trang bên trái có 3 dofollow, trang bên phải chỉ có 2 dofollow và 1 nofollow. Tính trên trung bình, PR truyền cho mỗi liên kết bên phải sẽ nhiều hơn PR truyền cho mỗi liên kết bên trái. Lý do là vì bên phải có 1 liên kết không phải truyền PR

Ban đầu, những người quản trị web thêm thuộc tính “nofollow” vào các trang mà họ cho là ít quan trọng (ví dụ các liên kết trỏ ra bên ngoài, vân vân). Điều đó cho phép họ chủ động trong việc “điều chỉnh dòng chảy” PageRank xung quanh trang của họ.

Lấy ví dụ, nếu họ có trang với PageRank là 7 (theo điểm số PR công khai trên thanh công cụ), và họ muốn đẩy “sức mạnh” cho trang cụ thể này, họ chỉ việc liên kết tới trang này từ một trang có PR cao và “nofollow” tất cả những liên kết khác trên trang PR cao đấy. Bằng cách đó, lượng PageRank tối đa sẽ được chuyển cho các trang mà họ chọn.

Google thay đổi điều này vào năm 2009. Đây là trích dẫn từ blog của Matt Cutt về vấn đề này:

Điều gì xảy ra khi bạn có trang với “điểm số PageRank là 10” và có mười liên kết trỏ ra ngoài trên trang, trong đó có năm liên kết là nofollow?… Ban đầu, năm link không bị gắn thẻ nofollow sẽ nhận được 2 điểm PageRank cho mỗi cái (10/5)… Tuy nhiên hơn một năm trước, Google đã thay đổi cách PageRank chuyển sức mạnh cho các liên kết không bị gắn thẻ nofollow, theo đó, mỗi cái sẽ chỉ nhận được 1 điểm PageRank (tức là sẽ không được nhận thêm điểm từ các trang nofollow).

Dưới đây là minh họa cho sự khác biệt đó:

PageRank không tăng

Ngày xưa, những trang không bị gắn nofollow sẽ được nhận thêm giá trị do các trang trỏ ra bên ngoài khác bị gắn nofollow. Hiện tại thì không, nó sẽ không nhận thêm sức mạnh nào cả, mọi thứ vẫn bị chia đều ra

Chúng tôi không rõ liệu đây có còn là công thức toán học cho các liên kết “nofollow” nữa hay không. Google đã thực hiện thay đổi này cách đây 9 năm rồi. Mọi thứ có thể thay đổi từ thời điểm đó. Có thể có những yếu tố khác (chẳng hạn như vị trí của liên kết trên trang) giờ cũng sẽ ảnh hưởng đến mức độ giá trị mà liên kết nhận được.

Nhưng điều mà chúng tôi chắc chắn là việc bổ sung thêm các thẻ “nofollow” cho một số liên kết sẽ không làm đẩy thêm “sức mạnh liên kết” cho các liên kết còn lại trên trang.

Google dần dần vượt qua điểm số PageRank công khai

Một thời gian ngắn sau khi thực hiện thay đổi liên quan đến việc PR được chuyển qua lại giữa cái gọi là “dofollow” và “nofollow” trên trang, Google đã thực hiện việc loại bỏ dữ liệu PageRank trên công cụ quản trị web.

Sau đó, vào năm 2014, sự hỗ trợ cho chỉ số công khai PageRank bị giáng thêm một đòn khác khi John Mueller, một thành viên của Google tuyên bố rằng mọi người nên ngừng việc sử dụng PageRank vì nó sẽ không được cập nhật nữa.

Tôi không sử dụng PageRank hoặc các liên kết như một chỉ số. Chúng tôi cập nhật lần cuối PageRank cách đây hơn 1 năm (như tôi nhớ) và không có kế hoặc cập nhật thêm nó nữa. Hãy nghĩ về điều gì mà bạn muốn người dùng làm trên trang, và xem xét số liệu thích hợp cho điều đó.

Trong năm 2016, thanh công cụ PageRank đã chính thức bị loại bỏ khỏi tình duyệt.

Điều này làm cho việc mua và bán “các liên kết có PR cao” trở nên khó khăn hơn vì không có cách nào biết được giá trị PageRank “thực sự” của một trang web là bao nhiêu.

Liệu có chỉ số thay thế nào phù hợp cho điểm số PageRank công khai không?

Không có bản sao chính xác hoàn toàn với PageRank tồn tại.

Nhưng có một vài chỉ số tương tự, một trong số đó là chỉ số URL Rating (UR) của công cụ SEO thương mại Ahrefs.

Lưu ý: Moz và Majestic cũng có một số chỉ số độc quyền có cách thức hoạt động tương tự như PageRank. Bạn cứ kiểm tra thoải mái các tài liệu trên những website này để tìm hiểu thêm. Trong bài viết này, chúng tôi sẽ chỉ nói về UR của Ahrefs vì đó là chỉ số mà chúng tôi hiểu đầy đủ và chính xác nhất.

URL Rating là gì?

URL Rating của Ahrefs (UR) là một chỉ số hiển thị mức độ mạnh của hồ sơ backlink của một URL cụ thể và được đo trong khoảng giá trị từ 1 đến 100.

Làm thế nào bạn biết được URL Rating của một trang? Đơn giản chỉ cần đưa nó vào Site Explorer.

chỉ số UR của Ahrefs

Hoặc sử dụng SEO toolbar của Ahrefs.

công cụ SEO toolbar của Ahrefs

URL Rating (UR) tương tự như thế nào so với PageRank?

Chúng tôi muốn minh bạch (transparent), vì thế điều quan trọng cần phải lưu ý là trong khi chúng tôi tính toán URL Rating (UR) theo cách tương tự với phiên bản gốc của Google PageRank, chúng vẫn không giống nhau hoàn toàn. Không ai ngoài Google biết được công thức thực sự của PageRank hiện đã được phát triển như thế nào sau nhiều năm.

Nhưng chúng tôi biết rằng URL Rating (UR) có khả năng so sánh được (comparable) với công thức PageRank gốc của Google nhờ một số cách sau:

  • Chúng tôi tính toán số lượng liên kết giữa các trang;
  • Chúng tôi tôn trọng thuộc tính “nofollow”;
  • Chúng tôi cũng có hệ số giảm “damping factor”;
  • Chúng tôi thu thập lượng dữ liệu khổng lồ (đây là thành phần cực kỳ quan trọng khi muốn tính toán chính xác các chỉ số dựa vào liên kết)

Cần nhớ đây là cách URL Rating so sánh với công thức gốc của PageRank. Google gần như chắc chắn đã sửa đi sửa lại và cải tiến công thức của họ trong suốt hơn hai thập kỷ qua sau khi thành lập.

Làm sao chúng tôi biết được điều đó? À vâng, điều đầu tiên thì đó là một giả thuyết hợp lý. Chúng tôi biết Google không đứng im một chỗ suốt thời gian này bởi vì các kết quả tìm kiếm của họ được đánh giá là tốt nhất so với bất kỳ công cụ tìm kiếm nào khác.

Dưới đây là trích dẫn câu nói từ Matt Cutts, từ một bài đăng vào năm 2009 về vấn đề điều chỉnh dòng chảy PageRank (sculpting):

Thậm chí khi tôi gia nhập công ty vào năm 2000, Google đã thực hiện nhiều tính toán tinh vi hơn so với khi bạn quan sát được từ tài liệu cổ điển về PageRank. Nếu bạn cho rằng Google đã ngừng đổi mới trong việc phân tích liên kết thì đó là giả định sai. Mặc dù chúng tôi vẫn gọi nó là PageRank, khả năng tính toán mạnh có tiếng của Google dựa trên các liên kết đã được nâng cao đáng kể qua nhiều năm.

URL Rating khác Google PageRank như thế nào?

Google đã nộp nhiều bằng sáng chế trong các năm qua, chúng đều có thể truy cập công khai. Nhưng không có một ai, kể các Bill Slawski, biết được các yếu tố nào hiện đang tồn tại trong thuật toán hoặc trọng số của từng cái.

Chỉ riêng thực tế này làm cho chúng ta rất khó biết được cách URL Rating (UR) khác biệt so với phiên bản hiện tại của Google PageRank như thế nào, bởi vì chúng ta không biết được đầy đủ (và chính xác) cách Google đánh giá giá trị liên kết ở thời điểm hiện tại.

Ngay cả khi nói đến những điều dường như cơ bản, chẳng hạn như cách các liên kết được đếm, những thứ không rõ ràng như bạn giả định đâu. Để minh họa, bạn hãy nhìn vào bức hình sau:

tại sao liên kết lại khó khăn

Đây là một bài kiếm tra tuyệt vời khi phỏng vấn SEO.

Trình thu thập dữ liệu (cawler) của Ahrefs sẽ đếm ra tám liên kết trỏ tới trang B, nhưng không phải mọi trình thu thập dữ liệu khác cũng làm việc tương tự theo cách này.

Chúng tôi không có bất cứ đầu mối nào cho thấy cách Google tính toán chúng.

Hơn nữa, số lượng liên kết thực tế chỉ là một phần của phương trình. Khi bạn bắt đầu tính toán mỗi liên kết có giá trị bao nhiêu, mức độ phức tạp đạt đến một cấp độ hoàn toàn mới.

Dưới đây là một số câu hỏi khác mà chúng tôi cũng không biết trả lời thế nào:

1. Việc chuyển PageRank có thay đổi tùy thuộc vào vị trí của liên kết trên trang không?

Bằng sáng chế lướt hợp lý (reasonable surfer patent) của Google chỉ ra rằng điều này có thể chính xác.

Cụ thể thì nó cho rằng liên kết ở vị trí cao hơn trong tài liệu có thể truyền nhiều PageRank hơn các vị trí thấp hơn bên dưới. Tương tự với các liên kết ở sidebar và các liên kết ở nội dung chính.

vị trí liên kết và pagerank

  • A: liên kết ở vị trí đầu của nội dung
  • B: liên kết ở phần giữa của nội dung
  • C: liên kết gần vị trí cuối của nội dung
  • D: liên kết nằm trong sidebar (cột phải, hoặc trái)
  • E: liên kết ở footer (chân trang)

Bill Slawski liệt kê một số thuộc tính khác mà Google có thể sử dụng để đánh giá tầm quan trọng của liên kết trong bài phân tích này.

2. Liệu liên kết nội bộ (internal link) có truyền PageRank giống như cách liên kết trỏ ra bên ngoài thực hiện không (external link)?

Bằng sáng chế về lướt hợp lý của Google cũng đưa ra một số chỉ dẫn có thể thích hợp trong trường hợp này.

Dù vậy thì không có câu trả lời dứt khoát cho câu hỏi này. Chỉ vì vấn đề được đưa ra trong bằng sáng chế của Google không có nghĩa là nó hiện đang được đưa vào thuật toán thực tế. Google đã nộp rất nhiều bằng sáng chế trong những năm qua.

3. Có phải liên kết đầu tiên từ website chuyển nhiều giá trị hơn so với các liên kết tiếp theo cũng từ website đó hay không?

Bill Slawski tuyên bố rằng các liên kết tiếp theo từ cùng một website “có thể bị bỏ qua khi điểm số cho các trang được tính toán”.

Chúng tôi cũng phát hiện ra một sự tương quan tích cực giữa số lượng tên miền duy nhất trỏ về và lưu lượng truy cập tự nhiên khi chúng tôi phân tích gần 1 TỶ trang web.

lưu lượng truy cập và số lượng tên miền duy nhất trỏ về

4…

Thành thực mà nói, chúng ta có thể liệt kê những điều chưa rõ ràng như thế này cả ngày cũng không hết. (Nếu bạn thích, bạn có thể tham khảo bài viết này của Moz về các lý do tại sao các liên kết lại không giống nhau).

Bạn có nên sử dụng URL Rating như công cụ thay thế PageRank?

URL Rating là một chỉ số thay thế tốt cho PageRank vì nó có nhiều điểm chung với công thức gốc của PageRank.

Dù vậy thì nó không phải là thuốc chữa bách bệnh. Chúng tôi biết sự thật rằng URL Rating không tính đến nhiều yếu tố như mô hình hiện đại của Google PageRank.

Vì thế, lời khuyên của chúng tôi là bạn sử dụng nó nhưng đừng dựa vào nó hoàn toàn. Luôn đánh giá liên kết nhắm đến theo cách thủ công (nghĩa là bạn cần ghé thăm trang thực sự) trước khi theo đuổi một liên kết.

Làm thế nào để giữ gìn và đẩy mạnh PageRank của bạn

Trước khi tôi bắt đầu phần này, tôi muốn nhấn mạnh một điểm quan trọng:

Phần này KHÔNG phải là câu chuyện về tối ưu hóa PageRank hoặc URL Rating (UR). Cách nghĩ đó thường dẫn đến các quyết định yếu kém. Nhiệm vụ thực sự là để đảm bảo bạn không làm mất hoặc lãng phí PageRank trên website của bạn.

Để làm điều đó, có ba phần chính mà chúng ta cần phải tập trung:

  1. Liên kết nội bộ: Cách bạn liên kết các trang với nhau trên website của bạn ảnh hưởng đến “tính thẩm quyền” hoặc “link juice” trên trang.
  2. Liên kết đến trang bên ngoài: Cả URL Rating và PageRank đều chia sẻ hiệu quả tính thẩm quyền giữa tất cả các liên kết ngoài trên trang. Nhưng điều đó không có nghĩa là chúng ta phải xóa hoặc để “nofollow” tất cả các liên kết bên ngoài. (Hãy đọc tiếp để biết rõ hơn).
  3. Backlink: Backlink đem đến cái gọi là “link juice” cho trang web của bạn, vì thế bạn cần phải giữ gìn nó cẩn thận.

Hãy xem xét cụ thể từng cái.

Liên kết nội bộ

Backlink không phải lúc nào cũng trong tầm kiểm soát của bạn. Mọi người có thể liên kết đến bất cứ trang nào trên website của bạn mà họ thích, và họ có thể sử dụng bất cứ văn bản neo nào mà họ muốn.

Nhưng liên kết nội bộ thì lại khác. Bạn có quyền tự chủ hoàn toàn với chúng.

Lưu ý: Liên kết nội bộ là một chủ đề lớn đủ để chúng tôi viết một bài riêng…và thực sự thì chúng tôi đã cho ra đời bài về chủ đề này. Còn trong bài đang viết đây tôi sẽ nêu một số thực hành quan trọng nhất cho bạn:

1. Giữ nội dung quan trọng của bạn càng gần trang chủ càng tốt

Trang chủ của bạn gần như chắc chắn là trang mạnh nhất trên website.

Bạn không tin ư? Hãy thử làm như sau:

Site Explorer > nhập tên miền của bạn > Best by Links

các liên kết mạnh nhất trên trang

Tôi cá là trang chủ của bạn cũng đứng đầu trong danh sách này.

Điều này xảy ra trong phần lớn trường hợp vì hai lý do sau:

  1. Hầu hết các backlinks sẽ trỏ về trang chủ của bạn: Hãy nhìn vào cột số lượng các tên miền trỏ về trong báo cáo. Bạn sẽ thấy rằng số lượng các liên kết trỏ về trang chủ là cao nhất trong số tất cả các trang trên website của bạn.
  2. Hầu hết các trang trên website của bạn liên kết trở lại trang chủ: Điều này dễ thấy phải không, bạn có để ý logo website trên các bài viết của web Kiến càng? Nó được liên kết đến trang chủ. Và nó tồn tại trên tất cả các trang riêng lẻ thuộc website này. Hầu hết các website đều có cấu trúc tương tự.

Vì thế trang càng gần với trang chủ của bạn (trong thuật ngữ cấu trúc liên kết nội bộ), càng có nhiều “thẩm quyền” mà nó nhận được. Đó là lý do vì sao bạn cần để nội dung quan trọng càng gần trang chủ càng tốt.

Bạn có thể biết được mức độ xa cách từ trang chủ đến một trang cụ thể bằng cách chạy trình thu thập dữ liệu trong Site Audit tool. Bạn có thể xem video bên dưới để biết cách.

SEO Audit: How to Fix Your Website’s Technical SEO Issues (Tutorial)

Sau khi hoàn thành việc đó, hãy vào:

Site Audit > lựa chọn project > lựa chọn crawl > Data Explorer

độ sâu của trang

Nhìn vào cột “Depth”, cái sẽ nói cho bạn biết có bao nhiêu click một trang nào đó cách trang chủ (giả định rằng trang chủ là nơi bạn bắt đầu quét).

Bạn thậm chí có thể sắp xếp cột “Depth” theo thứ tự giảm dần để xem các trang có khoảng cách xa nhất tính từ trang chủ.

Nhưng có vấn đề này, bạn không thể liên kết đến mọi trang từ trang chủ của bạn đúng không?

Tin tốt là trang chủ của bạn không phải là trang có giá trị cao duy nhất trên website có khả năng chuyển thẩm quyền cho các trang khác. Nếu bạn đang tuyệt vọng trong chuyện gửi thêm “link juice” cho các trang cụ thể nào đấy, hãy làm như sau:

  1. Sử dụng báo cáo Best by links để tìm ra các trang có thẩm quyền cao nhất trên website của bạn;
  2. Liên kết đến trang mà bạn cố gắng muốn đẩy từ bất kỳ trang liên quan nào có UR cao

Lấy ví dụ, hãy xem báo cáo Best by link cho blog của Ahrefs, tôi thấy rằng bài viết về danh sách các mẹo SEO của chúng tôi có UR cao.

Sắp xếp theo UR từ cao xuống thấp

Tôi cũng biết rằng chúng tôi có đề cập đến PageRank trong bài viết này…

có đề cập đến pagerank trong bài viết

…vì thế đây là một trang có UR cao hoàn toàn phù hợp, từ đó chúng ta có thể liên kết đến chính bài đang viết đây (về PageRank).

2. Sửa các trang mồ côi

PageRank dịch chuyển trên trang thông qua các liên kết nội bộ và các liên kết trỏ ra bên ngoài. Điều đó có nghĩa là “link juice” chỉ có thể chảy đến một trang nếu nó thực sự được liên kết từ một hoặc nhiều trang trên website của bạn.

Nếu một trang không có bất kỳ liên kết nội bộ nào trỏ đến thì nó được gọi là trang mồ côi.

Nếu dùng WordPress, hãy sử dụng Yoast SEO, nó có công cụ thống kê số lượng liên kết nội bộ trỏ đến và trỏ đi. Bạn chỉ cần sắp xếp theo thứ tự tăng dần và tìm bất cứ bài viết nào có liên kết nội bộ trỏ đến là 0:

các bài viết không có liên kết nội bộ nào trỏ đến

Tôi từng viết khá nhiều bài viết về JS mà không có trang nào trỏ đến nó, cũng như nó chẳng liên kết đến trang nào (2 cột liên kết nội bộ trỏ đến và trỏ đi đều là 0)

Các liên kết ngoài

Nhiều người nghĩ rằng các liên kết ra các nguồn bên ngoài (ví dụ các trang trên website khác) sẽ làm tổn hại ít nhiều đến thứ hạng của họ.

Điều đó không đúng. Các liên kết trỏ ra bên ngoài không làm ảnh hưởng đến bạn, vì thế bạn không cần phải lo lắng về chuyện liên kết đến các trang khác. Chúng tôi thường liên kết đến các nguồn hữu ích (bên ngoài) từ blog của Ahrefs (trang Kiến càng cũng rất thường xuyên liên kết đến các nguồn bên ngoài), và lưu lượng truy cập của chúng tôi vẫn tăng đều đặn.

lưu lượng truy cập của Ahrefs

Đúng là nếu bạn có càng nhiều liên kết trên trang, thì sẽ càng có ít “sức mạnh” chuyển cho mỗi liên kết. Nhưng chúng tôi khá tự tin cho rằng, ở thời điểm hiện tại, việc tính toán giá trị cho từng liên kết trên trang không còn đơn giản như thập kỷ 90 của thế kỷ trước khi Google lần đầu đưa ra bằng sáng chế về PageRank.

Vì thế, trong khi bạn có thể tích trữ liên kết, và không liên kết đến bất kỳ ai, điều đó không có nghĩa là Google sẽ thưởng cho bạn cho hành động đó. Không liên kết đến bất kỳ nguồn bên ngoài nào dù sao đi nữa trông có vẻ khá mờ ám và dường như là có sự thao túng vậy (manipulative/thao tác thủ công), chúng ta biết rõ Google không ưa kiểu thực hành như vậy.

Điều quan trọng nhất là gì? Các liên kết trỏ ra bên ngoài tồn tại vì chúng có mục đích; chúng giúp người đọc mở rộng hành trình khám phá nội dung họ đang quan tâm. Vì thể, bạn cần liên kết đến các trang bên ngoài nếu nó có ích khi làm như thế.

Dưới đây là một số thực hành tốt nhất về liên kết ngoài mà bạn cần làm theo:

1. Đừng để liên kết ngoài là nofollow trừ khi bạn cần làm điều đó

Dưới đây là điều Google nói về các liên kết “nofollow”:

Nói chung chúng tôi không đi theo các liên kết đó. Điều đó có nghĩa là Google không chuyển PageRank hoặc văn bản neo cho các liên kết như vậy.

Một số website (chẳng hạn như Forbes, HuffPo, vân vân) để mặc định các liên kết trỏ ra bên ngoài là nofollow.

Đó có phải là cách làm tốt không? KHÔNG phải lúc nào cũng vậy.

Hầu hết những trang web này chọn thực hiện chính sách biên tập như vậy bởi vì một số người viết báo của họ đã bí mật bán các liên kết từ các bài viết của họ. Vì không muốn thúc đẩy các hành vi như vậy, đã có một lệnh cấm đối với các liên kết “dofollow” trỏ ra bên ngoài trang.

Nhưng rất có thể bạn không gặp vấn đề như vậy. Hy vọng là bạn đang chạy các website chất lượng và bất kỳ bài viết khách nào gửi lên cũng được kiểm tra kỹ càng. Trong trường hợp đó, bạn không cần để nofollow tất cả các liên kết trỏ ra bên ngoài của bạn. Đơn giản chỉ là không có ý nghĩa khi làm như vậy.

Vì thế bạn chỉ nên để các liên kết ngoài là nofollow khi:

  • Liên kết đến các trang vẫn còn nghi vấn (không hoàn toàn tin tưởng): Trong trường hợp này, bạn có thể muốn đặt câu hỏi rằng có nên liên kết đến nguồn thông tin này hay không;
  • Liên kết đến các trang “bài đăng được tài trợ/quảng cáo”: Các bài đăng được tài trợ là các bài được trả tiền, đây chính xác là cái mà thuộc tính nofollow nên được dùng.

2. Sửa các liên kết trỏ ra bên ngoài bị gãy

Các liên kết trỏ ra bên ngoài bị gãy ảnh hưởng tiêu cực đến trải nghiệm người dùng. Ví dụ dưới đây là điều xảy ra khi người đọc click vào một liên kết:

liên kết gãy

Những liên kết như thế làm lãng phí PageRank.

Hãy nghĩ về điều này: Liên kết gãy không có giá trị cho bất kỳ ai, nhưng nó làm loãng giá trị của các liên kết còn lại trên trang đó.

Bạn làm thế nào để sửa chúng? Điều đầu tiên bạn cần làm là tìm ra chúng.

Đọc bài viết này để biết cách tìm liên kết gãy.

Backlink

Backlink giúp đẩy PageRank của trang được liên kết. Lấy ví dụ, trang backlinko.com liên kết đến bài viết hướng dẫn về SEO onpage của chúng tôi và vì thế sẽ giúp đẩy PR của nó.

Nhưng như thảo luận bên trên, không phải tất cả backlink được tạo ra bằng nhau. Google nhìn vào hàng trăm yếu tố để xác định giá trị thực của một backlink.

Ở đây chúng ta sẽ nói về một vài mẹo hữu ích để có thể nhận được nhiều hiệu quả nhất từ backlink của bạn:

1. Tập trung vào việc xây dựng liên kết từ các trang có UR cao

PageRank chuyển dịch giữa các trang (pages), chứ không phải giứa các tên miền (domains).

Một liên kết từ trang có thẩm quyền cao (hight-authority) trên một website có thẩm quyền thấp (low-authority) sẽ có nhiều giá trị hơn so với một liên kết từ trang có thẩm quyền thấp trên một website có thẩm quyền cao (quy mô tên miền).

chọn trang có UR cao

Backlink đến từ website có thẩm quyền thấp có thể tốt hơn so với website có thẩm quyền cao

Vì thế khi đánh giá liên kết triển vọng trong Site Explorer, chúng tôi khuyến khích sắp xếp theo URL Rating (UR):

xếp hạng URL rating

Nếu bạn phát hiện bất cứ liên kết tiềm năng nào ở chỗ khác (chẳng hạn, thông qua Google scrape), sẽ có giá trị khi bạn đưa chúng vào công cụ Batch Analysis để kiểm tra URL rating của từng trang.

Lưu ý nhỏ. Bạn có thể sử dụng công cụ như URL Profiler để kéo URL Rating -- và các chỉ số khác của Ahrefs -- từ hàng ngàn trang thành một trang duy nhất.

2. Sửa các trang gãy làm phí phạm “link juice”

Backlink không chỉ làm tăng “tính thẩm quyền” của trang được trỏ tới, mà nó còn đẩy bất cứ liên kết nội bộ nào bên trong trang đó. Lý do là PageRank chảy từ trang này sang trang kia thông qua các liên kết nội bộ.

Nhưng nếu bạn có các backlink trỏ đến trang bị gãy thế thì bất kỳ “link juice” nào cũng bị lãng phí bởi vì nó không có nơi nào để chảy ra từ đó.

Do vậy, bạn cần sửa bất kỳ các liên kết gãy nào có backlink trỏ tới chúng. Bạn có thể tìm các trang như vậy bằng cách thêm bộ lọc “404 not found / không tìm thấy” với báo cáo Best by links.

Site Explorer > nhập tên miền của bạn > Best by links > add a 404 filter

trang bị lỗi 404

Điều này sẽ hiển thị tất cả các trang bị gãy trên website của bạn, cộng với số liên kết mà từng trang có.

Bạn có thể tìm hiểu thêm về cách tìm và sửa chữa liên kết gãy ở đây.

3. Đừng bị mù quáng bởi “tính thẩm quyền”; hãy để ý đến bối cảnh nữa

PageRank quan trọng, nhưng bối cảnh của liên kết cũng vậy.

Ý của tôi là gì? Tưởng tượng bạn đang có một blog nói về mèo, và bạn viết một bài đăng về chuyện con mèo của bạn làm xước ghế ngồi trên chiếc BMW tuyệt đẹp mới mua. Trong bài viết đó, bạn liên kết đến trang sản phẩm liên quan trên website chính thức của BMW. Liên kết này có phải là không liên quan chút nào vì nó đến từ blog về mèo không?

Không. Nó vẫn hoàn toàn hợp lệ (legit) và liên quan (relevant). Tuy nhiên, nó có thể có ít “giá trị” trong mắt Google so với một liên kết đến từ blog có tiếng tăm về ô tô, người viết một bài hoàn chỉnh về các mẫu BMW cụ thể.

Nhưng thành thật mà nói, trong trường hợp dưới đây, nếu phải chọn một trong hai trang để làm backlink cho từ khóa liên quan đến BMW hẳn tôi sẽ rất đắn đo đấy:

khó chọn trang

P/S: hai trang này không có thực, tôi chỉ tưởng tượng ra để làm ví dụ cho các bạn.

Vài suy nghĩ cuối

Hầu hết người làm SEO không bao giờ nghĩ về PageRank của Google vì những lý do rõ ràng: cho rằng nó đã cũ, và không có cách nào để thấy được chỉ số PageRank cho bất kỳ trang nào nữa, ngay cả khi bạn muốn.

Nhưng điều quan trọng cần nhớ là công thức PageRank vẫn là trái tim của nhiều thực hành SEO tốt nhất ở thời điểm hiện tại. Đó là lý do giải thích vì sao backlinks vẫn quan trọng, và đó là lý do vì sao người làm SEO chuyên nghiệp vẫn chú ý rất nhiều vào liên kết nội bộ.

Điều đó không có nghĩa là bạn nên bị ám ảnh, hoặc thậm chí thử cố gắng tối ưu hóa PageRank một cách trực tiếp. Bạn không nên làm vậy. Nhưng hãy hiểu rằng bất cứ khi nào bạn xây dựng liên kết, làm việc với cấu trúc liên kết nội bộ, hoặc kiểm tra cẩn thận các liên kết ngoài của bạn thì chúng đều là các hành vi tối ưu hóa gián tiếp cho PageRank.

(Lược dịch từ bài viết Google PageRank is NOT Dead: Why It Still Matters, tác giả Tim Soulo, website Ahrefs)

0 bình luận

Khu vực bình luận

avatar