10 minh họa về cách máy tìm kiếm đánh giá liên kết: Tất cả các liên kết không được tạo ra bình đẳng với nhau

bởi Nguyễn Đức Anh
liên kết rất quan trọng trọng SEO

Bên cạnh việc nghiên cứu từ khóa, thì xây dựng liên kết luôn là thứ ám ảnh người làm SEO. Chúng ra lúc nào cũng tò mò về cách máy tìm kiếm đánh giá liên kết như thế nào?

Vào năm 1997, người sáng lập Google tạo ra một thuật toán để xác định tầm quan trọng và phổ biến của trang (liên kết) dựa trên một số nguyên lý căn bản:

  • Liên kết trên trang web có thể được diễn giải như là một phiếu bầu bỏ cho nguồn mà nó nhắm đến
  • Tất cả các phiếu bầu, ở thời điểm ban đầu, đều được xem là ngang bằng nhau
  • Trong quá trình thực hiện thuật toán về biểu đồ liên kết, các trang nhận được nhiều phiếu bầu hơn được xem là quan trọng hơn
  • Các trang quan trọng hơn thì phiếu bầu mà họ bỏ (cho trang nào đó) cũng quan trọng hơn
  • Các phiếu bầu một trang có thể bỏ là một chức năng về tầm quan trọng của trang đó, được chia bởi số lượng phiếu bầu/liên kết mà nó nhận được

Thuật toán này, như nhiều người biết, đó là PageRank, và nó đã thay đổi quá trình tìm kiếm trên web, cung cấp giá trị to lớn cho những nỗ lực ban đầu của Google để trả về các kết quả chất lượng và liên quan. Khi kiến thức về PageRank trở nên phổ biến, những người quan tâm đến ảnh hưởng của thứ hạng tìm kiếm (người làm SEO) đã tìm ra các cách khai thác thông tin này để làm đòn bẩy cho trang web của họ.

Nhưng, Google không đứng yên một chỗ hoặc thỏa mãn với vầng hào quang của họ trong lãnh vực phân tích liên kết. Họ đổi mới, tận dụng các tín hiệu như văn bản neo, sự tin cậy, ổ thông tin và thẩm quyền, mô hình chủ đề và thậm chí là các hoạt động của con người để đánh giá mức độ quan trọng mà một liên kết có thể có. Tuy nhiên, không may là, nhiều người làm trong lĩnh vực SEO vẫn không nhận thức được những sự thay đổi đó và cách chúng ảnh hưởng đến việc tiếp thị bên ngoài (external marketing) và các thực hành tốt nhất về việc thu thập liên kết.

Trong bài viết này, tôi dạo qua 10 nguyên tắc về việc đánh giá liên kết có thể quan sát được, kiểm tra được, và trong một số trường hợp đã được cấp bằng sáng chế. Tôi muốn gửi lời cảm ơn đặc biệt đến Bill Slawski từ SEO By the Sea, người có bài đăng gần đây về Mô hình Lướt Hợp Lý của GoogleĐiều gì tạo ra một trang hạt giống tốt cho máy tìm kiếm quét? là chất xúc tác và nguồn dẫn cho bài đăng này.

Khi bạn đọc xong 10 vấn đề dưới đây, hãy lưu ý rằng chúng không phải là các quy tắc cứng nhắc. Với quan điểm của chúng tôi, các quy tắc này dựa trên kinh nghiệm, kiểm tra và quan sát, nhưng giống như mọi thứ khác trong SEO, đây chỉ là ý kiến. Chúng tôi chào đón và đặc biệt khuyến khích người đọc tự kiểm tra chúng. Không có điều gì tốt hơn cho việc học SEO bằng việc trải nghiệm thực tế.

#1 – Các liên kết ở vị trí cao hơn trong mã HTML nhận được phiếu bầu có giá trị hơn

liên kết ở vị trí cao hơn

Bất cứ khi nào chúng tôi (hoặc nhiều người làm SEO khác chúng tôi trò chuyện) thực hiện các kiểm tra các tính năng của trang hoặc liên kết trong môi trường được kiểm soát trên web, chúng tôi/họ phát hiện ra rằng các liên kết ở vị trí cao hơn trong code HTML của trang dường như chuyển nhiều giá trị hơn so với các liên kết ở dưới thấp. Điều này chắc chắn phù hợp với bằng sáng chế mới được cấp gần đây của Google – Xếp hạng tài liệu dựa trên hành vi của người dùng và/hoặc tính năng của dữ liệu, nó gợi ý một số thứ có thể được xem xét theo cách thức mà các đo lường về liên kết được truyền tải.

liên kết ở vị trí cao hơn trong văn bản HTML

#2 – Các liên kết ngoài có ảnh hưởng lớn hơn so với các liên kết nội bộ

liên kết ngoài quan trọng hơn liên kết nội bộ

Không có nhiều bất ngờ ở đây, nhưng nếu bạn nhớ lại, ý tưởng ban đầu của PageRank không đề cập đến sự khác biệt giữa liên kết nội bộ và liên kết ngoài. Có khả năng là các số liệu đo đạc được tạo ra (sau năm 1997) đã thưởng cho các các liên kết ngoài vượt lên trên các liên kết nội bộ. Bạn có thể thấy điều này trong dữ liệu tương quan mà chúng tôi đã thử nghiệm vài tuần trước, cho thấy các liên kết ngoài mozRank (“PageRank” gửi cho các trang bên ngoài) có mối tương quan cao hơn với thứ hạng so với mozRank tiêu chuẩn (PageRank):

tương quan thứ hạng giữa liên kết ngoài và liên kết nội bộ

Tôi không nghĩ là Google căng đến mức phải tính toán/phân tích PageRank liên kết ngoài và PageRank liên kết nội bộ riêng biệt hoặc có khả năng sử dụng chúng theo các cách khác nhau để đánh giá thứ hạng của trang.

#3 – Các liên kết đến từ tên miền mới quan trọng hơn các liên kết đến từ tên miền đã từng liên kết trước đây

sự đa dạng tên miền quan trọng hơn

Dựa trên dữ liệu tương quan, không một số liệu đơn lẻ và đơn giản nào có tương quan với thứ hạng trên Google (của một trang nào đó) tốt bằng số lượng các tên miền cụ thể có liên kết ngoài trỏ về trang đấy. Mối tương quan mạnh mẽ này cho thấy tính đa dạng đóng vai trò trong hệ thống xếp hạng và sẽ tốt hơn nếu bạn có 50 liên kết từ 50 tên miền khác nhau so với việc có hơn 500 liên kết từ trang web đã từng liên kết với bạn trước đây. Nếu bạn tò mò thêm, thì thuật toán PageRank nguyên gốc không cung cấp điều này, cái này có thể là một lý do giải thích số lượng liên kết rộng từ các tên miền có PageRank cao đã làm việc rất tốt trong những năm đầu Google ra mắt.

#4 – Những liên kết đến từ các tên miền – mà các tên miền này gần với nhóm hạt giống tin cậy hơn thì chuyển giá trị cao hơn

các tên miền gần với nhóm hạt giống tin cậy hơn

Chúng tôi từng có buổi nói chuyện trước đây về TrustRank trên SEOmoz và thường dẫn về nghiên cứu này của Yahoo – Chống lại Webspam với TrustRank. Dù vậy, Google chắc chắn cũng đã làm rất nhiều trên mặt trận này (như Bill đề cập ở đây) và đơn xin cấp bằng sáng chế này về việc lựa chọn các trang hạt giống (seed sites) đáng tin cậy nói lên rằng có một nhu cầu đang tăng lên và giá trị của phương pháp luận này. Chức năng điểm số mozTrust của Linkscape làm việc chính xác theo cách này, sử dụng thuật toán tương tự PageRank, theo đó có sự thiên vị với các liên kết từ các trang hạt giống tin cậy chứ không bình đẳng với nhau trên toàn bộ trang web.

#5 – Các liên kết đến từ “bên trong” trang nội dung duy nhất đem lại nhiều giá trị hơn so với các liên kết đến từ chân trang/cột phải/cột trái/thanh điều hướng

các liên kết bên trong nội dung quan trọng hơn các liên kết từ khu vực khác

Các tài liệu như Microsoft VIPS (Vision Based Page Segmentation – Tầm nhìn dựa trên phân trang), Xếp hạng tài liệu dựa trên khoảng cách ngữ nghĩa của Google, và bài viết gần đây Công cụ lướt hợp lý, tất cả đều gợi ý rằng việc đánh giá các liên kết từ nội dung quan trọng hơn so với các thanh sidebar (trái hoặc phải) hoặc chân trang có tác động tích cực trong việc tránh spam và thao túng. Là người quản trị web và làm SEO, chúng tôi có thể chứng nhận chắc chắn sự thật là rất nhiều liên kết trả tiền ở trong các khu vực bên ngoài của nội dung trang và việc có được liên kết không tự nhiên bên trong nội dung thì khó hơn nhiều.

#6 – Các từ khóa trong văn bản HTML đem lại giá trị nhiều hơn so với trong thuộc tính Alt của liên kết hình ảnh

liên kết văn bản thường quan trọng hơn thuộc tính ALT

Điều này không được đề cập trong bất cứ tài liệu hoặc bằng sáng chế nào (trong hiểu biết của tôi), nhưng kiểm tra của chúng tôi cho thấy (và các thử nghiệm của những người khác cũng ủng hộ điều này) rằng văn bản neo trong HTML bằng cách nào đó có giá trị hơn so với thuộc tính ALT trong liên kết hình ảnh. Điều này không có ý nói rằng chúng ta không nên thực hiện liên kết với hình ảnh hoặc thuộc tính ALT nữa. Nó chỉ có ý nói rằng chúng ta cần nhận biết rằng Google dường như có sự thiên vị này (có lẽ nó chỉ là tạm thời).

P/S: Hơi liên quan một chút, nhân tiện nói đến thẻ ALT, bạn nào quan tâm đến cách SEO ảnh thì đọc bài này nhé.

#7 – Các liên kết đến từ tên miền quan trọng hơn, phổ biến hơn, tin cậy hơn đem lại nhiều giá trị hơn (thậm chí khi nó đến từ các trang cụ thể ít quan trọng trong trang web đó)

các liên kết đến từ tên miền giá trị hơn thì đem lại lợi ích lớn hơn

Chúng ta dường như đều có kinh nghiệm này: cảm giác sai sai (sinking feeling) khi thấy đối thủ của mình có ít liên kết hơn cũng như trang liên kết tới họ không có vẻ mạnh mẽ nhưng cuối cùng lại xếp hạng cao hơn chúng ta. Điều này có thể được giải thích phần nào bởi giá trị của tên miền vượt qua giá trị thông qua một liên kết, giá trị của tên miền có thể không được phản ánh đầy đủ trong các chỉ số ở cấp độ trang riêng lẻ. Nó cũng giúp các máy tìm kiếm chống lại spam và nhìn chung cung cấp các kết quả đáng tin cậy hơn.

Chú thích: Tôi gặp khó khăn trong việc tìm kiếm các tài liệu/bằng sáng chế chứng mình cho kết luận trên; Tôi sẽ cố gắng xem lại và tìm chúng sớm.

#8 – Các liên kết bên trong thẻ noscript chuyển giá trị thấp hơn (và có thể là không có giá trị nào)

các liên kết bên trong thẻ <noscript>

Qua nhiều năm, hiện tượng này đã được báo cáo và gây tranh cãi nhiều lần. Kiểm tra của chúng tôi khẳng định chắc chắn là các liên kết trong thẻ <noscript> không chuyển giá trị nào, nhưng nó có thể không đúng trong một số trường hợp. Đó là lý do tạo sao chúng tôi có thể có khả năng lọc noscript trong Linkscape, nhưng số lượng các liên kết tổng thể trên web bên trong thẻ này là khá nhỏ.

#9 – Các liên kết mới gia tăng bùng nổ có thể làm cho một trang đánh bại đối thủ “mạnh hơn” trong tạm thời (hoặc mãi mãi)

các trang có liên kết gia tăng đột biến có thể đánh bại đối thủ mạnh hơn

Ngoài các thuật toán QDF (Query Deserves Freshness) của Google, cái có thể đánh giá các nội dung mới được tạo và liên kết tới gần đây cao hơn trong các tìm kiếm “xu hướng” nhất định, có vẻ như máy tìm kiếm cũng sử dụng các tín hiệu liên kết tạm thời xung quanh để kết hợp cả đánh giá các trang spam/thao túng và khen thưởng các trang kiếm được một số lượng lớn trích dẫn, tham khảo (backlink) trong một khoảng thời gian ngắn. Bằng sáng chế của Google về truy xuất thông tin dựa trên dữ liệu lịch sử lần đầu tiên đề xuất việc sử dụng dữ liệu tạm thời, nhưng mô hình này có thể được xem xét sửa đổi và tinh chỉnh từ thời điểm đó.

#10 – Các trang mà liên kết đến trang webspam có thể làm giảm giá trị các liên kết khác mà chúng trỏ đến

các liên kết spam làm giảm giá trị chuyển cho liên kết khác

Những người có nhiệm vụ quản trị web đã khôn ngoan cập nhật việc loại bỏ spam để tránh gây ra khả năng bị phạt xếp hạng từ Google (và có thể mất giá trị liên kết).


Nhưng về chỉ sổ “PageRank” cổ điển thì sao – con số mà chúng ta chỉ có hiểu biết nhỏ lấy từ các pixel màu xanh của thanh Google toolbar? Tôi thực sự đoán rằng trong khi nhiều (có thể là tất cả) các tính năng về liên kết thảo luận bên trên tạo ra cách thức của riêng chúng trong quá trình xếp hạng, PR vẫn không thay đổi quá nhiều từ ý tưởng nguyên gốc của nó. Chỉ là lý luận của riêng tôi thôi phải không? Không đâu, SEOmoz có chỉ số mozRank của riêng mình, cái có tương quan đáng kể với chỉ số PR và nó được tính toán rất giống với ý tưởng ban đầu về PageRank. Nếu tôi phải đoán (và tôi thực sự đang đoán), tôi sẽ nói rằng Google vẫn duy trì PR cổ điển bởi vì họ thấy nó là một khám phá hữu dụng đơn giản cho một số nhiệm vụ (có khả năng bao gồm cả việc ưu tiên thu thập dữ liệu/lập chỉ mục), và đã áp dụng nhiều chỉ số để phù hợp với nó bên trong thuật toán tổng thể.

Như mọi khi, chúng tôi mong đợi phản hồi của bạn và hy vọng một số bạn sẽ nhận lấy thử thách để kiếm tra những kết luận trên trên các trang web của bạn hoặc trong môi trường thử nghiệm và báo lại cho chúng tôi các phát hiện của mình nhé.

(Dịch từ bài viết All Links are Not Created Equal: 10 Illustrations on Search Engines’ Valuation of Links – Tác giả: Rand Fishkin – Website: MOZ)

0 bình luận