Google RankBrain là gì?

bởi Nguyễn Đức Anh
RankBrain - mục đích thực sự

Ngày Google xác nhận sự tồn tại của RankBrain: 26 tháng 10, 2015.

RankBrain là một bộ phận trong thuật toán lõi của Google, nó sử dụng máy học (khả năng máy móc tự dạy bản thân chúng từ dữ liệu nhập vào) để xác định các kết quả phù hợp nhất với truy vấn cho máy tìm kiếm.

Trước khi có RankBrain, Google sử dụng các thuật toán cơ bản của nó để xác định các kết quả hiển thị cho một truy vấn nào đó. Còn sau khi RankBrain được tích hợp vào, truy vấn giờ đây đi qua một mô hình giải thích – là cái áp dụng các yếu tố có thể như địa chỉ của người tìm kiếm, đặc tính cá nhân, và các từ trong truy vấn để xác định mục đích thực sự của người tìm kiếm. Bằng cách thấy rõ mục đích thực sự này, Google có thể trả về các kết quả chính xác hơn.

Khía cạnh máy học của RankBrain là điều khiến nó tách rời khỏi các bản cập nhật khác. Để “dạy” thuật toán RankBrain tạo ra được các kết quả tìm kiếm hữu ích, trước hết Google “nuôi” nó bằng các dữ liệu từ nhiều nguồn khác nhau. Sau đó thuật toán được tạo ra từ đó, tính toán và tự dạy bản thân nó qua thời gian để kết hợp nhiều tín hiệu với nhiều kết quả và để sắp xếp thứ hạng trên máy tìm kiếm dựa trên những tính toán này.

Hiểu thế nào về RankBrain

Để có khái niệm rõ ràng về RankBrain, bạn cần đặt mình vào vị trí của Google, hãy cố gắng hiểu mục đích của truy vấn tìm kiếm như thế này “Olympics location.” (từ location có nghĩa là vị trí, địa điểm).

Mục đích thực sự của tìm kiếm này là gì? Người tìm kiếm muốn biết về Thế vận hội Mùa đông hay Mùa hè? Liệu ý của họ là Thế vận hội vừa mới kết thúc hay là cái sẽ diễn ra bốn năm sau? Có phải người tìm kiếm tham dự Thế vận hội ngay lúc này, đang ngồi đâu đó ở khách sạn và tìm hướng đến địa điểm tổ chức khai mạc? Thậm chí là có thể họ đang tìm kiếm thông tin lịch sử về địa điểm tổ chức Thế vận hội đầu tiên ở Hy Lạp cổ đại?

Giờ, hãy tưởng tượng nỗ lực cần phải bỏ ra để trả lời câu hỏi này, tất cả những gì bạn có là các tín hiệu thuật toán đơn giản như chất lượng nội dung hoặc số lượng liên kết mà nội dung có được để xếp hạng kết quả cho người tìm kiếm.

Tưởng tượng Thế vận hội Mùa đông ở Sochi ở Nga vừa mới kết thúc tháng trước và trang web chính thức về Thế vận hội ở Sochi nhận được hàng triệu liên kết cho nội dung của nó từ các sự kiện trong quá khứ.

Nếu thuật toán của bạn đơn giản, nó có thể chỉ hiển thị các kết quả về Thế vận hội Sochi, bởi vì chúng kiếm được nhiều liên kết nhất…thậm chí ngay cả khi mong muốn thực sự của người tìm kiếm là biết được nơi tổ chức của Thế vận hội Mùa đông tiếp theo ở Pyeongchang, Hàn Quốc.

Trong tình huống phức tạp nhưng phổ biến đó, khả năng của RankBrain xuất hiện là điều thực sự cần thiết. Nhờ vào các kết quả tính toán toán học dựa trên các mẫu mà thuật toán máy học “nhận thấy” trong hành vi của người tìm kiếm mà Google có thể xác định được, lấy thí dụ, phần lớn người dùng sử dụng tìm kiếm từ khóa “Olympics location” muốn biết nơi Thế vận hội tiếp theo được tổ chức (có thể là Mùa hè hoặc Mùa đông). Vì thế, trong trường hợp này, câu trả lời của Google về Thế vận hội kế tiếp sẽ phục vụ được phần lớn nhu cầu của người tìm kiếm.

Trong khi câu trả lời trên có thể giải đáp mục đích ẩn đằng sau hầu hết các truy vấn “Olympics location”, có các ngoại lệ nổi bật mà Google cần phải giải quyết. Lấy thí dụ, nếu tìm kiếm được thực hiện bởi người dùng ở trong thành phố diễn ra Olympic (như Pyeongchang), thì Google có thể cung cấp các chỉ dẫn lái xe tới địa chỉ nơi lễ khai mạc được tổ chức. Nói cách khác, các tín hiệu như vị trí của người dùng và nội dung tươi mới phải được đưa vào tính toán để giải nghĩa mục đích và phân phối các kết quả phù hợp nhất để làm thỏa mãn người dùng.

*RankBrain là tiến trình công việc liên tục, với mục tiêu máy học của Google là hoàn thiện khả năng giải thích ý định của người tìm kiếm qua thời gian. Thật thú vị, câu truy vấn giả thuyết của chúng tôi, “Olympics location”, được thực hiện ở Hoa Kỳ vào Tháng 4 của năm 2007 đã trả về kết quả như thế này:

RankBrain

Có phải điều này cho thấy rằng Google tin rằng phần lớn người tìm kiếm truy vấn này vẫn thích thú với Thế vận hội mùa hè diễn ra ở Rio de Janeiro năm 2016 hơn là sự kiện kế tiếp Thế vận hội mùa đông Pyeongchang năm 2018? RankBrain có thành công, dựa trên các mẫu nó đã tính toán, hoặc là nó vẫn “trong quá trình làm việc,” điều này không chắc bởi sự mơ hồ của câu truy vấn, làm cho việc xác định trở nên khó khăn, chúng ta muốn thông tin cũ hơn – là câu trả lời phổ biến, hay cái mới hơn hướng tới tương lai? Và câu trả lời cho truy vấn này sẽ là gì nếu chúng ta thực hiện nó vào tháng 12 năm 2018? Liệu câu trả lời sẽ là về Pyeongchang bởi vì các tín hiệu xung quanh sự kiện này đã được tăng cường vào thời điểm đó?

Bởi vì mức độ và sắc thái của RankBrain ảnh hưởng lên cách thuật toán tìm kiếm lõi của Google làm việc vẫn chưa được tiết lộ đầy đủ, do vậy một trong những biện pháp tốt nhất để học hỏi thêm về cách RankBrain làm việc có thể đến từ việc quan sát câu trả lời của Google từ vô số truy vấn của bạn làm bạn hài lòng đến đâu. Nó có thường xuyên giải nghĩa chính xác được mục đích của bạn?

Có phải RankBrain sẽ thay đổi cách chúng ta làm SEO?

Tùy thuộc vào các kỹ năng SEO cá nhân của bạn tinh tế và hiện đại đến đâu, RankBrain có thể đại diện cho cả sự thay đổi nhỏ lẫn lớn trong lý thuyết cũng như thực hành SEO. Chuyên gia về bằng sáng chế được kính trọng Bill Slawski đưa ra ví dụ minh họa sau lý giải tại sao RankBrain là cần thiết trong môi trường tìm kiếm:

Đối với người cưỡi ngựa, con ngựa là con thú lớn có bốn chân, với thợ mộc, ngựa cũng có bốn chân nhưng nó không sống trên đồng cỏ và nhai cỏ khô, còn với vận động thể dục dụng cụ, ngựa là thiết bị dùng để tập luyện; với các vấn đề liên quan đến bối cảnh của RankBrain, và đảm bảo rằng bạn nắm bắt được bối cảnh đó có thể là chìa khóa để tối ưu hóa cho cách tiếp cận theo lối máy học này.

1. Các tín hiệu xếp hạng khác nhau được áp dụng cho các truy vấn khác nhau

Trước khi có RankBrain, việc đánh giá mức độ tối ưu trang web bằng cách xem xét tất cả các tín hiệu truyền thống (sự đa dạng liên kết, mức độ sâu sắc của nội dung, so khớp từ khóa, vân vân) có thể thích hợp. Sau khi có RankBrain, người làm SEO cần xác định kiểu nội dung phục vụ tốt nhất cho nhu cầu của người dùng.

Với những thứ kiểu như thông tin về một cơn bão đột ngột, bạn sẽ xem xét sự tươi mới hơn là các liên kết có thể đã tích lũy được. Còn đối với những thứ như lịch sử âm nhạc của người Mỹ bản địa, bạn sẽ dựa trên sự sâu sắc trong nội dung, và các chủ đề có thể liên quan đến lãnh vực của bạn, ví dụ như tín hiệu về thẩm quyền.

Chúng ta biết rằng các thuật toán máy học định hướng RankBrain để khớp các tín hiệu kèm với mục đích truy vấn, và người làm SEO cũng phải làm như vậy.

2. Các tín hiệu áp dụng cho mức độ uy tín trang web của bạn

Những người làm SEO hướng đến việc xây dựng uy tín thương hiệu dưới dạng một nguồn được tin tưởng bởi máy tìm kiếm và người dùng trong việc cung cấp một trải nghiệm cụ thể. Các lợi ích của việc gây dựng những thứ như uy tín có thể bao gồm thứ hạng tốt cho các từ khóa quan trọng nhất với bạn.

Liệu thương hiệu của bạn cần xây dựng uy tín của nó về mặt tươi mới, mức độ sâu sắc nội dung, sự đa dạng các liên kết có được, người dùng tương tác cao hay là các tín hiệu khác?

Câu trả lời tùy thuộc vào chủ để mà bạn muốn thực hiện (ví dụ như tỷ số của các sự kiện thể thao đang diễn ra và khóa học trực tuyến về học tiếng Tây Ban Nha). Các tìm kiếm bạn hy vọng thăng hạng là dành cho nhu cầu có được câu trả lời nhanh chóng và ngắn gọn hay là các khám phá sâu sắc?

Qua thời gian, tên miền của bạn phải xây dựng uy tín dựa trên các tín hiệu nó muốn phục vụ, nhận ra rằng RankBrain tạo ra một môi trường trong đó thương hiệu của bạn có thể trở nên nổi tiếng trong việc phân phối một kiểu nội dung cụ thể để làm hài lòng một nhu cầu cụ thể.

3. Một-từ-khóa-một-trang thực sự, thực sự là đã chết rồi

Có khả năng, bạn đã biết đến trong thực hành việc tạo một trang cho từ khóa “spatula”, một trang khác cho từ khóa “spatulas”, một trang khác nữa cho “kitchen spatula”, một trang khác tiếp cho “pancake turner”, và một cái tiếp cho “metal spatula” đây là công việc chán ngán cần phải kết thúc.

SEO hiện đại sẽ kết hợp tất cả những cụm từ này (và URL liên kết của chúng) vào một nội dung toàn diện duy nhất kết hợp với ngôn ngữ tự nhiên, bao gồm các biến thể của cụm từ khóa phản ánh cách con người tìm kiếm và nói chuyện.

Đây không phải là tin tức gì mới đối với những ai làm SEO tỉnh táo, nhưng sự xuất hiện của RankBrain làm nổi bật sự khôn ngoan của việc tập trung vào tất cả các ý tưởng từ khóa với nội dung toàn diện, hơn là bẻ nó ra làm nhiều trang để phục vụ cho các biến thể khác nhau của từ khóa.

Những thực tế khác về RankBrain

  • RankBrain được trích dẫn như là một phần của thuật toán tổng thể Google Hummingbird.
  • Trong năm 2015, Google tuyên bố rằng RankBrain đã được sử dụng để xử lý 15% truy vấn mà hệ thống chưa bao giờ gặp trước đây. Năm 2016, Google đã áp dụng RankBrain cho tất cả các truy vấn.

(Dịch từ bài viết What is Google RankBrain – Website: MOZ)

0 bình luận