Google Panda là gì? Thuật toán này giúp cải thiện chất lượng tìm kiếm như thế nào?

bởi Nguyễn Đức Anh
Google Panda là gì

Google Panda là gì?

Ngày phát hành lần đầu (initial release date): 23, tháng 2, năm 2011

Mục đích của cập nhật thuật toán Google Panda là thưởng cho các website chất lượng cao và làm giảm sự hiện diện của các website chất lượng thấp trong kết quả tìm kiếm tự nhiên của Google. Nó còn được biết đến với tên gọi ban đầu là “Farmer/Người nông dân”. Theo Google, triển khai lần đầu của Panda qua vài tháng đã ảnh hưởng đến 12 phần trăm các kết quả tìm kiếm bằng tiếng Anh. Chúng tôi (Moz) ghi nhận 28 lần cập nhật của Panda từ năm 2011 đến năm 2015.

Tại sao chúng ta cần Panda?

Cập nhật thuật toán Panda giúp giải quyết một số vấn đề trong trang kết quả tìm kiếm của Google, chẳng hạn như:

  • Nội dung sơ sài (thin content): Trang có nội dung ít liên quan hoặc bản thân nó không phải là nguồn hay nội dung thực chất, chẳng hạn một tập hợp trang mô tả các trạng thái sức khỏe khác nhau chỉ với vài câu trên mỗi trang.
  • Nội dung trùng lắp (duplicate content): Nội dung sao chép xuất hiện trên internet ở nhiều website. Vấn đề về nội dung trùng lắp cũng có thể xảy ra trên website của chính bạn khi bạn có nhiều trang có cùng nội dung hoặc chỉ khác nhau chút ít. Ví dụ, một công ty bán vợt cầu lông có thể tạo ra 10 trang, mỗi trang sẽ phục vụ cho việc kinh doanh ở từng thành phố, với nội dung gần như giống hệt nhau trên tất cả các trang và chỉ có tên thành phố là được thay thế (chẳng hạn, “Chúng tôi bán vợt cầu lông chất lượng cao ở Nam Định”, rồi “Chúng tôi bán vợt cầu lông chất lượng cao ở Đà Nẵng” ở một trang khác, và “Chúng tôi bán vợt cầu lông chất lượng cao ở Sài Gòn” trên trang kế tiếp).
  • Nội dung chất lượng thấp (low-quality content): Các trang cung cấp ít giá trị cho người đọc vì nó thiếu thông tin chuyên sâu.
  • Thiếu uy tín/sự tin cậy (authority/trustworthiness): Nội dung được tạo ra từ các nguồn không được xác minh. Một đại diện của Google tuyên bố rằng các website muốn tránh ảnh hưởng của Panda phải làm thế nào để được ghi nhận là có thẩm quyền trong lĩnh vực đó và sự tin cậy phải đạt đến mức độ mà người dùng có thể thoải mái cung cấp thông tin thẻ tín dụng.
  • Trang trại nội dung (content farming): Một số lượng lớn các trang chất lượng thấp, thường là tổng hợp từ nhiều website khác nhau. Lấy ví dụ, trang trại nội dung có thể là một website thuê một số lượng lớn người viết với mức lương bèo bọt để tạo ra các bài viết ngắn bao trùm đến một số lượng lớn truy vấn tìm kiếm, tạo ra nội dung thiếu uy tín và giá trị cho người đọc vì mục đích cốt lõi của nó chỉ đơn giản là giành được thứ hạng cao trên máy tìm kiếm cho càng nhiều thuật ngữ càng tốt.
  • Nội dung chất lượng thấp tạo bởi người dùng (UGC / User-Generatef Content): Một ví dụ của kiểu nội dung chất lượng thấp tạo bởi người dùng là một blog xuất bản các bài guest post là các bài viết ngắn với rất nhiều lỗi chính tả và ngữ pháp, cũng như việc thiếu thông tin thẩm quyền.
  • Tỷ lệ quảng cáo chiếm quá nhiều so với nội dung (hight ad-to-content ratio): Trang có bố cục được tạo ra chiếm phần nhiều bởi quảng cáo trả tiền, hơn nhiều so với nội dung gốc. (Xem thêm các kiểu quảng cáo bị người dùng ghét).quá nhiều quảng cáo làm trang có chất lượng thấp
  • Nội dung chất lượng thấp bao quanh các liên kết tiếp thị (affiliate links): Nội dung nghèo nàn bao quanh các liên kết trỏ đến các chương trình tiếp thị liên kết trả tiền.
  • Website bị block (chặn) bởi người dùng: Các website bị người dùng thực (con người) chặn trực tiếp trong kết quả tìm kiếm hoặc sử dụng tiện ích mở rộng của trình duyệt Chrome để làm điều đó, đây là dấu chỉ cho thấy chất lượng thấp.
  • Nội dung không trả lời được truy vấn tìm kiếm: Các trang mà “hứa” đem lại các câu trả lời liên quan khi được click từ kết quả tìm kiếm, nhưng rồi rút cuộc lại không làm được như thế. Lấy ví dụ, một trang web có thể có tiêu đề “Mã giảm giá 35% khi mua ở siêu thị điện máy bất kỳ ở Hà Nội”, nhưng khi click vào thì chẳng có mã giảm giá nào cả hoặc chỉ có một trang với đầy quảng cáo, điều đó sẽ khiến người dùng thất vọng.

Làm thế nào tôi biết được mình đang bị tác động bởi Panda?

Một tín hiệu giúp đoán được bạn đang bị hình phạt Panda đó là đột ngột bị tụt giảm lưu lượng truy cập tự nhiên hoặc thứ hạng trên máy tìm kiếm tương quan với ngày cập nhật thuật toán đã được công bố.

thống kê lưu lượng truy cập

Nếu thống kê cho thấy sự sụt giảm trùng khớp với ngày công bố cập nhật thuật toán

Tuy nhiên, điều quan trọng cần nhớ là có rất nhiều thứ có thể là nguyên nhân gây tụt hạng và giảm lưu lượng truy cập. Chúng bao gồm sự tăng trưởng đến từ đối thủ trong thị trường của bạn (để ý đến những người có thứ hạng tốt hơn bạn để xem có ai đó là đối thủ mới vượt lên trên bạn không), phạt thủ công (kiểm tra trong Googel Search Console để xem báo cáo này), nhu cầu tiêu dùng giảm theo mùa (ví dụ bình nước nóng lạnh vào tháng 7), hoặc thậm chí là một cập nhật hoàn toàn khác từ Google (ví dụ, Penguin thay vì Panda).

Khi một cập nhật đã biết, được đặt tên xuất hiện, điều quan trọng là nghiên cứu các tài liệu thực hành chuyên ngành được trích dẫn là liên quan đến cập nhật. Nếu thứ hạng hoặc lưu lượng truy cập sụt giảm tương ứng với khoảng thời gian đã biết, hãy xem bản liệt kê các thực hành có thể dẫn đến hình phạt để biết được liệu chúng có nằm ở đâu đó trên website của bạn hay không. Sau đó, nếu bạn tin rằng bạn tìm ra được mối tương quan giữa các thực hành khả nghi và một cập nhật nào đó, hãy hành động để khắc phục tình huống này.

Bị phạt bởi Panda, làm sao khắc phục được?

Trong lĩnh vực SEO, Panda thường được trích dẫn là cập nhật khó có thể khôi phục lại được. Dù vậy, vì trọng tâm của cập nhật Panda là chất lượng nội dung/website, nên các bước phục hồi nhìn chung là quay lại cải thiện chất lượng. Các biện pháp khắc phục bao gồm:

  • Từ bỏ các thực hành liên quan đến trang trại nội dung (tối ưu cho máy tìm kiếm nhưng chẳng quan tâm gì đến con người)
  • Chỉnh sửa nội dung website triệt để để cải thiện chất lượng, hữu ích, mức độ liên quan, tính tin cậy và thẩm quyền
  • Đánh giá lại tỷ lệ quảng cáo/nội dung và tiếp thị liên kết/nội dung để xem liệu trang có bị chi phối bởi quảng cáo hoặc các liên kết tiếp thị hay không
  • Đảm bảo rằng nội dung của trang khớp với truy vấn của người dùng
  • Loại bỏ hoặc chỉnh sửa triệt để nội dung trùng lắp
  • Kiểm tra và chỉnh sửa cẩn thận nội dung do người dùng tạo và đảm bảo nó là nguyên bản, không có lỗi, và hữu dụng cho người đọc
  • Sử dụng câu lệnh Robots noindex, nofollow để chặn chỉ mục nội dung trùng lắp (hoặc gần trùng lặp) trong website, hoặc các vấn đề khác.

Nói tóm lại, nếu website duy trì xuất bản nội dung chất lượng cao, nguyên bản thì không cần phải lo lắng gì về bản cập nhật này, nhưng nếu website của bạn có thực hiện một số thực hành có vấn đề, nó có thể bị tác động bởi Panda. Từ quan điểm thực tế cũng như kinh doanh, hy vọng tốt nhất của bạn để tránh Panda là phát triển thương hiệu để nó có khả năng được ghi nhận là có thẩm quyền trong lĩnh vực đó và xây dựng website trở thành nguồn thông tin đáng tin cậy nhờ chất lượng nội dung tuyệt vời mà nó tạo ra.

Một số lưu ý khác về cập nhật Panda

  • Panda ban đầu được đưa ra tách rời với thuật toán cốt lõi (core algorithm) nhưng sau đó nó đã được tích hợp vào trong thuật toán lõi vào tháng 3 năm 2012 (dù vẫn chưa được xác nhận).
  • Panda được đặt theo tên của nhân viên Google là Navneet Panda.

(Dịch từ bài viết What is Google Panda? – Website: Moz)

0 bình luận

Khu vực bình luận

avatar