Kiểm tra 2 giả thiết về tên miền có dấu gạch ngang trong nhóm top Alexa

Khi tìm hiểu về cách đặt tên miền hay, tôi nhận thấy tên miền có dấu gạch ngang dù không phải là kiểu tên miền đẹp nhưng lại khá phổ biến, ngay cả trong nhóm các trang web có lưu lượng truy cập cao nhất thế giới.

Rõ ràng việc chủ động thêm dấu gạch ngang có nguyên nhân của nó, chẳng phải tự dưng mà người ta gây thêm phiền toái cho mình.

Có hai giả định về lý do có dấu gạch ngang:

  1. Tên miền liền mạch đã bị mua mất
  2. Tên miền nếu để liền sẽ khó đọc

Nhưng trước hết: Có đúng là tên miền có dấu gạch ngang phổ biến không?

Trong bài nói về đặc điểm tên miền .vn có lưu lượng truy cập cao, chúng tôi thống kê chỉ có khoảng 1,31% tên miền có dấu gạch ngang, tuy nhiên mẫu này rất nhỏ, toàn bộ data thống kê chỉ có 2598 tên miền.

Khi chúng tôi tiến hành thống kê trên mẫu hơn 15700 tên miền .vn thông thường thì kết quả cho thấy tên miền có dấu gạch ngang chiếm tỷ lệ 2,83%

Tiếp đến chúng tôi tìm hiểu tỉ lệ tên miền có dấu gạch ngang trong top 1 triệu Alexa (năm 2016), kết quả như sau (đã loại bỏ tên miền IDN có gạch ngang nhưng chỉ ở dạng mã hóa, không phải dạng hiển thị):

Nhóm Tỷ lệ tên miền có dấu gạch ngang
1 ngàn trang web đầu tiên 1,90%
10 ngàn trang web đầu tiên 4,05%
100 ngàn trang web đầu tiên 7,04%
1 triệu trang web đầu tiên 10,67%

Có sự tăng tiến rất rõ về tỷ lệ có dấu gạch ngang khi số lượng trang web tăng lên, mối tương quan được tính ra là 0,88. Và nhìn vào 1 triệu trang web có thứ hạng cao nhất thì thậm chí nói tên miền có gạch ngang là dạng phổ biến cũng chẳng hề sai.

Phần 1: Có phải tên miền liền mạch đã bị mua?

Giả thiết này để kiểm tra chính xác thì phải biết được lịch sử mua của tên miền viết liền (A) và lịch sử mua của tên miền có dấu gạch ngang (B). Nếu năm mua của tên miền viết liền (A) được mua sớm hơn năm mua của tên miền tương ứng có dấu gạch ngang (B) thì có khả năng giả thiết là đúng, còn không chứng tỏ người mua tên miền có dấu gạch ngang đã chủ động chọn vì một lý do nào đó (chẳng hạn để dễ đọc hơn).

Tuy nhiên nếu muốn thống kê được năm mua lần đầu của hàng ngàn tên miền rất tốn công sức nên trong tìm hiểu này tôi chỉ giới hạn là xem xem tên miền viết liền có còn khả năng mua hay không.

Vì kiểm tra số lượng lớn chỉ cho phép với một số đuôi quốc tế nên tôi chỉ khoanh vùng 3 đuôi .com, .net và .org.

Kết quả:

  • 4240 tên miền viết liền được kiểm tra (dạng viết liền tương ứng của tên miền có dấu gạch ngang)
  • Trong đó có 875 tên miền vẫn cho phép đăng ký

Vậy có thể nói một cách tương đối là có khoảng 20% tên miền viết liền vẫn đăng ký được nhưng chủ trang bỏ qua để chủ động đăng ký tên miền có dấu gạch ngang.

Phần 2: Tên miền nếu để liền sẽ khó đọc

Việc có dấu gạch ngang làm tách từ, dĩ nhiên sẽ dễ đọc hơn. Tên miền khó đọc vì viết liền mạch thường vì nó dài. Do vậy nếu giả thiết số 2 đúng thì chắc chắn tên miền có dấu gạch ngang sẽ phải dài hơn đáng kể (về số lượng ký tự) so với tên miền viết liền mạch.

Tuy nhiên để cho công bằng thì vì chính bản thân dấu gạch ngang làm tên miền dài hơn, nên trong thống kê, tôi sẽ cần trừ đi số dấu gạch ngang này, chẳng hạn nếu tên miền có dấu gạch ngang như này: duc-anh-plus.com, tên miền có 12 ký tự, nhưng tôi cần trừ đi 2 là số gạch ngang và còn 10 để so sánh.

So sánh số lượng ký tự trung bình của tên miền có dấu gạch ngang và không có dấu gạch ngang

Thí nghiệm được thực hiện với các tên miền trong nhóm 100 ngàn trang web đầu tiên theo Alexa.

Kết quả:

  • Số lượng ký tự trung bình của tên miền có dấu gạch ngang là: 10,485 (sau khi đã trừ đi dấu gạch ngang, tính cả gạch ngang là 11,579).
  • Số lượng ký tự trung bình của tên miền không có gạch ngang: 8,611

Như vậy tên miền có dấu gạch ngang trung bình dài hơn 21,7% so với tên miền không có dấu gạch ngang.

Sau khi thu thập đủ tên miền .vn cần thiết, chúng tôi đã thống kê đặc điểm có dấu gạch ngang ở nhóm tên miền quốc gia cấp cao nhất này của Việt Nam.

Leave a Comment