Một số phân tích về tên miền .vn

bởi Nguyễn Đức Anh
phân tích tên miền .vn

Tên miền .vn là tên miền quốc gia cấp cao nhất của Việt Nam. Hôm nay tôi sẽ phân tích một số đặc điểm của tên miền này như:

  • Số lượng ký tự trung bình
  • Tên miền có số
  • Tên miền có dấu gạch nối
  • Tên miền thường bắt đầu bằng ký tự nào
  • Tên miền thường kết thúc bằng ký tự nào
  • Vân vân

A. Phương pháp thu thập dữ liệu

Tên miền quốc gia .vn nói riêng và tên miền quốc gia cấp cao nhất nói chung không công khai Zone file giống như tên miền .com và .net, do vậy không có cách nào có được toàn bộ danh sách tên miền đã đăng ký. Chúng ta chỉ có thể khảo sát trên mẫu rồi suy ra kết quả rộng hơn.

Để có được danh sách mẫu tôi thu thập thông qua backlink. Các trang web thường liên kết qua lại với nhau, đặc biệt là những trang web có nhiều lượt truy cập hoặc nổi tiếng trong một lĩnh vực chuyên ngành cụ thể.

Sử dụng danh sách top 500 trang web có lưu lượng truy cập nhiều nhất Việt Nam theo Alexa (tương đối), tôi tìm xem những trang đó có bao nhiều backlink từ các trang web .vn và ngược lại (tôi chỉ dùng khoảng 150 trang có tiềm năng nhất trong số 500 trang trên – thường cũng là những trang đứng đầu). Ngoài ra tôi có kết hợp danh sách backlink của khoảng 50 trang .vn có số lượng backlink lớn nhất.

Thời gian thu thập vào tháng 1 năm 2018, kết quả có được tổng cộng 121.766 tên miền .vn

Số lượng tên miền .vn thực tế đã đăng ký theo VNNIC (trung tâm Internet Việt Nam) tính đến tháng 12 năm 2017 là 430.454 tên miền.

Vậy mẫu này bao phủ được 28,3% số lượng tên miền thực tế.

Ưu điểm cũng như nhược điểm của mẫu chúng tôi thu thập đó là danh sách này chỉ bao gồm các tên miền đã hoạt động (ít nhất là trong khoảng thời gian nào đó gần thời điểm khảo sát) chứ không phải là các tên miền đã đăng ký nhưng chưa đưa vào sử dụng, do vậy nó chắc chắn không phản ánh đầy đủ được toàn bộ danh sách tên miền đã đăng ký.

Danh sách tên miền chúng tôi thu thập được sẽ KHÔNG được công bố công khai, chúng tôi chỉ đưa ra các thống kê tóm lược từ toàn bộ danh sách đó mà thôi.

B. Một số thống kê

1. Phân bố chiều dài tên miền

phân phối độ dài tên miền .vn

Độ dài tên miền phổ biến nhất là 8 ký tự, tiếp đến là 7 và 9 ký tự. Độ dài trung bình của toàn bộ mẫu khảo sát là 9,92 ký tự, độ lệch chuẩn 4,34. Độ dài trung vị là 10 (có nghĩa là số lượng tên miền có nhiều hơn 10 ký tự bằng với số lượng tên miền có ít hơn 10 ký tự). Dưới đây là bảng tóm tắt:

.VN
Độ dài trung bình9,92
Độ dài trung vị10
Độ dài phổ biến nhất8

Để các con số trên có ý nghĩa hơn tôi đưa ra so sánh với kiểu đuôi tên miền khác, theo đó tên miền quốc tế .com (tính trên toàn bộ không gian tên miền đã đăng ký – nhờ Verisign công bố Zone file) có độ dài trung bình là 13,54. Độ dài phổ biến nhất và độ dài trung vị đều là 12. Các con số của tên miền .vn nhỏ hơn vì tên miền .vn còn rất nhiều không gian để đăng ký, trong khi tên miền .com chật chội hơn nhiều, các tên miền ngắn hầu như đã bị đăng ký hết, những người đến sau buộc phải chọn tên miền dài hơn, dẫn đến dần các con số trung bình lớn thêm.

Xét tiếp về độ dài thì:

  • Có 10% tên miền .vn trong mẫu có độ dài từ 16 ký tự đổ lên
  • Chỉ có 1,5% tên miền .vn trong mẫu có độ dài từ 21 ký tự đổ lên

Bảng bên dưới đây sẽ cho cái nhìn tổng quan hơn, trục tung là tỷ lệ %, trục hoành là số lượng ký tự tối thiểu tương ứng:

tỷ lệ tên miền .vn theo độ dài ký tự

Chẳng hạn nhìn vào cột số 6, với giá trị khoảng 81, có nghĩa là có khoảng 81% tên miền có từ 6 ký tự trở lên, cột số 10 với giá trị khoảng 50, nghĩa là có 50% tên miền có từ 10 ký tự trở lên. Vị trí cuối cùng: chỉ có 0,38% tên miền có từ 25 ký tự trở lên.

Một số kỷ lục về độ dài trong danh sách mẫu của chúng tôi bao gồm:

5buocdongiandecomoiquanhehoanhao.vn

kientanh-thientrithuc-kientanh.com.vn

nhathuocdongygiatruyentienhanh.com.vn

thcs-tonthatthuyet-vinhlinh-quangtri.edu.vn

congtycophandautudothivakhucongnghiepsongda7.vn

Tên miền dài nhất có 44 ký tự thuộc về tên miền cuối cùng. Chúng tôi thực hiện riêng một bài viết tìm hiểu về tên miền dài .vn ở đây.

2. Số và dấu gạch ngang

Trong một khảo sát tương tự dành cho tên miền .com đã dẫn ở trên người ta nhận thấy có khoảng 9% tên miền .com là có số (từ 0 đến 9). Với tên miền .vn trong mẫu này, chúng tôi thấy có 5770 tên miền có số, chiếm tỷ lệ 4,74%, tức là chỉ bằng 1/2 so với .com (ví dụ về tên miền có số: 24h.vn).

Về gạch ngang, có 11,8% tên miền .com có gạch ngang, còn tỷ lệ có dấu gạch ngang trong mẫu tên miền .vn mà chúng tôi thu thập được chỉ là 2,70%, tức là bằng chưa đến 1/4 so với .com (ví dụ về tên miền có gạch nối: hyundai-thanhcong.vn). Trong tìm hiểu về tên miền dài hơn 15 ký tự trong nhóm .vn này, chúng tôi thấy tỷ lệ có gạch nối tăng lên đột ngột đến gần 3 lần.

3. Các đuôi sử dụng

Bên dưới là số lượng và tỷ lệ các đuôi trong mẫu của chúng tôi:

69149.vn (56,79%)
38002.com.vn (31,20%)
8861.edu.vn (7,28%)
2296.net.vn (1,88%)
181.name.vn (0,15%)
1405.org.vn (1,15%)
1374.gov.vn (1,13%)
206.info.vn  (0,17%)
149.pro.vn (0,12%)
74.biz.vn (0,06%)
58.ac.vn (0,05%)
1.int.vn (0,0008%)
10.health.vn (0,008%)

Các con số này cũng khá tương đồng với thống kê của VNNIC về các tên miền đã đăng ký, nhất là ở 2 đuôi tên miền phổ biến nhất:

tỷ lệ sử dụng đuôi tên miền

Sự khác biệt lớn nhất thuộc về name.vn, 2 thống kê chênh nhau khoảng 10 lần, chúng tôi dự đoán do tên miền .name.vn được đăng ký nhiều (vì giá khá rẻ, chỉ 40 – 50 ngàn đồng cho 1 năm duy trì) nhưng hiện chưa được sử dụng nhiều (do vậy không có backlink và vì thế không xuất hiện trong dữ liệu mẫu của chúng tôi với tỷ lệ tương xứng).

4. Tên miền có dấu

Tên miền có dấu hay tên miền đa ngữ là kiểu tên miền mới với việc sử dụng bảng chữ cái tiếng Việt cùng với các dấu đi kèm, ví dụ như xưởng.vn

Thống kê của chúng tôi cho thấy, trong mẫu này chỉ có 1434 tên miền tiếng Việt, chiếm 1,18%

Thông tin phụ:

Hầu hết các thống kê trong bài này đều tính đến tên miền có dấu, một số thì không, và trong trường hợp đó tôi sẽ lưu ý và nêu lý do.

Tên miền có dấu ở Việt Nam có một thời gian khá dài cho phép đăng ký và duy trì miễn phí để kích thích nhu cầu. Hiện nay vẫn miễn phí đăng ký, nhưng có phí duy trì, tuy nhiên cũng rất rẻ – chỉ khoảng 50 ngàn đồng / năm.

Do ảnh hưởng của việc miễn phí, rất nhiều tên miền có dấu .vn vẫn chưa được đưa vào sử dụng (con số thống kê là 94%). Tuy nhiên ảnh hưởng này không tác động đến mẫu của chúng ta nhiều vì 2 nguyên do:

  • Tỷ lệ có dấu trong mẫu thu thập được rất nhỏ
  • Các tên miền có dấu trong mẫu đều ít nhất hoạt động trong một thời gian nào đó (vì là dạng backlink)

5. Ký tự bắt đầu trong tên miền

Trong thống kê này để đỡ phức tạp khung nhìn chúng tôi loại bỏ các tên miền bắt đầu với chữ cái nằm ngoài bảng latinh, thực tế thì số lượng của chúng cũng rất ít, chỉ 88 tên miền như vậy.

Dưới đây là biểu đồ thanh số lần ký tự đầu tiên trong tên miền xuất hiện:

ký tự bắt đầu trong tên miền .vn

Một số điểm dễ dàng rút ra:

  • Tên miền chủ yếu bắt đầu với chữ cái, số lượng tên miền bắt đầu là số theo tính toán của chúng tôi chiếm chưa tới 0,88% trong mẫu này.
  • 5 chữ cái có số lượng bắt đầu nhiều nhất là t, d, c, s, v
  • 5 chữ cái có số lượng bắt đầu ít nhất là z, j, y, u, w – có thể thấy 3 trong số chúng là z, j, w không có trong bảng chữ cái tiếng Việt (nhưng chúng vẫn tồn tại với số lượng đáng kể vì tên miền .vn rất chuộng tiếng Anh, ngoài ra tên miền có thể chứa bất cứ ký tự nào theo ý thích của người mua). Với y và u, đây cũng là những chữ cái không có nhiều từ trong bắt đầu trong tiếng Việt.

6. Ký tự cuối cùng trong tên miền

Cũng như ký tự bắt đầu trong tên miền, ở phần ký tự cuối cùng tôi cũng không tính các tên miền có ký tự cuối cùng không nằm trong bảng chữ cái latinh vì số lượng của chúng không đáng kể.

Dưới đây là biểu đồ thanh tương ứng:ký tự cuối cùng trong tên miền

Một số điểm dễ nhận ra:

  • Tên miền vẫn chủ yếu kết thúc là chữ cái thay vì số, nhưng so với ký tự bắt đầu, ký tự kết thúc là số nhiều hơn hẳn, theo thống kê của chúng tôi tỷ lệ là 2,38% – gần gấp 3 lần tên miền bắt đầu là số.
  • 5 chữ cái có số lượng là ký tự kết thúc nhiều nhất là n, g, e, t, a
  • 5 chữ cái có số lượng là ký tự kết thúc ít nhất là j, q, z, f, w – một lần nữa chúng ta thấy các ký tự không có trong bảng chữ cái tiếng Việt, lần này có thêm f. Chữ cái Việt có trong danh sách này là q thì trong thực tế không bao giờ đứng cuối trong từ tiếng Việt.

Khi chúng tôi để 2 biểu đồ thanh ký tự bắt đầu và kết thúc lồng vào nhau với cùng một tỷ lệ, chúng ta có kết quả như sau:

ký tự bắt đầu và kết thúc trong tên miền .vn

Bạn có thể dễ dàng nhận ra một số ký từ có sự khác biệt lớn về tỷ lệ bắt đầu và kết thúc. Cụ thể “b” là ký tự bắt đầu gấp gần 9 lần “b” là ký tự kết thúc, “j” bắt đầu gấp khoảng 6 lần kết thúc, “q” bắt đầu gấp 10 lần kết thúc. Ngược lại “y” kết thúc gấp gần 7 lần bắt đầu, “u” kết thúc gần gấp 5 lần bắt đầu.

7. Tỷ lệ tên miền .com đã được đăng ký

Có 2 lý do người ta thường muốn đăng ký tên miền .vn:

  • Tên miền quốc tế .com đã bị đăng ký mất
  • Tên miền .vn được pháp luật Việt Nam bảo vệ tốt hơn

Ở đây tôi muốn kiểm chứng vế đầu tiên, cụ thể tôi muốn biết có bao nhiêu tên miền .com tương ứng trong danh sách đã được đăng ký. Tuy nhiên kiểm chứng này không hẳn hoàn hảo, vì rất có thể đuôi .com đó cũng thuộc về cùng công ty có tên miền .vn (nhiều công ty thường đăng ký cả tên miền quốc tế .com lẫn tên miền quốc gia .vn – đây là thực hành nên áp dụng), dù vậy đây cũng là thông tin rất hữu ích. Ở phía ngược lại nó cũng cho ta biết có bao nhiêu tên miền .com bỏ ngỏ chưa được đăng ký.

Chúng tôi sử dụng công cụ của Name Bright để kiểm tra đồng loạt tên miền, nó thể kiểm thử cùng lúc 5000 tên miền, tuy nhiên có chút nhược điểm là không check được tên miền tiếng Việt, chỉ soi được tên miền không dấu.

Kết quả cho thấy chỉ có 16,95% tên miền không dấu tương ứng .com là còn có khả năng đăng ký, nói cách khác, đã có 83,05% tên miền .com không dấu trong mẫu đã bị (hoặc được) đăng ký.

Xét riêng với tên miền tiếng Việt, tôi sử dụng công cụ của GoDaddy để kiểm tra, nó có thể check đồng thời 500 tên miền cùng lúc. Kết quả cho thấy ở chiều hướng ngược lại với tên miền không dấu, có đến 97,1% tên miền có dấu .com tương ứng trong mẫu của chúng tôi chưa được (bị) đăng ký.

8. Hiện tượng trùng tên

Các tên miền .vn có thể trùng tên nhau (tất nhiên đuôi khác nhau). Tên miền trùng tên có thể của cùng một công ty với chính sách bao vây tên miền, nó cũng có thể thuộc về nhiều công ty, tổ chức, cá nhân khác nhau.

Chúng tôi ghi nhận 15.371 tên miền trùng (không hẳn là nó chỉ giống với 1 tên miền đuôi khác, có thể có 2, 3, 4, vân vân tên miền khác đuôi nhưng tên giống nhau), sau khi lọc còn 106.395 tên miền là tên duy nhất. Tỷ lệ tên miền duy nhất là 87,38% trên tổng số.

Để dễ hiểu các con số trên, giả dụ tôi có các tên miền sau: a.vn; a.com.vn; a.org.vn; 1.vn; 1.net.vn; 2.vn; 3.vn;

Thống kê:

  • Số lượng tên miền: 7
  • Số lượng tên miền trùng: 3 (2 tên miền a, và 1 tên miền 1)
  • Lọc đi còn dữ liệu duy nhất: 4 (a, 1, 2, 3)
0 bình luận

Khu vực bình luận

avatar