Yếu tố địa lý trong tên miền .vn

Khi tôi thực hiện tìm hiểu các tiền tố và hậu tố phổ biến trong tên miền .vn thì nhận thấy các yếu tố chỉ địa lý chiếm một vị trí đáng kể. Hôm nay chúng ta sẽ cùng nhau tìm hiểu xem những thành phần cụ thể nào thường được đưa vào, và liệu thứ tự đó có liên quan ít nhiều đến xếp hạng kinh tế hay không. Ngoài ra sẽ có các đánh giá rộng hơn nếu có thể. Mẫu sử dụng vẫn là 121.766 tên miền .vn trong thu thập nói ở đây.


A. Định nghĩa

  • Tiền tố phổ biến: là từ, cụm từ có tần số xuất hiện cao hơn thông thường và nằm ở phần đầu tên miền. Ví dụ các tên miền sau có tiền tố là shop như shop2xu.vn; shop360.vn; shop3m.vn
  • Hậu tố phổ biến: là từ, cụm từ có tần số xuất hiện cao hơn thông thường và nằm ở phần cuối tên miền. Ví dụ các tên miền sau có hậu tố là shop, như 123shop.vn; 1shop.vn; sdcshop.vn

B. Phương pháp

Sử dụng từ chỉ địa lý, cụ thể là Việt Nam và các biến thể có nghĩa tương đương, cùng với danh sách tên tỉnh thành chính thức để so khớp nó ở dạng tiền tố và hậu tố trong mẫu tên miền .vn nói ở trên.


C. Các thống kê

1. Yếu tố địa lý phổ biến nhất là chỉ đến Việt Nam

Tôi thống kê 4 từ thường được dùng để chỉ nghĩa Việt Nam bao gồm:

  • viet
  • vina
  • vn
  • vietnam

Kết quả như sau:

TừTiền TốHậu Tố
vietnam382 (3,14)1818 (14,93)
viet1691 (13,89)1602 (13,16)
vn618 (5,08)793 (6,51)
vina601 (4,94)179 (1,47)

Trong đó số đằng trước là số lần tìm thấy cụm từ, số trong ngoặc là tỷ lệ phần nghìn, ví dụ hậu tố vietnam: 1818 (14,93) có nghĩa là 1818 tên miền có hậu tố vietnam trong mẫu 121.766 tên miền .vn của chúng tôi, và tỷ lệ này chiếm 14,93 phần nghìn, hay nói cách khác cứ 1000 tên miền thì có gần 15 tên miền chứa hậu tố này.

Trong khi vietvn có tiền tố và hậu tố không chênh lệch nhau nhiều thì vietnam có hậu tố áp đảo còn vina lại có tiền tố áp đảo.

2. Các tỉnh, thành phố trong tên miền

Sử dụng danh sách tên gọi của 63 tỉnh thành chúng tôi tiến hành thống kê ở dạng không dấu, viết liền (dạng phổ biến nhất trong tên miền), cho kết quả như sau, theo thứ tự từ cao xuống thấp.

Trước tiên là với tiền tố:

Tiền tốSố lần tìm thấyTỷ lệ phần nghìn
saigon3663.01
hanoi2261.86
danang830.68
haiphong430.35
thaibinh310.25
cantho300.25
binhduong240.2
hoabinh240.2
thanhhoa230.19
haiduong210.17
quangninh190.16
vungtau180.15
dongnai170.14
thainguyen150.12
binhdinh150.12
ninhbinh150.12
dienbien140.11
daklak130.11
quangtri130.11
bacninh130.11
gialai130.11
phuyen130.11
nghean120.1
hatinh120.1
sonla120.1
langson120.1
quangnam110.09
vinhphuc110.09
quangbinh100.08
phutho100.08
quangngai100.08
kontum100.08
tiengiang100.08
namdinh90.07
binhthuan90.07
hungyen90.07
kiengiang90.07
caobang90.07
tayninh80.07
laocai80.07
bacgiang80.07
angiang80.07
camau80.07
lamdong80.07
ninhthuan80.07
hagiang80.07
khanhhoa70.06
yenbai70.06
hanam70.06
soctrang70.06
vinhlong70.06
laichau70.06
haugiang70.06
binhphuoc60.05
dongthap60.05
tuyenquang60.05
travinh60.05
bentre50.04
longan50.04
daknong40.03
thuathienhue40.03
baclieu30.02
backan30.02
bariavungtau30.02

Có 2 lưu ý nhỏ với danh sách tên các tỉnh thành phố:

  • Tên chính thức TP. Hồ Chí Minh chúng tôi nhận thấy rất ít được sử dụng trong tên miền .vn, khi chúng tôi thử thống kê bằng từ có nghĩa tương đương là Sài Gòn thì có số lượng nhiều hơn hẳn, vì thế ở thống kê trên, Sài Gòn được hiểu chỉ đến TP. Hồ Chí Minh
  • Tên chính thức Bà Rịa Vũng Tàu được chúng tôi thống kê 2 lượt, một là dạng đầy đủ bariavungtau, một là dạng rút gọn vungtau
  • Tên thường gọi, ngắn gọn của Thừa Thiên Huế là Huế, và nó cũng được dùng trong tên miền, thí dụ như banhcanhhue.com.vn (Bánh Canh Huế), tuy nhiên chúng tôi không thống kê được cho riêng từ huế, vì hậu tố của nó bị lẫn cũng các từ như thuế, nhuệ. Việc phân biệt sẽ tốn khá nhiều công sức nên hiện tôi tạm thời bỏ qua.

Tiếp theo là bảng của hậu tố:

Hậu tốSố lần tìm thấyTỷ lệ phần nghìn
hanoi9477.78
saigon5214.28
danang3743.07
binhduong2802.3
haiphong2542.09
cantho1611.32
thanhhoa1281.05
dongnai1150.94
vungtau1100.9
daklak1050.86
quangninh1030.85
nghean1040.85
quangtri1010.83
hatinh980.8
thainguyen950.78
bacninh950.78
binhdinh920.76
haiduong860.71
binhphuoc770.63
quangnam680.56
thaibinh630.52
ninhbinh610.5
tayninh590.48
namdinh570.47
laocai570.47
khanhhoa570.47
bentre570.47
gialai560.46
bacgiang550.45
vinhphuc530.44
binhthuan530.44
quangbinh510.42
phutho500.41
hoabinh490.4
phuyen470.39
yenbai470.39
hungyen450.37
angiang430.35
quangngai420.34
kontum410.34
hanam400.33
sonla360.3
kiengiang370.3
camau360.3
longan360.3
langson350.29
caobang340.28
lamdong340.28
ninhthuan340.28
dongthap340.28
dienbien320.26
tuyenquang320.26
travinh280.23
soctrang270.22
tiengiang260.21
baclieu230.19
daknong210.17
backan210.17
hagiang200.16
vinhlong180.15
laichau150.12
haugiang140.11
thuathienhue140.11
bariavungtau130.11

Một số nhận xét khi so sánh 2 bảng tiền tố và hậu tố tên các tỉnh, thành phố:

  • Hậu tố được dùng nhiều hơn áp đảo so với tiền tố, tính toán cho thấy tổng hậu tố được dùng nhiều hơn tổng tiền tố đến 4 lần.
  • Chỉ tính riêng các tỉnh thành phố, tỷ lệ sử dụng là hơn 57 phần nghìn, trong đó hậu tố rơi vào 46 phần nghìn, tiền tố khoảng 11 phần nghìn
  • Hậu tố và tiền tố có mối tương quan khá lớn, với hệ số 0,82. Hệ số càng gần 1 thì càng tương quan đồng biến, nghĩa là nếu số lần hậu tố tìm thấy của một tỉnh thành phố là lớn (so với các hậu tố của các tỉnh thành phố khác) thì khả năng cao tiền tố của nó cũng được dùng nhiều hơn (so với các tiền tố của tỉnh thành phố khác)
  • Vì trong tay tôi không có thống kê về các chỉ số kinh tế của từng tỉnh thành phố nên không thể rút ra được kết luận nào về mối tương quan ở đây. Tuy nhiên nhìn vào nhóm xếp hạng đầu tiên có thể thấy đều là các tỉnh thành sôi động nhất cả nước về kinh tế, văn hóa. Hà Nội, Sài Gòn và Đà Nẵng chiếm các vị trí đầu cả ở tiền tố và hậu tố.
  • Nhóm 10 tỉnh thành đứng cuối có số lượng cũng như tỷ lệ sử dụng trong tên miền không đáng kể.

D. Kết luận

Yếu tố địa lý không hề hiếm gặp trong tên miền .vn, phổ biến nhất là các từ chỉ đến Việt Nam và các tỉnh thành lớn nhất cả nước. Hậu tố được dùng nhiều hơn áp đảo so với tiền tố.

Viết một bình luận