Yếu tố địa lý trong tên miền .vn

Khi tôi thực hiện tìm hiểu các tiền tố và hậu tố phổ biến trong tên miền .vn thì nhận thấy các yếu tố chỉ địa lý chiếm một vị trí đáng kể. Hôm nay chúng ta sẽ cùng nhau tìm hiểu xem những thành phần cụ thể nào thường được đưa vào, và liệu thứ tự đó có liên quan ít nhiều đến xếp hạng kinh tế hay không. Ngoài ra sẽ có các đánh giá rộng hơn nếu có thể. Mẫu sử dụng vẫn là 121.766 tên miền .vn trong thu thập nói ở đây.

A. Định nghĩa

  • Tiền tố phổ biến: là từ, cụm từ có tần số xuất hiện cao hơn thông thường và nằm ở phần đầu tên miền. Ví dụ các tên miền sau có tiền tố là shop như shop2xu.vn; shop360.vn; shop3m.vn
  • Hậu tố phổ biến: là từ, cụm từ có tần số xuất hiện cao hơn thông thường và nằm ở phần cuối tên miền. Ví dụ các tên miền sau có hậu tố là shop, như 123shop.vn; 1shop.vn; sdcshop.vn

B. Phương pháp

Sử dụng từ chỉ địa lý, cụ thể là Việt Nam và các biến thể có nghĩa tương đương, cùng với danh sách tên tỉnh thành chính thức để so khớp nó ở dạng tiền tố và hậu tố trong mẫu tên miền .vn nói ở trên.

C. Các thống kê

1. Yếu tố địa lý phổ biến nhất là chỉ đến Việt Nam

Tôi thống kê 4 từ thường được dùng để chỉ nghĩa Việt Nam bao gồm:

  • viet
  • vina
  • vn
  • vietnam

Kết quả như sau:

Từ Tiền Tố Hậu Tố
vietnam 382 (3,14) 1818 (14,93)
viet 1691 (13,89) 1602 (13,16)
vn 618 (5,08) 793 (6,51)
vina 601 (4,94) 179 (1,47)

Trong đó số đằng trước là số lần tìm thấy cụm từ, số trong ngoặc là tỷ lệ phần nghìn, ví dụ hậu tố vietnam: 1818 (14,93) có nghĩa là 1818 tên miền có hậu tố vietnam trong mẫu 121.766 tên miền .vn của chúng tôi, và tỷ lệ này chiếm 14,93 phần nghìn, hay nói cách khác cứ 1000 tên miền thì có gần 15 tên miền chứa hậu tố này.

Trong khi vietvn có tiền tố và hậu tố không chênh lệch nhau nhiều thì vietnam có hậu tố áp đảo còn vina lại có tiền tố áp đảo.

2. Các tỉnh, thành phố trong tên miền

Sử dụng danh sách tên gọi của 63 tỉnh thành chúng tôi tiến hành thống kê ở dạng không dấu, viết liền (dạng phổ biến nhất trong tên miền), cho kết quả như sau, theo thứ tự từ cao xuống thấp.

Trước tiên là với tiền tố:

Tiền tố Số lần tìm thấy Tỷ lệ phần nghìn
saigon 366 3.01
hanoi 226 1.86
danang 83 0.68
haiphong 43 0.35
thaibinh 31 0.25
cantho 30 0.25
binhduong 24 0.2
hoabinh 24 0.2
thanhhoa 23 0.19
haiduong 21 0.17
quangninh 19 0.16
vungtau 18 0.15
dongnai 17 0.14
thainguyen 15 0.12
binhdinh 15 0.12
ninhbinh 15 0.12
dienbien 14 0.11
daklak 13 0.11
quangtri 13 0.11
bacninh 13 0.11
gialai 13 0.11
phuyen 13 0.11
nghean 12 0.1
hatinh 12 0.1
sonla 12 0.1
langson 12 0.1
quangnam 11 0.09
vinhphuc 11 0.09
quangbinh 10 0.08
phutho 10 0.08
quangngai 10 0.08
kontum 10 0.08
tiengiang 10 0.08
namdinh 9 0.07
binhthuan 9 0.07
hungyen 9 0.07
kiengiang 9 0.07
caobang 9 0.07
tayninh 8 0.07
laocai 8 0.07
bacgiang 8 0.07
angiang 8 0.07
camau 8 0.07
lamdong 8 0.07
ninhthuan 8 0.07
hagiang 8 0.07
khanhhoa 7 0.06
yenbai 7 0.06
hanam 7 0.06
soctrang 7 0.06
vinhlong 7 0.06
laichau 7 0.06
haugiang 7 0.06
binhphuoc 6 0.05
dongthap 6 0.05
tuyenquang 6 0.05
travinh 6 0.05
bentre 5 0.04
longan 5 0.04
daknong 4 0.03
thuathienhue 4 0.03
baclieu 3 0.02
backan 3 0.02
bariavungtau 3 0.02

Có 2 lưu ý nhỏ với danh sách tên các tỉnh thành phố:

  • Tên chính thức TP. Hồ Chí Minh chúng tôi nhận thấy rất ít được sử dụng trong tên miền .vn, khi chúng tôi thử thống kê bằng từ có nghĩa tương đương là Sài Gòn thì có số lượng nhiều hơn hẳn, vì thế ở thống kê trên, Sài Gòn được hiểu chỉ đến TP. Hồ Chí Minh
  • Tên chính thức Bà Rịa Vũng Tàu được chúng tôi thống kê 2 lượt, một là dạng đầy đủ bariavungtau, một là dạng rút gọn vungtau
  • Tên thường gọi, ngắn gọn của Thừa Thiên Huế là Huế, và nó cũng được dùng trong tên miền, thí dụ như banhcanhhue.com.vn (Bánh Canh Huế), tuy nhiên chúng tôi không thống kê được cho riêng từ huế, vì hậu tố của nó bị lẫn cũng các từ như thuế, nhuệ. Việc phân biệt sẽ tốn khá nhiều công sức nên hiện tôi tạm thời bỏ qua.

Tiếp theo là bảng của hậu tố:

Hậu tố Số lần tìm thấy Tỷ lệ phần nghìn
hanoi 947 7.78
saigon 521 4.28
danang 374 3.07
binhduong 280 2.3
haiphong 254 2.09
cantho 161 1.32
thanhhoa 128 1.05
dongnai 115 0.94
vungtau 110 0.9
daklak 105 0.86
quangninh 103 0.85
nghean 104 0.85
quangtri 101 0.83
hatinh 98 0.8
thainguyen 95 0.78
bacninh 95 0.78
binhdinh 92 0.76
haiduong 86 0.71
binhphuoc 77 0.63
quangnam 68 0.56
thaibinh 63 0.52
ninhbinh 61 0.5
tayninh 59 0.48
namdinh 57 0.47
laocai 57 0.47
khanhhoa 57 0.47
bentre 57 0.47
gialai 56 0.46
bacgiang 55 0.45
vinhphuc 53 0.44
binhthuan 53 0.44
quangbinh 51 0.42
phutho 50 0.41
hoabinh 49 0.4
phuyen 47 0.39
yenbai 47 0.39
hungyen 45 0.37
angiang 43 0.35
quangngai 42 0.34
kontum 41 0.34
hanam 40 0.33
sonla 36 0.3
kiengiang 37 0.3
camau 36 0.3
longan 36 0.3
langson 35 0.29
caobang 34 0.28
lamdong 34 0.28
ninhthuan 34 0.28
dongthap 34 0.28
dienbien 32 0.26
tuyenquang 32 0.26
travinh 28 0.23
soctrang 27 0.22
tiengiang 26 0.21
baclieu 23 0.19
daknong 21 0.17
backan 21 0.17
hagiang 20 0.16
vinhlong 18 0.15
laichau 15 0.12
haugiang 14 0.11
thuathienhue 14 0.11
bariavungtau 13 0.11

Một số nhận xét khi so sánh 2 bảng tiền tố và hậu tố tên các tỉnh, thành phố:

  • Hậu tố được dùng nhiều hơn áp đảo so với tiền tố, tính toán cho thấy tổng hậu tố được dùng nhiều hơn tổng tiền tố đến 4 lần.
  • Chỉ tính riêng các tỉnh thành phố, tỷ lệ sử dụng là hơn 57 phần nghìn, trong đó hậu tố rơi vào 46 phần nghìn, tiền tố khoảng 11 phần nghìn
  • Hậu tố và tiền tố có mối tương quan khá lớn, với hệ số 0,82. Hệ số càng gần 1 thì càng tương quan đồng biến, nghĩa là nếu số lần hậu tố tìm thấy của một tỉnh thành phố là lớn (so với các hậu tố của các tỉnh thành phố khác) thì khả năng cao tiền tố của nó cũng được dùng nhiều hơn (so với các tiền tố của tỉnh thành phố khác)
  • Vì trong tay tôi không có thống kê về các chỉ số kinh tế của từng tỉnh thành phố nên không thể rút ra được kết luận nào về mối tương quan ở đây. Tuy nhiên nhìn vào nhóm xếp hạng đầu tiên có thể thấy đều là các tỉnh thành sôi động nhất cả nước về kinh tế, văn hóa. Hà Nội, Sài Gòn và Đà Nẵng chiếm các vị trí đầu cả ở tiền tố và hậu tố.
  • Nhóm 10 tỉnh thành đứng cuối có số lượng cũng như tỷ lệ sử dụng trong tên miền không đáng kể.

D. Kết luận

Yếu tố địa lý không hề hiếm gặp trong tên miền .vn, phổ biến nhất là các từ chỉ đến Việt Nam và các tỉnh thành lớn nhất cả nước. Hậu tố được dùng nhiều hơn áp đảo so với tiền tố.

Leave a Comment