URL là gì? Có cấu trúc thế nào? Có cần tối ưu hóa URL không, và làm như thế nào?
Những câu hỏi trên người làm SEO chắc hẳn đôi khi cũng thắc mắc. Và trong bài viết này tôi sẽ giới thiệu chi tiết.
NỘI DUNG CHÍNH
- URL là gì vậy?
- Cấu trúc URL
- 1. Giao thức kết nối
- 2. Tên miền
- 3. Chuyên mục (category)
- 4. Tên trang
- 5. Cổng kết nối
- 6. Phần truy vấn, có dấu “?”
- 7. Phần phân mảnh, có dấu “#”
- Tại sao cần tối ưu hóa URL?
- Tối ưu hóa URL thế nào khi làm SEO?
- URL chứa chính xác từ khóa chính
- Người đọc cần hiểu được URL
- Cấu trúc URL hợp lý
- Độ dài URL hợp lý
- Không sử dụng chữ cái viết HOA
- Sử dụng dấu gạch ngang phân cách các từ
- Chỉ định URL chính (Canonical URL)
- Chặn những URL không có lợi cho SEO
- Tạo chuyển hướng 301 Redirect với những URL cũ
- Chọn 1 phương án URL cho tất cả các phiên bản website
- Tóm lược
Trước hết hãy cùng tìm hiểu về thuật ngữ…
URL là gì?
URL tạm hiểu là đường dẫn đến website. Nó cũng giống như địa chỉ website của bạn vậy. Khi ai đó nhập địa chỉ rồi Enter thì trình duyệt sẽ dẫn họ đến trang web.
Chẳng hạn, với trang web bạn đang xem thì URL là: https://carly.com.vn/blog/url-la-gi/. Chỉ cần nhấp vào liên kết này, hoặc copy/paste đường dẫn này vào trình duyệt, thì bạn sẽ được chuyển đến đúng trang bài viết.
Về mặt chuyên ngành, URL là viết tắt của cụm từ tiếng Anh: Uniform Resource Locator.
Nếu dịch sang tiếng Việt thì cụm từ này nghĩa là “Trình định vị tài nguyên thống nhất”. Nó được dùng để tham chiếu tài nguyên trên internet. Trong phạm vi chúng ta đang quan tâm thì tài nguyên đó chính là trang web.
Nói cách khác, URL dùng để định vị địa chỉ site trên Internet, có thể là địa chỉ của một website, một webpage, hoặc một bài đăng cụ thể nào đó trên website.
Cấu trúc URL
Mỗi URL mà chúng ta hay nhìn thấy ở các trang web đều được đặt theo cú pháp nhất định, và gồm những thành phần cụ thể.
Thử xem ví dụ trong hình dưới:
Đường dẫn minh họa trong hình này có 4 thành phần sau:
1. Giao thức kết nối
Giao thức kết nối (URL Scheme) là phương thức gửi yêu cầu từ máy tính của bạn đến máy chủ, và máy chủ phản hồi thông tin trang bạn muốn truy cập đến máy tính của bạn. Thành phần này xuất hiện trước dấu hai chấm và hai dấu gạch chéo và báo cho ứng dụng web cách truy cập tài nguyên.
Hiện có một số giao thức phổ biến:
- http: giao thức truyền tải siêu văn bản
- https: kết hợp giữa giao thức http và lớp bảo mật SSL hay TLS
- ftp: được sử dụng để truyền file qua Internet
- mailto: gửi thư điện tử…
2. Tên miền
Gồm tên miền chính (trong hình trên là “example”), có thể có tên miền phụ đứng trước (www, hoặc 1 tên nào đó khác), và tiếp đó đến tên miền cấp cao nhất TLD (.com, .org, .vn).
Phần này có thể chỉ là một địa chỉ IP, chẳng hạn như 192.168.1.1 (không có dấu chấm ở cuối).
3. Chuyên mục (category)
Tương đương với thư mục, và có thể tiếp theo bởi một hoặc nhiều chuyên mục con (sub-category) ngăn cách bởi dấu gạch chéo “/”. Những thành phần này có thể được định hướng để làm SEO khá hiệu quả.
4. Tên trang
Là tên cụ thể của trang (webpage), và thường chứa từ khóa cần SEO.
Trên đây là cấu trúc URL thông thường, và thân thiện với người dùng, với 4 thành phần chính. Nếu bạn để ý trong thực tế, thì đường dẫn của nhiều trang web có thêm những thành phần bổ sung, như tôi liệt kê dưới đây.
5. Cổng kết nối
Thường chỉ sử dụng thành phần này nếu bạn muốn sử dụng một cổng khác với cổng mặc định ví dụ: 88, 443, 995, 2222… Số cổng mặc định cho HTTP là cổng 80.
6. Phần truy vấn, có dấu “?”
Bạn thử gõ 1 từ khóa gì đó (ví dụ: cấu trúc URL) rồi Search bằng Google, thì URL trang kết quả sẽ có dạng thế này:
https://www.google.com/search?q=c%E1%BA%A5u+tr%C3%BAc+URL
Đây là URL trang kết quả khi tìm kiếm trên Google. Bạn sẽ thấy có nhiều ký tự đặc biệt, trong đó có dấu “?”, “%”, và cụm từ được tìm kiếm đã được mã hóa. Cả phần từ “search?” là câu truy vấn.
7. Phần phân mảnh, có dấu “#”
Thành phần cuối cùng của URL mà bạn có thể thấy được gọi là phân mảnh (fragment). Có thể có hoặc không.
Phân mảnh được bắt đầu bằng một dấu thăng (#) và thường được sử dụng để tạo liên kết neo (anchor) cho những đoạn cụ thể, ví dụ như các tiêu đề (heading). Khi người quản trị chèn liên kết neo (anchor) tại 1 vị trí nhất định trong nội bộ trang, bạn sẽ thấy trong URL của đường link xuất hiện dấu # cùng với tên của anchor.
Ví dụ như trong bài này, tôi đã chèn anchor đến một số vị trí để bạn dễ theo dõi. Thử vào 1 vài đường link trong phần NỘI DUNG CHÍNH ở đầu trang, bạn sẽ thấy URL tương ứng có ký tự #, ví dụ:
https://carly.com.vn/blog/url-la-gi/#ten-trang
Khi có phân mảnh thích hợp ở cuối URL, trình duyệt sẽ tải trang trước, sau đó sẽ chuyển đến vị trí đặt liên kết neo đó. Liên kết neo thường được sử dụng để tạo mục lục trang web giúp cho việc điều hướng được dễ dàng hơn. Bạn để ý phần mục lục trên đầu của bài này, thì sẽ hiểu ý tôi đang nói nhé.
Trên đây tôi vừa nói về cấu trúc URL, cả những gì phổ biến, và những gì ít gặp. Với website thông thường, ngoài việc đảm bảo cấu trúc, bạn cũng cần lưu ý đến việc tối ưu hóa để thân thiện với người dùng.
Tại sao cần làm vậy? Đó là nội dung tiếp theo.
Tại sao cần tối ưu hóa URL?
Vì việc tối ưu hóa đường dẫn là một trong các yếu tố giúp trang web được cả người dùng và công cụ tìm kiếm ưa thích hơn.
Người dùng muốn hiểu hết những gì có trên trang, kể cả thanh URL trên trình duyệt hay trong trang kết quả tìm kiếm (SERP). Một cách tự nhiên, chúng ta thường không thích những gì xa lạ, khó hiểu.
Công cụ tìm kiếm cũng đánh giá cao những gì nó hiểu được và những gì thân thiện với người dùng. Ngoài ra cấu trúc, và những yêu cầu với URL sẽ giúp cho đường dẫn trở lên thân thiện dễ hiểu hơn với Google.
Một khi đã được tối ưu hóa, được người dùng và Google đánh giá cao, thì lợi ích trang web nhận được chính là những gì mà việc làm SEO hướng tới:
- Trang đạt vị trí cao hơn trên bảng kết quả Google (tăng thứ hạng – Ranking)
- Người dùng ghé thăm trang nhiều hơn (tăng tỉ lệ nhấp chuột – CTR)
Về thực chất, tối ưu hóa SEO cũng chính là một trong những yếu tố quan trọng khi thực hiện SEO OnPage. Vì vậy, bạn đừng ngại khi phải nghiên cứu thêm một chút về cách thực hiện nhé.
Tối ưu hóa URL thế nào khi làm SEO?
Cần tối ưu cho thân thiện cả với người dùng và máy tính, cụ thể là các công cụ tìm kiếm như Google.
URL chứa chính xác từ khóa chính
Mỗi trang web cần tập trung cho một từ khóa chính, và có thể kèm theo một vài từ khóa phụ nếu cần. Từ khóa chính là nội dung trọng tâm của trang đó.
Từ khóa có thể là tên sản phẩm, dịch vụ, câu truy vấn… là những gì liên quan đến chủ đề của bạn mà người dùng tìm kiếm nhiều. Nếu chưa biết cách, bạn có thể tìm hiểu thêm trong bài viết hướng dẫn cách xác định từ khóa.
Ở đây, URL cần chứa từ khóa chính của trang webpage đó. Nhiều người chọn luôn từ khóa chính làm tên trang trong URL, với các từ được phân cách bởi dấu gạch ngang. Bạn có thể dùng tiếng Việt có dấu hoặc không có dấu, nhưng thông thường người ta hay chọn phương án tiếng Việt không dấu cho đồng bộ với các thành phần khác trong URL.
Ảnh minh họa URL tiếng Việt có dấu:
Để có thể chỉnh sửa URL, với tư cách là người quản trị web, thì bạn cần sự kết hợp hỗ trợ của người lập trình web (coder). Nên đề nghị họ cấp cho admin quyền tạo tên trang trong đường dẫn URL.
Xin lưu ý nhiều web cho phép tạo URL tự động. Điều này cũng tiện, nhưng lại giới hạn việc sửa chữa đường dẫn theo ý người quản trị. Vì vậy, kinh nghiệm của tôi là: bạn cần yêu cầu thêm phương án cho phép admin được tự sửa, nếu muốn.
Và khi được tự đặt hoặc sửa tên trang, thì sẽ có một số lựa chọn để tối ưu.
Ví dụ, với từ khóa chính là “xe máy điện”, thì mấy phương án từ tốt đến tệ:
- Chuẩn nên là: https://sieuthixe.com/xe-may-dien/ (chính xác từ khóa)
- Tạm được: https://sieuthixe.com/xe-may-dien-ct205/ (từ khóa + id)
- Hơi dở: https://sieuthixe.com/cac-loai-xe-may-chay-bang-dien/ (không có từ khóa)
- Rất tệ: https://sieuthixe.com/phuong-tien-di-lai/ (tên trang ít liên quan đến từ khóa)
Người đọc cần hiểu được URL
Cần đảm bảo người dùng hiểu được URL, tốt nhất là 100% nội dung. Nếu người không hiểu, thì công cụ tìm kiếm cũng vậy.
Bạn hoàn toàn có thể kiểm tra bằng trực giác.
Nếu nhìn URL mà có thể hiểu được nội dung trang về chủ đề gì, thì nghĩa là đã thân thiện, và như vậy có lợi cho SEO.
Chẳng hạn, với URL dưới đây, bạn chỉ cần nhìn qua là biết về trang sản phẩm Quạt cây Panasonic F409KB. Rất đầy đủ & rõ ràng!
Ngược lại, nếu xem URL mà không hiểu được, hoặc chỉ đoán lờ mờ nội dung của trang, thì nghĩa là URL đó kém thân thiện.
Chẳng hạn như trong ví dụ tiếp theo, URL cần được tối ưu. Mặc dù cùng là sản phẩm cũng như trong trang Mediamart tôi nói trong ví dụ trước, nhưng đọc thì chẳng biết là về sản phẩm gì. Chỉ có từ “panasonic” là rõ nhất, nhưng chưa đủ để giúp chúng ta hiểu về nội dung trang. Trường hợp này cần được chỉnh sửa.
Cấu trúc URL hợp lý
Như trong phần đầu tôi đã giải thích, bố cục URL gồm các thành phần: giao thức, tên miền, đường dẫn, chuỗi truy vấn.
Việc đưa cấu trúc hợp lý để đảm bảo toàn bộ URL tối ưu cũng có lợi cho SEO. Điều này đặc biệt hữu ích với những website lớn, có nhiều sản phẩm hoặc bài viết, cần được sắp xếp vào các cấp độ chuyên mục và chuyên mục con.
Độ dài URL hợp lý
Trình duyệt khác nhau có thể hỗ trợ số ký tự tối đa khác nhau trong URL.
Internet Explorer công bố cho phép URL tối đa được 2.083 ký tự. Tôi đã thử tìm kiếm nhưng không thấy công bố chính thức độ dài tối đa mà các trình duyệt khác như Firefox, Chrome… hỗ trợ. Tuy nhiên trên diễn đàn thì có những con số có thể tham khảo về nội dung này.
Nếu lấy theo con số maximum laf 2.083 ký tự thì cũng đã quá đủ. Thực tế trong lĩnh vực SEO, thì có lẽ chẳng bao giờ dùng đến hết số lượng này.
Do đó, bạn chỉ cần biết thông tin tham khảo, và hoàn toàn không cần lo ngại URL vượt quá chiều dài cho phép.
Nhưng khi làm SEO thì chúng ta nên để ý: Google chỉ cho hiển thị tối đa 512 pixel với độ dài URL trên trang kết quả tìm kiếm. Nếu dài hơn thì sẽ bị cắt bớt, và thay bằng dấu 3 chấm (…) ở cuối. Để tận dụng tối đa độ dài được hiển thị, và tóm lược được nội dung chính cho người đọc, bạn nên tạo URL sao cho dài không quá 512 pixel.
Có thể dùng Công cụ SEO này để xem trước hiển thị URL cũng như nội dung các thẻ Title, Meta Description.
Không sử dụng chữ cái viết HOA
Chữ Viết Hoa gây khó nhớ, và có thể gây bối rối cho người dùng và công cụ tìm kiếm. Vì vậy, trong URL người ta dùng toàn bộ là chữ thường.
Sử dụng dấu gạch ngang phân cách các từ
Để người và máy có thể dễ hiểu, thì cần phân cách các từ cạnh nhanh. Khi đó, bạn nên dùng dấu gạch ngang giữa dòng “-”, không dùng gạch ngang dưới chân “_” hay ký tự nào khác.
Đơn giản là vì các con bot của Google được thiết lập để đọc hiểu dấu gạch giữa dòng là để phân cách từ. Và bạn muốn tối ưu, thì cần làm theo quy tắc đó.
Ví dụ:
- Nên viết là: https://tenmien.com/toi-uu-url/
- Không nên: https://tenmien.com/toi_uu_url/
Chỉ định URL chính (Canonical URL)
Ý này không phải là chỉnh sửa trực tiếp vào URL. Thay vào đó, bạn cần quy định URL nào là chính khi có nhiều trang cùng nội dung.
Trong thực tế, bạn sẽ gặp phải trường hợp trên website có một số URL dẫn đến trang có cùng nội dung, và như vậy sẽ phạm lỗi trùng lặp nội dung.
Ví dụ về các trang khác URL nhưng có thể cùng nội dung:
Các trang song ngữ của cùng bài viết, được coi là cùng nội dung (chỉ khác ngôn ngữ)
Các trang truyền thống và trang AMP cũng có cùng nội dung (chỉ khác về cú pháp đặt thẻ)
v.v…
Để khắc phục lỗi này, thì bạn cần quy định trong số đó, có 1 URL là chính. Còn lại tất cả phụ và được trỏ về URL chính. Phương pháp này gọi là đặt Canonical URL: tất cả các URL có khả năng trùng lặp nội dung đều trỏ về 1 Canonical URL.
Để trỏ như vậy, tất cả các trang cùng nội dung, cần đặt 1 dòng code trong thẻ <head> chỉ rõ URL chính, ví dụ của bài này, tôi đặt Canonical URL trong thẻ <head> như sau:
<link rel="canonical" href="https://carly.com.vn/blog/url-la-gi/" />
Chặn những URL không có lợi cho SEO
Trên website của bạn, vào lúc này hay lúc khác, bạn có thể thấy sẽ có 1 số URL không cần hoặc không nên để Google biết, vì như vậy không có lợi.
Ví dụ những URL không an toàn, không có lợi:
- Những trang đang phát triển, nội dung còn ít hoặc chưa hoàn thiện
- Những trang có nội dung không liên quan, hoặc không có lợi gì cho chủ đề chúng của website. Tiêu biểu là những trang như: Quy định chung; Chính sách riêng tư…
- Những trang có nội dung copy toàn bộ từ website khác, nhưng vì lý do nào đó bạn quyết định vẫn sử dụng.
Khi đó, để tránh bị Google đánh tụt điểm, hoặc thậm chí xử phạt, thì bạn cần chỉnh định rõ không cho Google lập chỉ mục với những URL này. Có 2 cách phổ biến:
- Đưa URL này vào file robots.txt để nói rõ với Search Engine: đừng index. Phương án này dễ làm nhưng không có hiệu quả tuyệt đối.
- Chèn thêm vào thẻ <head> dòng mã dưới đây. Cách này chắc chắn loại bỏ URL này khỏi tầm ngắm của các SE. Lưu ý gỡ bỏ dòng code này khi bạn không còn ý định ngăn Google ghé thăm trang.
<meta name="robots" content="noindex" />
Tạo chuyển hướng 301 Redirect với những URL cũ
Tôi hay gặp trường hợp thế này:
Khách hàng có website cũ, và giờ xây dựng website mới. Những trang trước đây đều có URL riêng, và nhiều trong số đó đã được Google lập chỉ mục (index). Một số trang còn có thể đã được xếp hạng cao (lên Top Google).
Khi thiết kế lại website, các trang mới thường không giữ nguyên được cấu trúc URL như trước. Nếu thay đổi tên miền, thì 100% URL bị đổi. Và do đó, thường các URL cũ bị thừa, và lãng phí (vì Google đã biết). Nếu ai đó vào URL cũ, thì sẽ thấy báo lỗi không tìm thấy trang (404 Error – Page not found).
Rõ ràng nếu để như vậy là 1 sự lãng phí. Những gì website cũ đã làm được thì không được sử dụng tiếp. Trong khi website mới cần 1 thời gian nhất định mới được các SE biết đến.
Vậy phương án khắc phục lúc đó là cần điều hướng tự động URL cũ sang URL mới bằng cách tạo chuyển hướng 301 Redirect. Tất nhiên nội dung trang cơ bản vẫn giữ nguyên, hoặc được cập nhật thêm thì càng tốt. Có như vậy thì những gì website cũ bạn đã làm được, mới được tận dụng đem sang website mới. Cái này gọi là tối ưu nhưng vẫn tận dụng nguồn lực đã có.
Việc này thì quả thực liên quan đến yếu tố kỹ thuật (xem hướng dẫn của Google). Bạn cần đề nghị đơn vị thiết kế website tạo sẵn 1 bảng chuyển đổi. Tại đó, admin chỉ cần nhập từng cặp URL cũ và mới, là xong việc kết nối. Tôi minh họa bảng này như trong hình dưới đây:
Trường hợp tương tự khi bạn thay đổi URL của trang hiện tại, khi đó URL cũ sẽ bị đứt gãy (broken URL). Khi đó cũng cần áp dụng chuyển hướng 301 Redirect như tôi vừa trình bày ở trên.
Chọn 1 phương án URL cho tất cả các phiên bản website
Điều này thỉnh thoảng bạn có thể gặp phải: Trang web vẫn hiển thị độc lập (không redirect) với cả URL:
- Có hoặc không có www
- Giao thức http hoặc https
Ví dụ với trang web của tôi, 4 phương án sau:
- https://giaotrinhhay.com/
- https://www.giaotrinhhay.com/
- http://giaotrinhhay.com/
- http://www.giaotrinhhay.com/
Nếu tất cả 4 phương án này đều hiển thị riêng rẽ thì Google sẽ coi là 4 website riêng biệt. Khi đó website của bạn dễ bị đánh lỗi nội dung bị trùng lặp, đồng thời có thể không tập hợp hết sức mạnh của backlink nếu liên kết trỏ tới cả 2 phiên bản có và không có www.
Cách khắc phục là, cần chọn 1 phương án chính, và trỏ những URL còn lại về URL chính đó. Tôi đã chọn phương án chính là https và không có www (phương án số 1). Nếu bạn thử nhập tất cả 4 URL tôi vừa nêu trên, thì sẽ thấy chỉ trong tích tắc trình duyệt sẽ chuyển tự độ về URL của phương án 1 mà thôi.
Hãy thử cho website của bạn, xem có như vậy không nhé.
Nếu chưa, thì cần khắc phục. Cách làm là dùng code để tạo 301 Redirect, như tôi đã nói ở trên. Hoặc có thể sửa tùy chọn trong phần quản lý hosting. Như tôi biết thì Plesk (ngôn ngữ ASP.net) hoặc … (ngôn ngữ PHP) đều cho phép cấu hình những nội dung này.
Còn nếu vì lý do nào đó mà không thể can thiệp sửa code, thì bạn có thể khắc phục tạm bằng cách đăng ký phiên bản URL chính của mình trong Google Search Console. Vào lần lượt: Configuration > Settings > Preferred Domain. Tuy vậy, cách này có nhược điểm sau:
- Chỉ có tác dụng với Google, chứ không có hiệu quả với SE khác như Bing, Yahoo hay Cốc Cốc…
- Chỉ hiệu quả với tên miền chính (vd: tenmien.com). Trường hợp bạn có tên miền phụ (subdomain), chẳng hạn như: abc.tenmien.com, thì không dùng cách này được.
Như vậy để đảm bảo tối ưu hóa, bạn nên sử dụng các kỹ thuật để đảm bảo không bỏ sót trường hợp nào, các kỹ thuật như tôi đã nói ở phía trên:
- Điều hướng 301 Redirect
- Đăng ký phiên bản chính trong Google Search Console
- Sử dụng Canonical URL
Tóm lược
Bài viết này tôi đã giải thích khá chi tiết về khái niệm URL là gì, cấu trúc gồm những thành phần nào. Đồng thời tôi cũng đã nêu rõ lợi ích của việc tối ưu hóa URL cho các trang web, một trong những công việc quan trọng khi làm SEO On-Page.
Và ở phần cuối cùng tôi đã tóm tắt những phương pháp phổ biến nhất để làm SEO cho URL. Một URL chuẩn SEO phải luôn chứa từ khóa, ngắn gọn, có ý nghĩa, dễ copy, dễ nhớ, không chứa những từ không cần thiết, không chứa các ký tự đặc biệt…
Hy vọng bài viết đem lại cho bạn những thông tin và kiến thức bổ ích giải đáp cho câu hỏi URL là gì và tối ưu hóa URL thế nào.
Còn bạn thì sao? Bạn thường viết và tối ưu hóa URL thế nào?
Bài viết liên quan
20+ lỗi viết Content SEO mà bạn cần tránh khi viết bài
Bài viết SEO chất lượng sẽ giúp bạn dễ dàng có được thứ hạng cao [...]
Th9
Đào tạo seo GHẾ MASSAGE thị trường cạnh tranh
Ghế massage là một loại thiết bị chăm sóc sức khỏe tại nhà. Nó là [...]
Th8
SEO hosting là gì? Tại sao nhiều người chọn sử dụng SEO hosting?
SEO hosting không phải là hosting giúp SEO website lên top Google nhanh chóng như [...]
Th8
Buyer Keyword là gì? từ khóa “có ý định” mua hàng
Định nghĩa về Buyer Keyword Buyer Keyword là những từ khóa xuất phát từ ý [...]
Th7
CASE STUDY SEO WEBSITE GHẾ MASSAGE
CASE STUDY SEO WEBSITE GHẾ MASSAGE TOÀN THÂN Chia sẻ với anh em một Case [...]
Th5
Cách đi backlink hiệu quả mà phần lớn anh em làm SEO chưa được biết
Đi bao nhiêu backlink là phù hợp, số lượng đi link như thế nào đối [...]
Th5