Google 검색에서 사이트를 효과적으로 크롤링할 수 있도록 하려면 다음 요구사항을 충족하는 크롤링 가능한 URL 구조를 사용하세요. URL이 다음 기준을 충족하지 않으면 Google 검색에서 사이트를 비효율적으로 크롤링할 가능성이 높습니다(극도로 높은 크롤링 속도 또는 아예 크롤링되지 않음 등).
URL 매개변수를 지정할 때는 다음과 같은 일반적인 인코딩을 사용하세요. 등호(=)를 사용하여 키-값 쌍을 구분하고 앰퍼샌드(&)를 사용하여 매개변수를 추가합니다. 키-값 쌍 내에 동일한 키의 값을 여러 개 나열하려면 쉼표(,)와 같이 IETF STD 66과 충돌하지 않는 문자를 사용하면 됩니다.
권장
권장하지 않음
등호(=)를 사용하여 키-값 쌍을 구분하고 앰퍼샌드(&)를 사용하여 매개변수를 추가합니다.
URL에 잠재고객의 언어로 된 단어(해당하는 경우 음역된 단어)를 사용합니다.
예를 들어 잠재고객이 독일어로 검색하는 경우 URL에 독일어 단어를 사용합니다.
https://example.com/lebensmittel/pfefferminz
또는 잠재고객이 일본어로 검색하는 경우 URL에 일본어 단어를 사용합니다.
https://example.com/ペパーミント
필요에 따라 UTF-8 인코딩 사용
사이트의 페이지에 연결할 때는 필요에 따라 링크의 href 속성에 UTF-8 인코딩을 사용합니다. 예약되지 않은 ASCII 문자는 인코딩되지 않은 형식으로 남을 수 있습니다. 또한 ASCII가 아닌 범위에 해당하는 문자는 UTF-8로 인코딩되어야 합니다. 예를 들면 다음과 같습니다.
가능하면 URL에서 단어를 구분하는 것이 좋습니다. 특히 밑줄(_) 대신 하이픈(-)을 사용하여 URL에서 단어를 구분하는 것이 좋습니다. 사용자와 검색엔진이 URL의 개념을 더 잘 식별할 수 있기 때문입니다. 역사적인 이유로 밑줄을 사용하는 것은 권장하지 않습니다. 이 스타일은 이미 함께 유지되어야 하는 개념을 나타내는 데 일반적으로 사용되기 때문입니다(예: 다양한 프로그래밍 언어가 함수 이름을 지정할 때(예: format_date)).
가능하면 불필요한 매개변수(콘텐츠를 변경하지 않는 매개변수)를 삭제하여 URL의 길이를 줄입니다.
URL은 대소문자를 구분함
IETF STD 66을 준수하는 다른 HTTP 클라이언트와 마찬가지로 Google 검색의 URL 처리는 대소문자를 구분합니다. 예를 들어 Google은 /APPLE과 /apple을 모두 자체 콘텐츠가 있는 고유한 URL로 취급합니다. URL의 대소문자 텍스트가 웹 서버에서 동일하게 처리되는 경우 모든 텍스트의 대소문자를 동일하게 변환하세요. 그러면 Google에서 URL이 동일한 페이지를 참조하는지 더 쉽게 판단할 수 있습니다.
다지역 사이트의 경우
다지역 사이트인 경우 사이트를 쉽게 지역 타겟팅할 수 있는 URL 구조를 사용하는 것이 좋습니다. URL 구조화 방법에 관한 더 많은 예시는 언어별 URL 사용을 참고하세요.
권장(국가별 도메인 사용):
https://example.de
권장(gTLD를 포함하는 국가별 하위 디렉터리 사용):
https://example.com/de/
URL 관련 일반적인 문제 방지
여러 개의 매개변수를 포함하고 있는 URL과 같이 지나치게 복잡한 URL은 동일하거나 유사한 사이트 콘텐츠를 가리키는 URL을 불필요하게 많이 생성하므로 크롤러에 문제를 일으킬 수 있습니다. 그 결과 Googlebot이 필요 이상의 대역폭을 소비하거나 Google 검색이 사이트의 모든 콘텐츠에 대한 색인을 완전히 생성하지 못할 수 있습니다.
URL의 수가 불필요하게 많은 데에는 다음을 포함하여 여러 원인이 있을 수 있습니다.
일반적인 문제
항목 모음 추가 필터링
많은 사이트에서 동일한 항목 또는 검색 결과 모음을 다양한 버전의 보기로 제공하여 사용자가 정의된 기준(예: 해변 호텔 보여줘)을 사용하여 이러한 모음을 필터링할 수 있도록 합니다. 그런데 헬스클럽이 있는 해변가 호텔과 같은 필터링 기준을 추가하면 사이트의 URL 수(데이터 보기)가 폭발적으로 증가합니다.
Googlebot은 각 호텔 페이지로 이동 가능한 목록 중 몇 개만 보면 되기 때문에 약간씩 다른 호텔 목록을 많이 만들면 목록이 중복됩니다.
예를 들면 다음과 같습니다.
robots.txt 파일을 사용하여 이러한 문제가 있는 URL에 Googlebot이 액세스할 수 없도록 차단하는 것이 좋습니다.
캘린더 문제
동적으로 생성된 캘린더는 시작일 또는 종료일에 제한이 없는 미래의 날짜 및 과거의 날짜로 연결되는 링크를 생성할 수 있습니다. 예를 들면 다음과 같습니다.
https://example.com/calendar.php?d=13&m=8&y=2011
사이트의 캘린더가 무한대인 경우 동적으로 생성되는 미래의 캘린더 페이지로 연결되는 링크에 nofollow 속성을 추가합니다.
깨진 상대적 링크
존재하지 않는 페이지에 올바른 HTTP 상태 코드로 서버가 응답하지 않는 경우 잘못된 페이지에 상위 상대 링크를 배치하면 무한한 공백이 생성될 수 있습니다. 예를 들어 https://example.com/category/community/070413/html/FAQ.htm의 <a href="../../category/stuff">...</a>와 같은 상위 상대 링크는 https://example.com/category/community/category/stuff와 같은 가짜 URL로 이어질 수 있습니다.
이 문제를 해결하려면 링크에서 상위 상대 URL 대신 루트 상대 URL을 사용하세요.
크롤링 관련 URL 구조 문제 해결
Google 검색에서 이러한 문제가 있는 URL을 크롤링하는 것으로 확인되면 다음을 수행하는 것이 좋습니다.
robots.txt 파일을 사용하여 Googlebot이 문제가 되는 URL에 액세스할 수 없도록 차단합니다. 일반적으로 검색 결과를 생성하는 URL과 같은 동적 URL이나 캘린더와 같이 무한대의 공간을 만드는 URL, 정렬 및 필터링 함수를 차단하는 것이 좋습니다.
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["필요한 정보가 없음","missingTheInformationINeed","thumb-down"],["너무 복잡함/단계 수가 너무 많음","tooComplicatedTooManySteps","thumb-down"],["오래됨","outOfDate","thumb-down"],["번역 문제","translationIssue","thumb-down"],["샘플/코드 문제","samplesCodeIssue","thumb-down"],["기타","otherDown","thumb-down"]],["최종 업데이트: 2025-06-24(UTC)"],[[["Create simple, readable URLs with descriptive words, using hyphens to separate words for better clarity for users and search engines."],["Utilize UTF-8 encoding for non-ASCII characters like umlauts, emojis, and characters from other languages instead of directly using them in the URL."],["Avoid using URL fragments, long ID numbers, and underscores in URLs, as they can negatively impact search engine understanding."],["Implement a logical URL structure, potentially using subdirectories for geotargeting, and resolve issues like redundant parameters to enhance crawling efficiency."],["For URL parameters, adhere to common encoding practices by using `=` for key-value pairs, `&` for additional parameters, and `,` for multiple values within a key."]]],["Google's URL best practices recommend using simple, descriptive words, preferably in the audience's language, and utilizing UTF-8 encoding for non-ASCII characters. Hyphens should separate words, and key-value pairs should use \"=\" and \"&\", with commas for multiple values. Avoid long ID numbers, fragments, and underscores. Complex URLs, excessive parameters, session IDs, and dynamic calendars can create indexing problems; address these by simplifying the URL structure, using robots.txt to block problem URLs, and avoiding session IDs.\n"]]