검색엔진최적화(SEO) – 사이트맵(sitemap) 이란?

Posted on Posted in 검색엔진최적화(SEO)

검색엔진최적화(SEO)에 대해 고객에게 설명하다보면 고객에게 자주 질문 받는 사항입니다.
사이트맵(sitemap)이라는 단어를 들으면 접속자가 웹사이트 메뉴, 서브메뉴 등 구조를 한눈에 파악하고 
클릭하여 접속할 수 있도록 만든 웹페이지를 가장 먼저 연상하는 것 같습니다.

검색엔진최적화의 한 부분이기도 한 사이트맵(sitemap)은 대상과 의미가 다릅니다. 
SEO에서의 사이트맵의 대상은 사람이 아니라 검색로봇이고 검색로봇의 효과적이 웹페이지 크롤링을 돕는 수단입니다.
아무리 검색 성능이 좋은 검색엔진이라도 웹사이트에 따라 놓치고 있는 웹페이지가 있을 수 있는데 
사이트맵은 검색로봇에 제외된 웹페이지의 가능성을 낮추는데 큰 도움을 줍니다.

아래에 내용도 참조하세요.

Sitemap이란 무엇입니까?

Sitemap은 웹마스터가 크롤링에 사용할 수 있는 사이트의 페이지에 대한 정보를 검색 엔진에 알리는 손쉬운 방법입니다. Sitemap의 가장 간단한 형식은 검색 엔진에서 사이트를 보다 지능적으로 크롤링할 수 있도록 각 URL에 대한 추가 메타데이터(마지막 업데이트된 날짜, 변경 빈도, 사이트의 다른 URL에 상대적인 중요도)와 함께 사이트에 대한 URL을 나열하는 XML 파일입니다.

웹크롤러는 보통 해당 사이트 및 기타 사이트의 링크에서 페이지를 검색합니다. Sitemap은 해당 데이터를 보완하여 Sitemap을 지원하는 크롤러가 해당 Sitemap에 있는 모든 URL을 선택하고 관련 메타데이터를 사용하여 이들 URL에 대해 파악할 수 있도록 합니다. Sitemap 프로토콜을 사용하더라도 웹페이지가 반드시 검색 엔진에 포함되는 것은 아니지만 이를 통해 웹크롤러가 귀하의 사이트를 보다 효과적으로 크롤링하기 위한 힌트를 얻을 수 있습니다.

Sitemap 0.90은 Attribution-ShareAlike Creative Commons License의 약관에 따라 제공되며 Google, Yahoo! 및 Microsoft의 지원을 비롯하여 널리 채택되고 있습니다.

출처 : http://www.sitemaps.org/ko/ 

이런 사이트맵은 보통 위에서 언급한 것처럼 보통 xml파일로 생성하나 txt파일로도 활용할 수 있습니다.
검색엔진에 제출하는 방법은 구글 웹마스터 같은 툴을 이용하거나 robots.txt를 활용하여 내부에 sitemap : /sitemap.xml 을 추가하여 제출할 수도 있습니다.

이런 사이트맵(sitemap) 관련 정보는 http://sitemaps.org에 접속하면 얻을 수 있습니다.
그 중 사이트맵 FAQ(자주 묻는 질문) 중 중요한 것만 발췌하여 블로그에 올립니다.

FAQ(자주 묻는 질문)

Q:
 Sitemap 파일을 생성하기 위해 어떤 문자 인코딩 방법을 사용하는지에 따라 차이가 있습니까?

예. Sitemap 파일은 UTF-8 인코딩을 사용해야 합니다.

Q: 내 Sitemap은 어디에 배치합니까?

Sitemap을 HTML 서버의 루트 디렉토리, 즉 http://example.com/sitemap.xml에 배치하실 것을 적극 권해 드립니다.

조직의 보안 권한에 따라 다른 디렉토리에 대한 읽기 권한이 분류되는 경우와 같이 어떤 상황에서는 사이트의 여러 경로에 대해 서로 다른 Sitemap을 만드실 수도 있습니다.

Google은 사용자에게 http://example.com/path/sitemap.xml을 업로드할 권한이 있는 경우 http://example.com/path/ 아래 메타데이터를 보고할 권한도 있는 것으로 가정합니다.

Sitemap에 나열된 모든 URL은 Sitemap과 같은 호스트에 있어야 합니다. 예를 들어, Sitemap이 http://www.example.com/sitemap.xml에 있는 경우 http://subdomain.example.com의 URL은 포함할 수 없습니다. Sitemap이 http://www.example.com/myfolder/sitemap.xml에 있는 경우 http://www.example.com의 URL은 포함할 수 없습니다.

맨위로

Q: Sitemap의 크기 제한은 어떻게 됩니까?

Sitemap은 크기가 10MB(10,485,760바이트) 미만이어야 하며 최대 50,000개의 URL을 포함할 수 있습니다.이러한 크기제한은 매우 큰 파일을 처리할 때 웹서버의 속도가 느려지지 않도록 하기 위한 것입니다.이는 사이트의 URL이 50,000개가 넘거나 Sitemap이 10MB보다 클 경우 여러 개의 Sitemap을 만들고 Sitemap 색인 파일을 사용해야 함을 뜻합니다.현재는 사이트 크기가 작지만 향후 URL이 50,000개를 넘고 파일 크기가 10MB를 초과할 것으로 예상되는 경우에도 Sitemap 색인 파일을 사용해야 합니다.Sitemap 색인 파일은 최대 1,000개의 Sitemap을 포함할 수 있지만 크기는 10MB(10,485,760바이트)를 초과할 수 없습니다.gzip을 사용하여 Sitemap을 압축할 수도 있습니다.

Q: 내 사이트에 수천 만개의 URL이 있는 경우 최근 변경된 URL만 제출할 수 있는 방법이 있습니까?

자주 변경되는 몇 개의 Sitemap에 업데이트된 URL을 나열한 뒤 Sitemap 색인 파일에서 lastmod 태그를 사용하여 이러한 Sitemap 파일을 구분할 수 있습니다. 이렇게 하면 검색 엔진에서 변경된 Sitemap만 크롤링할 수 있습니다.

Q: 내 Sitemap을 만든 다음에는 무엇을 해야 합니까?

Sitemap을 만들었으면 검색 엔진에 직접 제출하거나, 검색 엔진을 ping하거나, robots.txt 파일에 Sitemap 위치를 추가하여 검색 엔진에 알리십시오.

Q: Sitemap의 URL을 완벽하게 지정해야 합니까?

예. 프로토콜(예: http)을 URL에 포함시켜야 합니다. 또한 웹서버에서 요구하는 경우 URL 뒤에 슬래시를 포함시켜야 합니다. 예를 들어, http://www.example.com/은 Sitemap의 유효한 URL이지만 www.example.com은 유효한 URL이 아닙니다..

Q: 내 사이트에 “http” 및 “https” 버전의 URL이 모두 들어 있습니다. 이 둘 모두 나열해야 합니까?

아니오. Sitemap에 URL 버전을 하나만 나열하십시오. 여러 버전의 URL을 포함시키면 사이트가 완전히 크롤링되지 않을 수도 있습니다.

Q: 내 사이트의 URL에 세션 ID가 들어 있습니다. 제거해야 합니까?

예. URL에 세션 ID를 포함시키면 사이트가 완전히 크롤링되지 않거나 반복해서 크롤링될 수 있습니다.

Q: 사이트의 일부 페이지에서 프레임을 사용합니다. 프레임세트 URL이나 프레임 콘텐츠의 URL을 포함시켜야 합니까?

두 URL을 모두 포함시키시기 바랍니다.

Q: Sitemap을 압축할 수 있습니까? 아니면 gzip으로 압축해야 합니까?

gzip을 사용하여 Sitemap을 압축하십시오.Sitemap은 압축 여부와 상관없이 크기가 10MB(10,485,760바이트) 미만이어야 합니다.

Q: XML Sitemap의 “priority” 힌트가 검색 결과에서 내 페이지의 순위를 변경합니까?

Sitemap의 “priority” 힌트는 귀하의 사이트에 있는 특정 URL과 기타 URL을 비교한 상대적 중요도만 표시할 뿐 검색결과에서 귀하의 페이지 순위에 대한 영향을 시사하는 것은 아닙니다.




답글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다.