검색엔진최적화(SEO) 실전 강의 – 중복콘텐츠 문제

검색엔진최적화(SEO) 중복콘텐츠
검색엔진최적화(SEO)는 검색엔진 친화적인 사이트, 쇼핑몰, 블로그를 통해 검색노출을 극대화하여 서비스, 제품 관련 키워드로의 접속을 확보하는데 큰 목적이 있습니다.

검색엔진이 중요하게 검색의 효율성과 검색결과의 품질을 중요하게 생각합니다.
검색의 효율이 떨어지면 검색의 품질에 영향을 줄 수 있으므로 서로 뗄 수 없는 관계이기도 합니다.

검색의 효율성을 떨어뜨리는 요소 중 중복 콘텐츠에 대해 알아보겠습니다.

1. 중복콘텐츠 정의 :

같은 도메인나 다른 도메인의 웹페이지가 동일하거나 거의 비슷한 콘텐츠를 의미하는데 의도적이지 않지만 시스템적인 이유로 중복콘텐츠로 간주되기도 합니다.

2. 중복콘텐츠는 왜 문제가 되는가?

검색엔진이 이미 수집한 정보와 콘텐츠를 다시 수집하는 것은 검색 자원의 낭비입니다. 새로운 웹문서를 수집해야 할 에너징와 시간을 헛되이 써버리는 것입니다.

이런 콘텐츠가 많다면 검색품질도 저하될 뿐만 아니라 검색자원이 상당히 낭비되기 때문에 검색엔진이 싫어하는 대표적인 요소로 중복콘텐츠가 많으면 검색엔진이 좋아할리 없습니다.


3. 중복콘텐츠 가능성이 높은 사례

  • www 유무 : 가장 쉬운 중복콘텐츠의 예는 www의 유무입니다. 검색엔진은 www.seosem.kr과 seosem.kr를 같은 콘텐츠가 각각 존재하는 중복콘텐츠로 여길 수 있습니다.
  • session ID : 세션 아이디의 경우 의도하지 않게 많은 중복콘텐츠를 생산할 수 있는 사례입니다.  https://seosem.kr/?PHPSESSID=12345
  • url 매개변수(parameter)를 활용한 사이트 : https://seosem.kr/?id=code  클릭트랙킹이나 분석 등 여러모로 유용하게 이용하지만 검색엔진을 상당히 헷갈리게 하는 요소입니다.

4. 중복콘텐츠 문제 해결 방법

  • 301 redirection
    중복콘텐츠나 가능성 있는 위의 사례의 경우 해결할 수 있는 가장 좋은 방법으로 알려져 있습니다
    →참고:  301 리디렉션( 301 redrection) 방법
  • rel=”canonical” 설정 : 용어가 약간 까다로운데 “표준페이지, 선호 url 설정”이라고 합니다. 301리디렉션을 할 수 없거나 301리디렉션보다 쉽게 설정할 수 있어서 흔히 이용합니다.  태그를 오리지날 페이지와  중복콘텐츠 페이지로 간주될 가능성이 큰 페이지에 마크업 합니다. 해당페이지 <head></head>태그 사이에 위치하도록 합니다.<head>
    <link href=”https://seosem.kr/original-page/” rel=”canonical” />
    </head>
  • 세션아이디(phpsessid) 미사용으로 설정
    특별히 사용해야 하는 경우가 아니라면 .htaccess를 활용하여 간단히 해결할 수 있습니다. 어쩔 수 없이 사용해야 한다면 위의 canonical 설정을 해야 합니다.<IfModule mod_php4.c>
    php_flag session.use_trans_sid off
    </IfModule>

실제로 중복콘텐츠에 대해서는 검색엔진 운영주체인 구글이 더 중요하게 생각합니다. 검색의 효율과 품질을 위한 중요한 부분이기에 구글은 “도움말”을 통해 이미 중복콘텐츠를 방지할 수 있는 안내 글을 친절히 설명하고 있습니다.

아래에 구글이 제시하는 “중복콘텐츠 문제 해결방법”을 더 소개합니다.

일관성 유지: 내부 링크를 일관성 있게 유지하세요. 예를 들어 http://www.example.com/page/, http://www.example.com/page 및 http://www.example.com/page/index.htm 등에는 링크하지 말아야 합니다.

신디케이션은 신중하게: 다른 사이트에 사용자의 콘텐츠를 신디케이트하는 경우 Google은 항상 각 검색에서 사용자에게 가장 적절하다고 판단되는 버전을 표시하지만, 이는 사용자가 원하는 버전일 수도 있고 그렇지 않을 수도 있습니다. 그러나 사용자의 콘텐츠가 신디케이트되는 각 사이트에 원본 문서로 다시 연결되는 링크를 포함시키면 도움이 될 수 있습니다. 또한 신디케이트된 자료를 사용하는 사용자에게 검색엔진이 콘텐츠 버전의 색인을 생성하지 못하게 noindex 메타태그를 사용하도록 요청할 수도 있습니다.

콘텐츠 관리 시스템 이해하기: 콘텐츠가 웹사이트에 표시되는 방식에 익숙해져야 합니다. 블로그, 포럼 및 관련 시스템에는 대개 동일한 콘텐츠가 다양한 형식으로 표시됩니다. 예를 들어, 하나의 블로그 항목이 블로그 홈페이지, 아카이브 페이지 및 동일한 라벨이 있는 기타 항목 페이지에 모두 나타날 수 있습니다.

유사한 콘텐츠 최소화: 유사한 페이지가 여러 개 있는 경우, 각 페이지를 확장하거나 여러 페이지를 하나로 통합하세요. 예를 들어, 두 도시에 대한 개별 페이지가 포함된 여행 사이트에서 두 페이지의 정보가 동일한 경우 해당 페이지를 두 도시 모두에 대한 하나의 페이지로 병합하거나 각 페이지를 확장하여 각 도시에 대한 고유한 콘텐츠를 제공할 수 있습니다.

발췌 :https://support.google.com/webmasters/answer/66359

중복컨텐츠는 대부분 자동적으로 생성되는 경우가 많으므로 검색엔진최적화(SEO)를 위한 관리요소의 하나로 지속적으로 관심을 가져야 합니다.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

이 사이트는 스팸을 줄이는 아키스밋을 사용합니다. 댓글이 어떻게 처리되는지 알아보십시오.