2015년 1월 27일 화요일

실전 구글 사이트 맵의 작성 방법 (no2)



구글 사이트 맵의 작성 방법




구글 사이트 맵은 도구를 사용하여 작성되는 케이스도 많다고 생각 합니다만, 사이트 맵이 어떤 구조로되어 있는지에 대한 설명과 실제 수작업으로 사이트 맵을 만드는 방법에 대해 설명합니다.(사이트맵은 구글 뿐만 아니라, 모든 검색엔진에 공통으로 적용됩니다.)

1. 사이트 프로토콜
2. 사이트 기본형
3. 옵션 태그
4. 사이트 작성의 주의점

1. 사이트 맵 프로토콜


사이트 맵은 sitemaps.org 정의되어있는 사이트 프로토콜에 따라 작성된 것입니다. 사이트맵은Google뿐만 아니라 많은 검색 엔진을 지원하고 있기 때문에, sitemaps.org 정의된 프로토콜에 따라 만든 사이트 맵은 일반적으로 사용 있습니다.

사이트 프로토콜에 대한 해설은 아래에서 있습니다.


 


자세한 내용은 사이트에서 "프로토콜" 페이지에 나와 있습니다.




프로토콜에 따라 사이트 맵을 만들려고합니다.

2. 사이트 맵의 기본형


사이트 프로토콜 0.9에서 사이트 맵을 XML 형식으로 작성하는 경우, 사이트 맵의 구조는 다음과 같습니다.


<? xml version = "1.0"encoding = "UTF-8"?>

<urlset xmlns = "http://www.sitemaps.org/schemas/sitemap/0.9">

 

  페이지의 URL 대한 정보

 

</ urlset>

XML 선언을 작성 <urlset> 태그로 전체를 감싸게 됩니다. <urlset> 태그는 필수입니다그리고 이 안에는 사이트에 포함 페이지마다 페이지의 URL 대한 정보를 기술하고 있습니다.

페이지의 URL 대해서는 다음과 같이 설명합니다.


<url>

    <loc> http://www.example.com/index.html </ loc>

</ url>

먼저 전체를 <url> 태그로 둘러쌉니다그리고 페이지의 URL <loc> 태그의 값으로 기술합니다.

따라서 하나의 페이지 포함 사이트 맵은 다음과 같이됩니다.


<? xml version = "1.0"encoding = "UTF-8"?>

<urlset xmlns = "http://www.sitemaps.org/schemas/sitemap/0.9">

    <url>

        <loc> http://www.example.com/index.html </ loc>

    </ url>

</ urlset>

일반적으로 사이트에는 여러 페이지가 포함되어 있습니다사이트 맵에 포함하려는 페이지의 수만큼 <url> 태그를 작성하십시오다음은 완성형이됩니다.

·         sitemap1-1.xml


<? xml version = "1.0"encoding = "UTF-8"?>

<urlset xmlns = "http://www.sitemaps.org/schemas/sitemap/0.9">

    <url>

        <loc> http://www.example.com/index.html </ loc>

    </ url>

 

    <url>

        <loc> http://www.example.com/sub1/index.html </ loc>

    </ url>

</ urlset>

텍스트 편집기에서 위의 소스를 저장하십시오사이트 맵의 파일 이름은 일반적으로 “sitemap.xml”를 사용합니다만, 다른 이름이라도 상관 없습니다.

사이트 맵은 이대로 등록해도 제대로 작동하지만 필요에 따라 다음의 옵션 태그를 사용하여 페이지의 URL 정보를 부여합니다.

 

 

3. 옵션 태그


사이트 맵에서 URL마다 <url> 태그를 작성하지만, 필수 태그는 URL 지정하는데 사용하는 <loc> 태그뿐입니다단지 부가적인 정보로 마지막 업데이트 빈도, 우선 순위에 대해 각각 설명 있습니다.

<lastmod> 태그

번째 옵션은 페이지의 최종 업데이트 날짜를 나타내는 <lastmod> 태그입니다값으로 다음과 같은 형식으로 지정하십시오.


· YYYY-MM-DD 형식 : 2015-01-27

· YYYY-MM-DDThh : mm : ssTZD 형식 : 2015-01-27T14 : 38 : 07 + 09 : 00

URL마다 설정된 마지막 갱신일은 검색엔진이 크롤링을 수행할지 여부를 판단 참고합니다그냥 업데이트가 오래되었다고 해서 크롤링되지 않는 것은 아닙니다.


<url>

    <loc> http://www.example.com/index.html </ loc>

    <lastmod> 2015-01-27 </ lastmod>

</ url>

 

<url>

    <loc> http://www.example.com/sub1/index.html </ loc>

    <lastmod> 2015-01-27T14 : 38 : 07 + 09 : 00 </ lastmod>

</ url>

<changefreq> 태그

번째 옵션은 페이지 업데이트 빈도를 나타내는 <changefreq> 태그입니다다음 하나입니다.


· always 액세스 때마다 내용이 업데이트됩니다

· hourly 1 시간에 한번

· daily 하루에

· weekly 1 주일에

· monthly 한달에 한번

· yearly 일년에

· never 기본적으로 내용이 변하지 않는 아카이브 페이지

URL마다 지정된 업데이트 빈도를 참고는 하지만,  hourly 지정했다고 해서 1 시간에 번씩 크롤링하러 오는 것은 아니고,  never 지정했다 하더라도 정기적으로 크롤링되는것 같습니다 .


<url>

    <loc> http://www.example.com/index.html </ loc>

    <changefreq> daily </ changefreq>

</ url>

 

<url>

    <loc> http://www.example.com/sub1/index.html </ loc>

    <changefreq> monthly </ changefreq>

</ url>

<pri​​ority> 태그

번째 옵션은 <priority> 태그입니다사이트에서 페이지 우선 순위를 상대적으로 지정합니다. 0.0 (중요하지 않은 페이지)에서 1.0 (중요한 페이지) 사이의 값을 지정합니다기본 값은 0.5로 보시면 됩니다.

검색 엔진은 URL 설정된 우선 순위를 보고 어떤 페이지를 우선적으로 인덱스 할지를 참고합니다.

주의해야 것은, 우선 순위는 사이트 내에서의 상대적 순위입니다모든 페이지에 1.0 지정하면 단순히 모든 페이지의 우선 순위에 차이가 없는 것입니다또한 다른 사이트와 비교하는 것 역시, 인덱스되는지 여부에 참고 뿐이므로, 우선 순위를 높게 설정한다고 하여 검색 순위 등에 영향을 주지 않습니다.


<url>

    <loc> http://www.example.com/index.html </ loc>

    <pri​​ority> 0.8 </ priority>

</ url>

 

<url>

    <loc> http://www.example.com/sub1/index.html </ loc>

    <pri​​ority> 0.5 </ priority>

</ url>

이상 이러한 가지 옵션을 사용하여 만든 사이트 맵의 예로는 다음과 같은 것입니다.

·         sitemap1-2.xml


<? xml version = "1.0"encoding = "UTF-8"?>

<urlset xmlns = "http://www.sitemaps.org/schemas/sitemap/0.9">

    <url>

        <loc> http://www.example.com/index.html </ loc>

        <lastmod> 2012-02-27T14 : 38 : 07 + 09 : 00 </ lastmod>

        <changefreq> daily </ changefreq>

        <pri​​ority> 0.8 </ priority>

    </ url>

 

    <url>

        <loc> http://www.example.com/sub1/index.html </ loc>

        <lastmod> 2012-02-27 </ lastmod>

        <changefreq> monthly </ changefreq>

        <pri​​ority> 0.5 </ priority>

    </ url>

</ urlset>

옵션은 어디 까지나 보조적인 정보이므로 생략도 가능하고 기술해도 상관 없습니다또한 어느 정도 이 옵션값이 고려되는지는 알려져 있지 않으며, 검색 엔진마다 다르다고 생각되기 때문에, 작성하는 경우에도 그렇게 민감하게 생각하면서 설정하지 않아도 될 것 같습니다.

4. 사이트 맵 작성의 주의점


사이트 맵을 만드는 방법에 대한 가지주의 사항이 있습니다.


사이트 파일은 UTF-8 인코딩하십시오.

· & 등의 문자는 이스케이프 처리를하십시오.

사이트 맵에 포함시킬 수있는 URL 50,000 개입니다.

파일 크기는 10MB (10,485,760 바이트) 이하로 필요가 있습니다.

이스케이프 처리가 필요한 문자는 다음과 같습니다.


& & amp;

'& apos;

"& quot;

> & gt;

<& lt;

50,000 이상의 URL이있는 사이트의 경우 Sitemap 색인 파일을 사용합니다 (자세한 것은 후술합니다). 

또한 파일 크기가 경우 gzip으로 압축 있습니다.

상기 이외에도 사이트 맵에 포함 수있는 URL 호스트 이름이라든지, 사이트 맵을 설치하는 위치는 다음 페이지에서 설명합니다.

댓글 없음:

댓글 쓰기