robots.txt 파일 설명 및 사용 예제

robots.txt 파일은 웹사이트의 검색 엔진 로봇(크롤러)에게 어떤 페이지를 방문해도 되는지, 어떤 페이지는 방문하지 말아야 하는지를 알려주는 가이드라인 파일입니다. 마치 집 앞에 붙인 "이 방은 들어오지 마세요" 안내문과 같습니다. 아래는 www.bookdu.net에 적용된 robots.txt 파일의 설명과 예제입니다.

robots.txt의 중요성

robots.txt의 기본 구조와 문법

robots.txt 파일은 웹사이트의 루트 디렉토리(www.bookdu.net/robots.txt)에 위치해야 합니다. 주요 지시어는 다음과 같습니다:

www.bookdu.net의 robots.txt 예제

아래는 www.bookdu.net에 적용된 robots.txt 파일의 예제입니다:

User-agent: *
Disallow: /AD/
Disallow: /test/

User-agent: HTTrack
Disallow: /

Sitemap: https://www.bookdu.net/sitemap.xml

설명:

작성 시 주의사항

추가 예제: 특정 파일 형식 차단

PDF 파일 차단 예제:

User-agent: *
Disallow: /*.pdf$