서치엔진(robot.txt )을 피하는 방법

리눅스/APACHE2015. 1. 16. 16:37

robot.txt 을 생성후 http://hbkr.net/robot.txt 위치에 업로드 한다.

# robot.txt 의 적당한 작성법 - 모든 robot의 /temp/ 디렉토리의 화일에 대해서 서치엔진으로부터 노출하지않음
User-agent: *
Disallow: /temp/

http://hbkr.net/temp/ 이후의 화일에 대해서는 노출을 하지 않는다.

# robot.txt - i hate robots
User-agent: *
Disallow: /

http://hbkr.net/ 이후의 화일에는 역시 노출하지 않음

2
meta tag 를 이용해서도 어느정도 노출을 줄이거나 늘릴수도 있다.

메타 테그에서 컨텐츠의 noindex는 모든 페이지에서 인덱스 하지 못하게 하는것이고 nofloow 는 메타테그가 들어간 웹페이지의 링크된 페이지를 인덱스 를 못하게 하는것

자신의 키워드를 노출함으로서 그 페이지가 어떤 키워드를 가지고 있는지 알려주는것

대부분의 키워드 서치 엔진에서는 robot.txt 의 약속을 지킨다

파일 압축 전송 (mod_gzip, mod_deflate) 사용 (0)	2015.01.16
ssl 보안 서버 구동시 암호묻지 않기 (0)	2015.01.16
아파치 2.x 에서의 트래픽 제한 (0)	2015.01.16
아파치 1.x 에서의 트래픽 제한 (0)	2015.01.16
yum 으로 APM 설치하기 (0)	2015.01.16

블로그 소개

공지사항

최근 등록 현황

달력

태그 구름

티스토리툴바