HTTP代理按匿名度分为透明代理、匿名代理和高度匿名代理。
使用透明爬虫代理,对方服务器可以知道你使用了代理,并且也知道你的真实IP。
透明爬虫代理访问对方服务器所带的HTTP头信息如下:
REMOTE_ADDR = 代理服务器IP
HTTP_VIA = 代理服务器IP
HTTP_X_FORWARDED_FOR = 你的真实IP
(2).匿名爬虫代理
匿名爬虫代理隐藏了你的真实IP,但是向访问对象透露了你是使用代理服务器访问他们的。
使用高匿名代理,对方服务器不知道你使用了代理,更不知道你的真实IP。
高匿名爬虫代理访问对方服务器所带的HTTP头信息如下:
REMOTE_ADDR = 代理服务器IP HTTP_VIA 不显示 HTTP_X_FORWARDED_FOR 不显示
高匿名爬虫代理隐藏了你的真实IP,同时访问对象也不知道你使用了代理,因此隐蔽度最高。