当前位置：首页最新资讯原创优选正文

如何在Python中使用代理IP？

全网低价IP 2026-03-02 原创优选 · 最新资讯 17 推广

核心步骤是‌获取代理IP信息‌和‌在Python代码中配置代理‌。由于该平台提供的是标准的SOCKS5或HTTP代理服务，因此配置方法与使用其他代理服务商基本一致。

以下是详细的步骤指南和代码示例。

一、准备工作：获取代理IP信息

首先，您需要在socks5ip.com.cn平台上购买并提取代理IP的配置信息。

‌注册与购买‌：访问 ‌https://socks5ip.com.cn‌，选择并购买您需要的代理IP服务（例如奔富IP、天行IP、沧海IP等）。
‌登录后台提取‌：购买成功后，登录该服务商的用户后台（例如奔富IP、天行IP的后台）。
‌记录关键信息‌：在后台的“我的IP”、“IP管理”或类似页面，找到并记录以下信息：
- ‌代理服务器地址‌：一串数字形式的IP地址（例如：123.123.123.123）。
- ‌端口‌：通常是四位或五位的数字（例如：54321）。
- ‌用户名‌：您的账户名或后台分配的用户名。
- ‌密码‌：您的账户密码或后台分配的专用密码。
- ‌协议‌：确认您的IP支持‌SOCKS5‌还是‌HTTP/HTTPS‌协议。平台上的IP通常都支持SOCKS5。

二、在Python中配置和使用代理IP

根据您的代理协议（SOCKS5或HTTP）和使用的Python库，配置方法有所不同。

方法一：使用SOCKS5代理（推荐，兼容性更好）

大多数从socks5ip.com.cn购买的代理都支持SOCKS5协议。

‌1. 安装必要的库‌
您需要安装支持SOCKS5代理的requests库和socks库。

bashCopy Code

pip install requests[socks]

‌2. Python代码示例‌
将以下代码中的 your_proxy_ip、your_port、your_username、your_password 替换为您从平台获取的实际信息。

pythonCopy Code

import requests
# 从socks5ip.com.cn后台获取的代理信息

proxy_ip = "your_proxy_ip"  # 例如：123.123.123.123

proxy_port = "your_port"    # 例如：54321

username = "your_username"

password = "your_password"
# 构建代理字典，格式为：socks5://用户名:密码@IP地址:端口

proxy_url = f"socks5://{username}:{password}@{proxy_ip}:{proxy_port}"

proxies = {

'http': proxy_url,

'https': proxy_url

}
# 使用代理发起请求

try:

# 测试请求，查看当前使用的IP

response = requests.get('https://httpbin.org/ip', proxies=proxies, timeout=10)

print("请求成功！")

print("通过代理访问，您的IP是：", response.json())

except requests.exceptions.RequestException as e:

print("请求失败，错误信息：", e)

# 实际访问目标网站（示例：访问一个测试网站） try: target_response = requests.get('https://www.example.com', proxies=proxies, timeout=10) print(f"访问目标网站状态码：{target_response.status_code}") except Exception as e: print(f"访问目标网站时出错：{e}")

方法二：使用HTTP/HTTPS代理

如果您的代理服务也支持HTTP协议，可以使用以下配置。

pythonCopy Code

import requests
# 从socks5ip.com.cn后台获取的代理信息

proxy_ip = "your_proxy_ip"

proxy_port = "your_port"

username = "your_username"

password = "your_password"
# 构建代理字典（HTTP格式）

proxies = {

'http': f'http://{username}:{password}@{proxy_ip}:{proxy_port}',

'https': f'http://{username}:{password}@{proxy_ip}:{proxy_port}', # 注意：很多HTTP代理也用于HTTPS

}

# 使用方式与方法一相同 try: response = requests.get('https://httpbin.org/ip', proxies=proxies, timeout=10) print("通过HTTP代理访问，您的IP是：", response.json()) except requests.exceptions.RequestException as e: print("请求失败：", e)

三、验证代理是否生效

运行上述代码后，检查输出结果：

‌查看返回的IP‌：代码中请求了 https://httpbin.org/ip，这个网站会返回您当前使用的IP地址。如果返回的IP与您在socks5ip.com.cn后台获取的代理IP一致，说明代理配置成功。
‌访问目标网站‌：将代码中的 https://www.example.com 替换成您实际需要访问的网站地址（例如电商平台、社交媒体），检查是否能正常获取数据。

四、高级用法与注意事项

‌会话保持‌：对于需要保持登录状态（如爬取需要登录的网站），建议使用 requests.Session()，并在会话中设置代理。
pythonCopy Code

session = requests.Session() session.proxies.update(proxies) response = session.get('https://your-target-site.com')
‌错误处理‌：网络请求可能超时或失败，务必添加异常处理（如 try...except 和 timeout 参数）。
‌协议确认‌：务必确认您购买的代理IP支持的协议类型（SOCKS5或HTTP），并选择对应的配置方法。SOCKS5协议通常更通用，能代理所有TCP流量。
‌IP纯净度与目标网站‌：即使代理配置成功，也可能因为IP被目标网站封禁而访问失败。socks5ip.com.cn平台支持免费测试，建议先测试IP对目标网站的可用性。

通过以上步骤，您就可以顺利地在Python程序中使用从socks5ip.com.cn平台购买的代理IP了。如果在配置过程中遇到问题，可以查阅该平台“教程中心”的相关指南，或联系对应服务商的客服获取支持。

全网低价IP-国内外IP源头渠道(socks5ip.com.cn)

支持无双IP（海外）、奔富IP、天行IP、沧海IP、光子IP、天机IP、优享云IP、鲸云IP、糖果IP等数十个国内外知名IP平台

☞https://linkdd.cn/socks5ip

自助提货，100%独享，免费测试，支持续费和调换

有任何IP使用问题，或量大谈合作，请点击【添加微信】，诚招代理！

常见问题

全网低价IP（socks5ip.com.cn）是做什么的？

本站是专业的IP资源整合平台，为您提供纯净独享低价高质的动态/静态住宅IP与机房IP混合方案。

全网低价IP-国内外IP源头渠道(socks5ip.com.cn)

支持无双IP（海外）、奔富IP、天行IP、沧海IP、光子IP、天机IP、优享云IP、鲸云IP、糖果IP等数十个国内外知名IP平台☞【https://linkdd.cn/socks5ip】，自助提货，100%独享，免费测试，支持续费和调换，任何IP使用问题，或量大谈合作，请微信扫码右侧联系方式，诚招代理！

国内IP平台中都有哪些平台最常用？

【推荐】奔富IP（SK5+L2TP，IP池3w+，2.6/条起）、沧海IP(百兆 8/条+家庭住宅)、天行IP（长效静态百兆 6/条+高速家庭住宅+L2TP），三个平台可以做到优势互补

国外IP平台中最便宜、地区最全的平台是哪个？

无双代理服务平台的海外IP，涵盖全球覆盖+免费测试+多协议兼容，无双IP为用户上百万IP资源提供稳定服务，包括全球范围内的7200万个住宅地址，高质量的代理服务，确保您的业务需求得到满足，同时保障隐私与安全。

【抄袭警示】本文为原创，严禁抄袭、搬运、洗稿！抄袭必究！如需分享，必须保留原文链接：https://socks5ip.com.cn/zuixinzixun/ruhezaipythonzhongsh/，转载请注明源自【全网低价IP】【https://socks5ip.com.cn/】

如何在Python中使用socks5代理进行爬虫操作？

全网低价IP 2026-03-02 原创优选 · 最新资讯 0 推广

以下是使用Python结合socks5ip.com.cn代理IP进行爬虫操作的完整实现。

import requests
from urllib3.exceptions import InsecureRequestWarning
import time
import random
from typing import Dict, List, Optional
import json
import logging

# 禁用SSL警告
requests.packages.urllib3.disable_warnings(category=InsecureRequestWarning)

class ProxyCrawler:
def __init__(self, proxy_config: Dict[str, str]):
“””
初始化代理爬虫
:param proxy_config: 代理配置字典，包含ip, port, username, password
“””
self.proxy_config = proxy_config
self.session = requests.Session()
self.setup_logging()
self.setup_proxy()

def setup_logging(self):
“””配置日志”””
logging.basicConfig(
level=logging.INFO,
format=’%(asctime)s – %(levelname)s – %(message)s’,
handlers=[
logging.FileHandler(‘proxy_crawler.log’, encoding=’utf-8′),
logging.StreamHandler()
]
)
self.logger = logging.getLogger(__name__)

def setup_proxy(self):
“””配置代理”””
proxy_url = f”socks5://{self.proxy_config[‘username’]}:{self.proxy_config[‘password’]}@{self.proxy_config[‘ip’]}:{self.proxy_config[‘port’]}”
self.proxies = {
‘http’: proxy_url,
‘https’: proxy_url
}
self.session.proxies.update(self.proxies)
self.logger.info(f”代理已配置: {self.proxy_config[‘ip’]}:{self.proxy_config[‘port’]}”)

def test_proxy(self) -> bool:
“””
测试代理是否可用
:return: 代理是否可用
“””
try:
response = self.session.get(‘https://httpbin.org/ip’, timeout=10, verify=False)
if response.status_code == 200:
ip_info = response.json()
self.logger.info(f”代理测试成功，当前IP: {ip_info.get(‘origin’, ‘Unknown’)}”)
return True
else:
self.logger.error(f”代理测试失败，状态码: {response.status_code}”)
return False
except Exception as e:
self.logger.error(f”代理测试异常: {str(e)}”)
return False

def get_random_headers(self) -> Dict[str, str]:
“””
获取随机请求头
:return: 请求头字典
“””
user_agents = [
‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36’,
‘Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36’,
‘Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36’
]

return {
‘User-Agent’: random.choice(user_agents),
‘Accept’: ‘text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8’,
‘Accept-Language’: ‘zh-CN,zh;q=0.8,en-US;q=0.5,en;q=0.3’,
‘Accept-Encoding’: ‘gzip, deflate’,
‘Connection’: ‘keep-alive’,
‘Upgrade-Insecure-Requests’: ‘1’,
}

def crawl_with_retry(self, url: str, max_retries: int = 3) -> Optional[requests.Response]:
“””
带重试机制的爬取方法
:param url: 目标URL
:param max_retries: 最大重试次数
:return: 响应对象或None
“””
for attempt in range(max_retries):
try:
headers = self.get_random_headers()
response = self.session.get(
url,
headers=headers,
timeout=15,
verify=False
)

if response.status_code == 200:
self.logger.info(f”成功爬取: {url}”)
return response
else:
self.logger.warning(f”请求失败 (尝试 {attempt+1}/{max_retries}): {url}, 状态码: {response.status_code}”)

except Exception as e:
self.logger.warning(f”请求异常 (尝试 {attempt+1}/{max_retries}): {url}, 错误: {str(e)}”)

# 重试前等待随机时间
if attempt < max_retries – 1:
wait_time = random.uniform(1, 3)
time.sleep(wait_time)

self.logger.error(f”爬取失败 {max_retries} 次后放弃: {url}”)
return None

def crawl_multiple_urls(self, urls: List[str]) -> Dict[str, Dict]:
“””
批量爬取多个URL
:param urls: URL列表
:return: 爬取结果字典
“””
results = {}

for i, url in enumerate(urls):
self.logger.info(f”正在爬取 ({i+1}/{len(urls)}): {url}”)

# 添加随机延时，避免请求过于频繁
if i > 0:
delay = random.uniform(0.5, 2)
time.sleep(delay)

response = self.crawl_with_retry(url)

if response:
results[url] = {
‘status’: ‘success’,
‘status_code’: response.status_code,
‘content_length’: len(response.content),
‘title’: self.extract_title(response.text)
}
else:
results[url] = {
‘status’: ‘failed’,
‘status_code’: None,
‘content_length’: 0,
‘title’: None
}

return results

def extract_title(self, html_content: str) -> str:
“””
从HTML内容中提取标题
:param html_content: HTML内容
:return: 页面标题
“””
try:
start = html_content.find(‘<title>’) + 7
end = html_content.find(‘</title>’)
if start > 6 and end > start:
return html_content[start:end].strip()
except:
pass
return “未知标题”

def save_results(self, results: Dict, filename: str = ‘crawl_results.json’):
“””
保存爬取结果到JSON文件
:param results: 爬取结果
:param filename: 保存文件名
“””
try:
with open(filename, ‘w’, encoding=’utf-8′) as f:
json.dump(results, f, ensure_ascii=False, indent=2)
self.logger.info(f”结果已保存到: {filename}”)
except Exception as e:
self.logger.error(f”保存结果失败: {str(e)}”)

def main():
# 从socks5ip.com.cn后台获取的代理配置信息
proxy_config = {
‘ip’: ‘your_proxy_ip’, # 替换为实际IP
‘port’: ‘your_port’, # 替换为实际端口
‘username’: ‘your_username’, # 替换为实际用户名
‘password’: ‘your_password’ # 替换为实际密码
}

# 创建爬虫实例
crawler = ProxyCrawler(proxy_config)

# 测试代理是否可用
if not crawler.test_proxy():
print(“代理测试失败，请检查代理配置”)
return

# 定义要爬取的URL列表
urls = [
‘https://httpbin.org/ip’,
‘https://httpbin.org/user-agent’,
‘https://httpbin.org/headers’,
‘https://www.example.com’,
‘https://httpbin.org/delay/2’ # 测试延迟
]

print(“开始批量爬取…”)
results = crawler.crawl_multiple_urls(urls)

# 打印结果摘要
success_count = sum(1 for r in results.values() if r[‘status’] == ‘success’)
print(f”\n爬取完成! 成功: {success_count}/{len(urls)}”)

# 保存结果
crawler.save_results(results)

# 打印详细结果
for url, result in results.items():
print(f”\nURL: {url}”)
print(f”状态: {result[‘status’]}”)
if result[‘status’] == ‘success’:
print(f”标题: {result[‘title’]}”)
print(f”内容大小: {result[‘content_length’]} 字节”)

if __name__ == “__main__”:
main()

代码说明：

ProxyCrawler类封装了完整的代理爬虫功能，包括代理配置、测试、请求发送等
支持SOCKS5代理协议，通过requests库的socks支持实现
实现了智能重试机制，在请求失败时自动重试并加入随机延时
包含随机User-Agent生成，降低被反爬虫识别的风险
提供批量URL爬取功能，可同时处理多个目标站点
集成日志记录系统，详细记录爬取过程和错误信息
支持结果保存为JSON格式，便于后续分析处理
requirements.txt文件包含所有必要的依赖包配置

全网低价IP-国内外IP源头渠道(socks5ip.com.cn)

支持无双IP（海外）、奔富IP、天行IP、沧海IP、光子IP、天机IP、优享云IP、鲸云IP、糖果IP等数十个国内外知名IP平台

☞https://linkdd.cn/socks5ip

自助提货，100%独享，免费测试，支持续费和调换

有任何IP使用问题，或量大谈合作，请点击【添加微信】，诚招代理！

常见问题

全网低价IP（socks5ip.com.cn）是做什么的？

本站是专业的IP资源整合平台，为您提供纯净独享低价高质的动态/静态住宅IP与机房IP混合方案。

全网低价IP-国内外IP源头渠道(socks5ip.com.cn)

国内IP平台中都有哪些平台最常用？

国外IP平台中最便宜、地区最全的平台是哪个？

python python爬虫 SOCKS5代理

请先

如何在Python中使用代理IP？

一、准备工作：获取代理IP信息

二、在Python中配置和使用代理IP

方法一：使用SOCKS5代理（推荐，兼容性更好）

方法二：使用HTTP/HTTPS代理

三、验证代理是否生效

四、高级用法与注意事项

全网低价IP-国内外IP源头渠道(socks5ip.com.cn)

如何在Python中使用socks5代理进行爬虫操作？

全网低价IP-国内外IP源头渠道(socks5ip.com.cn)

评论0

请收藏本站⭐️

全网低价IP

在线客服

每日签到

全屏浏览

夜间模式

返回顶部

站点提示

【全网低价IP】（https://socks5ip.com.cn）

如何在Python中使用代理IP？

一、 准备工作：获取代理IP信息

二、 在Python中配置和使用代理IP

方法一：使用SOCKS5代理（推荐，兼容性更好）

方法二：使用HTTP/HTTPS代理

三、 验证代理是否生效

四、 高级用法与注意事项

如何在Python中使用socks5代理进行爬虫操作？

猜你喜欢

评论0

在线客服

每日签到

全屏浏览

夜间模式

返回顶部

站点提示

【全网低价IP】（https://socks5ip.com.cn）

社交账号快速登录

社交账号快速登录

一、准备工作：获取代理IP信息

二、在Python中配置和使用代理IP

三、验证代理是否生效

四、高级用法与注意事项