python request爬虫如何进行数据存储

1324
2024/12/11 9:22:52
栏目: 云计算
开发者测试专用服务器限时活动,0元免费领,库存有限,领完即止! 点击查看>>

在Python中,使用requests库进行网络请求并将数据存储到文件或数据库中,可以通过以下步骤实现:

  1. 安装requests库:
pip install requests
  1. 导入所需的库:
import requests
import json
  1. 发送HTTP请求并获取响应:
url = 'https://api.example.com/data'  # 替换为你要请求的URL
response = requests.get(url)
  1. 检查响应状态码,确保请求成功:
if response.status_code == 200:
    data = response.json()  # 假设返回的数据是JSON格式
else:
    print(f"请求失败,状态码:{response.status_code}")
  1. 将数据存储到文件中:
with open('output.json', 'w', encoding='utf-8') as file:
    json.dump(data, file, ensure_ascii=False, indent=4)
  1. 将数据存储到数据库中(以SQLite为例): 首先,安装sqlite3模块(Python内置):
import sqlite3

然后,创建一个SQLite数据库连接:

conn = sqlite3.connect('output.db')
cursor = conn.cursor()

接着,创建一个表格来存储数据:

cursor.execute('''
CREATE TABLE IF NOT EXISTS data (
    id INTEGER PRIMARY KEY AUTOINCREMENT,
    key TEXT NOT NULL,
    value TEXT NOT NULL
)
''')

将数据插入到数据库中:

for item in data:
    cursor.execute("INSERT INTO data (key, value) VALUES (?, ?)", (item['key'], item['value']))

最后,提交更改并关闭数据库连接:

conn.commit()
conn.close()

这样,你就可以使用Python的requests库进行网络请求,并将获取到的数据存储到文件或数据库中了。

辰迅云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>

推荐阅读: python中exit的使用方法是什么