问题 Python请求参数/处理api分页

我正在玩Angel List（AL）API，想要在圣旧金山取得所有工作。因为我找不到api的活动Python包装器（如果我取得任何进展，我想我想自己制作），我正在使用请求库。

AL API的结果是分页的，我无法弄清楚如何超越结果的第一页。

这是我的代码：

import requests
r_sanfran = requests.get("https://api.angel.co/1/tags/1664/jobs").json()
r_sanfran.keys()
# returns [u'per_page', u'last_page', u'total', u'jobs', u'page']
r_sanfran['last_page']
#returns 16
r_sanfran['page']
# returns 1

我尝试添加参数 requests.get，但那没用。我也尝试过一些非常愚蠢的东西 - 改变'page'键的价值，就像魔法般地为我分页一样。

例如。 r_sanfran['page'] = 2

我猜它是相对简单的东西，但我似乎无法弄明白所以任何帮助都会很棒。

一如既往地谢谢。

Angel List API文档如果它有用

5445

2017-07-21 23:04

起源

答案:

读 last_page 并为该范围内的每个页面发出get请求：

import requests

r_sanfran = requests.get("https://api.angel.co/1/tags/1664/jobs").json()
num_pages = r_sanfran['last_page']

for page in range(2, num_pages + 1):
    r_sanfran = requests.get("https://api.angel.co/1/tags/1664/jobs", params={'page': page}).json()
    print r_sanfran['page']
    # TODO: extract the data

2017-07-21 23:23

我猜应该是这样的 range(2, num_pages + 1) 因为第一页是1，而16是总页数，所以希望包含在范围内...（并且可能想要使用 requests.get('http://...blah...?', params={'page': page}) 避免字符串插值 - Jon Clements♦

啊。我没有看到我可以在requests.get中传递params参数 - crock1255

啊。好的。我知道发生了什么。我在想这个分页来自angel.co/1...angel.co/2等等。感谢您的帮助！ - crock1255

@JonClements一如既往，好点，谢谢:) - alecxe

在params = {之后缺少关闭'}' - API_sheriff_orlie

答案: