我正在尝试/想要编写一个Python脚本(2.7),该脚本会转到网站上的表单(名称为 "form1"
)并用所述单词填写所述表格中的第一个输入字段 hello
,第二个带字的输入字段 Ronald
,和第三个领域 ronaldG54@gmail.com
任何人都可以帮我编码或给我任何提示或指示如何做到这一点?
我正在尝试/想要编写一个Python脚本(2.7),该脚本会转到网站上的表单(名称为 "form1"
)并用所述单词填写所述表格中的第一个输入字段 hello
,第二个带字的输入字段 Ronald
,和第三个领域 ronaldG54@gmail.com
任何人都可以帮我编码或给我任何提示或指示如何做到这一点?
除了大卫提到的机械化和硒之外,它也可以实现 Requests
和 BeautifulSoup
。
为了更清楚,使用 Requests
发送请求和从服务器检索响应,并使用 BeautifulSoup
解析响应html以了解要发送到服务器的参数。
这是我编写的使用两者的示例脚本 Requests
和 BeautifulSoup
提交用户名和密码登录维基百科:
import requests
from bs4 import BeautifulSoup as bs
def get_login_token(raw_resp):
soup = bs(raw_resp.text, 'lxml')
token = [n['value'] for n in soup.find_all('input')
if n['name'] == 'wpLoginToken']
return token[0]
payload = {
'wpName': 'my_username',
'wpPassword': 'my_password',
'wpLoginAttempt': 'Log in',
#'wpLoginToken': '',
}
with requests.session() as s:
resp = s.get('http://en.wikipedia.org/w/index.php?title=Special:UserLogin')
payload['wpLoginToken'] = get_login_token(resp)
response_post = s.post('http://en.wikipedia.org/w/index.php?title=Special:UserLogin&action=submitlogin&type=login',
data=payload)
response = s.get('http://en.wikipedia.org/wiki/Special:Watchlist')
更新:
对于您的具体情况,这是工作代码:
import requests
from bs4 import BeautifulSoup as bs
def get_session_id(raw_resp):
soup = bs(raw_resp.text, 'lxml')
token = soup.find_all('input', {'name':'survey_session_id'})[0]['value']
return token
payload = {
'f213054909': 'o213118718', # 21st checkbox
'f213054910': 'Ronald', # first input-field
'f213054911': 'ronaldG54@gmail.com',
}
url = r'https://app.e2ma.net/app2/survey/39047/213008231/f2e46b57c8/?v=a'
with requests.session() as s:
resp = s.get(url)
payload['survey_session_id'] = get_session_id(resp)
response_post = s.post(url, data=payload)
print response_post.text
除了大卫提到的机械化和硒之外,它也可以实现 Requests
和 BeautifulSoup
。
为了更清楚,使用 Requests
发送请求和从服务器检索响应,并使用 BeautifulSoup
解析响应html以了解要发送到服务器的参数。
这是我编写的使用两者的示例脚本 Requests
和 BeautifulSoup
提交用户名和密码登录维基百科:
import requests
from bs4 import BeautifulSoup as bs
def get_login_token(raw_resp):
soup = bs(raw_resp.text, 'lxml')
token = [n['value'] for n in soup.find_all('input')
if n['name'] == 'wpLoginToken']
return token[0]
payload = {
'wpName': 'my_username',
'wpPassword': 'my_password',
'wpLoginAttempt': 'Log in',
#'wpLoginToken': '',
}
with requests.session() as s:
resp = s.get('http://en.wikipedia.org/w/index.php?title=Special:UserLogin')
payload['wpLoginToken'] = get_login_token(resp)
response_post = s.post('http://en.wikipedia.org/w/index.php?title=Special:UserLogin&action=submitlogin&type=login',
data=payload)
response = s.get('http://en.wikipedia.org/wiki/Special:Watchlist')
更新:
对于您的具体情况,这是工作代码:
import requests
from bs4 import BeautifulSoup as bs
def get_session_id(raw_resp):
soup = bs(raw_resp.text, 'lxml')
token = soup.find_all('input', {'name':'survey_session_id'})[0]['value']
return token
payload = {
'f213054909': 'o213118718', # 21st checkbox
'f213054910': 'Ronald', # first input-field
'f213054911': 'ronaldG54@gmail.com',
}
url = r'https://app.e2ma.net/app2/survey/39047/213008231/f2e46b57c8/?v=a'
with requests.session() as s:
resp = s.get(url)
payload['survey_session_id'] = get_session_id(resp)
response_post = s.post(url, data=payload)
print response_post.text