正则表达式re写便民查询网翻译python爬虫
正则表达式re写便民查询网翻译python爬虫
需要用到的模块:
request urllib re
re用于正则表达式模块
放入一个header信息
如:
header={:}
爬写方式,用到谷歌的F12,点击输入翻译抓包
找到翻译的接口
得到地址:
https://www.woaifanyi.com/api/1.9/save/?ajaxtimestamp=1612505994032
现在需要把 fromdata装入
formdata={ : , : , : }
这里发现我们找到的response信息为: [{"x_s_w_z":0,"n_r":"\u5df4\u9ece"},{"x_s_w_z":1,"f_y_y_q":3,"h_h_id":"00d467975ad55252b9b0932cdeb97541"},{"x_s_w_z":2,"n_r":"Paris<br>"}] 我们取一个n_r就可以了 写一个zhengz 格式为r'"n_r":"<.*?>"' 利用re.findall去区配
你好
发现返回的地址是:['\\u6211\\u7231\\u4e2d\\u56fd', '\\u6211\\u7231\\u4e2d\\u56fd', 'I love China<br>']
看到信息比较乱
我们取第2个数组元素
prtint(reu[2])
from urllib import request import urllib import re header={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36" } url="https://www.woaifanyi.com/api/1.9/save/?ajaxtimestamp=1612504530730" formdata={ "source": "我爱中国", "from": "1", "to": "2" } data=urllib.parse.urlencode(formdata).encode(encoding='utf-8') res=request.Request(url,data=data,headers=header) response=request.urlopen(res).read().decode() zhengz=r'"n_r":"(.*?)"' reu=re.findall(zhengz,response) print(reu[2])
<< 上一篇
下一篇 >>