Chcę uzyskać dostęp do zawartości zasobów strony internetowej za pomocą Pythona poprzez protokół debugowania Chrome, z tej strony method-getResourceContent, zauważyłem tę metodę: getResourceContent, potrzebuję params frameId i url.i myślę, że ta metoda jest tym co potrzebuję. więc to uczynił:jak uzyskać zawartość zasobów strony internetowej poprzez zdalne debugowanie chrome
1.Get uruchomieniu Chrome jako serwera. \ Chrome.exe --remote-debugowanie-port = 9222
2.write kodu testu python:
# coding=utf-8
"""
chrome --remote-debugging api test
"""
import json
import requests
import websocket
import pdb
def send():
geturl = requests.get('http://localhost:9222/json')
websocketURL = json.loads(geturl.content)[0]['webSocketDebuggerUrl']
request = {}
request['id'] = 1
request['method'] = 'Page.navigate'
request['params'] = {"url": 'http://global.bing.com'}
ws = websocket.create_connection(websocketURL)
ws.send(json.dumps(request))
res = ws.recv()
ws.close()
print res
frameId = json.loads(res)['result']['frameId']
print frameId
geturl = requests.get('http://localhost:9222/json')
websocketURL = json.loads(geturl.content)[0]['webSocketDebuggerUrl']
req = {}
req['id'] = 1
req['method'] = 'Page.getResourceContent'
req['params'] = {"frameId":frameId,"url": 'http://global.bing.com'}
header = ["User-Agent: Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.103 Safari/537.36"]
pdb.set_trace()
ws = websocket.create_connection(websocketURL,header=header)
ws.send(json.dumps(req))
ress = ws.recv()
ws.close()
print ress
if __name__ == '__main__':
send()
3.Page.navigate praca w porządku, mam coś takiego: { "id": 1, "wynik": { "frameId": "8504,2"}}
4.When próbuję metodę: getResourceContent , wystąpił błąd: {"error": {"code": - 32000, "message": "Agent nie jest włączony . "}," id ": 1}
Próbowałem dodać User-Agent, nadal nie działa.
Dzięki.