понедельник, 22 марта 2010 г.

google-adsense-parser

google adsense parser оказывается легко реализовать на python.
Надо использовать mechanize (mechanize - это библиотека на python, которая позволяет работать с web как browser. Только вот не знаю, можно ли использовать javascript)
Итак, сам код

import mechanize

root_url = 'https://www.google.com/adsense/login/en/'
email = "xxx"
passwd = "xxx"

br = mechanize.Browser()
home_page = br.open(root_url)
br.follow_link(text="Take me to my account.")
br.select_form(nr=0)
br['Email'] = email
br['Passwd'] = passwd
result_page = br.submit()

Видно, как мы с помощью этого браузера заходим на страницу https://www.google.com/adsense/login/en/ , далее, переходим по ссылке с текстом "Take me to my account.". На полученной странице логинимся и в переменной result_page уже хранится текст со страницы https://www.google.com/adsense/report/overview . Этот полученный текст можно парсить например с помощью BeautifulSoup

Комментариев нет:

Отправить комментарий