python爬取Dz论坛
本文最后更新于1820天前,其中的信息可能已经有所发展或是发生改变。

ps:

  1. 选择浏览器无痕模式
  2. 打开网站http://www.lxwc.com.cn/
  3. F12打开chrome 调试工具
  4. 打开network标签,勾上preserve log
  5. 点击登录按钮,打开登录框
  6. 选择用户名密码登录
  7. 添上用户名、密码
  8. 请求链接
    http://www.lxwc.com.cn/member.php?mod=logging&action=login&loginsubmit=yes&handlekey=login&loginhash=LUmiU&inajax=1
  9. 请求方法: POST
  10. requests url里参数部分是query string parameters
  11. formdata
    formhash: 0a7afe68
    referer: http://www.lxwc.com.cn/
    登录方式
    loginfield: username 用户名登录方式
    用户名
    username: vvaa00
    密码
    password: FcprHkcUTeshFp6
    questionid: 0
    answer:

写代码

  1. 新建文件
  2. 写login函数

找formhash

  1. 请求链接
    http://www.lxwc.com.cn/member.php?mod=logging&action=login&infloat=yes&handlekey=login&inajax=1&ajaxtarget=fwin_content_login
  2. Request Method: GET
  3. 写函数执行网络访问,获取网页源代码
  4. 解析网页源代码

注意:
爬取失败

  1. 加useragent
  2. Host:Origin: Referer:
  3. cookies

点击数:110

    暂无评论

    发送评论 编辑评论

    
    				
    |´・ω・)ノ
    ヾ(≧∇≦*)ゝ
    (☆ω☆)
    (╯‵□′)╯︵┴─┴
     ̄﹃ ̄
    (/ω\)
    ∠( ᐛ 」∠)_
    (๑•̀ㅁ•́ฅ)
    →_→
    ୧(๑•̀⌄•́๑)૭
    ٩(ˊᗜˋ*)و
    (ノ°ο°)ノ
    (´இ皿இ`)
    ⌇●﹏●⌇
    (ฅ´ω`ฅ)
    (╯°A°)╯︵○○○
    φ( ̄∇ ̄o)
    ヾ(´・ ・`。)ノ"
    ( ง ᵒ̌皿ᵒ̌)ง⁼³₌₃
    (ó﹏ò。)
    Σ(っ °Д °;)っ
    ( ,,´・ω・)ノ"(´っω・`。)
    ╮(╯▽╰)╭
    o(*////▽////*)q
    >﹏<
    ( ๑´•ω•) "(ㆆᴗㆆ)
    😂
    😀
    😅
    😊
    🙂
    🙃
    😌
    😍
    😘
    😜
    😝
    😏
    😒
    🙄
    😳
    😡
    😔
    😫
    😱
    😭
    💩
    👻
    🙌
    🖕
    👍
    👫
    👬
    👭
    🌚
    🌝
    🙈
    💊
    😶
    🙏
    🍦
    🍉
    😣
    Source: github.com/k4yt3x/flowerhd
    颜文字
    Emoji
    小恐龙
    花!
    上一篇
    下一篇