顯示廣告
隱藏 ✕
※ 本文為 ericcenter.bbs. 轉寄自 ptt.cc 更新時間: 2017-02-20 11:44:05
看板 Python
作者 cobrasgo (人魚線變成鮪魚線,超帥)
標題 [問題] 抓證交所網頁資料
時間 Sat Jun 20 13:39:31 2015


大家好
我現在想抓這個網頁的資料
http://info512.taifex.com.tw/Future/FusaQuote_Norl_Top1.aspx

左上角有個每頁顯示筆數
我想抓的是"全部"

我用wireshark抓了封包
試著送出類似的內容
但是因為對網頁技術苦手
一直無法抓到全部的資料(我猜是post body的資料有誤)

小弟的程式碼如下
http://pastie.org/10249845

可以請網頁高手指點一下嗎?
謝謝

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 122.116.108.229
※ 文章代碼(AID): #1LXFoMcO (Python)
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1434778774.A.998.html
arthur104: header要給User Agent和Cookie1F 06/20 22:29
arthur104: post data要給__VIEWSTATE和Pagesize那個
cobrasgo: 抓到了,謝謝。請問一下那個__VIEWSTATE是幹嘛用的?3F 06/21 11:57
Azraelx: 要參考一下這個嗎 https://pypi.python.org/pypi/grs4F 06/22 23:44
grs 0.7.0 : Python Package Index
台灣上市上櫃股票價格擷取(Fetch Taiwan Stock Exchange data)含即時盤、台灣時間轉換、開休市判斷。 ...

 
Azraelx: 不知道符不符合您的需求5F 06/22 23:45

--
※ 看板: NoMatter 文章推薦值: 0 目前人氣: 0 累積人氣: 101 
r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄 同主題: =)首篇 [)上篇 ])下篇