第一次在課堂上報告完後教授就和我說只要統計那一塊區域的分佈密度就可以,希望我把它整理出來。但我為了讓資料更精準一點,所以當天就寫信給螺絲公會,請求給予較新的公會會員資料。不過過了十幾天後才回覆,而且還是我去 Meeting 的時候回覆的,想當然一定是沒有取得最新的資訊。
禮拜三(25)中午收到博班學姊的 Mail,要我隔天報告。我下午想了一下,覺得之前那樣取得資料的方式有點沒效率,應該還有更好的方式去取得,況且一直等不到公會的回覆,所以我就覺得要用 GAE(Google App Engine) 來取得資料。製作的過程就如同以下的簡報:
我大概估計了一下,從開始寫程式到完成開始抓資料大約花了 12 小時的工作時數,利用 Python 的 HTMLParser 去解析網頁,然後利用 cron 設定每一分鐘抓五家廠商到 GAE 資料庫,最後資料庫輸出成 CSV 檔丟到試算表裡面處理。相關的程式原始碼放在 isufinstudio@github。
之後還要搭配 Google Maps API 處理定位的事情,不過最近很忙,這部份就留到下禮拜才要處理!所以這就是第一次因為研究上需要,利用 GAE 來解決的狀況,還挺好玩的!
2 篇留言 我要留言!: