最新消息

[公告2014/05/30] 如有需要將部落格中,任何一篇文章的程式碼使用在商業用途,請與我聯繫。

[公告2015/04/26] Line版的 iInfo程式與投資應用 群組已上線想加入的朋友們,請先查看 "入群須知" 再與我聯繫 Line : aminwhite5168,加入請告知身分與回答 "入群須知" 的問題。

[公告2018/04/22] 台北 Python + Excel VBA 金融資訊爬蟲課程,課程如網頁內容 金融資訊爬蟲班:台北班 Python 金融資訊爬蟲、EXCEL VBA 金融資訊爬蟲

[公告2019/01/08] 請注意:我再次重申,部落格文章的程式碼,是要提供各位參考與學習,一旦網頁改版請自行修改,別要求東要求西要我主動修改,你們用我寫東西賺錢了、交差了,請問有分我一杯羹嗎?既然賺錢沒分我,請問有什麼理由要求我修改,如果沒能力改,就花錢來找我上課。

[公告2019/12/01] 若各位有 Excel VBA 案子開發需求,歡迎與我聯繫,可接案處理。

[公告2020/05/22] 頁面載入速度慢,起因為部分JS來源(alexgorbatchev.com)失效導致頁面載入變慢,目前已做調整,請多見諒。

2019年7月31日 星期三

Python 抓取三大法人統計數據,透過read_html() 處理數字資料後千分位不見的處理方式

有人遇到用 Python 抓三大法人每日統計表,在使用read_html() 後,對於千分位的 "," 符號會消失而束手無策,即使用 "thousands" 也無效。


這裡提供作法讓千分位再顯示回來,如下程式碼。
import requests
import pandas as pd
from bs4 import BeautifulSoup as bs

url = "http://www.twse.com.tw/fund/BFI82U?response=html&type=day"
tb = bs(requests.get(url).text, "lxml").select("table")[0]
df = pd.read_html(tb.prettify(), encoding= 'utf8', skiprows=[0], header=0)[0].iloc[0:5]
df.iloc[:,1:] = df.iloc[:,1:].apply(lambda x : x.astype(int).apply('{:,}'.format)) 
df


加入以下這行程式即可解決。
df.iloc[:,1:] = df.iloc[:,1:].apply(lambda x : x.astype(int).apply('{:,}'.format)) 


沒有留言:

張貼留言