最新消息

[公告2014/05/30] 如有需要將部落格中,任何一篇文章的程式碼使用在商業用途,請與我聯繫。

[公告2015/04/26] Line版的 iInfo程式與投資應用 群組已上線想加入的朋友們,請先查看 "入群須知" 再與我聯繫 Line : aminwhite5168,加入請告知身分與回答 "入群須知" 的問題。

[公告2018/04/22] 台北 Python + Excel VBA 金融資訊爬蟲課程,課程如網頁內容 金融資訊爬蟲班:台北班 Python 金融資訊爬蟲、EXCEL VBA 金融資訊爬蟲

[公告2019/01/08] 請注意:我再次重申,部落格文章的程式碼,是要提供各位參考與學習,一旦網頁改版請自行修改,別要求東要求西要我主動修改,你們用我寫東西賺錢了、交差了,請問有分我一杯羹嗎?既然賺錢沒分我,請問有什麼理由要求我修改,如果沒能力改,就花錢來找我上課。

[公告2019/12/01] 若各位有 Excel VBA 案子開發需求,歡迎與我聯繫,可接案處理。

[公告2020/05/22] 頁面載入速度慢,起因為部分JS來源(alexgorbatchev.com)失效導致頁面載入變慢,目前已做調整,請多見諒。

2020年2月4日 星期二

健保特約藥局查詢

近期肺炎話題很熱,昨天2/3行政院發佈了一則新聞,2/6後口罩只能在健保特約藥局購買,為方便大家可以順利找尋居家附近區域的健保特約藥局所在位置,用Python寫了一個簡單的查詢程式,希望對大家有幫助查尋。

Python程式碼。
import requests
import pandas as pd
from bs4 import BeautifulSoup as bs

url = "http://www.nhi.gov.tw/QueryN/Query3.aspx"
res = requests.get(url)
soup = bs(res.text, 'lxml')

sle = soup.select('#ctl00_ContentPlaceHolder1_ddlCountyAreaCode option')
df = []
for val in sle:
    tmp = []
    if len(val['value']) > 0:
        tmp.append(val['value'])
        tmp.append(val.text)
    df.append(tmp)
CountyAreaCode = pd.DataFrame(df)
CountyAreaCode = CountyAreaCode.drop([0])

payload ={
    'ctl00$ContentPlaceHolder1$ddlCountyAreaCode': '01'
}

for ele in soup.select('input[type==hidden]'):
    payload[ele['name']] = ele['value']
    
res = requests.post(url, data=payload)
soup  = bs(res.text, "lxml")    
sle = soup.select('#ctl00_ContentPlaceHolder1_ddlTownAreaCode option')
df = []
for val in sle:
    tmp = []
    if len(val['value']) > 0:
        tmp.append(val['value'])
        tmp.append(val.text)
    df.append(tmp)
TownAreaCode = pd.DataFrame(df)
TownAreaCode = TownAreaCode.drop([0])

df1 = []
for Townid, Town in zip(TownAreaCode[0], TownAreaCode[1]):
    payload['ctl00$ContentPlaceHolder1$ddlTownAreaCode'] = Townid
    payload['ctl00$ContentPlaceHolder1$ddlSpecialCode'] = '5'
    payload['ctl00$ContentPlaceHolder1$tbxPageNum'] = 999
    payload['ctl00$ContentPlaceHolder1$btnSubmit'] = '開始查詢'
    for ele in soup.select('input[type==hidden]'):
        payload[ele['name']] = ele['value']
    res = requests.post(url, data=payload)
    soup  = bs(res.text, "lxml")
    tb = soup.select('table')[2]
    df0 = pd.read_html(tb.prettify('utf8'), encoding = 'utf8', header = 0)[0]
    df0 = df0[pd.notnull(df0['地址'])].iloc[:, 0:3]
    df0.insert(0, '行政區', Town)
    df1.append(df0)
    
pd.set_option("display.max_rows", None)
df = pd.concat(df1)
df = df.reset_index(drop=True)
df.to_csv("健保特約藥局.csv")
df
執行結果:

18行:CountyAreaCode為個縣市列表。

38行:TownAreaCode為行政區列表。

注意:為避免部分Python開發環境無法正常執行,在24行、46行的程式碼 input[type==hidden] 可改為 input[type=hidden]

沒有留言:

張貼留言