最新消息

[公告2014/05/30] 如有需要將部落格中,任何一篇文章的程式碼使用在商業用途,請與我聯繫。

[公告2015/04/26] Line版的 iInfo程式與投資應用 群組已上線想加入的朋友們,請先查看 "入群須知" 再與我聯繫 Line : aminwhite5168,加入請告知身分與回答 "入群須知" 的問題。

[公告2018/04/22] 台北 Python + Excel VBA 金融資訊爬蟲課程,課程如網頁內容 金融資訊爬蟲班:台北班 Python 金融資訊爬蟲、EXCEL VBA 金融資訊爬蟲

[公告2019/01/08] 請注意:我再次重申,部落格文章的程式碼,是要提供各位參考與學習,一旦網頁改版請自行修改,別要求東要求西要我主動修改,你們用我寫東西賺錢了、交差了,請問有分我一杯羹嗎?既然賺錢沒分我,請問有什麼理由要求我修改,如果沒能力改,就花錢來找我上課。

[公告2019/12/01] 若各位有 Excel VBA 案子開發需求,歡迎與我聯繫,可接案處理。

[公告2020/05/22] 頁面載入速度慢,起因為部分JS來源(alexgorbatchev.com)失效導致頁面載入變慢,目前已做調整,請多見諒。

2015年7月25日 星期六

Windows上建置R Studio與Package安裝

上午上R Crawler課程,記錄在Windows安裝R Studio環境,要注意的細節。
Step 1. 到R 官網,下載安裝 R for Windows
Step 2. 到R Studio官網,下載安裝 R Studio

Step 3. 在Console畫面中輸入以下指令,安裝套件。
install.packages("httr")
install.packages("XML")
install.packages("tmcn", repos="http://R-Forge.R-project.org")
install.packages("devtools")
install.packages("http://cran.r-project.org/src/contrib/Archive/CSS/CSS_1.0.2.tar.gz",repos = NULL,type = "source")

安裝套件後檢查一下,出現以下有套件無法安裝的訊息

這時可到 R-Forge 官網下載 "tmcn" 套件,回到RStudio 右下角視窗中,點選 "Packages" 標籤頁中的 "Install"。

在對話框中 "Install from" 項目中,選擇 "Package Archive File (.zip;,tar.gz)" 選項,並在 "Package Archive" 項目中,找到剛剛下載 "tmcn" 套件 "tmcn_0.1-4.zip" 來安裝。

最後 "tmcn" 套件安裝成功的畫面。

PS:"tmcn" 套件為Windows上用來處理中文字的套件,有需要在Windows上處理中文字的朋友可以多注意。

Step 4. 輸入以下程式碼,開始用R抓網頁資料。
library(httr);
library(XML);
library(tmcn);
req <- GET("https://tw.news.yahoo.com/sports/",encoding='utf8')
req <- content(req,'text', encoding = 'utf8')
req <- htmlParse(req, encoding = 'utf8')
dd <- xpathSApply(req, '//div[@id="mediablistmixedlpcatemp"]/div/ul/li/div/a', xmlValue)
View(dd)