a) Określić najnowszą wersję Pandoc i chwyć URL za pomocą pakietu XML
:
library(XML)
page <- readLines('http://code.google.com/p/pandoc/downloads/list', warn = FALSE)
pagetree <- htmlTreeParse(page, error=function(...){}, useInternalNodes = TRUE, encoding='UTF-8')
url <- xpathSApply(pagetree, '//tr[2]//td[1]//a ', xmlAttrs)[1]
url <- paste('http', url, sep = ':')
b) lub zastosować kilka wyrażeń regularnych magiczne dzięki @ G.Grothendieck zamiast (nie ma potrzeby pakietu XML
ten sposób):
page <- readLines('http://code.google.com/p/pandoc/downloads/list', warn = FALSE)
pat <- "//pandoc.googlecode.com/files/pandoc-[0-9.]+-setup.exe"
line <- grep(pat, page, value = TRUE); m <- regexpr(pat, line)
url <- paste('http', regmatches(line, m), sep = ':')
C) lub po prostu sprawdzić najnowszą wersję ręcznie jeśli chcesz poczuć tak:
url <- 'http://pandoc.googlecode.com/files/pandoc-1.10.1-setup.exe'
Wielkiej! Jakikolwiek sposób automatycznie rozpoznać najnowszą wersję? –
@TalGalili: Mam nadzieję, że udało mi się znaleźć najnowszą wersję. – daroczig
Ah, i przepraszam za częste zmiany, już nie będę dotykać tego postu. Obiecuję :) – daroczig