2012年10月29日 星期一

在windows底下用cmd命令開啟網頁(讀取HTML內容)

方法一:用系統預設瀏覽器

  1. 執行 「start http://網址」 指令,此時會用系統預設的瀏覽器開啟所輸入的網址。

方法二:用telnet指令,開啟http request

  1. 輸入「telnet 網址 80」(例:telnet google.com 80),建立http連接
  2. 連接成功後,畫面會一片黑,此時輸入
    GET /index.html HTTP/1.0」,再按兩次「Enter」,即可讀取該網頁的HTML內容。
    註1:/index.html 為欲瀏覽的網頁
    註2:輸入「GET /index.html HTTP/1.0」時,可能也是一片黑,看不到輸入的字,但是可看到游標的位置有在移動
  3. 若是使用HTTP1.1,
    則是輸入「GET /index.html HTTP/1.1」後,按一次「Enter」,
    再輸入「Host: 網址」(例:Host: google.com),再按兩次「Enter」。

方法三:使用curl指令

  1. 使用curl指令應該是最簡單的,但windows沒有內建此指令,所以需要自己下載。
    官網:http://curl.haxx.se/download.html
    這邊有各種平台的檔案,我們要在windows上使用,
    所以選擇win32或win64的binary檔下載。

    2021-11-20補充說明:win10 Insider Build 17063 開始,已經內建 curl、tar 指令。
    https://techcommunity.microsoft.com/t5/containers/tar-and-curl-come-to-windows/ba-p/382409

  2. 下載完,解壓縮便可以使用,解壓縮後只有一個curl.exe檔。
    我解壓縮到 D:\curl\資料夾
  3. 可以執行「D:\curl\curl -help」看指令用法,
    最簡單的用法就是執行「D:\curl\curl 網址」,即可。
    使用curl指令,便可以很容易讀取網頁HTML的內容。

沒有留言:

張貼留言