国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

用 Puppeteer 實現一個自動化機器人

開發 前端 自動化
Puppeteer 是 Node.js 的一個函數庫,可用來操控瀏覽器,是 Google 的項目,可以應用的范圍包括:前端的自動化測試、爬蟲、表單提交等。

 [[390866]]

目錄

  • 簡介

  • Selenium vs Puppeteer

  • 安裝

  • 一個簡單的例子

  • 解釋代碼

  • 把項目容器化

  • 容器打包時的一些坑

    • 1. Puppeteer 安裝 Chromium 時會缺少一些組件

    • 2. 頁面焦點問題

    • 3. Page Crash 問題

    • 4. 時區問題

Puppeteer 是 Node.js 的一個函數庫,可用來操控瀏覽器,是 Google 的項目,可以應用的范圍包括:前端的自動化測試、爬蟲、表單提交等。

Selenium vs Puppeteer

之前有過用 Python 配合 Selenium 的經驗,不過如果是做爬蟲、自動化操作用 Puppeteer 還是非常方便的,安裝簡單快速,API 也容易使用。美中不足的是它只支持 Chromium 以下是兩者的比較,僅供參考:

 

由于 Puppeteer 是用 Node.js 寫的,所以必須要先安裝 Node。

  1. 可以至官網 下載

  2. 如果用 mac 可以使用 https://nodejs.org/en/

安裝完后可以在 terminal 輸入 node -v 檢查是否安裝成功

然后到要開發的項目路徑下輸入 npm init -y 初始化項目,接著 npm i puppeteer ,安裝的時候會發現它會連同 Chromium 一同安裝。

安裝成功后就可以開始了。

一個簡單的例子

新增一個文件 main.js ,并復制以下代碼:

  1. const puppeteer = require('puppeteer'); 
  2.  
  3. (async () => { 
  4.  
  5.   // 開啟 browser 
  6.   const browser = await puppeteer.launch({ 
  7.         headless: false 
  8.   }); 
  9.   // 新增分頁 
  10.   const page = await browser.newPage(); 
  11.   // 到自己的博客網站 
  12.   await page.goto(`https://www.myblog.com/`); 
  13.   // 等待訂閱按鈕出現 
  14.   await page.waitForSelector("button[class='subscribe-button pill-button']"); 
  15.   // 點擊訂閱按鈕 
  16.   await page.click("button[class='subscribe-button pill-button']"); 
  17. })(); 

接著到終端下輸入 node main.js 執行。

解釋代碼

前面的代碼先引入 Puppeteer,以便后續使用,接下來可以看到用 async 以及 () => , async 表示函數要用到異步操作, () => 則是 JS 的箭頭函數。

  1. const puppeteer = require('puppeteer'); 

接下來是用 Puppeteer 打開一個瀏覽器 ( Chromium ),其中可以看到我們設了參數 headless : false ,如果是設定為 true ,會開啟沒有界面的無頭瀏覽器,如果設定 false ,就會開一個瀏覽器窗口。

  1. const browser = await puppeteer.launch({ 
  2.     headless: false 
  3. }); 

這段就很簡單了,它會幫你在瀏覽器開一個新的分頁。

  1. const page = await browser.newPage(); 

這段也很容易,看到 goto 就可以猜到會幫你導向后方指定的網址。

  1. await page.goto(`https://b123105.blogspot.com/`); 

最后這段代碼用到了 click 這個方法,它能夠幫你點擊后面指定的元素,可以看到我是指定 class = subscribe-button pill-button 的 <button> 。

waitForSelector 的作用是,在執行時整個操作速度會很快,有時可能這個元素都很沒出現,就讓它去點擊,有可能會找不到。所以先讓它等待指定元素出現后,再去點擊。

  1. await page.waitForSelector("button[class='subscribe-button pill-button']"); 
  2.  
  3. await page.click("button[class='subscribe-button pill-button']"); 

把項目容器化

首先下載 Docker,這里就不再贅述。接下來在項目目錄下創建 Dockerfile ,把下面的腳本代碼復制粘貼。

然后構建鏡像: docker build -t puppeteer-bot . 。

構建完成后就執行 docker run -d --name puppeteer-bot-timeline puppeteer-bot:latest 。

之后可以通過 docker logs puppeteer-bot-timeline 查看 console.log 的內容 ( 如果有的話 )。

要記得 headless 要設定為 true 才能運行。

  1. FROM node:11-slim 
  2. # 下載 chromium 在 docker 運行時所需組件 
  3. RUN apt-get update && apt-get install -yq libgconf-2-4 
  4. RUN apt-get update && apt-get install -y wget --no-install-recommends \ 
  5.     && wget -q -O - https://dl-ssl.google.com/linux/linux_signing_key.pub | apt-key add - \ 
  6.     && sh -c 'echo "deb [arch=amd64] http://dl.google.com/linux/chrome/deb/ stable main" >> /etc/apt/sources.list.d/google.list' \ 
  7.     && apt-get update \ 
  8.     && apt-get install -y google-chrome-unstable \ 
  9.       --no-install-recommends \ 
  10.     && rm -rf /var/lib/apt/lists/* \ 
  11.     && apt-get purge --auto-remove -y curl \ 
  12.     && rm -rf /src/*.deb 
  13.  
  14. ADD https://github.com/Yelp/dumb-init/releases/download/v1.2.0/dumb-init_1.2.0_amd64 /usr/local/bin/dumb-init 
  15. RUN chmod +x /usr/local/bin/dumb-init 
  16. USER root 
  17. ENV TZ=Asia/Shanghai # 轉換時區,非必要 
  18. RUN ln -snf /usr/share/zoneinfo/$TZ /etc/localtime && echo $TZ > /etc/timezone 
  19. COPY . /app/ 
  20. WORKDIR app 
  21. RUN npm install 
  22. EXPOSE 8084 
  23. ENTRYPOINT ["dumb-init""--"
  24. CMD ["node""main.js"

容器打包時的一些坑

接下來是我在用 Docke 打包過程遇到的一些問題:

1. Puppeteer 安裝 Chromium 時會缺少一些組件

本來用 docker 封裝是很容易的,安裝 node 然后 npm install 就行了,但是在實際操作時一直報錯說 Chromium 缺少組件。后來去 Puppeteer 的 issue 上查到原來安裝 Puppeteer 時會自動安裝 Chromium,但要在 Docker 上運行的相關組件并不會自動下載。

2. 頁面焦點問題

在開發時我是通過開啟一個瀏覽器,然后持續開三個分頁來進行操作,希望能加快處理的速度。但是發現當 headless:false 時,會同時開啟三個分頁,但只有被設置為焦點的當前頁面在執行后面的腳本,另外兩頁并沒有。因為在開發過程中執行時 tab 頁會被關閉,所以接下來第二個 tab 中的頁面獲得焦點后會再開始運行。

在 issue 中也看到有人遇到了同樣的問題,只有在 headless:true 的時候會同時處理,但目前還沒找到其他解法。

3. Page Crash 問題

上面有提到我在一個瀏覽器上操作三個分頁,放在 docker 中運行,總是遇到 Page Crash 問題,第一反應是可能內存不足,在 issue 上查到原來在打開瀏覽器時要加上 --disable-dev-shm-usage 。

原文是這樣說的:

By default, Docker runs a container with a /dev/shm shared memory space 64MB. This is typically too small for Chrome and will cause Chrome to crash when rendering large pages. To fix, run the container with docker run --shm-size=1gb to increase the size of /dev/shm. Since Chrome 65, this is no longer necessary. Instead, launch the browser with the --disable-dev-shm-usage flag: const browser = await puppeteer.launch({ args: ['--disable-dev-shm-usage'] });

4. 時區問題

這個問題與 Puppeteer 無關,有的服務器時區默認是 GMT,這時就要在 Dockerfile 指定容器的時區,不然代碼中涉及到時間的操作時會被自動加 8 小時。

責任編輯:張燕妮 來源: 前端先鋒
相關推薦

2021-04-21 13:56:32

人工智能機器學習

2023-10-30 17:41:29

機器人自動化

2019-04-02 09:00:00

機器人人工智能HMI設計

2023-07-11 16:35:13

機器人流程自動化

2020-09-10 11:40:00

Python機器人人工智能

2024-03-04 15:04:37

機器人人工智能

2023-10-18 15:23:47

人工智能聊天機器人

2020-04-11 22:21:07

開源機器人過程自動化工具RPA

2020-04-29 11:28:54

智能自動化機器人流程自動化AI

2022-09-30 13:55:46

Python機器人

2020-12-02 13:00:17

Recast.AI聊天機器人人工智能

2021-08-11 11:18:25

機器人人工智能技術

2024-02-04 09:43:53

機器人物聯網

2023-08-28 16:16:15

機器人測試

2021-09-02 10:19:17

人工智能AI機器人

2021-10-08 09:31:05

機器人自動化物流

2020-08-18 09:55:21

機器人過程自動化數字化轉型RPA

2024-03-07 14:37:46

自動化機器人人工智能

2021-08-06 09:35:37

Python盯盤機器人編程語言

2020-07-08 10:29:54

機器人自動化人工智能
點贊
收藏

51CTO技術棧公眾號

gogo人体一区| 欧美日韩三级电影在线| 亚洲精品影视在线观看| 国内高清免费在线视频| 日韩免费一区二区| 在线视频色在线| 亚洲品质自拍视频网站| 濑亚美莉vs黑人在线观看| 亚洲永久免费视频| 91超碰在线播放| 亚洲一区在线看| 91资源在线观看| 亚洲自拍欧美另类| 精品国产不卡一区二区| 精品一区二区不卡| 亚洲草久电影| 色视频网站在线| 亚洲国产成人tv| 狼人天天伊人久久| 国产精品va在线播放| 欧美一级二级三级区| 日本视频久久久| 国产精品国产三级国产aⅴ原创| 全部孕妇毛片丰满孕妇孕交 | 97超碰国产精品| 亚洲国产日日夜夜| 国产伦久视频在线观看| 欧美一级淫片aaaaaaa视频| 日韩和欧美的一区| 亚洲最大成人在线观看| 日韩欧美激情四射| 涩涩涩在线视频| 欧洲精品久久久| 96久久久久久| 日韩一级片在线观看| 日韩色淫视频| 欧美在线中文字幕| 在线看片一区| 九九九热999| 久久综合欧美| 国产精品黄页网站在线播放免费| 少妇av一区二区三区| 青春草视频在线| 欧美一级搡bbbb搡bbbb| xx欧美视频| 色777狠狠综合秋免鲁丝| 俄罗斯一级**毛片在线播放 | 99蜜桃在线观看免费视频网站| 成人午夜电影网站| 日韩a在线看| 日韩精品中文在线观看| 欧美电影一二区| 美女av免费观看| 亚洲无线码一区二区三区| 91av资源在线| 91sa在线看| 亚洲人体在线| 神马精品久久| 97在线视频观看| 青青草97国产精品免费观看无弹窗版 | 欧美自拍偷拍午夜视频| 伊人青青综合网| 欧美少妇另类| 欧美精品在线极品| 国产精品亚洲专一区二区三区| 男人的天堂在线播放| 精品国产伦一区二区三区观看体验 | 在线观看精品视频| 日本久久电影网| 亚洲经典视频| 99视频在线| 欧美一区二区三区日韩| 国内成人精品2018免费看| 国产一区二区在线观| www.av99| 欧美日韩亚洲免费| 国产午夜精品一区理论片飘花| 亚洲视频综合| 一区二区三区视频国产日韩| 日韩一区二区欧美| 精品一区二区影视| www成人免费| 亚洲91av视频| 亚洲第一在线综合网站| 亚洲精品小说| 国产三级在线看| 国产成人免费电影| 欧美精品一区二区三区一线天视频| 欧美a级理论片| 国产在线视频福利| 国产一区二区精品在线| 欧美手机在线视频| 日韩福利电影在线| 北条麻妃av高潮尖叫在线观看| 国精产品一区二区| 久久久久中文字幕2018| 色综合天天综合色综合av| 亚洲欧美日韩国产| 日韩欧美少妇| 又色又爽又高潮免费视频国产| 热久久99这里有精品| 最新久久zyz资源站| 九九热线有精品视频99| 91成人app| 久久爱91午夜羞羞| 亚洲天堂2017| www.欧美精品一二三区| 亚洲欧美在线另类| 欧美一级专区| 加勒比视频一区| melody高清在线观看| 国产精品国产精品国产专区蜜臀ah| 欧美夜福利tv在线| 麻豆国产欧美一区二区三区| 99精品国产在热久久| 欧美成人亚洲| 国产伦一区二区三区| 成人性生交大片免费看96| 欧美日韩亚洲国产| 欧美xxx性| 国产在线看片免费视频在线观看| 中午字幕在线观看| 日本成人免费| 青青青在线视频播放| 国产日韩二区| 欧美大尺度在线观看| 欧美性猛交xxxx免费看漫画| 亚洲一区免费在线观看| www.成人网.com| 欧美国产成人精品| 国产精品二三区| 亚洲午夜精品网| 亚洲制服丝袜av| 久久久99久久| 日韩成人一级片| 久久在线电影| 精品嫩草影院| 成人免费短视频| 男女污污视频在线观看| 国产69久久| 欧美videos另类精品| 在线观看免费视频你懂的| 欧美最猛性xxxxx直播| 最新国产精品精品视频| 4438五月综合| 老司机aⅴ在线精品导航| 在线播放一区二区精品视频| 亚洲动漫精品| 久久成人免费| 亚洲性人人天天夜夜摸| 国产成人影院| 在线观看日韩av电影| 亚洲视频高清| 日欧美一区二区| 久久成人免费网站| 亚洲日本在线视频观看| 色婷婷综合在线| 亚洲人成电影网站色mp4| 日韩午夜三级在线| 欧美年轻男男videosbes| 678五月天丁香亚洲综合网| 最近2019年手机中文字幕| 在线视频欧美日韩精品| 欧洲精品在线视频| 久久久成人精品一区二区三区| 久草福利资源站| 日本在线观看视频| 免费黄色网址在线观看| av中文字幕在线看| 国产精品久久久久久久久久白浆| 亚洲五码在线| 日本一区中文字幕| 中文字幕 久热精品 视频在线| 日韩精品专区在线影院观看| 欧美一区二区三区免费| 欧美另类交人妖| 中文字幕在线中文| 成人欧美亚洲| 综合视频一区| 久久影院视频免费| 日韩中文字在线| 黄色免费视频大全| 琪琪久久久久日韩精品| 精品网站在线| 91在线看国产| 国产精品日韩专区| 韩国三级在线观看久| 日韩制服丝袜av| 色视频www在线播放国产成人 | 在线播放高清视频www| 亚洲视频成人| 欧美日韩午夜影院| 青娱乐国产91| 国产区在线看| 老司机午夜精品视频在线观看| 国产精品久久久久影院老司| 91精品国产777在线观看| 在线中文字幕av| 欧美日韩中文| 亚洲成人性视频|