Cloudflare將預設封鎖AI爬蟲,同時發表Pay per crawl支付方案,讓願意付費給內容網站的AI業者,得以擷取網頁內容訓練模型
文/林妍溱 | 2025-07-02發表
因應AI模型業者以網頁爬蟲(robot)未經同意擷取網頁內容訓練模型,本周內容遞送網路(CDN)業者Cloudflare宣布新措施,將預設封鎖AI網頁爬蟲。同時間,Cloudflare提供出版商能以允許爬蟲賺取收入的方案。
在周二(7/1)Cloudflare稱為內容獨立日(Content Independency Day)最新措施,也是去年Cloudflare提供網頁爬蟲的封鎖工具給客戶後更進一步。
Cloudflare指出,Google、OpenAI及Anthropic AI業者提供的聊天機器人在其回應中,已提供75%用戶需要的答案,而無需用戶造訪網頁,而Google的AI Overview的推出將使比例更向上攀高。
然而AI網頁爬蟲(或網頁機器人)擷取了出版商網頁內容提供的回答,已經對出版商造成營運傷害,因為來自廣告及訂閱的收入消失。
過去10年,內容創作者想再產生同樣流量,困難幾乎成長10倍,這還是來自Google造成的損害。根據Cloudflare的數據,因OpenAI及Anthropic再產生同樣流量,困難度達到750及30,000倍。可以說AI爬蟲侵害已嚴重侵害網路產業。
因此Cloudflare宣布,已和主要出版商和AI公司合作,採取新措施來防範AI網頁爬蟲不當擷取出版商的內容,並為創作者開闢新的營收來源。Cloudflare將預設封鎖AI爬蟲,除非AI業者支付創作者費用。
Cloudflare也宣布Pay per crawl的支付方案。它整合有Web基礎架構,運用HTTP status codes建立驗證機制,以建立付費內容存取框架。
技術原理如下。AI爬蟲每次呼叫內容時,若不能request headers經由展示支付意圖(intent)就會接收到一個附有收費價格的402 Payment Required的回應。Pay per crawl的紀錄商戶(Merchant of Record)和底層技術架構都是由Cloudflare扮演。
Pay per crawl框架提供網域持有者(出版商)收費策略完整控制權。他們可以定義站上以呼叫次數計費的單一費率,也能決定允許、收費和封鎖。但必要時,出版商必要時也可繞過收費,以免費內容執行外部內容合作。而AI網頁爬蟲操作單位及內容擁有者(出版商)必須在Cloudflare帳號下設定pay per crawl支付細部規定,所有爬蟲呼叫及支付活動都會紀錄下來,再由Cloudflare集結、收費並將報告發布給出版商。
不過Pay per crawl最重要的是出版商願意使用。目前Pay per crawl以不公開beta版本測試,Cloudflare邀請出版商報名加入。
網頁設計.RWD響應式網站.企業形象網站 / 電子工業類
網站技術:Javascript
火車/公車時刻表、醫院掛號或是馬路看板到更多的應用都是新耀的服務範圍,這些應用卻與我們生活息息相關。網站目前展示所有的應用產品、顯示系統範例,對此服務有興趣都可以透過信箱聯繫業務負責人喔。
精選專案.網頁設計.RWD響應式網站 / 教育人文類
網站技術:PHP/MySql
國語日報的粉絲們,可以在網站進行報紙的訂購喔! 透過報紙獲取新知、了解國家大事。本網站提供會員在線上訂購報紙,會員登入後可以觀看購買紀錄、訂單,可以利用ㄅ幣進行結帳。當然ㄅ幣需要先完成訂單才會有喔!
精選專案.企業形象網站.Line OA / 休閒餐飲類
網站技術:PHP/MySql
達日好胖卡推出點數及票劵LINE官方帳號喔,功能有點數集點/兌換/轉讓,甚至也有票劵功能,像是餐劵、遊戲劵等等。適用於公司、學校與社區活動,便利性極高的LINE OA 官方帳號。
電話:(02)2739-9096 | 傳真:(02)2739-6637 | 客服:[email protected] | 臺北市信義區和平東路3段257號6樓map
© 2019 傑立資訊 All rights reserved.| 網站隱私政策