香港商報
-- 天氣
OpenAI承認使用爬蟲 自我設限難消公眾懷疑

OpenAI承認使用爬蟲 自我設限難消公眾懷疑

責任編輯:程向明 2023-08-10 10:12:55 來源:香港商報網

 据《科創板日報》援引科技媒體Insider最新報道,OpenAI近日承認,其推出了名為GPTBot的網絡爬蟲機器人,用於抓取和收集數據用於大模型訓練。

 網絡爬蟲,是一種模擬人(網絡用戶)的行為,自動瀏覽、收集網絡信息的計算機程序。網絡爬蟲可以將自己所訪問的數據保存下來,數據抓取者對這些數據進行分析等加工再利用,推測出互聯網用戶的偏好,再順勢推送給與之匹配的用戶群體。

 目前還不清楚OpenAI的爬蟲機器人在網上潛伏了多久,有些人懷疑OpenAI已經秘密收集每個人的在線數據長達數月或數年。

 面對這樣的「指控」,OpenAI積極自辯,該公司表示,GPTBot將嚴格遵守任何付費牆的規則,不會抓取需要付費的信息,並且也不會收集能追蹤到個人身份的數據。

 此外,OpenAI上線了一種阻止GPTbot的方法,用戶可以修改其robots.txt文件,或者屏蔽其IP地址,拒絕爬蟲的造訪。該公司最近還宣布與美聯社達成一項協議,OpenAI將付費購買AI訓練數據所需的美聯社內容。

 爬蟲技術作為一種數據搜集的手段,本身並沒有合法與非法之分。但OpenAI主動為其爬蟲工具設限的舉動,似乎並不能挽回公眾對這家大模型頭號公司的信任。

 老牌科幻雜誌《克拉克世界》的主編、雨果獎得主尼爾•克拉克(Neil Clarke)表示:「OpenAI和其他大模型公司一再用行動證明,他們不尊重作者、藝術家和其他創意人士的權利,他們的產品很大程度上基於他人受版權保護的作品。」

 如何平衡個人隱私保護和鼓勵技術創新,如何找到企業生存與合規生產間的最優路徑,已經是每個致力於生成式AI事業的公司繞不開的問題。

責任編輯:程向明 OpenAI承認使用爬蟲 自我設限難消公眾懷疑
香港商報PDF
股市

友情鏈接

承印人、出版人:香港商報有限公司 香港商報有限公司版權所有,未經授權,不得複製或轉載。 Copyright © All Rights Reserved
聯絡我們

電話:(香港)852-2564 0768

(深圳)86-755-83518792 83517835 83518291

地址:香港九龍觀塘道332號香港商報大廈