04/08/2023

OpenAI接連被告！ChatGPT涉嫌誹謗、侵權、損害私隱，CEO奧特曼如何應對訴訟浪潮？

加入最愛專欄
收藏文章

方展策
方展策
少年時，曾研習 Geographic Information System，可惜學無所成，僥倖畢業。成年後，誤打誤撞進入傳媒圈子，先後在印刷、電子、網絡媒體打滾，略有小成。中年後，修畢資訊科技碩士，眼界漸擴，決意投身初創企業，窺探不同科技領域。近年，積極鑽研數據分析與數碼策略，又涉足 Location Intelligence 開發項目；有時還會抽空執教鞭，既可向他人分享所學，亦可鞭策自己保持終身學習。
智城物語

　　曾使用ChatGPT的人可能發現，它偶爾會亂說話，編造假資訊。如你以玩樂心態操作，看到它一本正經地「說出」失實答案，還真是幾搞笑的；但當這些假資訊牽涉到有名有姓的真實人物，當事人就覺得一點都不好玩了。另一方面，OpenAI從互聯網抓取數據來訓練AI模型，當中難免包含受版權保護的內容，讓眾多作家深感不滿。因此，愈來愈多知名人士、作家對該公司提起誹謗、侵權訴訟。面對這波訴訟浪潮，被譽為「ChatGPT之父」的奧特曼要如何應對呢？

ChatGPT捏造案件面臨誹謗訴訟

　　槍械刊物《AmmoLand》的主編弗雷德·里爾（Fred Riehl）在2023年5月撰寫一篇「第二修正案基金會（SAF）訴訟 Robert Ferguson」案件的報道，要求ChatGPT提供案件摘要。根據ChatGPT所述，SAF創辦人艾倫·戈特利布（Alan Gottlieb）起訴喬治亞州電台主持人馬克·沃爾特斯（Mark Walters），涉嫌以SAF財務長的職權非法挪用基金會的資金。

　　里爾致電給戈特利布查問是否真有其事，結果對方證實ChatGPT產出的內容完全是錯誤的。事實上，沃爾特斯既不是「Robert Ferguson」案件的當事人，亦從未任職於第二修正案基金會。沃爾特斯得知此事後，於2023年6月5日決定向OpenAI提起誹謗訴訟。這是全球首宗針對ChatGPT的誹謗索償起訴，象徵著誹謗法例同樣適用於生成式AI領域。

　　ChatGPT 胡亂捏造他人犯法已非首次。2023年4月，澳洲維多利亞省赫本郡（Hepburn Shire）市長萊恩·胡德（Brian Hood）發現，ChatGPT錯誤地把他列為2011年澳洲印鈔公司（Note Printing Australia）海外賄賂案的犯人，因賄賂而入獄，讓他擔心自己的聲譽會因此受損。

　　胡德的代表律師指出，其客戶確實曾受僱於澳洲印鈔公司，但卻是舉報高層向外國官員行賄以獲取貨幣印刷合約的吹哨人，而不是犯案者。他表示，已向OpenAI發出律師信，要求對方修改有關其客戶的錯誤，否則便會考慮提出誹謗訴訟。

胡德的代表律師指出，胡德本人作為赫本郡市長，聲譽對他至關重要。如果有市民在ChatGPT上看到有關他的錯誤資訊，將給他帶來巨大的負面影響。（圖片來源：Brian Hood臉書專頁）

8,000作家要求AI公司付版權費

　　面對外界指責ChatGPT編造假資訊，OpenAI執行長山姆·奧特曼（Sam Altman）坦承，生成式AI有「資訊幻覺」（Hallucination）是一個需要解決的問題，其團隊現正積極開發可以減少不實資訊產生的新模型。

喬治亞州電台主持人沃爾特斯表示，自己是ChatGPT產生「幻覺」下的受害者。（圖片來源：Mark Walters臉書專頁）

　　除誹謗官司外，OpenAI還遭受侵權指控。2023年7月，逾8,000名作家發表連署公開信，要求OpenAI、微軟（Microsoft）、Google、Meta等科技公司，為AI所用的版權內容付費。這封由美國最大作者組織作家協會（Authors Guild）發起的公開信指控，用於訓練AI模型的書籍內容，大部分來自一些盜版網站，而這些公司未經作者同意，擅自取用其著作的內容，更沒有支付過一分錢。

　　作家協會主席瑪雅·尚巴格·朗（Maya Shanbhag Lang）指出，生成式AI輸出的內容本質上是衍生物——這是AI吸收人類作家的著作內容後，再重組內容而產出的衍生作品。作家寫作內容來「餵養」AI，讓它學習和進化，因此而獲得補償是公平的。

作家協會主席尚巴格·朗直言，AI產出的內容本質上只是人類作家的衍生作品。（圖片來源：IG@ mayaslang）

　　公開信中列出對科技公司的3項要求：一、獲得生成式AI模型所用的版權內容許可；二、為過往或現在AI模型中所用到的作品給予作者公平補償；三、為AI生成內容中所用到的作品給予作者公平補償。尚巴格·朗強調，任何作品不得在未經同意、署名、報酬的情況下使用，三者缺一不可，惟公開信中未有提到任何法律行動。

小說家向OpenAI提起侵權訴訟

　　不過，有部分作家早已按捺不住，決意訴諸法律行動。2023年6月28日，美國小說作家保羅·特倫布萊（Paul Tremblay）、莫娜·阿瓦德（Mona Awad）對OpenAI提告，控訴OpenAI在沒有獲得版權授權下，利用他們的作品來訓練AI模型。兩位作家指出，ChatGPT能夠精確地為其小說撰寫摘要，代表著他們的作品已被複製到AI模型中，屬於侵權行為。該訴訟代表全美國版權所有者，尋求一筆數額不詳的賠償金。

特倫布萊是一位美國小說作家，擅長撰寫黑暗奇幻和科幻小說，代表作有《世界盡頭的小屋》（The Cabin at the End of the World）。（圖片來源：X.com@BookCougars帳戶）

阿瓦德是一位加拿大小說家，以黑色喜劇小說作品而聞名，代表作包括《兔子》（Bunny）和《看待胖女孩的13種方式》（13 Ways of Looking at a Fat Girl）。（圖片來源：Amazon）

　　目前AI模型是在大量文本數據上進行訓練，惟OpenAI從未透露ChatGPT所用的訓練數據來源，只表示通常會從互聯網抓取資料，包括維基百科、網上檔案圖書等。兩位作家認為，書籍是訓練AI的理想材料，因為內裏結集了精心編製的高質文章，匯聚人類思想的精華。根據起訴書所述，估計OpenAI的訓練數據包含逾30萬本書，其中包括版權歸屬不明、或未獲授權的版權書籍。

書本被認為是訓練AI模型的最佳材料，因為書中輯錄了高質、有深度的長篇文章，儲存了人類思想的精華。（圖片來源：Pexels圖庫）

　　可是，要證明ChatGPT是怎樣採集、在哪裏採集這些書本內容，以及相關作者是否需承受經濟損失，卻是非常困難。除書籍外，ChatGPT也運用了大量網上訊息作數據訓練，例如網民在社交媒體上對這些書的討論貼文。因此，就算ChatGPT寫出的書籍摘要，跟作品的內容一模一樣，亦未必可以證明AI模型內包含了書籍內容。

　　英國修適士大學（University of Sussex）知識產權法講師安德烈斯·瓜達穆斯（Andres Guadamuz）表示，這是首宗針對ChatGPT的侵權訴訟，有助於探討生成式AI領域內行為合法性的問題。美國范德堡大學（Vanderbilt University）法律系教授丹尼爾·賈維斯（Daniel Gervais）預估，未來會有愈來愈多涉及生成式AI的侵權官司出現。

OpenAI擅取個人信息再遭訴訟

　　同樣是6月28日，OpenAI也遭到另一宗性質有點不同的集體訴訟：一群匿名人士指控OpenAI竊取大量個人信息，用於訓練其AI模型。克拉克森律師事務所（Clarkson Law Firm）向法院提交的訴狀中表示，原告的名字以姓名首字母縮寫作為標識。

　　這群匿名人士指出，OpenAI透過互聯網抓取了3,000億個單詞，當中包括個人信息、以及來自 X.com (Twitter) 和 Reddit 等社交媒體平台的貼文。雖然用戶的個人信息在社交媒體上是公開的，但如果數據被擅自複製到其他平台使用，卻屬於侵犯私隱行為。

　　他們估計，受害人數可能高達數百萬，涉及30億美元（約234億港元）的潛在損失。該訴訟不但尋求金錢賠償，更要求法院提高 OpenAI 數據收集和處理、使用個人數據的損害和賠償、以及用戶選擇退出數據收集機制的透明度。

　　華盛頓大學法律學者Inyoung Cheong認為，法院在審判時，要權衡AI技術使用這些內容時所帶來的各種風險與益處，故此相關案件可能需要數年時間始能結案。

OpenAI向傳媒業界遞出橄欖枝

　　當然，科技公司亦已意識到訓練AI模型所涉及的法律風險。如要解決版權問題，跟內容出版商達成協議，取得內容使用許可，可能是最好方法。奧特曼曾經表示，願意為某些領域的高質內容數據付出高昂代價。

　　最近OpenAI陸續向傳媒及出版業界遞出橄欖枝。2023年7月，OpenAI跟美聯社（Associated Press）達成為期2年的授權協議，將取得美聯社部分新聞報道的使用授權，內容甚至可以追溯至1985年的新聞。同月，OpenAI宣布向非牟利組織美國新聞計劃（American Journalism Project）提供500萬美元（約3,900萬港元）資金，用於建立一個工作室，幫助地方新聞網站使用AI技術來改善營運。

　　更有消息指，OpenAI、微軟、Google近幾個月會晤了新聞業高層，討論生成式AI工具使用新聞內容的版權問題。美國新聞集團（News Corp）、《紐約時報》集團（New York Times）、英國《衛報》（The Guardian）、以及德國報業集團斯普林格（Axel Springer）等，均至少與一家科技公司商討合作的可能性。

　　雙方的討論方向主要圍繞著版權費的定價與收費方式。較簡單的方式是「按年收費」，有業者開出的價碼是介乎500萬至2,000萬美元（約3,900萬至1.56億港元）的授權年費。另有傳媒業高層傾向採用「按量計價」，只要AI模型使用了新聞內容一次，就要付一次錢；但這種收費方式卻需要科技公司披露AI模型對內容的使用狀況，目前AI業界還沒有人這樣做。

FTC對OpenAI展開深入調查

　　在抵禦訴訟浪潮的同時，奧特曼一直試圖影響政府和立法者，如何制定監管AI的新法例。早前他周遊列國向全球各國政府示好，努力為利好AI發展的監管環境打好基礎。可惜事與願違，美國聯邦交易委員會（Federal Trade Commission，FTC）於2023年7月決定對OpenAI展開深入調查。這是該公司目前遇到最強力的監管行動。

OpenAI執行長奧特曼早前走訪世界各國，拜會當地政府官員和立法者，討論AI前景和威脅。2023年6月，他會晤了韓國總統尹錫悦和當地約100家初創企業。（圖片來源：X.com@sama帳戶）

　　聯邦貿易委員會表示，OpenAI將民眾個人聲譽和私隱暴露於危險中，涉嫌觸犯消費者保護法，因此必須介入調查。FTC要求OpenAI提供多種公司文件以協助調查，包括：ChatGPT的營銷計劃、廣告部署、訓練方法、怎樣收集訓練AI模型的資料、怎樣防止假資訊扭曲個人形象、以及怎樣防止AI模型洩露個人資料等。奧特曼強調，OpenAI的技術具有高度安全性，並以消費者為重，並表示樂意配合FTC的調查。