AI的著作權議題

AI的著作權議題
Photo by Markus Winkler / Unsplash

近年生成式AI的發展迅速,更為普及,大眾使用門檻也降低,讓關於AI的議題與權利備受討論。其中AI從訓練過程到產製內容,都是一系列挑戰著作定義及權利的過程,無論立法者、業者或使用者,都關注其監管、治理與各式準則。

除了歐盟的法規與討論外,在不少科技公司發源於美國的情況下,美國著作權局一系列的報告及相關判例也成為重要參考。

我將基於美國著作權局(US Copyright Office)Part 2、Part 3的報告以及一些相關判例和新聞,簡要談談AI的著作權議題現狀及我個人看法。


著作權法的本質

一個可能需要釐清的觀念是著作權法並不是純然基於保護著作出發,反而是一個探討利益應該如何合理分配的法律,也因此我們才需要探討合理使用,而不是全部保護起來不給用,授權的概念在其中當然很重要,實務上「著作權」包含了非常多複雜的權利,比如「人格權」也不只是署名而已。這麼多樣的權利要怎麼合理分配?這就是相關法律及解釋在處理與解讀的問題。

思想(構想)與表達二分

我們可以發現縱觀多數的著作權法,邏輯上並不阻礙資訊流通以及學習,所以我們如果經過學習而學會書本中傳達的觀念、方法或資訊,並不必擔心侵害著作權,但是如果涉及「表達」那就不一樣了。

在《著作權法》第10條之1是這麼說的:

依本法取得之著作權,其保護僅及於該著作之表達,而不及於其所表達之思想、程序、製程、系統、操作方法、概念、原理、發現

著作權法企圖在保障著作人權益以及促進社會公益及文化發展等目的間取得平衡,這也是為什麼並未保護著作背後的思想、程序、製程、系統、操作方法、概念、原理、發現,正是為了避免知識的壟斷無形箝制創作自由與社會多元發展的可能,因此在法律上避免使具有公共資產性質的人類精神產物具備排他性。比如說我們針對同樣的遊戲規則,可以創造出表達方式不一樣的遊戲,有人可以設計電玩,有人可以設計桌遊,單就遊戲規則本身不構成侵害著作權。

著作權的表達是什麼

既然「表達」這麼重要,怎麼樣才算表達?在高等法院的判決中有不同的見解,在 臺灣高等法院94年度智上字第53號民事判決中認為表達形式是指作品基於構想(idea)與事實(fact),所使用的語言(language)、闡發(development)、處理(treatment)、安排(arrangement)及其順序(sequence);但臺灣高等法院 94 年度智上字第 45 號民事判決卻指出著作權法所指稱的表達必須要有具體形象存在,比如「歌曲之於錄音帶、光碟片,樂譜之於紙張、羊皮卷等」。

在此我們可以發現著作以及著作物、表達的定義與形式,實際上常有混淆或模糊,卻之於著作權而言是一關鍵,也是需要多解釋說明的部分。

但思想與表達必然二分嗎?

智慧財產法院 100 年度民著訴字第 42 號民事判決中也提醒思想與表達合併原則的觀點與此原則運用時機:「思想或概念若僅有一種或極其有限之表達方式時,因其他著作人無他種方式或僅可以極有限方式表達該思想,如著作權法限制該等有限表達方式之使用,將使思想為原著作人所壟斷,而影響人類文化、藝術之發展,亦侵害憲法就人民言論、講學、著作及出版自由之基本人權保障,是以倘表達特定思想之方法僅有一種或極其有限之方式,或思想與表達不可分辨、不可分離時,縱他人表達方式有所相同或近似,此為同一思想表達有限之必然結果,亦不構成著作權之侵害,此即思想與表達合併原則。」

著作權法需要不斷適應新技術,檢視既有原則與立意能否妥善解釋新技術,但其目的仍是在保留對於創造性活動的鼓勵並鼓勵持續的多元創造,讓大眾均可受益。


AI與著作權議題不能脫離資料生命週期

從一般數位轉型到AI發展,不變的是資料很重要,而資料並不只是個資及隱私權的概念,必需了解什麼是資料才能知道為什麼每個部門與單位都很重要——資料治理絕對不可侷限於特定機構單位,所有單位都需要進行資料治理。

資料治理不等於開放資料,開放資料不等於解決著作權及訓練資料的問題。幾個概念之間固然存在關聯,但也不宜輕易劃上等號。

若我們以資料/數據作為核心出發,那麼談著作權也需要從整個資料的生命週期來看,取得、使用與處置各有不同的「功課」要處理,不宜單以「反正現在就是很不行」之語概括,面對技術革新,已經需要更細緻說明及處理。

舉四月份Politico的報導為例,英國前陣子也在討論著作權法修法,修法方向是讓公開發表的素材都可被拿來訓練AI模型,不過也有保留權利人不同意時可以退出的機制以及探討權利人被補償的地位。看上去這是為AI訓練的合規鋪路,不過兩個大公司都對此感到不太滿意。

如果我們「陪伴」資料到它被處置運用,就可以理解為什麼BigTech對此有意見——經過訓練的語料原則上已經不是原本的樣態,要「退出」是要剔除到什麼程度呢?實際操作相對困難且成本較高,另一方面增加賦予權利人被補償地位也可能有後續爭議。至於從法律見解上現行的哪些部分已經足夠,哪些地方尚有漏洞,可以參考法律相關學者專家的評論。

但AI與著作權的糾葛不僅於此。


AI作品的著作權

2022年2月,美國Thaler v. Perlmutter案中,法院裁定,由AI根據prompt自主生成的作品不能獲得著作權,但當時並沒有述明AI輔助創作的認定標準,此部分陸續在美國著作權局2023年的指引(具AI產出之著作註冊指引)以及今年一月發佈的AI著作權報告Part 2中陸續釐清。

在今年發表的報告中,美國著作權局從過往判例,釐清「作者」、「是否使用工具」等之於著作權的含義與定義,最終指出著作權保護人類作者創作的作品之原創表達,即使其中包含人工智慧生成的資料,但不適用於純由AI產生或由人類對表達元素控制不足的內容。

另一方面美國著作權局認為現行美國著作權的法律已足夠解決相關問題,不需另外立法。那麼如何知道人類對表達元素的控制是否足夠呢?報告中提及,目前普及技術的功能而言,prompt本身不能視為足夠的控制。人類對AI產製內容之貢獻是否足以被視為「作者」?參考Community for Creative Non-Violence v. Reid案,只是委託以及提供詳細建議與指示的貢獻並不足以成為共同作者;而參考Andrien v. Southern Ocean County Chamber of Commerce案,明確指示準備工作具體細節使編譯只要簡單轉錄就能完成最終形式,印刷商也沒有實質改變原始表達的情況下可定義為作者,這其實也進一步說明何以USCO認為向AI下prompt (視為描述、委託作品)不能視為著作權法意義上的共同作者,就算有針對性反覆輸入亦然,因為著作權保護的是人類精神的智慧成果,而不是強調保障辛勤勞動的工作成果

USCO並非主張使用AI就沒有著作權,並透過Burrow-Giles Lithographic Co. v. Sarony案中法院見解說明,當作品已包含足夠人類創作表達元素時,使用機器作為工具沒問題。當然具體貢獻狀況需要依個案而定,報告中也分析了一些常見使用方式在著作權認定上之異同,相信能讓關注此議題者有進一步的理解。

在此報告公開後,生成式AI平台Invoke公告他們以人類和GenAI合作完成的圖《A Single Piece of American Cheese》註冊成功。欲知詳情,可以查看Invoke的公開報告

當然AI著作權的爭議不只在上述的「作者」與「作品」更在訓練階段運用的資料問題。


AI訓練資料的著作權議題

今年二月的舊聞,Thomson Reuters v. Ross Intelligence 裁定Ross Intelligence使用路透社旗下Westlaw中有受著作權保護的法律判決摘要訓練AI模型構成侵權,不過此案尚未終審,也不是近期正夯的GenAI判例,但若再加上OECD、WIPO等組織目前的報告/指引,或可初步反映AI產業雖主張合理使用(Fair Use),實際上仍有法律風險及挑戰。

USCO在美國時間5/9發佈生成式AI報告的預發佈版本,但預計正式版本不會有實質性的結論差異。

我個人的結論摘要與衍生洞見如下:

  • 美國著作權局認為現在或許還未到政府必須介入的時機,自願授權(Voluntaty Licensing)無論是直接或集體授權的模式是可行且已在發展的方向。
  • 生成式AI的著作權議題很複雜,也如大家所想,合理使用(Fair Use)的原則與認定是其中關鍵。
  • 目前看來標註偏好是對於採取CC或其他授權的內容創作者可以先進行的方向,對於已有慣例的產業而言則可尋求集體授權解方

我見之報告說什麼

因行程忙碌,近期時間有限,但也先筆記我閱讀報告後初步的摘要與想法,對此議題有興趣的話建議實際查看報告。

著作權不只是保護,而是鼓勵創造

著作權法之所以不斷適應新技術,很重要的一點是保留對於創造性活動的鼓勵,因此一直以來授權就是其中重要的一環,有效的授權是確保持續創新且不損害智慧財產權,讓創新者、內容創作者與一般大眾均可受益。

在這份報告中也因而認為授權市場應持續發展。

難以迴避的侵權討論

科技公司與組織收集並處理受著作權保護的著作作為訓練資料集,通常涉及重製權,即使在訓練過程中被轉換為權重或其他表示形式,也未必能完全避免侵權責任,關於此項判定仍有爭議,也是持續討論的題目。

算合理使用嗎?重點之一:轉化性

是否能主張合理使用主要還是看《著作權法》第 107 條[1]的四項要素。其中,轉化性(transformativeness)會是在討論目的與性質時的重要考量。
報告認為在訓練生成式AI的過程是具有轉化性目的,但轉化性的議題要看的是程度,而轉化程度取決於模型最終功能與部署方式。
可以想見模型的訓練技術以及部署安全措施(Deployment Guardrails)在這項評估中很重要。實際上報告一開始也有簡介技術背景,以此切入後續在法規與政策上的見解,在此我們也能理解到AI與其監管治理相關的法規、政策之難,在於需要跨域知識與對話,在理解技術本質的情況下,才有辦法確認現行的規範是否足以定義,我們又是否需要更前衛或積極的措施。
生成式AI的另一個挑戰是當訓練目的是生成具有表達性(expressive)的內容,或者涉及重製受著作權保護的材料,尤其是在輸出成果可能與原始作品產生競爭時,可能被判定較無轉化性,而訓練本身算不算非表達性的使用也還存在爭議。


  1. 此指美國著作權法,臺灣著作權法第65條亦有「合理使用」相關規定 ↩︎

「記憶」讓判斷更複雜

人們閱讀一本書、一篇文章獲得知識後以此工作並產出,會因而給前述資料額外的權利補償嗎?目前在人類的學習上並無這樣的措施,這也是AI訓練的爭點之一。有些人認為AI訓練就如同人類學習一樣,因此無需額外支付費用,USCO的這份報告中提及這樣的觀點,但在分析時並沒有完全將 AI 訓練和人類學習劃上等號,而是回歸以AI 使用作品的具體目的、性質、方式及其對市場的影響分析是否構成合理使用。

AI訓練通常需要使用作品的全部或實質的多數部分,這對於主張合理使用自然是不利的,尤其模型存在記憶(memorization),使得要判斷要素三(利用的數量及其在整個著作所佔的比例)更複雜困難。

當然,前面段落中提到的安全措施如果實質有效或許可以降低不利影響,但實質上有效性仍然存在爭議。

為什麼「記憶」讓判斷更困難?主要還是回歸到潛在的侵權輸出 (Infringing Outputs)。報告指出,生成式 AI 模型有時會輸出複製或非常相似於受著作權保護著做的內容。比如:和電影的近乎完全相同的靜態圖片、受著作權保護的角色或新聞報導文字內容,這很可能是因為模型在訓練過程中「記憶」了這些內容;當 AI 的輸出成果複製或改作訓練資料中著作時,可能侵害著作權人的重製權以及衍生著作權利 (Reproduction and Derivative Rights)。

對著作潛在市場與價值的影響

合理使用的另一大重點正是對於著作潛在市場與現在價值的影響,白話文就是模型輸出的結果是否會與原始作品在同一市場中競爭?這是考量及探討要素四(利用結果對於著作潛在市場與價值的影響)的重點。報告遂提及自願授權市場的機制及發展。

自願授權可以嗎?自願授權可行也符合著作權法的基本授權框架,且可鼓勵建立高品質的訓練資料集,然而自願授權也存在一大挑戰——AI 模型需要龐大且多樣化的資料集,自願授權在規模可行性以及交易成本涵蓋類型上存在挑戰。

集體授權組織可能是一種相對能兼顧規模化及效率的方法,但報告中也提及這可能面臨潛在的壟斷議題。

這樣的議題涉及常民著作(vernacular works)時更挑戰(比如使用社群媒體的內容)。

其他國家怎麼做

報告中簡介了其他地方處理此議題的框架,比如說「文本與資料探勘例外」(TDM)、合法取得、退出機制等。

但也指出法定方法,要多想想。

這份報告中對強制授權(Compulsory Licensing)延伸性集體授權(ECL)提出一些擔憂。前者需非常清楚精準界定範圍,後者的選擇退出(Opt-out)也不符著作權的選擇加入(Opt-in)本質。

未來

報告提及,關於侵權問題的執法挑戰和潛在責任分工將在後續的部分處理。著作權局認為授權市場應該持續發展,將初步的成功擴展到更多領域,在尚存差距且不太可能跟上的領域,應考慮擴大集體授權方案來解決任何市場失靈的問題。


我見之下一步

AI 訓練的授權可行性取決於多種因素,包括所需作品類型行業授權慣例、AI 系統設計和預期用途,處理巨量資料的授權確實是一個挑戰。

我同意USCO報告在自願授權以及擴大集體授權上的想法,但也不排斥法界持續透過對於技術的理解,釐清現行的著作權法所保障的權利是否需額外的新定義或解釋。

在此同時,基於個人背景,我其實更在在意各界在資料治理與運用。

各國對AI及資料的監管治理,尚是值得也需要討論的面向,而在其衍生權利上也需更多釐清與討論。這或許也能夠說明為什麼在談AI的時候也需要從國家層面談資料應用。在既有範疇內是否有認知與更細緻的訂定權利——這與前述的法律權利定義與解釋並不衝突,但我個人認為若缺乏落地,那麼前端的討論也很容易真空,執行依然會是災難。

回到著作權來舉例。

縱觀不少公部門徵件、比賽甚至服務的條款,對於著作權仍採過度廣泛的授權要求,可能會提及要有授權書,但卻非常粗略說明需要「不行使著作人格權」,雖可理解這樣通常是為了後續發表、宣傳等行政作業方便,然而人格權實務上不只是公開發表權,還包含姓名表示禁止不當修改權

然而關於這點,智財局早在2021年就針對當時社群的疑慮提出解釋與建議:

著作人格權方面,因係專屬於著作人本身,機關應予尊重,有實際需求時始為特別約定,避免一律要求著作人不行使全部之著作人格權

除了上述建議外,智財局也提供政府機關著作權約定文件範本以利無相關背景的機關可細緻訂定,然而近四年過去,有多少機關及其承辦廠商真的有此認知並策進修改?沒有實務操作,容易讓相關的政策與討論少了更多實際碰撞的見解,甚是可惜。