未來已來 人工智能如何重塑出版業
——2024開明出版傳媒上海論壇綜述
8月16日,2024開明出版傳媒上海論壇在上海召開。此次論壇是民進中央在整合原上海民進出版傳媒論壇的基礎上,首次以“開明出版傳媒上海論壇”為名舉辦,并將其固定在上海舉辦。這既體現了民進中央高度重視出版傳媒的延續性,也體現了論壇活動的新要求。
“民進始終以推動我國出版事業發展為己任,堅持貫徹黨的方針政策,圍繞中心、服務大局,聚焦重大問題,深入調查研究,積極建言獻策、反映社情民意、開展社會服務。”全國人大常委會副委員長、民進中央主席蔡達峰在開幕式講話中指出,本次論壇的舉辦,是出版傳媒業界學習貫徹落實中共二十屆三中全會精神,探索文化和科技融合的有效機制,創造新動能,實現高質量發展面臨的重大課題,具有重要的現實意義。
根據一段文字,人工智能大模型就能生成一篇以假亂真的文章、一張細節滿滿的圖片或者一段充滿想象力的視頻。文生文、文生圖、文生視頻……人工智能大模型的日漸成熟和廣泛應用,讓人類領略了人工智能的無限可能。在出版行業,從選題策劃到內容創作,從編輯加工到出版傳播的每一個環節,都有人工智能技術的影響。
在人工智能的影響下,舊的出版邊界正在淡化,新的出版秩序逐步形成,智慧出版形態嶄露頭角。8月16日,在2024開明出版傳媒上海論壇上,圍繞“人工智能與未來出版”,眾多傳媒業專家學者與民進會員展開了深入的探討交流。
變革與重塑 人工智能驅動下的出版融合發展
“在人工智能技術的驅動下,出版事業經歷著前所未有的變革和重塑。”北京印刷學院副院長陳丹表示,變革和重塑體現在出版角色、出版產品、出版流程和出版邊界等發生了顛覆性的變化,也使出版的生態產生了變革。
“當人工智能深度參與出版環節的時候,出版的邊界會如何變化?”陳丹認為,一方面,人工智能與出版深度融合后,出版可以超越傳統圖書出版的范疇,和影視、游戲、教育等領域進行深度融合,從而創造一個IP多元化衍生的新生態。“我們可以通過‘破圈’,擴展IP的傳播邊界和深度,吸引更多的受眾,獲得更多的利益。”
但另一方面,“破圈”和融合也會模糊出版的邊界。對此陳丹表示,在人工智能的加持下,出版的功能已經不再僅僅是知識的載體,更多的是知識與智慧的孵化器;同時,出版業還可以成為推動社會進步和文明發展更重要的力量。在價值層面上,出版業也可以更深刻地影響并優化人類的生產和生活方式。“出版業、出版人應該保持敏銳的洞察力和開放的心態,積極擁抱變革,不斷探索創新路徑,適應新的需求。”陳丹說。
在中國版權協會理事長閻曉宏看來,未來的出版在人工智能的支持下可能會出現作品質量提升、創作效能提高、創作格局改變、打破創作和傳播界限以及擁有大量數字資源五方面的轉變。“以書評為例,”閻曉宏說,“人工智能可以快速產生幾百篇不同的書評,盡管沒有大評論家的質量高,但是它的成本低、數量大,因此也會對出版作品帶來影響。”
出版業的歷史也是一部人類的文明史。武漢大學信息管理學院副院長,文化遺產智能計算教育部哲學社會科學實驗室主任王曉光表示,出版業是人類文明的重要推手,同時也是文明發展進程的加速器。王曉光在主旨報告中提出,當前的出版業正處于“數字搖籃本”的轉折時代。其中,“數字搖籃本”是指的是20世紀50年代以來人類在出版物數字化轉型中探索生產的各類型數字出版物的統稱,代表著出版業從印刷時代向數字時代過渡的歷史階段。
在王曉光看來,當前的“數字搖籃本”仍存在內容生產效率低下、出版物產品制式不成熟等問題,但人工智能生成內容(簡稱“AIGC”)技術為出版業超越“數字搖籃本”提供了機會。“AIGC是一種顛覆性創新技術,這種顛覆性創新會消融媒介的邊界和產業邊界,帶來資源結構的共軛演化。”王曉光說,一方面AIGC可以為出版業賦能,作為內容生產的有力助手,但另一方面也是內容產業的破壞性技術,將改變內容產業市場結構。因此他認為,邁向AI時代的新出版業必須堅持出版業歷史悠久的理想和信念,即保持高質量內容的生產。
創新與規制 人工智能時代的知識生產與傳播
人工智能時代,創作的邊界被進一步打破,人工智能生成的內容與人類創作的內容邊界也逐漸模糊。生成式人工智能產生的內容可以被視為作品嗎?論壇上,許多專家學者圍繞這個問題進行了討論。
“如果用現行的著作權法來看構不成作品,因為作品是人創作出來的。”閻曉宏認為,但人類將人工智能作為工具進行創作生產的內容,在一定的質量標準下可以視為作品,“應該把生成式人工智能作為創作作品的工具來看待,通過它提高作品質量、降低創作成本。”
上海市法學會黨組副書記、專職副會長施偉東同樣認可人工智能的工具屬性。“AIGC降低了知識生產的門檻,用好了這個工具,在一定的框架內能夠幫助人類作者更快、更高效地進行知識生產。”施偉東認為,人類的學術出版是引領和支撐人類文明發展的基礎,而人類的學術創新和創造也是人類在面對人工智能時占領未來出版制高點的法寶,“我們既要擁抱人工智能技術,也要擁護更符合人類價值的高質量學術出版。”
學術傳播對于守護出版地位也具有重要意義。施偉東表示,越來越多的作者意識到,只有有效地傳播才能真正帶來或實現學術價值。因此,他認為,被AIGC作品淹沒的人類作品需要在有效學術傳播中獲得影響,學術傳播機構和出版機構有責任幫助作者實現更好的學術傳播,推動學術價值的實現。
對于AIGC王曉光也持有相同的觀點。“有報道指出,AI生成一篇文章的成本只有15美元,但一個老師發表一篇論文可能要花15萬美元,因為他要做實驗、做調研。”王曉光表示,如果對人工智能生成的內容不做任何限制,一方面會導致它的規模極其龐大,從而沖擊市場,擠壓用戶生成內容的市場空間;另一方面AI會“一本正經地胡說八道”,產生價值錯誤。
出版業如何邁向未來?王曉光表示,出版物要堅持以便利“人”的閱讀、理解和學習為核心,出版業也要堅持以人為創作主體。此外還要對AI生成的內容進行標識、實現AI與出版業的雙向賦能以及審慎地對待和采納AIGC。
博弈與發展 人工智能時代的版權保護
版權是推動人類文明進步和文化發展的重要力量。從版權的角度,閻曉宏將知識創作與傳播分為了四個重要階段。在當前的互聯網時代,中國的版權治理經驗為全球樹立了榜樣。
人工智能大模型的訓練需要高質量的數據。“高質量數據就是頂級的論文。”閻曉宏表示,文本的挖掘、數據的加工使用得不到有效授權許可是生成式人工智能在作品創作和傳播方面面臨的問題之一。對此,他建議盡快提出一種授權方式來解決影響人工智能發展的版權問題。此外,閻曉宏還提出,未來的出版擁有大量的數字資源,出版業應整合資源,形成談判優勢,與生成式人工智能相關的大模型進行規模化的版權交易,同時實現版權的保護。
如何在用高質量數據“投喂”人工智能大模型的同時保護版權,陳丹認為要從兩個方面進行突破。“首先要提倡智能技術向善,其次要合作共贏。”陳丹表示,出版業要以人為本,樹立人工智能訓練數據版權作品合規使用的價值取向,強化行業內外的協同合作,制定并推廣行業標準和規范,平衡版權人和AI開發者的相關利益,實現資源共享、利益共享,實現人工智能技術和出版業的深度融合、共向發展、共生發展。“這有賴于研究者、產業從業者、管理者的共同努力”,陳丹說。
施偉東從完善著作權法的角度對未來出版的版權保護提出了自己的觀點。“未來人工智能技術越是顛覆性發展,我們越要堅定不移地、態度明確地保護人類作者的知識生產。”施偉東建議,應圍繞作者來設計完善著作權制度,并將作品的財產性權利與發表權一起授權或轉讓給學術出版機構,通過機構與作者的共同努力最終實現作品的真正價值。
擷英拾萃
中信出版集團黨委書記、董事長 陳 煒
出版業作為人類歷史上最傳統的行業之一。在數字化的十字路口,如何找尋出版業的底層價值,就約等于如何尋找出版這個傳統行業的自信。
未來,出版人的生產方式不再是與轉化為圖書的知識開展對話,而是和一個動態發展的智能體系開展對話,這給出版人和出版業帶來了巨大的挑戰。因為知識的生產和傳播本質上是人和知識開展對話,所以只要內容的價值依然存在,出版將始終陪伴著人類發展。我們相信,只要高質量的知識是被社會、被人類所需要的,出版工作就永遠有意義,出版工作者們的專業知識也將始終是高質量內容的一把篩子。
民進中央出版和傳媒委員會委員、同方知網數字出版技術股份有限公司總經理 張宏偉
人工智能大模型最大的貢獻是壓縮了人類的知識,促進了知識平權,可以讓更多人更方便地獲取知識,讓更多人從事知識的創造和創新的工作。
現在的出版有兩套系統:一套是傳統的面向知識精英的出版系統,另外一套就是面向普羅大眾的互聯網出版系統。在人工智能時代,這樣的邊界會進一步被打破。因為人工智能可以讓更多的人從事知識創造的工作、知識生產的工作,這些工作不再是知識精英的特權和專利。所以出版的邊界,從創作的角度會被顛覆。
中國出版傳媒股份有限公司原董事、總經理 李 巖
在新時代背景下的知識生產與傳播呈現出以下新的特點和趨勢:知識生產的去中心化和非核心化;知識傳播的即時性和廣泛性;知識獲取的個性化和精準化;知識形態的多元化和融合化。
出版是出版人進行選擇之后把人類最好的智慧成果,提供給讀者的社會行為。在新時代下,出版人要更多擁抱新技術的應用,更多和人工智能大模型領域的專家學者一道合作,共同為出版業的未來提供更美好的前景,這是出版人應有的使命。
中圖科信數智(北京)有限公司總經理 許若華
現在,為了進行大語言模型的訓練,大量由AI生成或由AI帶來的數據會產生我們和真實數據間的隔閡,這就形成了一種全新形式的數據孤島。
在這種數據孤島中能夠作為橋梁的是什么?就是傳統出版行業按照傳統的出版流程,經過審核確認的數據。只有這種數據不斷進入人工智能賦能出版行業的新范式中,才能確保真實有效的數據和內容進行相互連接,才能真正讓新范式提升生產效率,而不是被大量的虛假數據、錯誤數據所充斥。
華東政法大學教授、中國版權協會副理事長 王 遷
創作是人憑自由意志來決定的,但這并不意味著人只能赤手空拳,人可以采用創作工具。然而我們要牢記一點,創作工具不可能實質性地參與表達性要素的決策過程。
判斷生成式人工智能是不是創作工具,可以向不同的生成式人工智能輸入相同的提示詞、參數,看不同人工智能根據相同的提示詞和參數生成的結果是否相同。如果不同的人工智能根據一模一樣的提示詞和參數生成的內容差了十萬八千里,只能說明一個問題,用戶的輸入只能對人工智能生成的內容產生間接影響,是人工智能自身的算法和數據訓練決定了人工智能生成的內容。
上海數據交易所總經理 湯奇峰
數據、算力和算法是人工智能大模型的三要素。談到人工智能的時候,有些人會認為“人工智能大量收錄數據,數據已經不夠了,以后怎么辦”。這有點杞人憂天。
我認為,大量數據還并沒有被大模型訓練成語料。如今,很多出版機構已經不像原來的出版機構了,而是把自己定義成數據的服務商,服務于千行百業。
記者手記
人工智能時代,我們怎樣讀書?
8月20日,為期一周的2024上海書展暨“書香中國”上海周落下了帷幕。全國19家出版集團、360余家出版社攜16萬余種精品圖書參展;新書發布會、名家講座、作者簽售等閱讀活動達1024場;7天主會場入場近30萬人次,實現線下圖書銷售總碼洋4814.83萬元,較2023年增長約35%。不少參加2024開明出版傳媒上海論壇的出版人評價今年的上海書展“非常熱!”
“掃碼閱讀”“拍照上傳識別古籍”“智能識譜”……在本屆上海書展中,一些展館聚焦人工智能場景下的出版業,展示了當前一些出版社在AI賦能數字閱讀方面的探索。
正如論壇上的專家學者所言,我們的出版業還處于數字時代就迎來了人工智能時代,人工智能技術的廣泛應用將深刻改變甚至重塑傳媒業各生產要素之間的關系。對于讀者來說,我們的閱讀體驗將會被如何改變?
很多讀者剛剛或正在經歷從閱讀紙質書籍到電子書的轉變。“上一次閱讀紙質書籍是什么時候?”近年來,在讀紙質書還是電子書的討論中總是會出現類似的問題,似乎在暗示“紙質書落寞”“閱讀式微”。但上海書展絡繹不絕的人流和不俗的購買力見證了大眾對紙質書仍有不滅的熱情。
隨著人類文明的不斷發展,知識的生產、傳播形式也不斷被改變。但在這個過程中,不變的是人類對知識的渴望和對閱讀的需求。未來已來,面對奔涌而來的人工智能時代,我們需要思考的不僅是人工智能是否會顛覆出版業、取代行業要素,還要思考如何利用人工智能技術為讀者帶來更好的閱讀體驗。
除了數字閱讀,未來是否會有讀者參與創作、定制化內容生產、沉浸式閱讀場景等方面的探索?身為一名讀者,我期待著在人工智能大模型這個匯集了人類智慧的工具的支持下,人類將會有更多美好的閱讀體驗。
團結報(2024年8月22日四版)