〔書摘〕暢銷書密碼

努力工作中的Rocket Café編輯群,用心以好文章與您分享。

編按:本站自即日起與多家出版社合作,由編輯為您精選最近出版的科技相關書籍內容,經授權後小幅改編為文章形式供您閱覽;希望您在繁忙的日常生活中,能以精簡方式吸收新書精華。

以下內容摘自原書,文中第一人稱為原書作者。如果您有任何討論或意見,歡迎您在這裡留言,原書資訊請參閱文末介紹。也歡迎各出版社與我們連絡,請來信到editor@rocket.cafe即可。

人類作者會被電腦取代嗎?

好,我們整本書都在講電腦會閱讀,那麼接下來有個合理的問題:電腦會寫作嗎?

2013年11月,大流士.卡澤米(Darius Kazemi)在推特上發了一個瘋狂的點子:「嘿,誰想和我一起參加『全國小說生產月』?花一個月寫程式,讓電腦寫出五萬字的小說,活動結束就公開小說內容和程式碼!」

「全國小說生產月」的主辦人就是卡澤米。他自稱是一名「網路藝術家」,擅長寫電腦程式,也就是所謂的「軟體機器人」,以網路上既有的文字為素材,用演算法去創作。他的一個軟體機器人就曾寫過很彆扭的搭訕開場白:「小姐,妳一定是美耐皿,因為妳是樹脂做的塑膠。」「帥哥,你儲存了好多資料,因為你是擁有1,048,576位元儲存空間的記憶體。」

如果電腦懂得閱讀,還能找出暢銷書的原則,那麼電腦會不會寫作?

卡澤米的另一套程式是「比喻產生器」,但它吐出來的短句就像是汽車保險桿貼紙上面的胡言亂語,離格言金句還差得遠了。2016年1月4日,一個名為@metaphorminute的機器人在推特上寫出了幾個好像能得獎的句子,比方說:「土撥鼠是一個滑雪道,花心又老朽。」還有更好玩也更富深意的:「寫傳記的人就像是伸長脖子的人,沒教養但可調查。」絕大多數機器人寫出來的推文都太荒唐,不合邏輯也難以理解。但偶爾,你還是會被某一則機器人寫出來的東西氣到,因為那實在太深奧,你不禁在那一刻懷疑電腦到底能演化成多麼狡黠調皮。

為什麼要讓電腦挑戰寫小說?

卡澤米創造這些機器人的目的有兩個,既是找樂子,也是顛覆文藝評論。他的藝術創作惹來笑聲與罵聲,但這些作品其實各有機巧,一方面逗我們開心,一方面又刺激我們去揣測電腦創作的方式,並玩味人工智慧之父圖靈的詭計;他著名的「圖靈測試」就是要測驗我們能否分辨電腦和人類的差別,若錯把電腦當做人類便是電腦的勝利。

但卡澤米的企圖心更強,他想要讓電腦寫出一整本小說,此話一上推特立刻引來許多媒體關注。卡澤米的靈感來自於「全國小說寫作月」,這個挑戰活動每年舉辦,主辦單位是一個提倡「流暢寫作、創意教育、創作樂趣」的非營利組織。「全國小說寫作月」邀請大家花一個月的時間寫出五萬字小說,卡澤米則邀請他的推特粉絲花一個月的時間來訓練電腦創作。

這個想法並不新,早在1952年,英國的計算機科學家斯特雷奇(Christopher Strachey)就挑戰過讓電腦寫情書;在那之前他已經寫出過第一個西洋跳棋程式以及第一個音樂演奏程式。透過圖靈的研究,他在「費倫蒂馬克一號」(Ferranti Mark 1)上安裝程式碼,寫出不少情書。寫作的方式是從程式清單上隨機抽出問候語、名詞、動詞和其他文字,再依照不同的文法結構造句。這些情感豐沛的信件通常都很短、很到位。這套軟體直到現在都還可以在網路上找到,而它寫給我們的情書使用了打字機字型,而且每個字都大寫:

蜜糖鴨鴨:

我珍貴的愛情為妳的渴望挑逗地喘息著。我的魅力灼熱地乞求妳珍貴的熱情。妳是我珍貴的同袍情誼,是讓我無法呼吸的熱情,讓我燃燒不斷的熱情。

焦急的
曼大電

這是多麼劃時代的挑逗!當代言情天后希維雅.黛看到謎樣人物「曼大電」的這封情書,應該不會覺得自己的地位受到威脅吧。(順帶說明一下,曼大電就是「曼徹斯特大學電腦」的縮寫。)但這其實不是實驗重點。重要的是,寫出這封情書的「費倫蒂馬克一號」是第一部商業化量產電腦,過去多用來處理複雜的數學運算。斯特雷奇的情書當然不如莎士比亞雋永,也不是為了要創造出異想天開、惹人發噱的作品,而是要研究電腦到底能否處理感受與情緒。正是因為要探究人工智慧的極限,讓電腦寫小說的想法才顯得有趣。

致力開發人工智慧的雷.庫茲威爾(Ray Kurzweil)在擔任Google工程總監時預測,電腦將在2029年超越人類智慧,就連天才也敵不過。若要實踐這則預言,電腦不但要懂得推理,也要能表達情緒和創意。當然,這就表示電腦要會寫作。

你應該會很訝異,我們平常所看到的運動新聞或財經報導可能是電腦寫的。「Narrative Science」這間公司的首席科學家暨共同創辦人克里斯.哈蒙德(Kris Hammon)表示,他的團隊正在讓電腦更接近人類,並給予電腦各種工具,讓它知道該怎麼說故事。他說:「Narrative Science的電腦每天都會替《富比士》提供市場快訊,也會為《十大聯盟》運動聯播網提供體育報導;另一間公司『Automated Insights』則為《美聯社》提供股市報告。」哈蒙德甚至指出,他的電腦已經懂得要服務讀者,能夠為針對不同讀者的喜好調整敘事方式。

正是因為要探究人工智慧的極限,讓電腦寫小說的想法才顯得有趣。

但寫小說又是另外一回事了。在我們看來,「電腦產生的文字」和所謂「電腦創作的文字」之間有一道真實且重要的鴻溝。在電腦能寫出暢銷的原創愛情故事之前,我們都不能斷言電腦已經懂得文字創作。

為什麼?

嗯,要電腦以愛情為題創作並感動讀者,和電腦在短時間內根據事實寫出新聞報導,是完全不同的兩件事。我們在討論人類與機器的關係時,最吊人味口的話題莫過於人類的「愛」,或者更準確地說,是「人與人的情感連結」,這也是我們在第二章提到過最重要的暢銷小說題材。斯特雷奇在1952年選擇用情書來做實驗,可能就是為了這個原因。

電腦能擁有人類般的感受嗎?

很多人都記得菲利普.狄克在1968年的短篇小說《仿生人會夢見電子羊嗎?》以及1982年的改編電影《銀翼殺手》。這篇小說能夠成為非主流當中的經典,並不單只是因為故事裡有人類也有生化人,而是因為它觸及了一些更深刻的問題:擬人的生化人真的可以超越人類嗎?他們將如何互動?在這篇小說裡,生化人可以完成人類的所有工作,但很詭異,他們就是無法表現出人性。在狄克的這部科幻作品中,自然人類與程式人類的終極差異就在於同理心。所以這個故事看似在講述人類與機器的界線面臨瓦解的威脅,但它其實重申了一個道理,那就是人類複雜的情感和精神是工廠生產線無法製造出來的東西。愛的最高表現就是同理心和體諒,這是人性的秘密配方。

第一本由電腦演算法寫出來的小說是《真愛》,完成於2008年。

史派克.瓊斯在2013年的電影《雲端情人》讓這個概念再往上提昇。主角西奧多的工作是替客戶寫出感人肺腑的信件,但他卻愛上了新的電腦作業系統莎曼珊,這個系統先進到可以模仿人類戀愛時的表達方式。而這段情節令人著迷之處,就在於利用戲劇來表現電腦談戀愛的可能。不過,到最後電腦決定和西奧多分手,以繼續探索她的存在,並在不同的時空中加速學習。

或許,《雲端情人》的分手和《揭密風暴》的暗示若合符節。作家要給我們的啟示應該是,電腦會自己不斷不斷地進化下去,而在晶片的祭壇上,人類深層的感情就是祭品。儘管對西奧多來說,電腦女友麻木不仁地說走就走的確讓他很難受,可是這場虛擬愛情的結束,卻讓他回頭寫出了自己最真摯的文字;這一次,他不再是為別人寫信,而是首度用自己的名字寫信給前妻。我們的解讀是,《雲端情人》與《銀翼殺手》展現了人類與機器最根本的差異,也捍衛了人性的價值。

和我們分析暢銷小說的情況一樣,「人與人的情感連結」在人工智慧和電腦寫作的相關實驗中,也是相當吸引研究人員的課題,不過此課題也顯示出了這些實驗的缺陷。

電腦寫出的小說,長什麼樣子?

一般公認,第一本由電腦演算法寫出來的小說是《真愛》(True Love,暫譯),完成於2008年,比卡澤米在推特上呼朋引伴更早。這本小說出自於一群俄國工程師,他們把托爾斯泰的《安娜.卡列尼娜》和另外十七本俄國現代小說,以及一本村上春樹的俄文譯本,一起匯入電腦。小說裡的人名都取自《安娜.卡列尼娜》,而小說的文風和節奏都以村上春樹為藍本。

在托爾斯泰與村上春樹的潛移默化下,這本演算法小說裡的一些句子還算及格。描寫景物的句子像這樣:

西沉的夕陽把雲朵的肚子漆成粉紅色,低低地掛在灰色海面上。白雲籠罩山頂,他一整天都以為會有雷雨,但顯然不會下了。

描述人物內心想法的句子則是:

凱蒂久久無法入眠。她的神經繃得緊緊,就像拉緊的弦一樣。弗龍斯基給她喝了一杯溫熱的酒,結果也無濟於事。她躺在床上,滿腦子都是草原上那可怕的一幕。

許多編輯看到用琴弦來比喻神經可能就會把稿子丟了,但其實我們看過人類作家寫出更爛的句子。重點是機器竟然懂得用比喻,而且形容詞和名詞的搭配也沒有出錯。在曼大電的情詩裡,「妳是我最珍貴的同袍情誼」簡直搞笑,但是在這裡「溫熱的酒」行得通,「可怕的一幕」也合理。這絕對是一種進步。然而,閱讀這本小說卻一點也不享受。每個人物說話的方法都一樣,句型也一樣,可見要用程式來創造不同人物的不同思維真的很難。

這本小說在俄國出版之後相當轟動,因為電腦寫書簡直是劃時代的創新。書評笑稱編輯以後不必再為作者拖稿所苦,也不必擔心作者意外懷孕或酗酒過量導致合約得重擬。但是談到這本小說的內容,書評就沒那麼篤定了。如果要做一個公平的比較,我們就一定得明白,曼大電的情書和前面引述的小說段落之所以會有那麼大的落差,其實是和哪些作家的作品被匯入電腦有關,而不是電腦自身的創意和情緒有了長足的進步。像這樣的電腦小說永遠只是膺品,儘管仿造得再巧妙,或是從不同作家混搭出了趣味,膺品究竟不是創作,回收再生也不是創作。

不論是內容素材還是「切割」的創作形式,電腦程式寫出來的小說都不能算是原創,而且我們也不太相信這些東西能多扣人心弦。

卡澤米還有一個程式叫做「內容永恆」,使用者可以先輸入一個主題關鍵字當起頭,例如愛情或死亡。程式會在《維基百科》裡搜尋這個字,並從搜尋結果最前面的幾個段落抓取文字,再從這些段落裡的連結連到其他網頁。之後電腦會從這些新網頁裡再擷取更多文字,最後用機器的「意識」重新組句。

前衛的達達主義藝術家也於1920年代跟上這股風潮,後來被垮世代小說家威廉.布洛斯在1950年代發展為「切割手法」(Cut-Up Technique)。之所以叫做切割就是因為方法很簡單,他先把報紙和其他書籍印出來,一個字一個字剪下,並重新編排,通常不太管語意。當奇怪的單詞組合在一起,便會產生獨特的意義和效果。這個技法現在也應用於電影、音樂和演講的影片。大衛.鮑伊、麥可.史戴普,以及電台司令主唱湯姆.約克都曾用這個方法創作歌詞。

所以,不論是內容素材還是「切割」的創作形式,電腦程式寫出來的小說都不能算是原創,而且我們也不太相信這些東西能多扣人心弦。小說家都經過訓練,擅長寫他們熟悉的題材,他們從生命經驗中汲取靈感,並帶著意識寫作。如果靈感的來源是《維基百科》,那電腦或許還可以寫出參考書或工具書;但若要電腦寫出引人入勝的小說,那它得把人類的內在精神到外在生活環境全部摸透,這點電腦還是不行。

《暢銷書密碼》

人工智慧帶我們重新理解小說創作


他們歷時五年,運用文字探勘技術,訓練電腦「閱讀」兩萬部小說,全面破解《紐約時報》暢銷書在題材、情節、角色和風格上的共同模式,告訴你人類如何閱讀,以及小說引人入勝的終極關鍵。還可以進一步運用研究結果預測暢銷書,只憑書稿,不論作者名氣或行銷運算,預測準確度就已超過八成。史無前例,《暢銷書密碼》是第一本「電腦觀點」的小說分析,運用新科技帶我們重新理解好故事如何打動人心。

出版:雲夢千里

作者:Jodie Archer, Matthew L. Jockers

詳細資訊


喜歡我們的文章嗎?按讚立即加入粉絲團 :)

火箭聊天室

rocketlab_banner

建立自有品牌真的就是台灣產業的救贖嗎?在專業代工與品牌經營的交叉路口,應該停看聽些什麼?這次三位講者皆具備相當的產業經驗,扎扎實實的台灣觀點、國際視野,絕對值得聚精會神、讓你腦漿沸騰。

立即搶位

直接報名



推薦您也參考

獎勵作者

歡迎您以點數獎勵作者:

關於點數的獲得與使用方式,請參閱說明