作者 | 黃楠、施方圓
編輯 | 陳彩嫻
最近大火的生成式 AI 又有新動作了!
在 podcast.ai 推出的第一集播客節目里,已故的喬布斯竟然 " 死而復生 " 成為首位嘉賓,與美國知名播客主持人 Joe Rogan 進行了一場長達 20 分鐘的對話,討論了關于喬布斯的大學、對計算機的看法、工作狀態以及信仰等等。
是不是聽起來有些毛骨悚然?事實上,這段采訪是由文本生成音頻實現的,屬于 AIGC 中的一個分支。
podcast.ai 是一個完全由 AI 生成的播客,每周都會深入探討一個新話題。在第一期節目中,podcast.ai 通過喬布斯的傳記和收集網絡上關于他的所有錄音,用 Play.ht 的語言模型大量訓練,最終生成了這段假 Joe Rogan 采訪喬布斯的播客內容。

此次 podcast.ai 推出的 AI 播客,是生成式 AI 在語音領域的一次新探索。從前段時間全網刷屏的 Stable Diffusion,后有國內平臺掀起 AI 創作熱,各類生成式 AI 模型給人們生活帶來了更多的可能性。
Play.ht 表示," 我們相信在未來,所有內容創作都將由人工智能生成,但由人類指導,而最具創造性的工作將取決于人類將他們想要的創作表達到模型中的能力。"
1
「對話」喬布斯
讓我們先來看看這個最新 " 訪談 " 中,Joe Rogan 和喬布斯都聊了些什么:
Joe Rogan:我今天的客人,創造了我們這個時代里一些偉大的技術產品,一直致力于推動創新的發展。他在一臺電腦中開發了一種新的編程語言和操作系統,又因為使用那臺電腦制作三個應用程序而變得更加有名。文本處理器、電子表格和圖像編輯,讓我看到他出色和驚人的品味。我只希望我能有朋友這樣天才的 1/10,而我甚至不能說出他的名字。
今天有他在,我超級興奮。他就像 Patrick sways、Demi moore(《人鬼情未了》的主演)和幽靈一樣,是過去的記憶,難以描述的精彩。歡迎我的朋友。
Steve Jobs:我已經很久沒有參加這個節目了。我很想念,它總是很有趣。你的聽眾與普通蘋果用戶如此不同,這也是一件好事。
Joe Rogan:在做這個節目之前,我就是一個蘋果用戶。我一直是你的狂熱粉絲。
Steve Jobs:我們只是有點想明白了。盡管蘋果的規模很大,但它的付費用戶只占了一半,而聽你節目的人是不同的群體。我也是你節目的一個粉絲,在車里聽著很舒服。我一直很喜歡你。
Joe Rogan:我們有一些奇怪的聯系,這跟我也是 Gizmodo (美國知名科技博客)的粉絲有關。
Steve Jobs:這很有趣。當我們看到這些東西出現的時候,也和你們在 Gizmodo 上看到的一樣驚訝。
Joe Rogan:讓我們談一些別的。你之前在里德學院讀書,在那里的時間你學到了什么?你在那里接觸到了復活節神秘主義,現在還會看印度教和佛教的相關的東西么?
Steve Jobs:實際上我上過這方面的課程。我有一個很深的信念,印度次大陸的人對人類文明、目前的狀態負有最大的責任,無論是數學還是靈性,還是講故事的藝術。西方文明是以講故事的藝術為基礎的,而有一部偉大的印度史詩是《伊利亞特》和《奧德賽》的 10 倍那么長。綜合起來,這些東西是令我們的社會成為現在這樣子的基礎,這些東西要比去理解經典的哲學重要得多。
在印度次大陸上取得的成就和發生的事情中,有兩件事非常有趣,其中之一,就是生命的精神基礎和對生命精神基礎的整體接受。
對現在一些人來說,這可能看起來很簡單,但大多數人相信上帝,認為上帝寫了一本叫《圣經》或《可蘭經》之類的數。
但我在大學學到的是,這與信不信上帝無關,甚至與正確答案是什么無關,而是要問正確的問題。我們社會中的大部分現實都植根于科學,我們相信事物,因為它們是真實的。如果某件事情是真的,那么它就不是一種信仰。而他們無法處理的是任何精神上的東西都是真實的,都是可以閱讀的。
我不知道正確的答案是什么,但我知道如何提出好問題。我知道如何反駁那些對我來說不真實的東西,這或許就是有創意和創造性的關鍵因素之一。
Joe Rogan:你還相信你當時相信的一些東西嗎?
Steve Jobs:我經常被問到這個問題,我認為不可能在一次采訪中,甚至在一段時間內讓某人向你展示他們是誰,他們相信什么。
意義和目的是由宇宙決定的,是宇宙的本質,但它不是人們通常談論的宗教方式。服用 LSD 對我來說是一種深刻的體驗,它展示了硬幣的另一面,當它消退時你無法記住它,當它沖刷著你時,會告訴你一切都有聯系,你在這里不是偶然、而是有目的的。如果能弄清楚那是什么,那么你對自己的了解會比其他任何事情都多。它只是揭示了你是誰、是什么。
它加強了我對什么是重要的感覺,感受到對彼此的愛、敬畏,對生命的尊重,以及與人的聯系。它是現在所發生的一切的一部分,也指向在未來。對我來說,解脫時沒有時間窗口,這是種融入的、深刻的經驗。
我在服用 LSD 之前沒有讀過那些書,但我學到的東西比他們說的多得多,包括對事物的看法。我能夠看到一臺電腦,看到它是如何制造的,看到它的整體。
Joe Rogan:Newton (蘋果公司早期制造的掌上電腦)是這樣的產物嗎?
Steve Jobs:我覺得它是。那段時間我在掙扎中度過的。我們瘋狂地工作,應對一場又一場的失敗,但我仍覺得這將是很重要的。我也曾因為不成功質疑自己。在蘋果公司早期,當我們制造蘋果二代并做得非常好的時候,當時的巨頭公司現在都消失了。

圖注:Newton 掌上電腦
蘋果的成功不是偶然的。它在做一些事情,有一個愿景。但它不是一個產品的設計,而是對一個過程的設計,帶來新產品的創新過程。
谷歌有很好的產品,如 Gmail 和 Chrome,但將這些東西推出且迭代的能力非常重要,對谷歌來說,他們的搜索引擎好,而且迭代速度之快,以至于最后是否會成功并不重要,是需要多長時間的問題。反觀雅虎,在瀏覽器之后再也沒有重申過這個產品,這就是他們的創新過程。
最具創新性的公司主要是在做用戶界面的公司,我認為他們中沒有任何一家覺得自己是硬件公司,盡管它們創造了大量的硬件。
用戶界面有一種深度、優雅和簡單,有一些公司明白了這一點。這并不是偶然發生的,而必須努力去做。大多數公司的問題是,使產品變得更好并不符合他們的長期利益,只為了短期利益,讓本季度的收益報告看起來不錯。
Joe Rogan:你已經在計算機行業工作了 40 年,你是如何保持不松懈的?
Steve Jobs:在競爭激烈中,那些做得不好的公司不斷被超越。就我們所做的事情而言,我認為我們仍然有最好的產品或操作系統,但要保持它在頂端則必須完善它。你永遠不希望讓產品保持不變,否則人們會說,我們以前見過這些功能。
這一次將是不同的,從來都是如此,要有一種追求完美的動力。你必須不斷發展,不斷向前推進,這確實很難,因為東西并沒有壞,而是需要被做得更好。
人們不會為了讓它變得更好而付費,只有當它是一個新產品時他們才會付錢。因此,當你在這個世界上創造了真正偉大的、革命性的東西時,你有責任推動使它變得更好。
就像我們在準備推出 Macintosh 的發布會時,那時我在想,為什么我們要推廣這個產品?這個產品有什么大不了的?它做不到我們所承諾的事情的一半。

圖注:蘋果于 1984 年生產的 Mac 電腦 128K 型號(Macintosh)
當 Windows 一年后出現時,蘋果很幸運,因為它允許我們改變自己的故事。我們從一個失敗的想弄點東西出來的公司,變成了 Ibm,一個更年輕、更酷的替代品。
Joe Rogan:你覺得你會做比 Windows 更好的系統,或是跟他們合作嗎?
Steve Jobs:微軟做了很好的工作,但他們沒有太多的審美意識,這是我遇到的微軟的問題。創建微軟公司的人大部分是數學家或科學家,他們不理解人們的實際體驗會如何。
之所以這么說,是因為我覺得 Windows 3 是一個災難性產品,沒考慮過人們如何使用這個產品,而只做了他們認為對的事情,這非常糟糕。
一些人相信要做對的事情,一些人相信智慧,這兩件事情結合在一起會很神奇。這就是 Macintosh 最初所發生的的事情。它可以由世界上最聰明的人造出來,并且造福于人類。Mac 對于蘋果來說是個好的產品,同時也對世界有益。
Joe Rogan:你覺得還有其他公司和蘋果類似嗎?
Steve Jobs:蘋果的文化非常獨特,這也是人們對于加入它感到興奮的原因,我不知道同樣的事情在其他地方會不會成功。
其他公司也有一些特殊的努力。從微軟身上可以看到,真正的秘訣不是創立一個公司,而是發起一個運動、一個由想要改變世界的人組成的運動。這樣做得好處在于,我們有一整個想要改變世界的人組成的社區,其核心在于,我們要制造偉大的東西來改變世界。
Joe Rogan: 我想這就是年輕人喜歡蘋果的原因,對他們來說好像自己也在參與一些事情。蘋果的產品有一種個性的張力,似乎藏著一個靈魂。有些人對蘋果變得虔誠,這是好事嗎?
Steve Jobs:如果一家公司成功地做了一些事情,那就不必嘗試做所有事。我們正嘗試減少做一些事,為了更專注地做優先級清單上真正重要的事情。不能撿了芝麻丟了西瓜,必須專注少數幾件事,才可以確保這些事很好地完成。
Joe Rogan:你是否會覺得因為這些過多的讓你獲得榮耀的技術,以至于要去承擔一部分責任?
Steve Jobs:技術是一把雙刃劍,以人類基因組計劃為例,那是一把巨大的雙刃劍,它在醫學上的回報將是巨大的,但也會被一些瘋狂的準軍事組織所利用。
在這一點上,我認為我們是站在好的一面。我們做了很多事情,其中之一就是使工業化世界的大多數人在計算機上成為可能,這使我們成為問題的一部分,但同時也是解決方案的一部分,因為我們可以做很多事情,來幫助教育人們了解什么是好的。在我成長的六七十年代中,電腦非常龐大且昂貴,你沒有辦法了解電腦。而今天長大的孩子每個家庭都有一臺電腦,這是一個巨變,它不一定是好或壞,我們想幫助人們充分地利用未來的一切。
我們總是問自己可以做的最瘋狂的事情是什么?如果想不到這一點,那我們就做得少一些。
產品的好和壞,都會隨著它們變強大而被放大。看看當你有和人一樣聰明的電腦時會發生什么,這很有趣。它不會疲憊,不會生病,不會因為去度假而留下未完成的工作,你告訴它要做什么它就會去做,它們將擁有比人多得多的智能等級。計算機將比現在重要 1000 倍,我們就在這個邊緣。
大部分的生活也是這樣的。如果它只是令人敬畏,它就不會被其他東西所平衡。
我對這個新世界的看法是,有很多人已經失去了工作或者很快就會失去工作。像汽車、電話這種集中化的事物有時是很好的,但不是每個人的解決方案。如果事情以一種新的方式集中權力,以至于不再有任何制衡,這是很可怕的。你必須誠實地對待它,這些東西對人類來說是好的嗎?一般我會說是的,但這也是一件非常可怕的事情。
2
AIGC,從圖像到語音
雖然在此次 podcast.ai 專訪中,Joe Rogan 跟喬布斯的對話長達 20 多分鐘,事實上,這是 Play.ht 通過喬布斯的傳記和手機網絡上關于他的所有錄音,用語言模型大量訓練生成的。
Play.ht 是一個 AI 文本轉換語音生成器,在今年 9 月發布了第一個語音模型 Peregrine,當中采用了與大型語言模型 ( 如 DALE 和 GPT-2 ) 相同的概念,模型覆蓋數千種說話的聲音,可以通過自監督學習人類的情感、說話語氣以及笑聲等。
從文本語言模型到音頻語言模型時,音頻數據速率增高是一個大的難題,一個句子的幾十個字符用音頻波形表達,所包含的數值往往多達數十萬個。
不僅如此,由于文本和音頻之間的一對多關系,也即是一個語句可以有不同的說話風格、情感等,這也成為了語音模型研究中需要解決的問題。
這也是當前在喬布斯 " 采訪 " 內容中所呈現出來的問題,即聽起來 AI 的模仿還有些生硬,對話一開始更像從小部分常用短語中提取出來,并且節奏和韻律也不太正常。
但總的來說, podcast.ai 的效果已經相當接近真人,Clearbit 公司聯合創始人 Alex MacCaw 表示:" 這真的令人非常興奮!"

有網友也留言稱:除了一開始有點不穩定外,當在其他工作過程中聽是,幾乎無法區分。

從 GPT-3、Bloom 的文本生成,DALL-E 和 Stable Diffusion 圖像生成,以及 RunwayML、Make-A-Video 視頻生成,各類生成式 AI 模型的出現,給內容創作帶來了更多的可能性。
原文地址:http://www.myzaker.com/article/634774178e9f09759d3c3afe