22/05/2023

Google AI反擊戰！Bard用圖片答問題，Google搜尋直接生成答案！會損害全球網站利益？

#Smart Living #智慧城巿 #人工智能 #AI #Google #聊天機械人 #Bard #語言模型 #PaLM 2 #Duet AI #Snapshot #網站 #Reddit #收據 #科技 #科研 #圖片生成

加入最愛專欄
收藏文章

方展策
方展策
少年時，曾研習 Geographic Information System，可惜學無所成，僥倖畢業。成年後，誤打誤撞進入傳媒圈子，先後在印刷、電子、網絡媒體打滾，略有小成。中年後，修畢資訊科技碩士，眼界漸擴，決意投身初創企業，窺探不同科技領域。近年，積極鑽研數據分析與數碼策略，又涉足 Location Intelligence 開發項目；有時還會抽空執教鞭，既可向他人分享所學，亦可鞭策自己保持終身學習。
智城物語

　　為抗衡ChatGPT，Google今年2月發表聊天機械人Bard，但普遍被認為比不上前者，以致股價暴跌。事隔3個月，該公司在Google I/O開發者大會上，可以拿出甚麼石破天驚的新產品來扳回一城，遂成為全球科技界焦點。結果，Google只是平實地端出升級版Bard與新大型語言模型PaLM 2。但外界對此做法卻表示讚許，認為Google沒有說些不切實際的偉大願景，而是老老實實地改良產品，並示範AI如何融入旗下各種網上服務，展示有能力持續發展AI的證據，反而讓人更有信心。

Google深耕AI多年卻未獲關注

　　回顧歷屆Google I/O大會，AI一直是重點主題。早在I/O 2017上，執行長皮查伊（Sundar Pichai）已宣告，Google是「以AI為核心的公司」。I/O 2021上，Google發表了對話AI模型LaMDA，宣稱其理解對話上下文的能力，遠勝當時所有大型語言模型。I／O 2022上，Google 宣布 LaMDA 2 的誕生，表示新模型深度結合AI與機器學習技術，能夠就看似無窮無盡的話題，進行自由而流暢的對話。

　　即使Google大肆吹噓LaMDA系列模型有多厲害，但卻始終無法引起太大關注。直至OpenAI於2022年11月推出ChatGPT，才真正讓生成式AI與大型語言模型紅起來。眼看自己深耕多年的領域，突然被一家名不經傳的小公司獨領風騷，令Google變得無比焦慮，2023年5月10日，終於來到新一屆I/O大會。Google在會上提及「AI」接近200次，除升級版Bard外，還一口氣發表25項建基於PaLM 2模型上的新功能，幾乎把AI整合至Google Search、Google Maps、Google Docs、Gmail等所有服務。由此可見，Google急於向所有人證明，它依然是一家頂尖的AI公司。

Google在I/O 2023大會上發表新一代大型語言模型 PaLM 2，比起2022年推出的上一代模型，在多語言處理、推理和編程能力方面有很大提升。（圖片來源：翻攝Google官方YouTube影片）

Bard以文字搭圖片回答用戶提問

　　我們先來看看Bard的3大升級功能。首先，Bard能夠以圖片回答你的提問。假如你詢問Bard：「新奧爾良有哪些必去景點？」Bard回覆的答案除文字外，也會配上圖片，讓你可以先看看新奧爾良的風景。

　　同時，Google又將Google Lens的視覺分析功能整合到Bard，讓它不但可以圖片回答，還可以看懂圖片。譬如上傳狗仔相片，並要求Bard生成有趣的文案，它就會自行理解相片中狗隻的品種，然後產出與狗仔相關的文案。

　　其次，Bard也針對編程工作上作出優化。當編程人員要求Bard協助編寫程式碼，倘若當中引用了一段他人的程式碼，只要點擊「標註」，Bard即會把引用部分標記底線，並提供來源連結，方便編程人員查核。Bard又會推出編程人員最喜歡的深色模式，讓介面可以變成黑底白字，以減輕眼睛負擔。此外，Google跟網上開發平台Replit合作，可以把Bard生成的程式碼匯出到Replit直接執行。

在Bard上輸入提示詞「What are some must-see sights in New Orleans?」，AI生成有圖片輔助的文本答案，方便用戶先看看New Orleans的風景。（圖片來源：Google官方網誌）

將兩隻狗的相片上傳到Bard，只輸入提示詞「Write a funny caption about these two」，甚麼也沒解釋，Bard就自行理解相中狗隻的品種，並提供幾組相關的圖片說明供用戶選擇。（圖片來源：Google官方網誌）

Bard融入各項Google網上服務

　　其三，Bard將與Google網上服務全面整合。Google為Google Workspace推出一個AI助手機械人「Duet AI」。當你利用Google Slides製作簡報時，想為簡報加入圖片，便可以要求Duet AI幫手生成圖片；如你不滿意圖片效果，可以另行設定圖片風格，再要求Duet AI產出新作品。再者，用戶請求Bard幫忙草擬電郵和文件後，也可以直接匯出到Gmail和Google Docs，免去「Copy & Paste」的運作，直接替你無縫轉移文字內容。

　　面對Bing Chat的威脅，Google亦會將AI整合到Google Search，推出新形態的搜尋介面「Snapshot」。當用戶輸入關鍵字後，如AI判斷這不屬於商業性搜索，便會把搜尋到的資料整理成一段文本答案，列在搜尋結果頁面的最上方；如判定為具有商業性的搜索，頁頂依然會顯示搜尋廣告。

　　如此一來，Google完全顛覆了一直以來提供資訊的方式：從以往純粹提供相關網頁連結的清單，變成供應由AI生成的自家內容，但同時又保留了廣告版面的曝光機會，此做法備受外界看好。因此，Google母公司Alphabet Inc.的Class A股在I/O大會後持續上漲，及至5月19日收122.76美元，創2022年8月16日以來收盤新高，已將ChatGPT在2022年11月推出後的失土全部收復。

Google與Adobe合作，把後者的AI繪圖技術「Firefly」整合至Bard，讓用戶可以要求Bard生成圖片。有了Adobe的支持，圖片版權與畫質問題都一併解決了。（圖片來源：Google官方網誌）

用戶利用Google Slides製作簡報時，如想加入圖片，只要在右邊側欄的對話框輸入提示詞，Duet AI便可以為簡報生成圖片。（圖片來源：Google官方網誌）

生成式搜尋或損害內容網站收益

　　不過，有人歡笑有人愁。不少網上內容供應商擔心，這種生成式搜尋體驗（Search Generative Experience）很有可能會影響到旗下網站流量。一旦Google全面推出Snapshot功能，用戶可以直接在Google搜尋頁面上獲得想知的答案，根本無需再點擊搜尋結果的網頁連結，前往其他網站找答案。於是，由Google導引至網站的流量勢將大幅下跌，以致廣告收入流失。

　　遊戲新聞網站TechRaptor首席執行長拉特利奇·道格特（Rutledge Daugette）認為，Google的AI搜尋使用網上內容出版商花時間和精力來創作的高質內容，生成Snapshot文本，相當於抄襲網站內容。他又批評，好像Google Bard這類聊天機械人在回答用戶提問時，不會提供答案所使用的資料來源，這沒有給內容網站帶來任何好處。

　　餐廳評論網站Yelp的公共政策主管路德·洛威（Luther Lowe）指出，今次Google Search的更新只是強化其一貫的商業策略——延長用戶在Google網站上的停留時間，而不是把他們帶引到其他網站。他更狠批，Google將AI導入搜尋引擎所產生的排他性，是給整個互聯網「放血的最終章」。

未來Google Search將加入「Snapshot」搜尋功能，AI會將搜尋所得資料用文本方式直接呈現出來，右邊則有3個方框顯示相關網站連結。（圖片來源：Google官方網誌）

日後當用戶使用 Google搜尋商品時，AI會根據產品評論、評分、價格、以及產品描述，為用戶推薦合適的產品。（圖片來源：Google官方網誌）

PaLM 2不僅能使用20多種程式語言，還懂得40種人類語言，惟現階段只支援英文、日文、以及韓文。（圖片來源：Google官方網誌）

出版商擬透過法律途徑獲取補償

　　網上媒體公司IAC/InterActiveCorp.董事長巴里·迪勒（Barry Diller）表示，如果全球所有內容資訊都被吸納到一個巨大黑洞，然後以聊天功能重新包裝成各式文案，你想要多少就有多少，你想要多少就有多少，那麼世上就不會再有出版業了。他認為，除非Google等AI公司設立向出版商支付內容費用的機制，否則就不應抓取網站內容，並強調出版業者可以根據版權法起訴AI公司。

　　然而，出版商面臨的最大挑戰是，難以確認他們的內容是否有被AI使用。Google沒有透露PaLM 2模型所用的訓練數據是來自甚麼地方。Google研究副總裁祖賓·加赫拉馬尼（Zoubin Ghahramani）只稱：「PaLM 2是通過對互聯網上的各種公開可用數據進行訓練。」

　　無論如何，美國媒體業者已開始探索，透過法律途徑向AI公司爭取賠償。代表美加近2,000家傳媒和出版商的「新聞媒體聯盟」（News Media Alliance）現正研究，網上媒體內容在多大程度上被用於訓練Bard、ChatGPT等AI模型，並討論如何索償和法律選項。

　　新聞媒體聯盟執行副總裁兼總法律顧問丹妮爾·科菲（Danielle Coffey）表示，網站上的高質內容是媒體機構不斷投入資源、記者和編輯辛勤工作的成果，但現在卻被其他人用來創造收入，故此必須獲得補償。據悉，該聯盟已準備向Google和微軟（Microsoft）等AI巨頭正式攤牌。

Reddit將向AI公司收數據使用費

　　另一邊廂，美國最大討論區Reddit也決定，向使用其內容數據的AI公司收費。Reddit執行長史蒂夫·霍夫曼（Steve Huffman）指出，討論區上存有很多網民真實對話記錄，Bard、ChatGPT的AI模型可以透過Reddit的討論串學習人類如何談論不同議題與表達觀點，從中獲益匪淺。他強調，不能把這些有價值的數據白白送給AI公司使用，故此擬於2023年6月推出數據使用方案，要求這些公司付費後才可通過API讀取Reddit的數據。

　　由此看來，不論是網上出版商、抑或社交媒體平台都積極部署，如何向Google、Microsoft，以至OpenAI等徵收費用。但Google發言人已表示，該公司目前沒有計劃向出版商作出任何補償。

　　事實上，AI侵權問題現已是國際頭等大事之一。七大工業國集團（G7）在廣島峰會上表示，生成式AI發展速度和規模，已超出監管法規的制約能力，因此同意於2023年年底前設立部長級論壇「廣島AI進程」（Hiroshima AI Process），討論生成式AI帶來的知識產權與虛假資訊等問題。G7領袖又呼籲，應盡快建立一套國際技術標準，以規範AI的應用，務求令AI變得「更值得信任」。

　　可是，一旦過度立法，有可能窒礙AI技術進步。嚴格的法規可能導致開發商和投資者失去創新動力和投資意願。縱然政府應加強AI監管，但不是推出聳人聽聞的禁令，而是提供框架讓AI開發變得更加安全。政策者需要跟AI業者合作，維持開放和容許合理風險的氛圍，方可讓AI產業發展達至合理的平衡。