22/05/2023
Google AI反擊戰!Bard用圖片答問題,Google搜尋直接生成答案!會損害全球網站利益?
為抗衡ChatGPT,Google今年2月發表聊天機械人Bard,但普遍被認為比不上前者,以致股價暴跌。事隔3個月,該公司在Google I/O開發者大會上,可以拿出甚麼石破天驚的新產品來扳回一城,遂成為全球科技界焦點。結果,Google只是平實地端出升級版Bard與新大型語言模型PaLM 2。但外界對此做法卻表示讚許,認為Google沒有說些不切實際的偉大願景,而是老老實實地改良產品,並示範AI如何融入旗下各種網上服務,展示有能力持續發展AI的證據,反而讓人更有信心。
Google深耕AI多年卻未獲關注
回顧歷屆Google I/O大會,AI一直是重點主題。早在I/O 2017上,執行長皮查伊(Sundar Pichai)已宣告,Google是「以AI為核心的公司」。I/O 2021上,Google發表了對話AI模型LaMDA,宣稱其理解對話上下文的能力,遠勝當時所有大型語言模型。I/O 2022上,Google 宣布 LaMDA 2 的誕生,表示新模型深度結合AI與機器學習技術,能夠就看似無窮無盡的話題,進行自由而流暢的對話。
即使Google大肆吹噓LaMDA系列模型有多厲害,但卻始終無法引起太大關注。直至OpenAI於2022年11月推出ChatGPT,才真正讓生成式AI與大型語言模型紅起來。眼看自己深耕多年的領域,突然被一家名不經傳的小公司獨領風騷,令Google變得無比焦慮,2023年5月10日,終於來到新一屆I/O大會。Google在會上提及「AI」接近200次,除升級版Bard外,還一口氣發表25項建基於PaLM 2模型上的新功能,幾乎把AI整合至Google Search、Google Maps、Google Docs、Gmail等所有服務。由此可見,Google急於向所有人證明,它依然是一家頂尖的AI公司。
Google在I/O 2023大會上發表新一代大型語言模型 PaLM 2,比起2022年推出的上一代模型,在多語言處理、推理和編程能力方面有很大提升。(圖片來源:翻攝Google官方YouTube影片)
Bard以文字搭圖片回答用戶提問
我們先來看看Bard的3大升級功能。首先,Bard能夠以圖片回答你的提問。假如你詢問Bard:「新奧爾良有哪些必去景點?」Bard回覆的答案除文字外,也會配上圖片,讓你可以先看看新奧爾良的風景。
同時,Google又將Google Lens的視覺分析功能整合到Bard,讓它不但可以圖片回答,還可以看懂圖片。譬如上傳狗仔相片,並要求Bard生成有趣的文案,它就會自行理解相片中狗隻的品種,然後產出與狗仔相關的文案。
其次,Bard也針對編程工作上作出優化。當編程人員要求Bard協助編寫程式碼,倘若當中引用了一段他人的程式碼,只要點擊「標註」,Bard即會把引用部分標記底線,並提供來源連結,方便編程人員查核。Bard又會推出編程人員最喜歡的深色模式,讓介面可以變成黑底白字,以減輕眼睛負擔。此外,Google跟網上開發平台Replit合作,可以把Bard生成的程式碼匯出到Replit直接執行。
在Bard上輸入提示詞「What are some must-see sights in New Orleans?」,AI生成有圖片輔助的文本答案,方便用戶先看看New Orleans的風景。(圖片來源:Google官方網誌)
將兩隻狗的相片上傳到Bard,只輸入提示詞「Write a funny caption about these two」,甚麼也沒解釋,Bard就自行理解相中狗隻的品種,並提供幾組相關的圖片說明供用戶選擇。(圖片來源:Google官方網誌)
Bard融入各項Google網上服務
其三,Bard將與Google網上服務全面整合。Google為Google Workspace推出一個AI助手機械人「Duet AI」。當你利用Google Slides製作簡報時,想為簡報加入圖片,便可以要求Duet AI幫手生成圖片;如你不滿意圖片效果,可以另行設定圖片風格,再要求Duet AI產出新作品。再者,用戶請求Bard幫忙草擬電郵和文件後,也可以直接匯出到Gmail和Google Docs,免去「Copy & Paste」的運作,直接替你無縫轉移文字內容。
面對Bing Chat的威脅,Google亦會將AI整合到Google Search,推出新形態的搜尋介面「Snapshot」。當用戶輸入關鍵字後,如AI判斷這不屬於商業性搜索,便會把搜尋到的資料整理成一段文本答案,列在搜尋結果頁面的最上方;如判定為具有商業性的搜索,頁頂依然會顯示搜尋廣告。
如此一來,Google完全顛覆了一直以來提供資訊的方式:從以往純粹提供相關網頁連結的清單,變成供應由AI生成的自家內容,但同時又保留了廣告版面的曝光機會,此做法備受外界看好。因此,Google母公司Alphabet Inc.的Class A股在I/O大會後持續上漲,及至5月19日收122.76美元,創2022年8月16日以來收盤新高,已將ChatGPT在2022年11月推出後的失土全部收復。
Google與Adobe合作,把後者的AI繪圖技術「Firefly」整合至Bard,讓用戶可以要求Bard生成圖片。有了Adobe的支持,圖片版權與畫質問題都一併解決了。(圖片來源:Google官方網誌)
用戶利用Google Slides製作簡報時,如想加入圖片,只要在右邊側欄的對話框輸入提示詞,Duet AI便可以為簡報生成圖片。(圖片來源:Google官方網誌)
生成式搜尋或損害內容網站收益
不過,有人歡笑有人愁。不少網上內容供應商擔心,這種生成式搜尋體驗(Search Generative Experience)很有可能會影響到旗下網站流量。一旦Google全面推出Snapshot功能,用戶可以直接在Google搜尋頁面上獲得想知的答案,根本無需再點擊搜尋結果的網頁連結,前往其他網站找答案。於是,由Google導引至網站的流量勢將大幅下跌,以致廣告收入流失。
遊戲新聞網站TechRaptor首席執行長拉特利奇·道格特(Rutledge Daugette)認為,Google的AI搜尋使用網上內容出版商花時間和精力來創作的高質內容,生成Snapshot文本,相當於抄襲網站內容。他又批評,好像Google Bard這類聊天機械人在回答用戶提問時,不會提供答案所使用的資料來源,這沒有給內容網站帶來任何好處。
餐廳評論網站Yelp的公共政策主管路德·洛威(Luther Lowe)指出,今次Google Search的更新只是強化其一貫的商業策略——延長用戶在Google網站上的停留時間,而不是把他們帶引到其他網站。他更狠批,Google將AI導入搜尋引擎所產生的排他性,是給整個互聯網「放血的最終章」。
未來Google Search將加入「Snapshot」搜尋功能,AI會將搜尋所得資料用文本方式直接呈現出來,右邊則有3個方框顯示相關網站連結。(圖片來源:Google官方網誌)
日後當用戶使用 Google搜尋商品時,AI會根據產品評論、評分、價格、以及產品描述,為用戶推薦合適的產品。(圖片來源:Google官方網誌)
PaLM 2不僅能使用20多種程式語言,還懂得40種人類語言,惟現階段只支援英文、日文、以及韓文。(圖片來源:Google官方網誌)
出版商擬透過法律途徑獲取補償
網上媒體公司IAC/InterActiveCorp.董事長巴里·迪勒(Barry Diller)表示,如果全球所有內容資訊都被吸納到一個巨大黑洞,然後以聊天功能重新包裝成各式文案,你想要多少就有多少,你想要多少就有多少,那麼世上就不會再有出版業了。他認為,除非Google等AI公司設立向出版商支付內容費用的機制,否則就不應抓取網站內容,並強調出版業者可以根據版權法起訴AI公司。
然而,出版商面臨的最大挑戰是,難以確認他們的內容是否有被AI使用。Google沒有透露PaLM 2模型所用的訓練數據是來自甚麼地方。Google研究副總裁祖賓·加赫拉馬尼(Zoubin Ghahramani)只稱:「PaLM 2是通過對互聯網上的各種公開可用數據進行訓練。」
無論如何,美國媒體業者已開始探索,透過法律途徑向AI公司爭取賠償。代表美加近2,000家傳媒和出版商的「新聞媒體聯盟」(News Media Alliance)現正研究,網上媒體內容在多大程度上被用於訓練Bard、ChatGPT等AI模型,並討論如何索償和法律選項。
新聞媒體聯盟執行副總裁兼總法律顧問丹妮爾·科菲(Danielle Coffey)表示,網站上的高質內容是媒體機構不斷投入資源、記者和編輯辛勤工作的成果,但現在卻被其他人用來創造收入,故此必須獲得補償。據悉,該聯盟已準備向Google和微軟(Microsoft)等AI巨頭正式攤牌。
Reddit將向AI公司收數據使用費
另一邊廂,美國最大討論區Reddit也決定,向使用其內容數據的AI公司收費。Reddit執行長史蒂夫·霍夫曼(Steve Huffman)指出,討論區上存有很多網民真實對話記錄,Bard、ChatGPT的AI模型可以透過Reddit的討論串學習人類如何談論不同議題與表達觀點,從中獲益匪淺。他強調,不能把這些有價值的數據白白送給AI公司使用,故此擬於2023年6月推出數據使用方案,要求這些公司付費後才可通過API讀取Reddit的數據。
由此看來,不論是網上出版商、抑或社交媒體平台都積極部署,如何向Google、Microsoft,以至OpenAI等徵收費用。但Google發言人已表示,該公司目前沒有計劃向出版商作出任何補償。
事實上,AI侵權問題現已是國際頭等大事之一。七大工業國集團(G7)在廣島峰會上表示,生成式AI發展速度和規模,已超出監管法規的制約能力,因此同意於2023年年底前設立部長級論壇「廣島AI進程」(Hiroshima AI Process),討論生成式AI帶來的知識產權與虛假資訊等問題。G7領袖又呼籲,應盡快建立一套國際技術標準,以規範AI的應用,務求令AI變得「更值得信任」。
可是,一旦過度立法,有可能窒礙AI技術進步。嚴格的法規可能導致開發商和投資者失去創新動力和投資意願。縱然政府應加強AI監管,但不是推出聳人聽聞的禁令,而是提供框架讓AI開發變得更加安全。政策者需要跟AI業者合作,維持開放和容許合理風險的氛圍,方可讓AI產業發展達至合理的平衡。
Reddit已宣布,日後AI公司要讀取討論區上的內容將要收取數據使用費。(圖片來源:翻攝Reddit官網)
Read More:
AI搜尋對決!Google Bard迎戰ChatGPT+Bing搜尋引擎,爭奪對話式AI技術話語權!
AI市場邁向戰國時代!亞馬遜推Bedrock劍指OpenAI,馬斯克開發TruthGPT對撼ChatGPT!
AI可能導致人類滅亡?白宮下令AI接受評估,歐盟擬立法監管AI,教AI做人或是最佳解決方法!
記者、作家飯碗不保?ChatGPT取代人類寫書、寫新聞,OpenAI擅用傳媒文章訓練AI模型!
《說說心理話》:講講常見年輕人理財問題!想「人有我有」?認可理財社工分享理財觀念小秘訣!► 即睇