Google AI反擊戰！Bard用圖片答問題，Google搜尋直接生成答案！會損害全球網站利益？-方展策

22/05/2023

Google AI反擊戰！Bard用圖片答問題，Google搜尋直接生成答案！會損害全球網站利益？

#Smart Living #智慧城巿 #人工智能 #AI #Google #聊天機械人 #Bard #語言模型 #PaLM 2 #Duet AI #Snapshot #網站 #Reddit #收據 #科技 #科研 #圖片生成

　　為抗衡ChatGPT，Google今年2月發表聊天機械人Bard，但普遍被認為比不上前者，以致股價暴跌。事隔3個月，該公司在Google I/O開發者大會上，可以拿出甚麼石破天驚的新產品來扳回一城，遂成為全球科技界焦點。結果，Google只是平實地端出升級版Bard與新大型語言模型PaLM 2。但外界對此做法卻表示讚許，認為Google沒有說些不切實際的偉大願景，而是老老實實地改良產品，並示範AI如何融入旗下各種網上服務，展示有能力持續發展AI的證據，反而讓人更有信心。

Google深耕AI多年卻未獲關注

　　回顧歷屆Google I/O大會，AI一直是重點主題。早在I/O 2017上，執行長皮查伊（Sundar Pichai）已宣告，Google是「以AI為核心的公司」。I/O 2021上，Google發表了對話AI模型LaMDA，宣稱其理解對話上下文的能力，遠勝當時所有大型語言模型。I／O 2022上，Google 宣布 LaMDA 2 的誕生，表示新模型深度結合AI與機器學習技術，能夠就看似無窮無盡的話題，進行自由而流暢的對話。

　　即使Google大肆吹噓LaMDA系列模型有多厲害，但卻始終無法引起太大關注。直至OpenAI於2022年11月推出ChatGPT，才真正讓生成式AI與大型語言模型紅起來。眼看自己深耕多年的領域，突然被一家名不經傳的小公司獨領風騷，令Google變得無比焦慮，2023年5月10日，終於來到新一屆I/O大會。Google在會上提及「AI」接近200次，除升級版Bard外，還一口氣發表25項建基於PaLM 2模型上的新功能，幾乎把AI整合至Google Search、Google Maps、Google Docs、Gmail等所有服務。由此可見，Google急於向所有人證明，它依然是一家頂尖的AI公司。

Google在I/O 2023大會上發表新一代大型語言模型 PaLM 2，比起2022年推出的上一代模型，在多語言處理、推理和編程能力方面有很大提升。（圖片來源：翻攝Google官方YouTube影片）

Bard以文字搭圖片回答用戶提問

　　我們先來看看Bard的3大升級功能。首先，Bard能夠以圖片回答你的提問。假如你詢問Bard：「新奧爾良有哪些必去景點？」Bard回覆的答案除文字外，也會配上圖片，讓你可以先看看新奧爾良的風景。

　　同時，Google又將Google Lens的視覺分析功能整合到Bard，讓它不但可以圖片回答，還可以看懂圖片。譬如上傳狗仔相片，並要求Bard生成有趣的文案，它就會自行理解相片中狗隻的品種，然後產出與狗仔相關的文案。

　　其次，Bard也針對編程工作上作出優化。當編程人員要求Bard協助編寫程式碼，倘若當中引用了一段他人的程式碼，只要點擊「標註」，Bard即會把引用部分標記底線，並提供來源連結，方便編程人員查核。Bard又會推出編程人員最喜歡的深色模式，讓介面可以變成黑底白字，以減輕眼睛負擔。此外，Google跟網上開發平台Replit合作，可以把Bard生成的程式碼匯出到Replit直接執行。

在Bard上輸入提示詞「What are some must-see sights in New Orleans?」，AI生成有圖片輔助的文本答案，方便用戶先看看New Orleans的風景。（圖片來源：Google官方網誌）

將兩隻狗的相片上傳到Bard，只輸入提示詞「Write a funny caption about these two」，甚麼也沒解釋，Bard就自行理解相中狗隻的品種，並提供幾組相關的圖片說明供用戶選擇。（圖片來源：Google官方網誌）

Bard融入各項Google網上服務

　　其三，Bard將與Google網上服務全面整合。Google為Google Workspace推出一個AI助手機械人「Duet AI」。當你利用Google Slides製作簡報時，想為簡報加入圖片，便可以要求Duet AI幫手生成圖片；如你不滿意圖片效果，可以另行設定圖片風格，再要求Duet AI產出新作品。再者，用戶請求Bard幫忙草擬電郵和文件後，也可以直接匯出到Gmail和Google Docs，免去「Copy & Paste」的運作，直接替你無縫轉移文字內容。

　　面對Bing Chat的威脅，Google亦會將AI整合到Google Search，推出新形態的搜尋介面「Snapshot」。當用戶輸入關鍵字後，如AI判斷這不屬於商業性搜索，便會把搜尋到的資料整理成一段文本答案，列在搜尋結果頁面的最上方；如判定為具有商業性的搜索，頁頂依然會顯示搜尋廣告。

　　如此一來，Google完全顛覆了一直以來提供資訊的方式：從以往純粹提供相關網頁連結的清單，變成供應由AI生成的自家內容，但同時又保留了廣告版面的曝光機會，此做法備受外界看好。因此，Google母公司Alphabet Inc.的Class A股在I/O大會後持續上漲，及至5月19日收122.76美元，創2022年8月16日以來收盤新高，已將ChatGPT在2022年11月推出後的失土全部收復。

Google與Adobe合作，把後者的AI繪圖技術「Firefly」整合至Bard，讓用戶可以要求Bard生成圖片。有了Adobe的支持，圖片版權與畫質問題都一併解決了。（圖片來源：Google官方網誌）

用戶利用Google Slides製作簡報時，如想加入圖片，只要在右邊側欄的對話框輸入提示詞，Duet AI便可以為簡報生成圖片。（圖片來源：Google官方網誌）

生成式搜尋或損害內容網站收益

　　不過，有人歡笑有人愁。不少網上內容供應商擔心，這種生成式搜尋體驗（Search Generative Experience）很有可能會影響到旗下網站流量。一旦Google全面推出Snapshot功能，用戶可以直接在Google搜尋頁面上獲得想知的答案，根本無需再點擊搜尋結果的網頁連結，前往其他網站找答案。於是，由Google導引至網站的流量勢將大幅下跌，以致廣告收入流失。

　　遊戲新聞網站TechRaptor首席執行長拉特利奇·道格特（Rutledge Daugette）認為，Google的AI搜尋使用網上內容出版商花時間和精力來創作的高質內容，生成Snapshot文本，相當於抄襲網站內容。他又批評，好像Google Bard這類聊天機械人在回答用戶提問時，不會提供答案所使用的資料來源，這沒有給內容網站帶來任何好處。

　　餐廳評論網站Yelp的公共政策主管路德·洛威（Luther Lowe）指出，今次Google Search的更新只是強化其一貫的商業策略——延長用戶在Google網站上的停留時間，而不是把他們帶引到其他網站。他更狠批，Google將AI導入搜尋引擎所產生的排他性，是給整個互聯網「放血的最終章」。

未來Google Search將加入「Snapshot」搜尋功能，AI會將搜尋所得資料用文本方式直接呈現出來，右邊則有3個方框顯示相關網站連結。（圖片來源：Google官方網誌）

日後當用戶使用 Google搜尋商品時，AI會根據產品評論、評分、價格、以及產品描述，為用戶推薦合適的產品。（圖片來源：Google官方網誌）

PaLM 2不僅能使用20多種程式語言，還懂得40種人類語言，惟現階段只支援英文、日文、以及韓文。（圖片來源：Google官方網誌）

出版商擬透過法律途徑獲取補償

　　網上媒體公司IAC/InterActiveCorp.董事長巴里·迪勒（Barry Diller）表示，如果全球所有內容資訊都被吸納到一個巨大黑洞，然後以聊天功能重新包裝成各式文案，你想要多少就有多少，你想要多少就有多少，那麼世上就不會再有出版業了。他認為，除非Google等AI公司設立向出版商支付內容費用的機制，否則就不應抓取網站內容，並強調出版業者可以根據版權法起訴AI公司。

　　然而，出版商面臨的最大挑戰是，難以確認他們的內容是否有被AI使用。Google沒有透露PaLM 2模型所用的訓練數據是來自甚麼地方。Google研究副總裁祖賓·加赫拉馬尼（Zoubin Ghahramani）只稱：「PaLM 2是通過對互聯網上的各種公開可用數據進行訓練。」

　　無論如何，美國媒體業者已開始探索，透過法律途徑向AI公司爭取賠償。代表美加近2,000家傳媒和出版商的「新聞媒體聯盟」（News Media Alliance）現正研究，網上媒體內容在多大程度上被用於訓練Bard、ChatGPT等AI模型，並討論如何索償和法律選項。

　　新聞媒體聯盟執行副總裁兼總法律顧問丹妮爾·科菲（Danielle Coffey）表示，網站上的高質內容是媒體機構不斷投入資源、記者和編輯辛勤工作的成果，但現在卻被其他人用來創造收入，故此必須獲得補償。據悉，該聯盟已準備向Google和微軟（Microsoft）等AI巨頭正式攤牌。

Reddit將向AI公司收數據使用費

　　另一邊廂，美國最大討論區Reddit也決定，向使用其內容數據的AI公司收費。Reddit執行長史蒂夫·霍夫曼（Steve Huffman）指出，討論區上存有很多網民真實對話記錄，Bard、ChatGPT的AI模型可以透過Reddit的討論串學習人類如何談論不同議題與表達觀點，從中獲益匪淺。他強調，不能把這些有價值的數據白白送給AI公司使用，故此擬於2023年6月推出數據使用方案，要求這些公司付費後才可通過API讀取Reddit的數據。

　　由此看來，不論是網上出版商、抑或社交媒體平台都積極部署，如何向Google、Microsoft，以至OpenAI等徵收費用。但Google發言人已表示，該公司目前沒有計劃向出版商作出任何補償。

　　事實上，AI侵權問題現已是國際頭等大事之一。七大工業國集團（G7）在廣島峰會上表示，生成式AI發展速度和規模，已超出監管法規的制約能力，因此同意於2023年年底前設立部長級論壇「廣島AI進程」（Hiroshima AI Process），討論生成式AI帶來的知識產權與虛假資訊等問題。G7領袖又呼籲，應盡快建立一套國際技術標準，以規範AI的應用，務求令AI變得「更值得信任」。

　　可是，一旦過度立法，有可能窒礙AI技術進步。嚴格的法規可能導致開發商和投資者失去創新動力和投資意願。縱然政府應加強AI監管，但不是推出聳人聽聞的禁令，而是提供框架讓AI開發變得更加安全。政策者需要跟AI業者合作，維持開放和容許合理風險的氛圍，方可讓AI產業發展達至合理的平衡。

Reddit已宣布，日後AI公司要讀取討論區上的內容將要收取數據使用費。（圖片來源：翻攝Reddit官網）

AI市場邁向戰國時代！亞馬遜推Bedrock劍指OpenAI，馬斯克開發TruthGPT對撼ChatGPT！

AI可能導致人類滅亡？白宮下令AI接受評估，歐盟擬立法監管AI，教AI做人或是最佳解決方法！

記者、作家飯碗不保？ChatGPT取代人類寫書、寫新聞，OpenAI擅用傳媒文章訓練AI模型！

05/07/2024

蘋果AI野望！iOS 18不止ChatGPT，還會整合Google Gemini？Apple AI產品策略大揭秘！

#Smart Living #智慧生活 #ChatGPT #AI #iOS 18 #Anthropi #Google #生成式AI #Apple #Apple Intelligence #OpenAI #蘋果

　　在生成式AI的賽道上，蘋果（Apple）比對手遲了一年才發表Apple Intelligence，處於落後位置。有消息指，為求迎頭趕上，蘋果除與OpenAI合作外，也會跟Google和Anthropic達成合作協議，預計在2024年秋季釋出的《iOS 18》作業系統，可能會有ChatGPT以外的AI服務可供選擇；日後添加更強大的AI新功能時，或許會改用類似iCloud+的訂閱模式。當Apple的產品策略聚焦於AI，將為其業務帶來甚麼新面貌？蘋果AI的發展將會面臨甚麼新挑戰？

蘋果AI部署慢步調優勢漸露

　　在引進新科技時，Apple一向採取非常審慎的態度，以致對新技術的採用速度往往偏慢，近年的生成式AI正是最明顯例子。ChatGPT在2022年11月面世後，旋即引爆生成式AI熱潮，微軟（Microsoft）、Google、亞馬遜（Amazon）等爭相在2023年推出AI工具，惟Apple卻一路拖到2024年 6 月始發表Apple Intelligence。

　　蘋果在AI部署上的慢步調作風一直飽受外界爭議，但最近看到其對手的AI項目相繼宣布失敗，反而凸顯其慢步調的優勢。微軟發表發表AI PC規格「Copilot+ PC」，對撼整合Apple Intelligence的Mac電腦，可是其主打AI功能「回想」（Recall）卻遭很多保安專家批評，具有極大資安風險，迫使微軟在2024年6月宣布押後推出此功能。

當《iOS 18》、《iPadOS 18》、《macOS Sequoia》正式推出時，作業系統內將包含Apple Intelligence功能。（圖片來源：翻攝蘋果官方YouTube影片）

蘋果採用慢步調作風，一開始只針對一小部分用戶推出Apple Intelligence，所以初期僅支援美式英文。（圖片來源：蘋果官網）

　　甫踏入2024年7月，另一科技巨頭Amazon宣布停止銷售商用AI機械人Astro for Business。該機械人於2024年11月上市，面向零售業與製造業的商家，但如今只發售7個月就要停產，成為非常短命的AI產品。Apple寧願待產品設計完善、測試妥當後，始會推出市場，這樣即使看似遠遠落後於對手，但總勝過產品發表後被迫撤回或停售的尷尬局面。

Gemini模型秋季登陸蘋果AI

　　為讓其AI服務變得更多元化，蘋果將為Apple Intelligence引入ChatGPT以外的AI模型。根據彭博（Bloomberg）報道，蘋果已跟Google和另一家AI初創Anthropic達成合作協議，其中Google的Gemini模型將率先於2024年秋季登陸蘋果AI平台，這正是Apple Intelligence測試版伴隨著《iOS 18》推出的時間點。

　　Apple決定跟多家AI公司合作，可以為其用戶帶來更全面的AI體驗。事實上，每家AI公司皆擁有獨特的技術優勢，如把不同公司的AI模型整合至同一平台上，Apple Intelligence可以在不同任務和應用情景中為用戶提供最佳選擇。

　　譬如Anthropic的Claude模型在撰寫創意文案上較出色，Google的Gemini模型在規劃行程的考量上較仔細。藉由這種多元化的合作策略，蘋果可以讓Apple Intelligence在各個方面皆保持優勢，同時又不會過度依賴單一AI技術供應商。

日後用戶在Macbook與iPhone上，除ChatGPT外，或許還可以召喚Google Gemini來協助文書處理。（圖片來源：翻攝蘋果官方YouTube影片）

AI訂閱模式創造新收入來源

　　早前WWDC 2024大會上，Apple展示了Apple Intelligence的各種應用功能，相信這些功能都是可以免費使用。但日後Apple Intelligence如有新功能加入，用戶或許要另外付費才能使用，情況有點像iCloud+訂閱服務。

　　iCloud為iPhone用戶提供5G的免費儲存空間，若用戶覺得不敷應用，可以付費升級至iCloud+，不但可享用更大的雲端儲存空間，還可以使用隱藏電子郵件、iCloud私密轉送，自訂電郵網域等增值功能。

　　目前主流的AI工具如OpenAI ChatGPT、Microsoft Copilot、Google Gemini等均設有收費版本，讓用戶使用回應速度更快、生成能力更強大的AI模型，相信未來Apple Intelligence都會有類似的收費服務。另外，倘若用戶透過iPhone訂閱OpenAI等合作夥伴的付費版服務，預計Apple 也會從中抽取分成，為蘋果帶來銷售手機以外的新收入來源。

蘋果AI面臨歐盟新法例挑戰

　　不過，Apple Intelligence的推出之路卻是布滿荊棘。2023年，歐盟通過《數碼市場法》（Digital Markets Act，DMA），將蘋果、微軟、亞馬遜、Alphabet、Meta、字節跳動家大型互聯網企業定性為「守門人」（Gatekeeper），必須承擔義務促進更公平的市場競爭，確保平台的互通性，以及保障用戶私隱免受侵犯；一旦發現違規，最高可被判處等同全球營業額10%的罰款。

　　歐盟執委會於2024年6月宣布，初步認定Apple Store業務規則已違反DMA，令蘋果成為首家受此法例起訴的企業，預計於2025年3月底前做出最後裁決。有鑑於此，蘋果已表示，2024年內不會在歐盟推出Apple Intelligence，避免再遭歐盟起訴。

　　從技術層面來看，Apple Intelligence背後的大型語言模很有機會涉及複雜的數據處理與私隱問題。更棘手的是，DMA的互通性要求與Apple的商業模式是互相違背的。蘋果透過嚴格控制硬件、軟件與服務無縫整合，為用戶帶來最佳的使用體驗，成功把客戶鎖在蘋果生態圈內。

　　DMA所要求的互通性，等同打破Apple築起的生態圈圍牆，容許用戶自由地自由地遷移到不同平台、使用不同服務，這樣將對蘋果的商業模式造成極大衝擊，因此寧願暫時避開歐洲市場。但長遠而言，Apple究竟將如何應對DMA的規管，AI產品策略又會作出甚麼相應調整，還需持續觀察。

延伸閱讀：

蘋果AI反擊戰！Apple Intelligence全面融入iPhone、Mac、iPad，能否改寫AI市場格局？

WWDC 2024最強預告：iOS 18將整合ChatGPT？Apple與OpenAI聯手掀iPhone智能變革？

數碼新秩序

Google AI反擊戰！Bard用圖片答問題，Google搜尋直接生成答案！會損害全球網站利益？

蘋果AI野望！iOS 18不止ChatGPT，還會整合Google Gemini？Apple AI產品策略大揭秘！