數碼新秩序

智城物語
22/05/2023

Google AI反擊戰!Bard用圖片答問題,Google搜尋直接生成答案!會損害全球網站利益?

#Smart Living #智慧城巿 #人工智能 #AI #Google #聊天機械人 #Bard #語言模型 #PaLM 2 #Duet AI #Snapshot #網站 #Reddit #收據 #科技 #科研 #圖片生成

  為抗衡ChatGPT,Google今年2月發表聊天機械人Bard,但普遍被認為比不上前者,以致股價暴跌。事隔3個月,該公司在Google I/O開發者大會上,可以拿出甚麼石破天驚的新產品來扳回一城,遂成為全球科技界焦點。結果,Google只是平實地端出升級版Bard與新大型語言模型PaLM 2。但外界對此做法卻表示讚許,認為Google沒有說些不切實際的偉大願景,而是老老實實地改良產品,並示範AI如何融入旗下各種網上服務,展示有能力持續發展AI的證據,反而讓人更有信心。

 

Google深耕AI多年卻未獲關注

 

  回顧歷屆Google I/O大會,AI一直是重點主題。早在I/O 2017上,執行長皮查伊(Sundar Pichai)已宣告,Google是「以AI為核心的公司」。I/O 2021上,Google發表了對話AI模型LaMDA,宣稱其理解對話上下文的能力,遠勝當時所有大型語言模型。I/O 2022上,Google 宣布 LaMDA 2 的誕生,表示新模型深度結合AI與機器學習技術,能夠就看似無窮無盡的話題,進行自由而流暢的對話。

 

  即使Google大肆吹噓LaMDA系列模型有多厲害,但卻始終無法引起太大關注。直至OpenAI於2022年11月推出ChatGPT,才真正讓生成式AI與大型語言模型紅起來。眼看自己深耕多年的領域,突然被一家名不經傳的小公司獨領風騷,令Google變得無比焦慮,2023年5月10日,終於來到新一屆I/O大會。Google在會上提及「AI」接近200次,除升級版Bard外,還一口氣發表25項建基於PaLM 2模型上的新功能,幾乎把AI整合至Google Search、Google Maps、Google Docs、Gmail等所有服務。由此可見,Google急於向所有人證明,它依然是一家頂尖的AI公司。

 

Google在I/O 2023大會上發表新一代大型語言模型 PaLM 2,比起2022年推出的上一代模型,在多語言處理、推理和編程能力方面有很大提升。(圖片來源:翻攝Google官方YouTube影片)

 

Bard以文字搭圖片回答用戶提問

 

  我們先來看看Bard的3大升級功能。首先,Bard能夠以圖片回答你的提問。假如你詢問Bard:「新奧爾良有哪些必去景點?」Bard回覆的答案除文字外,也會配上圖片,讓你可以先看看新奧爾良的風景。

 

  同時,Google又將Google Lens的視覺分析功能整合到Bard,讓它不但可以圖片回答,還可以看懂圖片。譬如上傳狗仔相片,並要求Bard生成有趣的文案,它就會自行理解相片中狗隻的品種,然後產出與狗仔相關的文案。

 

  其次,Bard也針對編程工作上作出優化。當編程人員要求Bard協助編寫程式碼,倘若當中引用了一段他人的程式碼,只要點擊「標註」,Bard即會把引用部分標記底線,並提供來源連結,方便編程人員查核。Bard又會推出編程人員最喜歡的深色模式,讓介面可以變成黑底白字,以減輕眼睛負擔。此外,Google跟網上開發平台Replit合作,可以把Bard生成的程式碼匯出到Replit直接執行。

 

在Bard上輸入提示詞「What are some must-see sights in New Orleans?」,AI生成有圖片輔助的文本答案,方便用戶先看看New Orleans的風景。(圖片來源:Google官方網誌)

將兩隻狗的相片上傳到Bard,只輸入提示詞「Write a funny caption about these two」,甚麼也沒解釋,Bard就自行理解相中狗隻的品種,並提供幾組相關的圖片說明供用戶選擇。(圖片來源:Google官方網誌)

 

Bard融入各項Google網上服務

 

  其三,Bard將與Google網上服務全面整合。Google為Google Workspace推出一個AI助手機械人「Duet AI」。當你利用Google Slides製作簡報時,想為簡報加入圖片,便可以要求Duet AI幫手生成圖片;如你不滿意圖片效果,可以另行設定圖片風格,再要求Duet AI產出新作品。再者,用戶請求Bard幫忙草擬電郵和文件後,也可以直接匯出到Gmail和Google Docs,免去「Copy & Paste」的運作,直接替你無縫轉移文字內容。

 

  面對Bing Chat的威脅,Google亦會將AI整合到Google Search,推出新形態的搜尋介面「Snapshot」。當用戶輸入關鍵字後,如AI判斷這不屬於商業性搜索,便會把搜尋到的資料整理成一段文本答案,列在搜尋結果頁面的最上方;如判定為具有商業性的搜索,頁頂依然會顯示搜尋廣告。

 

  如此一來,Google完全顛覆了一直以來提供資訊的方式:從以往純粹提供相關網頁連結的清單,變成供應由AI生成的自家內容,但同時又保留了廣告版面的曝光機會,此做法備受外界看好。因此,Google母公司Alphabet Inc.的Class A股在I/O大會後持續上漲,及至5月19日收122.76美元,創2022年8月16日以來收盤新高,已將ChatGPT在2022年11月推出後的失土全部收復。

 

Google與Adobe合作,把後者的AI繪圖技術「Firefly」整合至Bard,讓用戶可以要求Bard生成圖片。有了Adobe的支持,圖片版權與畫質問題都一併解決了。(圖片來源:Google官方網誌)

用戶利用Google Slides製作簡報時,如想加入圖片,只要在右邊側欄的對話框輸入提示詞,Duet AI便可以為簡報生成圖片。(圖片來源:Google官方網誌)

 

生成式搜尋或損害內容網站收益

 

  不過,有人歡笑有人愁。不少網上內容供應商擔心,這種生成式搜尋體驗(Search Generative Experience)很有可能會影響到旗下網站流量。一旦Google全面推出Snapshot功能,用戶可以直接在Google搜尋頁面上獲得想知的答案,根本無需再點擊搜尋結果的網頁連結,前往其他網站找答案。於是,由Google導引至網站的流量勢將大幅下跌,以致廣告收入流失。

 

  遊戲新聞網站TechRaptor首席執行長拉特利奇·道格特(Rutledge Daugette)認為,Google的AI搜尋使用網上內容出版商花時間和精力來創作的高質內容,生成Snapshot文本,相當於抄襲網站內容。他又批評,好像Google Bard這類聊天機械人在回答用戶提問時,不會提供答案所使用的資料來源,這沒有給內容網站帶來任何好處。

 

  餐廳評論網站Yelp的公共政策主管路德·洛威(Luther Lowe)指出,今次Google Search的更新只是強化其一貫的商業策略——延長用戶在Google網站上的停留時間,而不是把他們帶引到其他網站。他更狠批,Google將AI導入搜尋引擎所產生的排他性,是給整個互聯網「放血的最終章」。

 

未來Google Search將加入「Snapshot」搜尋功能,AI會將搜尋所得資料用文本方式直接呈現出來,右邊則有3個方框顯示相關網站連結。(圖片來源:Google官方網誌)

日後當用戶使用 Google搜尋商品時,AI會根據產品評論、評分、價格、以及產品描述,為用戶推薦合適的產品。(圖片來源:Google官方網誌)

PaLM 2不僅能使用20多種程式語言,還懂得40種人類語言,惟現階段只支援英文、日文、以及韓文。(圖片來源:Google官方網誌)

 

出版商擬透過法律途徑獲取補償

 

  網上媒體公司IAC/InterActiveCorp.董事長巴里·迪勒(Barry Diller)表示,如果全球所有內容資訊都被吸納到一個巨大黑洞,然後以聊天功能重新包裝成各式文案,你想要多少就有多少,你想要多少就有多少,那麼世上就不會再有出版業了。他認為,除非Google等AI公司設立向出版商支付內容費用的機制,否則就不應抓取網站內容,並強調出版業者可以根據版權法起訴AI公司。

 

  然而,出版商面臨的最大挑戰是,難以確認他們的內容是否有被AI使用。Google沒有透露PaLM 2模型所用的訓練數據是來自甚麼地方。Google研究副總裁祖賓·加赫拉馬尼(Zoubin Ghahramani)只稱:「PaLM 2是通過對互聯網上的各種公開可用數據進行訓練。」

 

  無論如何,美國媒體業者已開始探索,透過法律途徑向AI公司爭取賠償。代表美加近2,000家傳媒和出版商的「新聞媒體聯盟」(News Media Alliance)現正研究,網上媒體內容在多大程度上被用於訓練Bard、ChatGPT等AI模型,並討論如何索償和法律選項。

 

  新聞媒體聯盟執行副總裁兼總法律顧問丹妮爾·科菲(Danielle Coffey)表示,網站上的高質內容是媒體機構不斷投入資源、記者和編輯辛勤工作的成果,但現在卻被其他人用來創造收入,故此必須獲得補償。據悉,該聯盟已準備向Google和微軟(Microsoft)等AI巨頭正式攤牌。

 

Reddit將向AI公司收數據使用費

 

  另一邊廂,美國最大討論區Reddit也決定,向使用其內容數據的AI公司收費。Reddit執行長史蒂夫·霍夫曼(Steve Huffman)指出,討論區上存有很多網民真實對話記錄,Bard、ChatGPT的AI模型可以透過Reddit的討論串學習人類如何談論不同議題與表達觀點,從中獲益匪淺。他強調,不能把這些有價值的數據白白送給AI公司使用,故此擬於2023年6月推出數據使用方案,要求這些公司付費後才可通過API讀取Reddit的數據。

 

  由此看來,不論是網上出版商、抑或社交媒體平台都積極部署,如何向Google、Microsoft,以至OpenAI等徵收費用。但Google發言人已表示,該公司目前沒有計劃向出版商作出任何補償。

 

  事實上,AI侵權問題現已是國際頭等大事之一。七大工業國集團(G7)在廣島峰會上表示,生成式AI發展速度和規模,已超出監管法規的制約能力,因此同意於2023年年底前設立部長級論壇「廣島AI進程」(Hiroshima AI Process),討論生成式AI帶來的知識產權與虛假資訊等問題。G7領袖又呼籲,應盡快建立一套國際技術標準,以規範AI的應用,務求令AI變得「更值得信任」。

 

  可是,一旦過度立法,有可能窒礙AI技術進步。嚴格的法規可能導致開發商和投資者失去創新動力和投資意願。縱然政府應加強AI監管,但不是推出聳人聽聞的禁令,而是提供框架讓AI開發變得更加安全。政策者需要跟AI業者合作,維持開放和容許合理風險的氛圍,方可讓AI產業發展達至合理的平衡。

 

Reddit已宣布,日後AI公司要讀取討論區上的內容將要收取數據使用費。(圖片來源:翻攝Reddit官網)

 

Read More:

 

AI搜尋對決!Google Bard迎戰ChatGPT+Bing搜尋引擎,爭奪對話式AI技術話語權!

AI市場邁向戰國時代!亞馬遜推Bedrock劍指OpenAI,馬斯克開發TruthGPT對撼ChatGPT!

AI可能導致人類滅亡?白宮下令AI接受評估,歐盟擬立法監管AI,教AI做人或是最佳解決方法!

記者、作家飯碗不保?ChatGPT取代人類寫書、寫新聞,OpenAI擅用傳媒文章訓練AI模型!

 

05/07/2024

蘋果AI野望!iOS 18不止ChatGPT,還會整合Google Gemini?Apple AI產品策略大揭秘!

#Smart Living #智慧生活 #ChatGPT #AI #iOS 18 #Anthropi #Google #生成式AI #Apple #Apple Intelligence #OpenAI #蘋果

  在生成式AI的賽道上,蘋果(Apple)比對手遲了一年才發表Apple Intelligence,處於落後位置。有消息指,為求迎頭趕上,蘋果除與OpenAI合作外,也會跟Google和Anthropic達成合作協議,預計在2024年秋季釋出的《iOS 18》作業系統,可能會有ChatGPT以外的AI服務可供選擇;日後添加更強大的AI新功能時,或許會改用類似iCloud+的訂閱模式。當Apple的產品策略聚焦於AI,將為其業務帶來甚麼新面貌?蘋果AI的發展將會面臨甚麼新挑戰?

 

蘋果AI部署慢步調優勢漸露

 

  在引進新科技時,Apple一向採取非常審慎的態度,以致對新技術的採用速度往往偏慢,近年的生成式AI正是最明顯例子。ChatGPT在2022年11月面世後,旋即引爆生成式AI熱潮,微軟(Microsoft)、Google、亞馬遜(Amazon)等爭相在2023年推出AI工具,惟Apple卻一路拖到2024年 6 月始發表Apple Intelligence。

 

  蘋果在AI部署上的慢步調作風一直飽受外界爭議,但最近看到其對手的AI項目相繼宣布失敗,反而凸顯其慢步調的優勢。微軟發表發表AI PC規格「Copilot+ PC」,對撼整合Apple Intelligence的Mac電腦,可是其主打AI功能「回想」(Recall)卻遭很多保安專家批評,具有極大資安風險,迫使微軟在2024年6月宣布押後推出此功能。

 

當《iOS 18》、《iPadOS 18》、《macOS Sequoia》正式推出時,作業系統內將包含Apple Intelligence功能。(圖片來源:翻攝蘋果官方YouTube影片)

蘋果採用慢步調作風,一開始只針對一小部分用戶推出Apple Intelligence,所以初期僅支援美式英文。(圖片來源:蘋果官網)

 

  甫踏入2024年7月,另一科技巨頭Amazon宣布停止銷售商用AI機械人Astro for Business。該機械人於2024年11月上市,面向零售業與製造業的商家,但如今只發售7個月就要停產,成為非常短命的AI產品。Apple寧願待產品設計完善、測試妥當後,始會推出市場,這樣即使看似遠遠落後於對手,但總勝過產品發表後被迫撤回或停售的尷尬局面。

 

Gemini模型秋季登陸蘋果AI

 

  為讓其AI服務變得更多元化,蘋果將為Apple Intelligence引入ChatGPT以外的AI模型。根據彭博(Bloomberg)報道,蘋果已跟Google和另一家AI初創Anthropic達成合作協議,其中Google的Gemini模型將率先於2024年秋季登陸蘋果AI平台,這正是Apple Intelligence測試版伴隨著《iOS 18》推出的時間點。

 

  Apple決定跟多家AI公司合作,可以為其用戶帶來更全面的AI體驗。事實上,每家AI公司皆擁有獨特的技術優勢,如把不同公司的AI模型整合至同一平台上,Apple Intelligence可以在不同任務和應用情景中為用戶提供最佳選擇。

 

  譬如Anthropic的Claude模型在撰寫創意文案上較出色,Google的Gemini模型在規劃行程的考量上較仔細。藉由這種多元化的合作策略,蘋果可以讓Apple Intelligence在各個方面皆保持優勢,同時又不會過度依賴單一AI技術供應商。

 

日後用戶在Macbook與iPhone上,除ChatGPT外,或許還可以召喚Google Gemini來協助文書處理。(圖片來源:翻攝蘋果官方YouTube影片)

 

AI訂閱模式創造新收入來源

 

  早前WWDC 2024大會上,Apple展示了Apple Intelligence的各種應用功能,相信這些功能都是可以免費使用。但日後Apple Intelligence如有新功能加入,用戶或許要另外付費才能使用,情況有點像iCloud+訂閱服務。

 

  iCloud為iPhone用戶提供5G的免費儲存空間,若用戶覺得不敷應用,可以付費升級至iCloud+,不但可享用更大的雲端儲存空間,還可以使用隱藏電子郵件、iCloud私密轉送,自訂電郵網域等增值功能。

 

  目前主流的AI工具如OpenAI ChatGPT、Microsoft Copilot、Google Gemini等均設有收費版本,讓用戶使用回應速度更快、生成能力更強大的AI模型,相信未來Apple Intelligence都會有類似的收費服務。另外,倘若用戶透過iPhone訂閱OpenAI等合作夥伴的付費版服務,預計Apple 也會從中抽取分成,為蘋果帶來銷售手機以外的新收入來源。

 

蘋果AI面臨歐盟新法例挑戰

 

  不過,Apple Intelligence的推出之路卻是布滿荊棘。2023年,歐盟通過《數碼市場法》(Digital Markets Act,DMA),將蘋果、微軟、亞馬遜、Alphabet、Meta、字節跳動家大型互聯網企業定性為「守門人」(Gatekeeper),必須承擔義務促進更公平的市場競爭,確保平台的互通性,以及保障用戶私隱免受侵犯;一旦發現違規,最高可被判處等同全球營業額10%的罰款。

 

  歐盟執委會於2024年6月宣布,初步認定Apple Store業務規則已違反DMA,令蘋果成為首家受此法例起訴的企業,預計於2025年3月底前做出最後裁決。有鑑於此,蘋果已表示,2024年內不會在歐盟推出Apple Intelligence,避免再遭歐盟起訴。

 

  從技術層面來看,Apple Intelligence背後的大型語言模很有機會涉及複雜的數據處理與私隱問題。更棘手的是,DMA的互通性要求與Apple的商業模式是互相違背的。蘋果透過嚴格控制硬件、軟件與服務無縫整合,為用戶帶來最佳的使用體驗,成功把客戶鎖在蘋果生態圈內。

 

  DMA所要求的互通性,等同打破Apple築起的生態圈圍牆,容許用戶自由地自由地遷移到不同平台、使用不同服務,這樣將對蘋果的商業模式造成極大衝擊,因此寧願暫時避開歐洲市場。但長遠而言,Apple究竟將如何應對DMA的規管,AI產品策略又會作出甚麼相應調整,還需持續觀察。

 

延伸閱讀:

蘋果AI反擊戰!Apple Intelligence全面融入iPhone、Mac、iPad,能否改寫AI市場格局?

WWDC 2024最強預告:iOS 18將整合ChatGPT?Apple與OpenAI聯手掀iPhone智能變革?

 

#食譜 #素食 #數碼營銷 #電影 #移民 #減肥 #創科 #Netflix #外賣 #辦公室貼士 #疫情 #在家運動 #WFH #抗疫不悶 #限聚令 #辦公室求生術
more on etnet.com.hk