翻譯表現提升44%!神經機器翻譯模型能翻譯200種語言【附人工智能技術賽道觀察圖譜】
瞻觀前沿
6月5日,《自然》發表的一篇論文報道了一個Meta人工智能(AI)模型的底層技術。該模型能翻譯200種不同語言,增加了機器翻譯的語言數量。神經機器翻譯模型利用人工神經網絡翻譯各種語言。這些模型通常需要大量可在線獲取的數據加以訓練,但并非所有語言數據都是公開、低成本或是普遍可及的,這類語言被稱為低資源語言。一味地增加模型翻譯語言數量,可能會影響模型的翻譯質量。
此次,Meta的法國研究團隊和“不落下**語言”(NLLB)團隊開發了一種跨語言技術,能讓神經機器翻譯模型學習如何利用翻譯高資源語言的預存能力,實現對低資源語言的翻譯。研究團隊開發了一個在線多語言翻譯工具,名為“NLLB-200”。該工具能容納200種語言,其低資源語言數量是高資源語言數量的3倍,翻譯表現則比當今已有系統高44%。
研究團隊指出,這個工具可以幫助很少被翻譯的那些語言的使用者,讓他們也能用上互聯網和其他技術。此外,教育是一個非常重要的應用,因為這個模型可以幫助低資源語言使用者獲取更多圖書和研究文章。但團隊也表示,目前誤譯的情況仍有可能出現。

圖片來源:攝圖網
技術價值觀察
人工智能產業鏈上游為硬件設備和數據設備,其中包括芯片、傳感器、大數據、云計算服務等,為人工智能提供數據服務和算力支持;中游是人工智能產業的技術核心,包括通用技術、算法模型、開發平臺三個方面,涵蓋了機器感知、自然語言理解、機器學習、圖譜、基礎開源框架等核心技術;下游是人工智能的應用產品和場景,涉及交通、醫療、安防、金融、家居、制造等多個領域。
Meta研究團隊開發了一個在線多語言翻譯工具,該AI工具能容納200種語言,可以幫助很少被翻譯的那些語言的使用者。因此,從人工智能產業鏈上看,該技術處于產業鏈的下游應用層環節。

宏觀市場觀察
——AI大模型是一種新的智能計算范式
超大規模智能模型,簡稱大模型,是近年興起的一種新的人工智能計算范式。和傳統AI模型相比,大模型的訓練使用了更多的數據,具有更好的泛化性,可以應用到更廣泛的下游任務中。按照應用場景劃分,AI大模型主要包括語言大模型、視覺大模型和多模態大模型等。業界典型的自然語言大模型有GPT-3、源、悟道和文心等。視覺大模型也已廣泛應用于自動駕駛、智能安防、醫學影像等領域。基于多模態大模型的以文生圖技術也迅速發展,AI內容生成(AI Generated Content,AIGC)已成為下一個AI發展的**領域。

——生成式AI行業技術圖譜
生成式AI(GenAI)是計算機科學的一個分支,涉及無監督和半監督算法,使計算機能夠使用之前創建的內容(如文本、音頻、視頻、圖像和代碼)來創建新內容,以響應簡短的提示問題。AI大模型為生成式AI提供了技術基礎和能力,而生成式AI則展示了大模型在實際應用中的潛在價值。
生成式AI進入探索爆發期,某些細分技術經過爆發開始走向落地,某些細分技術還處于培育期有待挖掘潛力。生成式AI技術圖譜主要評估了當前市場上技術的成熟度與發展潛力。從下到上,代表當前采用度越高;從左到右的3條曲線,代表當前對于整體市場規模的影響。**程度上,左側曲線當前的滲透率較高,右側的曲線未來的增長潛力更高。
技術圖譜展示了三種類型的技術,其中變革性技術將**重塑市場和投資戰略,可能創造新的業務和市場機會,并為企業和消費者市場帶來新能力。遞增性技術在現有技術的基礎上進行了重大改進,以提供更好的業務結果。機會性技術將根據具體的使用情況而發展,其改進現有技術/流程的能力尚未確定或有限。

——大模型的應用已經不局限于NLP(自然語言處理) 領域
目前大模型的應用已經不局限于NLP(自然語言處理)領域,包括圖片、語音、視頻、代碼等多種模態的應用開始涌現,而大模型、生成算法與多模態等底層技術的突破成為了生成式AI的質變的關鍵。一方面,目前大模型可以廣泛適用于各類下游任務,當前已經成為了生成式AI的底層框架。許多跨領域的AI應用均是構建于大模型之上,能夠解決多任務、多場景、多功能需求,支撐各種模態的生成;另一方面,包括生成對抗網絡(GAN)、變分自編碼器(VAE)、擴散模型(DiffusionModel)、神經輻射場(Nerf)等快速涌現的生成算法,以大模型為基礎,能夠創造出文字、圖片、語音、視頻、代碼等各種模態的內容,而基于此之上的多模態應用開始涌現。此外,超級深度學習近年來的快速發展帶來了深度神經網絡技術在大模型和多模態兩個方向上的不斷突破,并為AIGC技術能力的升級提供了強力的支撐和全新的可能性。

——全球生成式AI行業競爭格局
目前,在生成式AI這條細分賽道,全球已經誕生了13家獨角獸公司(估值達到10億美元以上),其中Open AI的估值及融資額排名**,其估值將達到800億美元。2023年以來新增的5家AI獨角獸中,包括Cohere和Runway兩家新晉生成式AI獨角獸。這13家生成式AI公司成為獨角獸的平均時間僅為3.6年,過去企業成為獨角獸的平時時間需要7年,從時間上來說幾乎縮短了一半。

——2023年**生成式AI市場規模約為14.4萬億元
2023年以來,由ChatGPT掀起的人工智能熱潮席卷全球,帶動AI產業取得了**發展。其中,生成式AI(也稱AIGC)這一分支備受投資者和科技巨頭青睞,各類AIGC大模型紛紛面世,收獲了數億級以上的用戶量,其影響力、應用范圍和迭代速度尤為令人矚目。因此,2023年被業界內外譽為“生成式AI元年”。
據**測算數據,2023年我國生成式AI的市場規模約為14.4萬億元;同時,預計到2035年將突破30萬億元,在全球總市場規模中占比超過35%,成為全球AI產業鏈的重要一環。

——**10億參數規模以上大模型數量已超100個
生成式人工智能的快速發展對算力提出了更高、更迫切的需求,**一體化算力體系建設的必要性愈益突出。截至2024年3月,**10億參數規模以上大模型數量已超100個,行業大模型深度賦能電子信息、醫療、交通等領域,形成上百種應用模式,賦能千行百業。

——全球生成式AI行業市場規模及預測
隨著ChatGPT的火爆出圈,生成式AI成為各行各業關注和熱議的話題。全球科技巨頭和AI廠商紛紛下場,唯恐錯過此番科技盛宴。行業翹楚和媒體將生成式AI浪潮類比昔日的移動互聯網機遇,認為它將對全球經濟和各個行業帶來深遠影響,企業也將迎來重大變革機遇,同時,根據Bloomberg Intelligence披露的數據,2023年全球生成式AI市場整體規模約為670億美元,預計2029年及2032年將分別達到7280億美元和1.3萬億美元,2022-2032年復合增長率高達42%。

**人工智能技術賽道熱力圖

根據前瞻產業熱力圖顯示,與人工智能關鍵技術強關聯的城市集群主要集中在華南和西北地區,并且以廣東、陜西省為**發展區域,未來布局人工智能技術及其他相關技術的發展路徑,極大可能性在于華南、西北地區優先導入,其中可**關注廣東省廣州市天河區、廣東省深圳市福田區及陜西省西安市雁塔區所處的人工智能相關企業,以及該地方對于人工智能產業發展投資環境、供給市場的潛力空間。
本文 軟文網 原創,轉載保留鏈接!網址:/news/383.html
1.本站遵循行業規范,任何轉載的稿件都會明確標注作者和來源;2.本站的原創文章,請轉載時務必注明文章作者和來源,不尊重原創的行為我們將追究責任;3.作者投稿可能會經我們編輯修改或補充。







