第101章 國產大模型風ai發布,挑戰穀歌!
重生高三:科技霸主歸來 作者:白玉展堂 投票推薦 加入書簽 留言反饋
時間來到2014年。
未來智能科技,這家由林風一手締造的ai巨頭,已經憑借“智學星”、“趣拍\/tick tock”、“靈犀客服”等爆款應用,以及在智慧城市、ai芯片(啟明一號已開始內部規模化應用)等領域的驚人突破,成為了華夏乃至全球科技界最耀眼的存在。
公司的估值早已突破數十億美金,在全球範圍內擁有數千名員工(包括大量頂尖的ai人才),其一舉一動,都足以引發行業的震動。
但林風的目光,從未停止眺望更遠的未來。
他知道,應用層的成功固然重要,但真正決定未來ai時代話語權的,是更底層的、能夠理解和生成人類語言、掌握世界知識的**“通用人工智能”**雛形——大型語言模型rgenguage model, llm)!
在當時的世界上,美國的openai(由科技狂人伊隆·馬斯克等人創立,此時已發布gpt-2並開始展現潛力)和穀歌大腦,在llm領域的研究處於領先地位,隱隱有壟斷下一代ai核心技術的趨勢。
“我們未來智能,絕不能在llm這個主戰場上缺席!更不能讓華夏在這一關鍵領域受製於人!”林風在一次最高級別的ai戰略會議上,對陳薇博士、周明博士等核心科學家說道,“我們不僅要做,還要做就做世界一流!做出真正懂中文、懂華夏文化的、我們自己的超大規模預訓練語言模型!”
目標:打造華夏第一個世界級大語言模型!
這個任務,被林風列為公司未來三年內,優先級最高的戰略項目,代號——“風”!
取“風起於青萍之末”,亦取“大風起兮雲飛揚”之意!
項目由林風親自掛帥,陳薇博士(機器學習)和周明博士(自然語言處理)領銜,調集了ai研究院最核心的數百名科學家和工程師,並獲得了未來智能科技“未來一號”、“女媧”全球數據中心,尤其是搭載了數萬顆“啟明一號”ai芯片的超級計算集群的全力支持!
這是一場真正的、不計成本的ai“核武器”研發競賽!
團隊首先利用ai係統提供的“未來視野”,以及林風的指導,確定了比當時gpt-2更先進、甚至借鑒了部分gpt-3(對當時來說是未來)設計理念的transformer模型架構。
接著,是數據的準備。趙誌強的數據中心團隊火力全開,清洗、整理了高達數tb的高質量中文語料數據(包括互聯網網頁、 digitized 古籍、百科知識、新聞資訊、以及部分經過嚴格脫敏和授權的公司內部數據),構建了當時全球範圍內規模最大、質量最高的中文訓練數據集!
然後,就是最關鍵、也最“燒錢”的——模型訓練!
未來智能科技那龐大的、由數萬顆“啟明一號”ai芯片組成的超級計算集群,開始為了“風ai”的誕生而日夜轟鳴!
經過長達一年多的、消耗了天文數字般的計算資源和電力(幸好有國家電網的合作和ai優化調度,成本可控)的艱苦訓練……
終於,在2014年底!
“風ai”大語言模型,訓練成功!
內部測試結果顯示,“風ai”不僅在中文的理解、生成、翻譯、問答、摘要等各項能力上,全麵超越了當時所有已知的語言模型,達到了驚人的流暢度和準確性,表現出令人讚歎的“智能”!
更令人驚喜的是,在許多通用的英文nlp評測基準(benchmark)上,“風ai”的表現,也完全不輸於、甚至在部分指標上超越了同期最強的openai gpt模型(假設此時gpt-3尚未發布或剛發布不久)!
“我們……成功了!”當看到最終的評測報告時,饒是陳薇、周明這些見慣了風浪的技術大牛,也激動得熱淚盈眶!
這是屬於華夏ai的裏程碑!
2015年初春。
未來智能科技,在首都京城,國家會議中心,舉辦了一場吸引了全球目光的、空前盛大的新聞發布會!
林風,再次站在了聚光燈下。
他身後的大屏幕上,隻顯示著兩個簡潔而充滿力量的漢字——“風 ai”!
“今天,我非常榮幸地向大家宣布,”林風的聲音沉穩而自豪,“未來智能科技,自主研發的、全球領先的、專注於中文理解與生成的超大規模預訓練語言模型——‘風ai’,正式發布!”
隨後,林風和陳薇博士一起,現場演示了“風ai”的強大能力:
——用流利標準的英文與主持人進行多輪複雜對話,並實時將對話內容精準翻譯成地道的中文。
——根據現場記者提出的“月下獨酌,思念故鄉”的意境,即興創作出數首意境優美、格律工整的七言絕句!
——快速閱讀並精準摘要了一篇長達數萬字的專業醫學論文!
——甚至,根據林風用自然語言描述的一個簡單功能需求,現場生成了一段可運行的python代碼!
……
一項項演示,如同魔法般,徹底震撼了現場的所有人!
台下的媒體記者們瘋狂地按著快門!
國內外的科技同行們,臉上寫滿了震驚和難以置信!
來自國家部委的領導們,則露出了無比欣慰和自豪的笑容!
林風公布了“風ai”在多個國際權威nlp評測基準上的得分——多項指標持平甚至超越同期最強的gpt模型!
這無疑是向全世界宣告:在代表著人工智能皇冠上明珠的“大語言模型”領域,華夏,不僅沒有落後,甚至……開始領跑了!
“風ai”的發布,如同一場十二級地震,瞬間席卷了全球科技界!
國內,是鋪天蓋地的讚美和民族自豪感的又一次井噴!“風ai”被譽為“國之重器”、“華夏智慧的結晶”!
國際上,尤其是矽穀,則是一片嘩然!穀歌、微軟、facebook、以及openai,都感受到了來自東方前所未有的巨大壓力!他們沒想到,未來智能科技不僅在應用層和芯片層取得了突破,竟然在最核心的ai基礎模型層麵,也追趕甚至反超了上來!
“未來智能的風ai,將徹底改變全球ai的競爭格局!”——《紐約時報》科技版頭條評論道。
林風站在發布會的台上,看著台下閃爍的燈光和激動的麵龐,知道自己又完成了一項壯舉。
“風ai”,不僅是未來智能科技又一個強大的技術引擎,更是他送給這個國家、這個民族的一份厚禮!
當然,挑戰,也才剛剛開始。
未來智能科技,這家由林風一手締造的ai巨頭,已經憑借“智學星”、“趣拍\/tick tock”、“靈犀客服”等爆款應用,以及在智慧城市、ai芯片(啟明一號已開始內部規模化應用)等領域的驚人突破,成為了華夏乃至全球科技界最耀眼的存在。
公司的估值早已突破數十億美金,在全球範圍內擁有數千名員工(包括大量頂尖的ai人才),其一舉一動,都足以引發行業的震動。
但林風的目光,從未停止眺望更遠的未來。
他知道,應用層的成功固然重要,但真正決定未來ai時代話語權的,是更底層的、能夠理解和生成人類語言、掌握世界知識的**“通用人工智能”**雛形——大型語言模型rgenguage model, llm)!
在當時的世界上,美國的openai(由科技狂人伊隆·馬斯克等人創立,此時已發布gpt-2並開始展現潛力)和穀歌大腦,在llm領域的研究處於領先地位,隱隱有壟斷下一代ai核心技術的趨勢。
“我們未來智能,絕不能在llm這個主戰場上缺席!更不能讓華夏在這一關鍵領域受製於人!”林風在一次最高級別的ai戰略會議上,對陳薇博士、周明博士等核心科學家說道,“我們不僅要做,還要做就做世界一流!做出真正懂中文、懂華夏文化的、我們自己的超大規模預訓練語言模型!”
目標:打造華夏第一個世界級大語言模型!
這個任務,被林風列為公司未來三年內,優先級最高的戰略項目,代號——“風”!
取“風起於青萍之末”,亦取“大風起兮雲飛揚”之意!
項目由林風親自掛帥,陳薇博士(機器學習)和周明博士(自然語言處理)領銜,調集了ai研究院最核心的數百名科學家和工程師,並獲得了未來智能科技“未來一號”、“女媧”全球數據中心,尤其是搭載了數萬顆“啟明一號”ai芯片的超級計算集群的全力支持!
這是一場真正的、不計成本的ai“核武器”研發競賽!
團隊首先利用ai係統提供的“未來視野”,以及林風的指導,確定了比當時gpt-2更先進、甚至借鑒了部分gpt-3(對當時來說是未來)設計理念的transformer模型架構。
接著,是數據的準備。趙誌強的數據中心團隊火力全開,清洗、整理了高達數tb的高質量中文語料數據(包括互聯網網頁、 digitized 古籍、百科知識、新聞資訊、以及部分經過嚴格脫敏和授權的公司內部數據),構建了當時全球範圍內規模最大、質量最高的中文訓練數據集!
然後,就是最關鍵、也最“燒錢”的——模型訓練!
未來智能科技那龐大的、由數萬顆“啟明一號”ai芯片組成的超級計算集群,開始為了“風ai”的誕生而日夜轟鳴!
經過長達一年多的、消耗了天文數字般的計算資源和電力(幸好有國家電網的合作和ai優化調度,成本可控)的艱苦訓練……
終於,在2014年底!
“風ai”大語言模型,訓練成功!
內部測試結果顯示,“風ai”不僅在中文的理解、生成、翻譯、問答、摘要等各項能力上,全麵超越了當時所有已知的語言模型,達到了驚人的流暢度和準確性,表現出令人讚歎的“智能”!
更令人驚喜的是,在許多通用的英文nlp評測基準(benchmark)上,“風ai”的表現,也完全不輸於、甚至在部分指標上超越了同期最強的openai gpt模型(假設此時gpt-3尚未發布或剛發布不久)!
“我們……成功了!”當看到最終的評測報告時,饒是陳薇、周明這些見慣了風浪的技術大牛,也激動得熱淚盈眶!
這是屬於華夏ai的裏程碑!
2015年初春。
未來智能科技,在首都京城,國家會議中心,舉辦了一場吸引了全球目光的、空前盛大的新聞發布會!
林風,再次站在了聚光燈下。
他身後的大屏幕上,隻顯示著兩個簡潔而充滿力量的漢字——“風 ai”!
“今天,我非常榮幸地向大家宣布,”林風的聲音沉穩而自豪,“未來智能科技,自主研發的、全球領先的、專注於中文理解與生成的超大規模預訓練語言模型——‘風ai’,正式發布!”
隨後,林風和陳薇博士一起,現場演示了“風ai”的強大能力:
——用流利標準的英文與主持人進行多輪複雜對話,並實時將對話內容精準翻譯成地道的中文。
——根據現場記者提出的“月下獨酌,思念故鄉”的意境,即興創作出數首意境優美、格律工整的七言絕句!
——快速閱讀並精準摘要了一篇長達數萬字的專業醫學論文!
——甚至,根據林風用自然語言描述的一個簡單功能需求,現場生成了一段可運行的python代碼!
……
一項項演示,如同魔法般,徹底震撼了現場的所有人!
台下的媒體記者們瘋狂地按著快門!
國內外的科技同行們,臉上寫滿了震驚和難以置信!
來自國家部委的領導們,則露出了無比欣慰和自豪的笑容!
林風公布了“風ai”在多個國際權威nlp評測基準上的得分——多項指標持平甚至超越同期最強的gpt模型!
這無疑是向全世界宣告:在代表著人工智能皇冠上明珠的“大語言模型”領域,華夏,不僅沒有落後,甚至……開始領跑了!
“風ai”的發布,如同一場十二級地震,瞬間席卷了全球科技界!
國內,是鋪天蓋地的讚美和民族自豪感的又一次井噴!“風ai”被譽為“國之重器”、“華夏智慧的結晶”!
國際上,尤其是矽穀,則是一片嘩然!穀歌、微軟、facebook、以及openai,都感受到了來自東方前所未有的巨大壓力!他們沒想到,未來智能科技不僅在應用層和芯片層取得了突破,竟然在最核心的ai基礎模型層麵,也追趕甚至反超了上來!
“未來智能的風ai,將徹底改變全球ai的競爭格局!”——《紐約時報》科技版頭條評論道。
林風站在發布會的台上,看著台下閃爍的燈光和激動的麵龐,知道自己又完成了一項壯舉。
“風ai”,不僅是未來智能科技又一個強大的技術引擎,更是他送給這個國家、這個民族的一份厚禮!
當然,挑戰,也才剛剛開始。