×

掃碼關(guān)注微信公眾號(hào)

要聞 | 中譯語(yǔ)通出席2023中國(guó)算力大會(huì),發(fā)布西部AI語(yǔ)料庫(kù)與大模型

2023/8/21 17:15:25      企業(yè)供稿

2023年8月18日至19日,由工業(yè)和信息化部、寧夏回族自治區(qū)人民政府聯(lián)合舉辦的2023中國(guó)算力大會(huì)在寧夏銀川舉行,主題為“算領(lǐng)新產(chǎn)業(yè)潮流、力賦高質(zhì)量發(fā)展”。中譯語(yǔ)通科技股份有限公司(簡(jiǎn)稱“中譯語(yǔ)通”)副總裁張曉丹受邀出席大會(huì),在大模型時(shí)代下的AI算力新基建分論壇發(fā)表演講,發(fā)布中譯語(yǔ)通“西部AI語(yǔ)料庫(kù)與大模型”,并代表公司出席中國(guó)聯(lián)通寧夏分公司“東數(shù)西算”生態(tài)伙伴簽約儀式。


image.png

中譯語(yǔ)通副總裁 張曉丹發(fā)言

“從去年11月OpenAI發(fā)布ChatGPT大模型以來(lái),行業(yè)內(nèi)外非常關(guān)注AIGC正在帶來(lái)的變革,以大模型為代表的AIGC產(chǎn)業(yè)已經(jīng)成為算力資源需求的增長(zhǎng)引擎?!眻?bào)告伊始,張曉丹結(jié)合中譯語(yǔ)通作為人工智能、自然語(yǔ)言處理行業(yè)的重要參與者身份,分享了新技術(shù)的發(fā)展與應(yīng)用現(xiàn)狀。

談到當(dāng)下熱議的基于可信資源的多語(yǔ)言大模型技術(shù),她介紹說(shuō),中譯語(yǔ)通在2021年啟動(dòng)研發(fā)多語(yǔ)言、多模態(tài)大模型技術(shù),并于2022年11月發(fā)布“格物”大模型。它涵蓋了多語(yǔ)言預(yù)訓(xùn)練模型、多語(yǔ)言機(jī)器翻譯超大模型、多模態(tài)預(yù)訓(xùn)練模型和多語(yǔ)言生成式對(duì)話大模型等四個(gè)模型,已在政務(wù)、外宣、文旅和安全等垂直領(lǐng)域?qū)崿F(xiàn)了落地應(yīng)用。


image.png

中譯語(yǔ)通于2022年11月發(fā)布“格物”大模型

當(dāng)前多模型、多語(yǔ)言相互融合技術(shù)已經(jīng)在諸多行業(yè)大展身手,中譯語(yǔ)通正積極探索在更多領(lǐng)域發(fā)揮我們的賦能價(jià)值,為促進(jìn)我國(guó)西部地區(qū)數(shù)字經(jīng)濟(jì)快速發(fā)展貢獻(xiàn)力量。張曉丹表示,未來(lái)期望與更多同道者攜手推進(jìn)大模型產(chǎn)業(yè)鏈發(fā)展,助力我國(guó)AIGC行業(yè)相較國(guó)外先進(jìn)技術(shù)的追趕與應(yīng)用落地。


image.png

中譯語(yǔ)通“西部AI語(yǔ)料庫(kù)與大模型”發(fā)布

在分論壇上,張曉丹代表中譯語(yǔ)通發(fā)布了“西部AI語(yǔ)料庫(kù)與大模型”,寧夏回族自治區(qū)發(fā)改委二級(jí)巡視員李汶鑫與寧夏回族自治區(qū)工業(yè)和信息化廳信息化推進(jìn)處處長(zhǎng)黃彥平出席見(jiàn)證。

“西部AI語(yǔ)料庫(kù)”由100多種語(yǔ)言、PB級(jí)多語(yǔ)言多模態(tài)高質(zhì)量數(shù)據(jù)、“一帶一路”沿線國(guó)家與地區(qū)的近80億句對(duì)的高質(zhì)量平行語(yǔ)料以及百億級(jí)知識(shí)三元組條目構(gòu)成,覆蓋新聞、農(nóng)業(yè)、水利、科技、金融、工業(yè)等領(lǐng)域,旨在支持面向西部地區(qū)與周邊國(guó)家和地區(qū)應(yīng)用的多語(yǔ)言自然語(yǔ)言處理和多模態(tài)大模型訓(xùn)練。

“西部AI大模型”以中譯語(yǔ)通自主研發(fā)的“格物”大模型和多語(yǔ)言AI語(yǔ)料庫(kù)為數(shù)據(jù)基礎(chǔ),構(gòu)建了多模態(tài)、多場(chǎng)景、多語(yǔ)言感知世界、認(rèn)知世界的通用能力,涉及西部多語(yǔ)言生成式對(duì)話大模型、西部多語(yǔ)言機(jī)器翻譯超大模型、西部多語(yǔ)言預(yù)訓(xùn)練模型和多模態(tài)預(yù)訓(xùn)練模型四個(gè)子模型。其中,西部多語(yǔ)言生成式對(duì)話大模型融合上下文理解、個(gè)性化、思維鏈等高達(dá)億級(jí)規(guī)模的高質(zhì)量業(yè)務(wù)化指令,并引入領(lǐng)域?qū)<覍?duì)齊和社交對(duì)抗反饋的混合強(qiáng)化學(xué)習(xí)技術(shù),旨在打造時(shí)效性較高、千人千面的生成式大模型。

“西部AI語(yǔ)料庫(kù)與大模型”的成果將落地位于寧夏中衛(wèi)的中國(guó)聯(lián)通智算中心訓(xùn)推一體樞紐節(jié)點(diǎn),立足于寧夏作為“一帶一路”和中阿合作重要窗口的政策優(yōu)勢(shì),支持西部政務(wù)、商貿(mào)、文旅等行業(yè)應(yīng)用。


image.png

中譯語(yǔ)通副總裁張曉丹(左三)代表公司簽約

會(huì)中,張曉丹代表公司與中國(guó)聯(lián)通寧夏分公司簽署了“東數(shù)西算”戰(zhàn)略合作協(xié)議。中譯語(yǔ)通由此作為重要參與者加入“東數(shù)西算”產(chǎn)業(yè)生態(tài)圈,進(jìn)一步助力提升寧夏算力產(chǎn)業(yè)發(fā)展的加速度,共筑大模型產(chǎn)業(yè)鏈、創(chuàng)新鏈、生態(tài)鏈,賦能千行百業(yè)數(shù)字化、智能化轉(zhuǎn)型升級(jí)。


image.png

大會(huì)現(xiàn)場(chǎng)