中譯語通展示格物多語言大模型技術和工業(yè)實踐

2023/7/27 17:15:47 砍柴網(wǎng)

2023年7月18日至20日,第二屆自然語言生成與智能寫作大會(NLGIW 2023)在新疆烏魯木齊召開。中譯語通科技股份有限公司(簡稱“中譯語通”)作為大會戰(zhàn)略合作伙伴,向與會嘉賓展示了公司格物大模型技術和工業(yè)實踐。會議還匯聚了騰訊AI Lab、百度等科技企業(yè),學術界和工業(yè)界的研究學者與從業(yè)人員,分享各自研究成果和實踐經(jīng)驗,推動了大模型和自然語言生成領域的技術創(chuàng)新與研究成果轉化。

中譯語通作為NLGIW戰(zhàn)略合作伙伴參會展示

本屆會議組織單位為中國中文信息學會自然語言生成與智能寫作專業(yè)委員會(籌),承辦單位為新疆師范大學。大會從特邀報告、講習班、青年學者論壇等各個環(huán)節(jié)圍繞自然語言生成與大模型展開,包括大語言模型、代碼大模型、多模態(tài)大模型的基本原理、高效訓練和推理、有監(jiān)督微調、人類反饋學習、安全與倫理、大模型應用等各個維度開展,為參與者提供一場關于大模型的盛宴。

NLGIW專委主任委員

兼中譯語通2030人工智能研究院院長

趙鐵軍教授出席開幕式并致辭

會議邀請到了中科院自動化所宗成慶研究員、華為諾亞方舟實驗室劉群教授、哈爾濱工業(yè)大學秦兵教授三位知名專家做大會特邀報告。這些報告簡要回顧了生成式語言模型“前世”的基礎上,對大語言模型的“今生”做了簡要分析,系統(tǒng)性地介紹了知識增強的語言模型技術和研究進展,以及從大模型的安全角度出發(fā),探索了大模型安全性內容生成的方法,包括研究大模型辨別是非能力,以及人類普世價值觀,社會文化價值觀及立場對齊上的內容檢測與生成方法,探索AI社會協(xié)作式的價值觀對齊機制。

中譯語通2030人工智能研究院副院長陳自巖進行報告發(fā)言

在企業(yè)論壇環(huán)節(jié)中,中譯語通2030人工智能研究院副院長陳自巖博士受邀進行題為《格物多語言大模型技術和工業(yè)實踐》的發(fā)言,針對當前人工智能在工業(yè)實踐中面臨的多語言間語義割裂、從數(shù)據(jù)+需求到應用的端到端的迫切需求、社交交互生成難以達到擬人化程度等挑戰(zhàn),闡述了中譯語通基于格物大模型解決這些難題的創(chuàng)新技術和成功實踐。

格物大模型是中譯語通于2022年11月發(fā)布的大模型體系,包括了多語言預訓練模型、多語言機器翻譯超大模型、多模態(tài)預訓練模型等。陳自巖博士還重點介紹了公司正在研發(fā)的新一代多語言生成式對話大模型,該模型以自有的近80億句對高質量平行語料、100多個語種的PB級數(shù)據(jù)為基礎,融合上下文理解、個性化、思維鏈等高達2000萬規(guī)模的高質量業(yè)務化指令,并提出領域專家對齊和社交對抗反饋的混合強化學習技術,旨在打造時效性較高、千人千面的生成式大模型。

目前公司研發(fā)的生成式大模型已在多語言知識圖譜端到端生成、社交媒體行為生成、領域報告寫作等應用場景實現(xiàn)了落地應用,同時針對全球防務安全、科研數(shù)據(jù)分析、智慧城市和全球戰(zhàn)略數(shù)據(jù)研究等領域進行全方位技術革新。此外,陳自巖博士與騰訊、百度等企業(yè)專家圍繞大模型在應用落地上的難點和應對措施進行圓桌討論。

中譯語通2030人工智能研究院副院長

陳自巖(左四)代表公司領獎

會議上,中國中文信息學會自然語言生成與智能寫作專委會為中譯語通等8家企業(yè)頒發(fā)感謝獎牌,表達各企業(yè)對本屆大會的特別支持。

會議現(xiàn)場

中譯語通現(xiàn)場展示多語種自然語言處理算法成果

中譯語通