聯(lián)發(fā)科推繁中大型語言模型

作者：時間：2023-02-27 來源：工商時報

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

聯(lián)發(fā)科集團(tuán)轄下的前瞻技術(shù)研究單位聯(lián)發(fā)創(chuàng)新基地、中央研究院詞庫小組和國家教育研究院等三方所組成的研究團(tuán)隊，23日宣布推出全球第一款繁體中文語言模型到開源網(wǎng)站提供測試，后續(xù)將有機(jī)會持續(xù)推動具備繁體中文的人工智能（AI）市場發(fā)展。

本文引用地址：http://2s4d.com/article/202302/443731.htm

聯(lián)發(fā)科表示，本次公開釋出以開源語言模型BLOOM開發(fā)的繁體中文大型語言模型（Large language model），比目前開源可用的最大繁體中文模型大1,000倍，所使用的訓(xùn)練數(shù)據(jù)也多1,000倍。該模型已公開讓外界下載，可應(yīng)用于問答系統(tǒng)、文字編修、廣告文案生成、華語教學(xué)、客服系統(tǒng)等。

聯(lián)發(fā)創(chuàng)新基地負(fù)責(zé)人許大山表示，大型語言模型是近年來人工智能技術(shù)進(jìn)步的亮點，更是未來進(jìn)步不可或缺的基石。此次結(jié)合中研院及國教院，成為臺灣極少數(shù)能訓(xùn)練大型語言模型的團(tuán)隊，以透明、開放和包容的方式，善用技術(shù)、人才及資源，既發(fā)展自主訓(xùn)練大型人工智能模型的能力，也讓繁體中文的大型語言模型研究及應(yīng)用更為普及。

開放原始碼釋出的大型語言模型，目前多數(shù)仍以英文為主要優(yōu)化的對象，繁體中文的語言模型相對不足。有鑒于開放原始碼繁體中文大型語言模型的重要性與迫切性，在2022年5月，聯(lián)發(fā)創(chuàng)新基地、中央研究院和國家教育研究院展開合作計劃，使用大型語言模型BLOOM的繁體中文模型再訓(xùn)練與優(yōu)化。

目前開放系列中第一個有量級跳躍意義的繁體中文語言模型，聯(lián)發(fā)創(chuàng)新基地也暫備一個手機(jī)網(wǎng)頁接口，供研究者試用。

為建立該項語言模型，國家教育研究院提供了大量高質(zhì)量的繁體中文語料，作為主要的訓(xùn)練材料。聯(lián)發(fā)創(chuàng)新基地則建置了訓(xùn)練的硬件環(huán)境，制訂各種符合國際標(biāo)準(zhǔn)的繁體中文評量指標(biāo)，收集更近期的語料，并對模型進(jìn)行能更有效讀懂使用者的指示（prompt）的特別訓(xùn)練。

新聞中心

聯(lián)發(fā)科推繁中大型語言模型

評論

相關(guān)推薦

技術(shù)專區(qū)