欧美日本免费一区二区三区,中文字幕丰满乱孑伦无码专区,免费a级毛片无码鲁大师,亚洲久悠悠色悠在线播放

科大訊飛榮獲多語言理解評測XTREME冠軍

本文章由注冊用戶 沉靜時光 上傳提供 2023-05-12 評論 發(fā)布 糾錯/刪除 版權(quán)聲明 0
摘要:世界多語言理解評測XTREME中,哈工大訊飛聯(lián)合實驗室(HFL)團隊以總平均分84.1位列榜首,刷新世界記錄,在四個賽道中獲得三項最好成績??拼笥嶏w發(fā)布面向少數(shù)民族語言的多語言預(yù)訓(xùn)練模型CINO,并將相關(guān)預(yù)訓(xùn)練模型和任務(wù)數(shù)據(jù)開源。希望未來能夠進一步促進業(yè)內(nèi)少數(shù)民族語言相關(guān)的技術(shù)研究,推動少數(shù)民族語言相關(guān)技術(shù)的應(yīng)用落地。

2021年11月,在世界權(quán)威多語言理解評測XTREME(Cross-Lingual Transfer Evaluation of Multilingual Encoders)中,哈工大訊飛聯(lián)合實驗室(HFL)團隊以總平均分84.1位列榜首,刷新世界記錄,在四個賽道中獲得三項最好成績。

這也標(biāo)志著科大訊飛多語言理解與跨語言遷移能力再上新臺階。

這個難度有多高?先來看一段話:

The heat required for boiling the water and supplying the steam can be derived from various sources, most commonly from burning combustible materials with an appropriate supply of air in a closed space (called variously combustion chamber, firebox). In manchen F?llen ist die W?rmequelle ein Atomreaktor, Erdw?rme, Solarenergie oder Abw?rme von einem Verbrennungsmotor oder einem Industrieprozess. En el caso de modelos o motores de vapor de juguete, la fuente de calor puede ser un calentador eléctrico.

上述這段話包含了英語、德語、西班牙語,而這只是機器多語言理解評測的冰山一角,它要面臨的是多達40種語言的高難度理解。翻譯成中文就是:

讓水沸騰以提供蒸汽所需熱量有多種來源,最常見的是在封閉空間(別稱有燃燒室、火箱)中供應(yīng)適量空氣來燃燒可燃材料。在某些情況下,熱源是核反應(yīng)堆、地?zé)崮?、太陽能或來自?nèi)燃機或工業(yè)過程的廢氣。如果是模型或玩具蒸汽發(fā)動機,還可以將電加熱元件作為熱源。

最新突破:在40種語言下完成自然語言理解

XTREME評測由谷歌公司舉辦,旨在全面考察模型的多語言理解與跨語言遷移能力。該評測覆蓋了中文、英語、韓語、日語、阿拉伯語、越南語等40種語言,包含了句對分類、序列標(biāo)注、閱讀理解、句子檢索賽道,共四大類九個任務(wù)。吸引了國內(nèi)外眾多知名高校和研究機構(gòu)參加。

XTREME評測包含4大類9個任務(wù),分別為:

句對分類:XNLI、PAWS-X(自然語言推斷)

序列標(biāo)注:UDPOS(詞性標(biāo)注)、PANX(命名實體識別)

閱讀理解:XQuAD、MLQA、TyDiQA(片段抽取型閱讀理解)

句子檢索:BUCC、Tatoeba(跨語言文本檢索)

與以往單語言自然語言理解評測任務(wù)不同的是,XTREME中的每一個任務(wù)都覆蓋了多種語言,評測的是模型在多種語言上的理解能力平均指標(biāo),因此對系統(tǒng)模型的多語言理解與跨語言遷移能力要求大大提高。

其難度可想而知,榜單上的模型也代表了多語言模型的頂尖水平,因此獲得了眾多機構(gòu)和高校的廣泛關(guān)注。

機器是怎么做到多語言理解的?

本次哈工大訊飛聯(lián)合實驗室提交的CoFe模型以總成績84.1分位居XTREME評測榜首,有三大法寶:

1、加入了自主研發(fā)的跨語言對比學(xué)習(xí)技術(shù),鼓勵模型學(xué)習(xí)不同語言中的語義相似性。

2、利用知識蒸餾技術(shù)進行自監(jiān)督學(xué)習(xí)和知識遷移,進一步提升了模型在各個語言上效果的穩(wěn)定性。

3、創(chuàng)新性地融入了細(xì)粒度的語言學(xué)特征,幫助模型克服訓(xùn)練不足的困難,解決低資源語言學(xué)習(xí)不充分的問題,同時使之適應(yīng)不同語言的形態(tài)學(xué)特點。

也就是說,通過本土語言學(xué)習(xí),機器可以在少量其他語言語料的情況下,通過“類比”學(xué)會這門語言,減少了收集語料、語音標(biāo)注等大量工作。

這就是多語言理解與跨語言遷移能力!

發(fā)布少數(shù)民族語言預(yù)訓(xùn)練模型CINO

“要讓中文語音技術(shù)由中國人做到最好?!?/p>

成立以來,科大訊飛初心未改,持續(xù)關(guān)注并積極推動中文相關(guān)信息處理技術(shù)的研究與發(fā)展。少數(shù)民族語言處理是中文信息處理中不可缺少的一環(huán),也是中文信息處理多樣性的一種體現(xiàn)。這項技術(shù)的進步將極大改善我國少數(shù)民族語言學(xué)習(xí)問題。

目前由于國內(nèi)少數(shù)民族語言語料稀缺、獲取難度大等原因,相關(guān)技術(shù)研究相對匱乏,而主流的多語言模型也無法很好地處理國內(nèi)少數(shù)民族語言文字。為了促進中國少數(shù)民族語言信息處理的研究與發(fā)展。2021年11月,科大訊飛發(fā)布了首個面向少數(shù)民族語言的多語言預(yù)訓(xùn)練模型CINO(Chinese mINOrity pre-trained language model),彌補相關(guān)資源的空白,并將相關(guān)預(yù)訓(xùn)練模型和任務(wù)數(shù)據(jù)開源。希望未來能夠進一步促進業(yè)內(nèi)少數(shù)民族語言相關(guān)的技術(shù)研究,推動少數(shù)民族語言相關(guān)技術(shù)的應(yīng)用落地。未來支持各少數(shù)民族語言的多語言搜索引擎等文字應(yīng)用工具或?qū)⒊蔀榭赡堋?/p>

網(wǎng)站提醒和聲明
本站為注冊用戶提供信息存儲空間服務(wù),非“MAIGOO編輯”、“MAIGOO榜單研究員”、“MAIGOO文章編輯員”上傳提供的文章/文字均是注冊用戶自主發(fā)布上傳,不代表本站觀點,版權(quán)歸原作者所有,如有侵權(quán)、虛假信息、錯誤信息或任何問題,請及時聯(lián)系我們,我們將在第一時間刪除或更正。 申請刪除>> 糾錯>> 投訴侵權(quán)>> 網(wǎng)頁上相關(guān)信息的知識產(chǎn)權(quán)歸網(wǎng)站方所有(包括但不限于文字、圖片、圖表、著作權(quán)、商標(biāo)權(quán)、為用戶提供的商業(yè)信息等),非經(jīng)許可不得抄襲或使用。
提交說明: 快速提交發(fā)布>> 提交資訊幫助>> 注冊登錄>>
相關(guān)推薦
語音翻譯機的工作原理是什么 語音翻譯機和翻譯軟件的區(qū)別
雖然智能手機的功能越來越強大,但是仍然有它不能勝任的工作,比如說翻譯。不少人說智能手機可以使用翻譯軟件,但是市面上的翻譯軟件并不能很好的翻譯出相應(yīng)的語言。而使用翻譯機,這種問題卻會小得多。翻譯機不同于翻譯軟件,由于拾音更準(zhǔn)確,同時配合專門的算法和AI加持,翻譯質(zhì)量要比翻譯軟件好。接下來跟著小編一起看看詳細(xì)知識。
十大語音翻譯器 語音翻譯軟件哪個好用 語音在線翻譯器推薦
語音在線翻譯有著廣闊的應(yīng)用前景,是未來的一大發(fā)展趨勢。在當(dāng)下,雖然翻譯技術(shù)限制重重,但仍出現(xiàn)了一批相對出色的語音翻譯軟件,如谷歌翻譯、有道翻譯官、騰訊翻譯君、彩云小譯、出國翻譯官、百度翻譯、Eotu、訊飛聽見、咪咕靈犀等,均有著較高的翻譯準(zhǔn)確率和效率。這些翻譯語音的軟件你用過幾個?下面一起看看。
翻譯 翻譯機 ★★★
2.4萬+ 10
同聲傳譯的特點和要求 同聲傳譯的基本原則
同聲傳譯、,簡稱“同傳”,又稱“同聲翻譯”、“同步口譯”,是指譯員在不打斷講話者講話的情況下,不間斷地將內(nèi)容口譯給聽眾的一種翻譯方式,同聲傳譯員通過專用的設(shè)備提供即時的翻譯,這種方式適用于大型的研討會和國際會議,通常由兩名到三名譯員輪換進行。同聲傳譯效率高,能保證演講或會議的流暢進行。不過同聲傳譯的要求也很高,下面就和小編一起了解一下吧。
翻譯機怎么使用?智能翻譯機使用方法介紹
翻譯機是一種能夠?qū)⑺N語言翻譯成自己能夠看懂或者聽懂語言的一種機器,它在出國旅游中十分常見?,F(xiàn)在的翻譯機由于人工智能技術(shù)的加持,翻譯水平已經(jīng)有了很大的提高。那么你知道怎樣使用翻譯機嗎?首先當(dāng)然是先買一臺翻譯機,然后開機,選擇翻譯的語言,拾音之后即可聽到或者看到翻譯結(jié)果。接下來一起來看下詳細(xì)介紹。
想要聽懂寵物說什么?你怎么能錯過這些翻譯器?
很多人都喜歡養(yǎng)寵物,但是有時候我們卻很難讀懂寵物們到底在想什么。不過有了寵物語言翻譯器一切問題都會變得不是問題。使用寵物語言翻譯器能夠識別動物們的語言,并且通過文字或者語音的形式表達出來。這樣我們在和寵物互動的時候就會更加容易了!接下來就一起了解一下詳細(xì)知識吧。