導讀:該系統(tǒng)是開放訪問的,以期為應用開發(fā)者、企業(yè)、研究團體和社會各界提供服務。在推出5個月后,該系統(tǒng)的語言能力變得更加強大。
《西班牙人報》網(wǎng)站近日報道稱,MarIA是第一個專門利用西班牙語理解和寫作的大規(guī)模人工智能系統(tǒng)。得益于該系統(tǒng),西班牙語得以在擁有海量開放訪問模型的語言中排在第3位,僅次于英語和中文。
報道稱,該系統(tǒng)建立在西班牙國家圖書館的數(shù)字文獻基礎之上,并通過MareNostrum 4超級計算機進行人工智能培訓。該圖書館一直致力于追蹤和歸檔所有使用西班牙語的網(wǎng)站。
該系統(tǒng)是開放訪問的,以期為應用開發(fā)者、企業(yè)、研究團體和社會各界提供服務。在推出5個月后,該系統(tǒng)的語言能力變得更加強大。
語言模型是一個人工智能系統(tǒng),由深度神經(jīng)網(wǎng)絡組成,經(jīng)過訓練能夠精確掌握語言、詞匯以及表達和寫作機制。
這些復雜的統(tǒng)計模型不僅能夠“理解”抽象的概念,而且能夠理解其背景。有了這些模型,應用程序開發(fā)者可以創(chuàng)建具有多種用途的工具,例如對文件進行分類或創(chuàng)建校對或翻譯工具等。
第1個版本的MarIA是利用RoBERTa訓練模型建立的,RoBERTa是一種創(chuàng)建“編碼器”類型語言模型的技術。而最新版本則是用GPT-2創(chuàng)建的,GPT-2是一種更先進的技術,可以創(chuàng)建生成性解碼器模型并為系統(tǒng)增加更多功能。
這些新的功能使MarIA成為一種有效的工具。通過適應具體任務的“特殊”訓練,該系統(tǒng)可以為應用開發(fā)者、公司和公共管理部門帶去更多幫助。
例如,迄今為止開發(fā)的英語模型都被用來在寫作應用中生成文本建議,根據(jù)每個用戶想了解的內容,總結合同或詳細介紹產品特點的復雜文件,以及在大型文本數(shù)據(jù)庫中搜索特定信息,并將其與其他相關信息聯(lián)系起來。
專家指出,通過MarIA這樣的項目,西班牙正在向利用西班牙語思考的人工智能邁出堅定的步伐,這將使西班牙的公司和技術行業(yè)獲得的經(jīng)濟機會成倍增加。因為該系統(tǒng)遠不止是一種交流的手段,更是看待數(shù)字化世界的新方式。