<pre id="co8k0"><cite id="co8k0"></cite></pre><strike id="co8k0"></strike>
  • <acronym id="co8k0"><cite id="co8k0"></cite></acronym>
  • <nav id="co8k0"></nav>
    <input id="co8k0"><em id="co8k0"></em></input>
  • 復旦大學MOSS模型今日正式上線 國內(nèi)首個插件增強的開源對話語言模型

    原標題:國內(nèi)首個類 ChatGPT 模型:復旦大學 MOSS 今日正式開源,RTX 3090 顯卡可運行

    4 月 21 日消息,復旦大學自然語言處理實驗室開發(fā)的新版 MOSS 模型今日正式上線,成為國內(nèi)首個插件增強的開源對話語言模型。

    目前,MOSS 模型已上線開源,相關代碼、數(shù)據(jù)、模型參數(shù)已在 Github 和 Hugging Face 等平臺開放,供科研人員下載。

    據(jù)介紹,MOSS 是一個支持中英雙語和多種插件的開源對話語言模型,moss-moon 系列模型具有 160 億參數(shù),在 FP16 精度下可在單張 A100 / A800 或兩張 3090 顯卡運行,在 INT4/8 精度下可在單張 3090 顯卡運行。MOSS 基座語言模型在約七千億中英文以及代碼單詞上預訓練得到,后續(xù)經(jīng)過對話指令微調(diào)、插件增強學習和人類偏好訓練具備多輪對話能力及使用多種插件的能力。

    MOSS 來自復旦大學自然語言處理實驗室的邱錫鵬教授團隊,名字與《流浪地球》電影中的 AI 同名,已發(fā)布至公開平臺(https://moss.fastnlp.top/),邀請公眾參與內(nèi)測。

    IT之家查看 MOSS 的 GitHub 頁面發(fā)現(xiàn),該項目所含代碼采用 Apache 2.0 協(xié)議,數(shù)據(jù)采用 CC BY-NC 4.0 協(xié)議,模型權重采用 GNU AGPL 3.0 協(xié)議。如需將該項目所含模型用于商業(yè)用途或公開部署,需要簽署文件并發(fā)送至 robot@fudan.edu.cn 取得授權,商用情況僅用于記錄,不會收取任何費用。

    模型

    moss-moon-003-base: MOSS-003 基座模型,在高質(zhì)量中英文語料上自監(jiān)督預訓練得到,預訓練語料包含約 700B 單詞,計算量約 6.67x1022 次浮點數(shù)運算。

    moss-moon-003-sft: 基座模型在約 110 萬多輪對話數(shù)據(jù)上微調(diào)得到,具有指令遵循能力、多輪對話能力、規(guī)避有害請求能力。

    moss-moon-003-sft-plugin: 基座模型在約 110 萬多輪對話數(shù)據(jù)和約 30 萬插件增強的多輪對話數(shù)據(jù)上微調(diào)得到,在 moss-moon-003-sft 基礎上還具備使用搜索引擎、文生圖、計算器、解方程等四種插件的能力。

    moss-moon-003-pm: 在基于 moss-moon-003-sft 收集到的偏好反饋數(shù)據(jù)上訓練得到的偏好模型,將在近期開源。

    moss-moon-003: 在 moss-moon-003-sft 基礎上經(jīng)過偏好模型 moss-moon-003-pm 訓練得到的最終模型,具備更好的事實性和安全性以及更穩(wěn)定的回復質(zhì)量,將在近期開源。

    moss-moon-003-plugin: 在 moss-moon-003-sft-plugin 基礎上經(jīng)過偏好模型 moss-moon-003-pm 訓練得到的最終模型,具備更強的意圖理解能力和插件使用能力,將在近期開源。

    數(shù)據(jù)

    moss-002-sft-data: MOSS-002 所使用的多輪對話數(shù)據(jù),覆蓋有用性、忠實性、無害性三個層面,包含由 text-davinci-003 生成的約 57 萬條英文對話和 59 萬條中文對話。

    moss-003-sft-data: moss-moon-003-sft 所使用的多輪對話數(shù)據(jù),基于 MOSS-002 內(nèi)測階段采集的約 10 萬用戶輸入數(shù)據(jù)和 gpt-3.5-turbo 構造而成,相比 moss-002-sft-data,moss-003-sft-data 更加符合真實用戶意圖分布,包含更細粒度的有用性類別標記、更廣泛的無害性數(shù)據(jù)和更長對話輪數(shù),約含 110 萬條對話數(shù)據(jù)。目前僅開源少量示例數(shù)據(jù),完整數(shù)據(jù)將在近期開源。

    moss-003-sft-plugin-data: moss-moon-003-sft-plugin 所使用的插件增強的多輪對話數(shù)據(jù),包含支持搜索引擎、文生圖、計算器、解方程等四個插件在內(nèi)的約 30 萬條多輪對話數(shù)據(jù)。目前僅開源少量示例數(shù)據(jù),完整數(shù)據(jù)將在近期開源。

    moss-003-pm-data: moss-moon-003-pm 所使用的偏好數(shù)據(jù),包含在約 18 萬額外對話上下文數(shù)據(jù)及使用 moss-moon-003-sft 所產(chǎn)生的回復數(shù)據(jù)上構造得到的偏好對比數(shù)據(jù),將在近期開源。

    來源:IT之家

    IT時代網(wǎng)(關注微信公眾號ITtime2000,定時推送,互動有福利驚喜)所有原創(chuàng)文章版權所有,未經(jīng)授權,轉載必究。
    創(chuàng)客100創(chuàng)投基金成立于2015年,直通硅谷,專注于TMT領域早期項目投資。LP均來自政府、互聯(lián)網(wǎng)IT、傳媒知名企業(yè)和個人。創(chuàng)客100創(chuàng)投基金對IT、通信、互聯(lián)網(wǎng)、IP等有著自己獨特眼光和豐富的資源。決策快、投資快是創(chuàng)客100基金最顯著的特點。

    相關文章
    復旦大學MOSS模型今日正式上線 國內(nèi)首個插件增強的開源對話語言模型

    精彩評論