<pre id="co8k0"><cite id="co8k0"></cite></pre><strike id="co8k0"></strike>
  • <acronym id="co8k0"><cite id="co8k0"></cite></acronym>
  • <nav id="co8k0"></nav>
    <input id="co8k0"><em id="co8k0"></em></input>
  • 原阿里M6帶頭人楊紅霞已加入字節AI Lab 參與語言生成大模型研發

    原標題:字節跳動將參與語言生成大模型研發,原阿里 M6 帶頭人楊紅霞被曝加盟 AI Lab

    3 月 22 日消息,阿里 M6 大模型的原帶頭人楊紅霞已于去年 9 月因個人家庭原因從阿里巴巴達摩院智能計算實驗室離職。36 氪從多處獨立信源獲悉,楊紅霞現已加入字節 AI Lab(人工智能實驗室),參與語言生成大模型的研發。

    有知情人士稱,楊紅霞在語言生成大模型團隊中處于領導地位,直接向字節跳動副總裁楊震原匯報。

    據公開資料,楊紅霞 2007 年本科畢業于南開大學,后前往美國杜克大學統計科學系攻讀博士學位,師從 David Dunson 教授。博士畢業后,楊紅霞先入職 IBM 全球研發中心任 Watson 研究員,之后入職雅虎公司,擔任首席數據科學家。

    據IT之家所知,她在人工智能領域國際會議、頂級期刊有上百篇頂級論文。2022 年 6 月,楊紅霞入選 2022 福布斯中國科技女性 50 榜。

    2016 年,楊紅霞結束了她在美國近 10 年的留學及工作生涯回國,去往杭州加入阿里巴巴集團。而阿里大模型 M6 正是楊紅霞在任期間的最突出成就,在她離職之前一直是阿里達摩院超大規模多模態預訓練模型 M6 的技術負責人。

    楊紅霞領導的阿里巴巴達摩院 M6 團隊致力于認知智能方向,此前已經研發出了 AliGraph、M6、洛犀等較為有影響力的人工智能開源平臺和系統,在美國和中國注冊的專利超過 30 項。

    M6 是一項通用性 AI 大模型,擁有多模態、多任務能力,尤其擅長設計、寫作、問答,在電商、制造業、文學藝術、科學研究等領域都具有廣泛應用前景。

    M6 于 2021 年 3 月首次發布,是國內首個千億參數多模態大模型,后續又通過 480 塊 GPU 更迭至萬億參數,再在 512 GPU 的基礎上成功在 10 天內訓練出 10 萬億模型,與 GPT-3 具有同等參數規模,但能耗僅為其 1%。

    值得一提的是,OpenAI 前政策主管 Jack Clark 當時曾贊揚道:這個模型的規模和設計都非常驚人。這看起來像是眾多中國的 AI 研究組織逐漸發展壯大的一種表現。

    值得一提的是,阿里巴巴技術副總裁賈揚清昨日也宣布從阿里巴巴畢業,表示將走向職業生涯的下一個挑戰。據稱,其計劃創業的方向屬于是 AI 基礎設施提供商,關注包括大模型在內的 AI 應用。

    據公開資料,賈揚清為浙江紹興人,本科和研究生階段就讀于清華大學自動化專業,后赴加州大學伯克利分校攻讀計算機科學博士。他在博士期間創立并開源了如今業內耳熟能詳的深度學習框架 Caffe,被微軟、雅虎、英偉達、Adobe 等公司采用。

    來源:IT之家

    IT時代網(關注微信公眾號ITtime2000,定時推送,互動有福利驚喜)所有原創文章版權所有,未經授權,轉載必究。
    創客100創投基金成立于2015年,直通硅谷,專注于TMT領域早期項目投資。LP均來自政府、互聯網IT、傳媒知名企業和個人。創客100創投基金對IT、通信、互聯網、IP等有著自己獨特眼光和豐富的資源。決策快、投資快是創客100基金最顯著的特點。

    相關文章
    原阿里M6帶頭人楊紅霞已加入字節AI Lab 參與語言生成大模型研發

    精彩評論