<thead id="zopz9"><optgroup id="zopz9"></optgroup></thead>

    <label id="zopz9"><meter id="zopz9"></meter></label>

      <li id="zopz9"><meter id="zopz9"><th id="zopz9"></th></meter></li>

        您終于找到專注于電腦行業的管理軟件了

        由于貼近電腦行業 使用起來自然得心應手

        大模型基準測試有了 ITU 國際標準,中國信通院牽頭制定


        IT之家 4 月 11 日消息,據中國信通院今日消息,國際電信聯盟電信標準分局(ITU-T)于 2025 年 3 月正式發布 ITU-T F.748.44 基礎模型的評估標準:基準測試 / Assessment criteria for foundation models: Benchmark

        該項國際標準由中國信息通信研究院(簡稱“中國信通院”)牽頭制定,規范了大模型基準測試的指標要求和測試方法。該標準旨在推動大模型基準測試體系架構形成國際共識,為大模型技術提供方和應用方提供高質量的能力評估依據,引導大模型技術及產業健康有序發展。

        圖片

        近些年來,如何客觀、全面地衡量大模型能力并且充分挖掘大模型潛在缺陷得到產學研各界的廣泛關注。模型基準測試(Benchmark)通過設計合理的測試任務和評價數據集來客觀、公正、量化的評估模型的性能,是目前產業界和學術界最為認可的模型能力評估方法。

        當前已有數百個基準測試方法和數據集用于衡量大模型的能力,例如 MMLU、C-Eval、AGIEval、GSM8K 等。但當前產學研各界對大基礎模型基準測試的體系、指標、數據集、方法、平臺工具等仍未達成一致,缺乏統一的標準,導致大模型評測的結果公正性受到質疑。為進一步推動大模型基準測評的技術發展與實際應用,充分釋放基準測試在人工智能領域的價值,特聯合相關單位開展標準的編制工作。

        本次發布的國際標準基于當前產學研界 500 余項基準測試系統性研究,一方面確立了大模型基準測試的 4 項核心要素,包括測試維度(測試場景、測試能力、測試任務和測試指標)、測試數據集、測試方法和測試工具。另一方面,針對通用場景的基礎模型,提供了標準化的測試用例和范例流程,以支持企業規范開展大模型能力評估。

        IT之家從中國信通院官方獲悉,中國信通院人工智能研究所于 2023 年開始布局大模型基準測試研究,并于 2023 年底發布“方升”大模型基準測試體系,推出自適應動態測試方法,積累 600 萬條數據集,構建 FactTeting 測試工具,支撐整個大模型測試過程的自動化實施。

        自 2024 年以來,參照已發布的 ITU 大模型基準測試國際標準,對國內外標桿大模型以兩個月為周期開展持續監測工作,包括 OpenAI o1、DeepSeek R1、Gemini 2.5 Pro、Claude 3.7 Sonnet、Qwen2.5-Max、百度文心大模型 X1 等上百個測試模型,目前已發布大語言通用能力、推理能力、代碼能力,多模態理解能力、文生圖能力、文生視頻能力等多個輪次的評測結果。國際標準 ITU-T F.748.44 的發布是大模型測試領域的重要標準化成果,對推動技術創新和發展、引領行業發展趨勢、促進國際合作與交流等方面具有重要意義。

        來源:IT之家
        電腦行業專用管理系統:IT江湖    上一篇    下一篇

        Copyright ? 2004-2025 宇然軟件(m.asdqqf.com) 版權所有
        粵ICP備14024714號

        主站蜘蛛池模板: 丝袜熟女国偷自产中文字幕亚洲| 亚洲 无码 在线 专区| 久久香蕉国产线看观看亚洲片| 四虎成人精品国产永久免费无码| 精品国产一区二区三区免费看| 亚洲中文字幕无码久久2020| 中文字幕无码视频手机免费看 | 亚洲精品免费在线| 蜜芽亚洲av无码精品色午夜| 久久国产乱子免费精品| 五月天网站亚洲小说| 外国成人网在线观看免费视频| 亚洲av无码成h人动漫无遮挡 | 男人天堂免费视频| 亚洲中久无码永久在线观看同| 中文字幕免费不卡二区| 国产v亚洲v天堂无码网站| 亚洲精品免费在线观看| 91亚洲va在线天线va天堂va国产| 真人做人试看60分钟免费视频| 亚洲影院天堂中文av色| 免费大片在线观看网站| 成年女人A毛片免费视频| 亚洲AV无码精品色午夜果冻不卡| 亚洲成年人免费网站| 亚洲成a人片在线观看天堂无码| 日韩精品成人亚洲专区| 三年片在线观看免费| 亚洲精品亚洲人成在线观看麻豆| 在线观看无码的免费网站| 国产综合成人亚洲区| 亚洲AV永久无码精品水牛影视| 免费v片在线观看视频网站| MM1313亚洲精品无码久久| 亚洲午夜国产精品无码| 久久精品a一国产成人免费网站| 人妖系列免费网站观看| 亚洲精品私拍国产福利在线| 日本特黄特黄刺激大片免费| 中文字幕乱码免费看电影| 国产午夜亚洲精品国产|