MMMU權(quán)威評測榜更新，云知聲山海UniGPT-mMed榮登榜首

2024-10-08 20:16:48 來源：天極網(wǎng) 作者：　

摘要：近日，多模態(tài)人工智能模型基準評測集MMMU更新榜單，云知聲山海多模態(tài)大模型UniGPT-mMed以通用能力、醫(yī)療專業(yè)能力雙雙排名第一的優(yōu)異成績登頂榜首，力壓GPT-4V，充分彰顯其硬核實力。

近日，多模態(tài)人工智能模型基準評測集MMMU更新榜單，云知聲山海多模態(tài)大模型UniGPT-mMed以通用能力、醫(yī)療專業(yè)能力雙雙排名第一的優(yōu)異成績登頂榜首，力壓GPT-4V，充分彰顯其硬核實力。

作為國內(nèi)權(quán)威多模態(tài)基準評測，MMMU由IN.AI Research等多家機構(gòu)聯(lián)合構(gòu)建，專注于考量人工智能在解決大學層次多學科問題時的多模態(tài)理解與推理能力。

該評測集涉及藝術(shù)與設(shè)計、商科、科學、健康與醫(yī)學、人文與社會科學、技術(shù)與工程等六個常見學科，包含 1.15 萬個精心選取的多模態(tài)問題，涵蓋 30 個不同的科目和183 個子領(lǐng)域。同時，MMMU 中許多問題都需要專家級的推理能力，例如，使用傅立葉變換或均衡理論來推導問題的解，這在滿足評測內(nèi)容廣泛性的同時，也確保了其深度。

此外，MMMU還提出了兩個獨特的挑戰(zhàn)：一是其涵蓋多種圖像格式，從照片和繪畫等視覺場景到圖表和表格，可用于測試 LMM 的感知能力；二是MMMU的輸入形式是文本和圖像的混合，要求AI模型能夠?qū)D像和文本信息結(jié)合起來進行深入理解，并在此基礎(chǔ)上執(zhí)行復雜推理。這不僅考驗了模型的學科知識儲備，也對其綜合分析和應用能力提出了更高要求。

評測結(jié)果顯示，云知聲山海多模態(tài)大模型UniGPT-mMed以總分57的優(yōu)異成績登頂榜首，并在健康與醫(yī)學細分賽道超越GPT-4V，力壓一眾大模型拔得頭籌，充分展現(xiàn)出其在擁有業(yè)內(nèi)一流的通用能力之外，更具備打造世界領(lǐng)先的行業(yè)大模型的能力。

UniGPT-mMed是云知聲基于山海大模型底座構(gòu)建的多模態(tài)大模型。其通過分析和整合海量論文、書籍及網(wǎng)站數(shù)據(jù)，利用精細化數(shù)據(jù)處理技術(shù)，自動識別并提取圖片及其相關(guān)文本描述，并通過多模態(tài)分析技術(shù)評估圖片的質(zhì)量和圖文之間的匹配度，篩選出最優(yōu)數(shù)據(jù)。與此同時，系統(tǒng)能夠參考圖片和上下文信息對圖片進行重新描述，使得圖文數(shù)據(jù)更加對齊。

通過預設(shè)問答場景，UniGPT-mMed能夠?qū)D文對齊數(shù)據(jù)轉(zhuǎn)化為高質(zhì)量的場景問答數(shù)據(jù)集，并采用思維鏈和自我反思技術(shù)，進一步優(yōu)化生成數(shù)據(jù)，最終構(gòu)建起一個包含數(shù)億條高質(zhì)量圖文問答的數(shù)據(jù)集，進而為用戶提供更加豐富、準確和可靠的信息檢索和問答服務(wù)。

此次評測，是云知聲在多模態(tài)大模型賽道持續(xù)深耕、不斷技術(shù)創(chuàng)新的成果體現(xiàn)。

作為中國AGI技術(shù)產(chǎn)業(yè)化的先行者，云知聲于2016年開始打造Atlas人工智能基礎(chǔ)設(shè)施，并以此為基礎(chǔ)，構(gòu)建云知大腦(UniBrain)技術(shù)中臺——以山海（UniGPT）通用認知大模型為核心，結(jié)合多模態(tài)感知與生成、知識圖譜、物聯(lián)平臺等智能組件，為云知聲智慧物聯(lián)、智慧醫(yī)療、智慧座艙、智慧交通等業(yè)務(wù)提供高效的產(chǎn)品化支撐，持續(xù)推動“U(云知大腦)+X(應用場景)”戰(zhàn)略布局，致力推動千行百業(yè)的智慧化升級。

作為云知大腦的核心，山海大模型具備語言生成、語言理解、知識問答、邏輯推理、代碼能力、數(shù)學能力、安全合規(guī)能力七項通用能力及插件擴展、領(lǐng)域增強、企業(yè)定制三項行業(yè)落地能力，能夠滿足更多場景的應用需求。今年8月，云知聲推出山海多模態(tài)大模型，通過整合跨模態(tài)信息，山海多模態(tài)大模型能夠接收文本、音頻、圖像等多種形式作為輸入，并實時生成文本、音頻和圖像的任意組合輸出，帶來實時多模態(tài)擬人交互體驗，開啟AGI新范式。

目前，山海大模型已相繼在OpenCompass大模型評測、SuperCLUE中文大模型基準測評、MedBench評測、Flageval大模型評測、SuperBench等多個權(quán)威評測中屢創(chuàng)佳績，穩(wěn)居國內(nèi)大模型第一梯隊；在醫(yī)療專業(yè)能力上，其基于山海大模型孵化的醫(yī)療大模型在CCKS 2023 PromptCBLUE醫(yī)療大模型評測中奪得通用賽道一等獎，并在MedBench評測中位列全球第一，各項指標全面超越GPT-4。

登頂MMMU評測榜，充分印證了云知聲山海多模態(tài)大模型在通用能力、專業(yè)能力層面的突出實力，也將鞭策云知聲持續(xù)迭代多模態(tài)大模型技術(shù)底座，實現(xiàn)大模型技術(shù)在多領(lǐng)域場景下的滲透和應用，以技術(shù)創(chuàng)新為各行各業(yè)帶來更多智能化變革。

上一篇： 核心資產(chǎn)強勢反攻，果鏈龍頭藍思科技領(lǐng)漲超18%
下一篇： 炸裂！A股驚天暴漲，真就無腦賺錢？

重磅名單公布！強腦科技韓璧丞出任香港特首顧問

智能+強腦科技

6月27日，香港特別行政區(qū)政府宣布新一屆特首顧問團成員名單，此次委任了34名成員，其中，腦機接口領(lǐng)域...

2天前

半年實現(xiàn)百萬級用戶，商湯科技「咔皮記賬」站穩(wěn)AI記賬TOP1

商湯科技智能+

AI記賬，本應是一個略顯紅海的小眾市場。

5天前

引領(lǐng)包裝產(chǎn)線自動化新浪潮，華沿機器人亮相上海國際食品包裝展

智能+華沿機器人

6月24-26日，上海國際食品加工與包裝機械展覽會（簡稱“上海國際食品包裝展”）在上海國家會展中心盛...

5天前

Nexus 2140全球博覽會盛大舉行，F(xiàn)EC創(chuàng)始人郭凡解讀信任經(jīng)濟

智能+Nexus 2140全球博覽會

2025年6月21日至22日,Nexus 2140:AI·Web3·ECOM全球博覽會在韓國高陽市K...

2025-06-23

云知聲×淮高鎮(zhèn)丨當AI遇上基層治理，看淮高鎮(zhèn)如何玩轉(zhuǎn)“數(shù)智淮高”

智能+云知聲

當AI遇上基層治理，看淮高鎮(zhèn)如何玩轉(zhuǎn)“數(shù)智淮高”新花樣

2025-06-20

精彩閱讀原創(chuàng)資訊投資人物專欄

TCL實業(yè)攜多款創(chuàng)新新品亮相AWE 2025，全面展現(xiàn)智慧科技硬實力

TCL 創(chuàng)新創(chuàng)業(yè)

2025年3月20日，中國家電及消費電子博覽會（AWE 2025）在上海盛大啟幕。

2025-03-24

長安信托攜手陜西聯(lián)合? 以金融創(chuàng)新助力體育事業(yè)高質(zhì)量發(fā)展

創(chuàng)新創(chuàng)業(yè)長安信托

此次合作不僅是金融與體育的跨界融合，也是長安信托做好“五篇大文章”，服務(wù)實體經(jīng)濟的重要實踐。

2025-03-24

小刀電動車以舊換新市場贏好評，卓越品質(zhì)成就品牌輝煌

創(chuàng)新創(chuàng)業(yè)小刀電動車

2025年，隨著電動車以舊換新政策的持續(xù)推進，行業(yè)頭部品牌小刀電動車在全國范圍延續(xù)以舊換新的熱潮，推...

2025-03-24

合而不同、AI無止境，2025中國家電創(chuàng)新零售峰會探索市場新篇章

創(chuàng)新創(chuàng)業(yè)中國家電創(chuàng)新零售峰會

3月21日，AWE2025正式開展的的第二天，由中國家用電器協(xié)會指導、中國家電網(wǎng)主辦、奧維云網(wǎng)特約聯(lián)...

2025-03-24

原創(chuàng)

寰宇同心金融共榮廈門國際銀行與集友銀行攜手舉辦海外同業(yè)戰(zhàn)略合作交流活動

創(chuàng)新創(chuàng)業(yè)廈門國際銀行

2025年3月20日,廈門國際銀行攜手集友銀行在香港舉辦“寰宇同心·金融共榮”海外同業(yè)戰(zhàn)略合作交流活...

2025-03-24

菲鵬攜手圣湘，聚焦 AI 分子酶創(chuàng)新研發(fā)與產(chǎn)品解決方案

創(chuàng)新創(chuàng)業(yè)菲鵬生物

3月22日下午，在杭州 CACLP 展會現(xiàn)場，菲鵬生物與圣湘生物舉行了以“圣”啟新章 “菲”躍未來為...

2025-03-24

華遠集團與北京建筑大學科技園簽署戰(zhàn)略協(xié)議

創(chuàng)新創(chuàng)業(yè)華遠集團

在國家積極倡導房地產(chǎn)行業(yè)高質(zhì)量發(fā)展，致力于打造適應未來居住與工作新需求的“智慧好房子”的大環(huán)境下，近...

2025-03-24

南方黑芝麻閃亮2025成都糖酒會第一品牌實力領(lǐng)航黑色食養(yǎng)賽道

大消費南方黑芝麻

第112屆全國糖酒商品交易會酒店展于2025年3月20日正式啟幕，作為中國食品行業(yè)的風向標展會，本屆...

2025-03-24

春雪食品與家家悅集團達成無抗鮮雞戰(zhàn)略合作，共同發(fā)布無抗系列產(chǎn)品

大消費春雪食品

3月23日上午，春雪食品集團與零售行業(yè)領(lǐng)軍企業(yè)家家悅超市集團簽署戰(zhàn)略合作協(xié)議，共同推出全新無抗系列產(chǎn)...

2025-03-24

AI偽造泛濫下親筆簽以動態(tài)生物特征破解電子簽名安全困局

AI 創(chuàng)新創(chuàng)業(yè)

今年以來，什么最熱門？AI（人工智能）等智能技術(shù)可能是最好的答案。

2025-03-24

投資家網(wǎng)（www.51baobao.cn）是國內(nèi)領(lǐng)先的資本與產(chǎn)業(yè)創(chuàng)新綜合服務(wù)平臺。為活躍于中國市場的VC/PE、上市公司、創(chuàng)業(yè)企業(yè)、地方政府等提供專業(yè)的第三方信息服務(wù)，包括行業(yè)媒體、智庫服務(wù)、會議服務(wù)及生態(tài)服務(wù)。長按右側(cè)二維碼添加"投資哥"可與小編深入交流，并可加入微信群參與官方活動，趕快行動吧。