近日,明略明略科技與北京大學、科技吉林大學合作的研究預測最新研究成果《PRE-MAP: Personalized Reinforced Eye-tracking Multimodal LLM for High-Resolution Multi-Attribute Point Prediction》被ACM MM 2025正式接收。該研究為解決現(xiàn)有視覺注意力模型在個性化注視點預測中的成果局限性,提出了一種新的接收方法(PRE-MAP)和一個大規(guī)模多模態(tài)數(shù)據(jù)集(SPA-ADV),以更好地捕捉個體差異并提高高分辨率視頻中的攻克個性多屬性注視點預測精度。
ACM MM 2025(ACM International Conference on 化注Multimedia)計劃將于2025年10月27—31日在愛爾蘭都柏林舉辦。該會議由國際計算機學會(ACM)主辦,視點是難題全球多媒體技術(shù)領(lǐng)域的旗艦會議,同時也是明略中國計算機學會(CCF)推薦的A類國際學術(shù)會議。
論文標題: PRE-MAP: Personalized Reinforced Eye-tracking Multimodal LLM for High-Resolution Multi-Attribute Point Prediction
(中文標題:PRE-MAP:用于高分辨率多屬性注視點預測的科技個性化眼動追蹤多模態(tài)大語言模型)
論文作者:吳寒冰*、姜平*、研究預測蘇安煬*、成果趙晨旭、接收傅天宇、攻克個性吳明輝、譚北平、李慧盈(*為共同第一作者)
研究成果簡述:
1. 直擊行業(yè)核心痛點
在當今的數(shù)字廣告領(lǐng)域,理解消費者的目光焦點至關(guān)重要。然而,不同背景的觀眾(如年齡、性別各異)在觀看同一視頻廣告時,其注意力分布也大相徑庭,傳統(tǒng)技術(shù)卻無法捕捉這種個性化差異。傳統(tǒng)的顯著性預測模型通常采用分割方法,依賴于降采樣的低分辨率圖像來生成顯著性熱圖,隨后將其放大到原生分辨率,這限制了它們捕捉個性化注意力模式的能力。
2. 構(gòu)建高質(zhì)量數(shù)據(jù)底座
為攻克這一難題,研究團隊開創(chuàng)性地建立了業(yè)界領(lǐng)先的大規(guī)模個性化注視行為數(shù)據(jù)集(SPA-ADV),首次記錄了超過4500名不同年齡與性別背景用戶的真實視覺行為。該數(shù)據(jù)集提供精確的個體級注視點坐標,為個性化顯著性建模提供了高質(zhì)量的基準數(shù)據(jù)支持。
3. 研發(fā)高精度預測模型
基于此數(shù)據(jù)集,團隊研發(fā)了PRE-MAP創(chuàng)新AI預測模型。該模型能結(jié)合用戶的個人特征,利用最前沿的多模態(tài)大模型技術(shù),增強模型的泛化能力和個性化預測效果,精準預測出“某一類人會看哪里”。有效解決現(xiàn)有AI模型預測不準、難以聚焦個性化熱點的問題,幫助品牌方和廣告商更科學地優(yōu)化廣告創(chuàng)意、評估投放效果,實現(xiàn)真正的“精準觸達”。
明略的多模態(tài)實踐:從腦電到眼動,補齊廣告預測模型的關(guān)鍵拼圖
此次成果并非孤立的突破,而是明略科技在多模態(tài)領(lǐng)域長期且深度耕耘的必然結(jié)果,彰顯了公司在前沿AI技術(shù)探索與大模型應(yīng)用落地上的前瞻性布局:
早在2023年,明略科技率先成為國內(nèi)首家基于多模態(tài)大語言模型(MLLM)實現(xiàn)智能社交媒體內(nèi)容分析和策略生成的企業(yè),首度將多模態(tài)大語言模型(MLLM)應(yīng)用于識別并預測能帶來最佳營銷效果的多樣化內(nèi)容類型,開辟了廣告領(lǐng)域全新的多模態(tài)技術(shù)應(yīng)用賽道。
2024年,明略科技推出超圖多模態(tài)大型語言模型(HMLLM),進一步整合了腦電等非標模態(tài)數(shù)據(jù),支持企業(yè)對廣告素材中的實體、情緒、效果、場景及受眾等多樣化元素進行深度分析,從而提升營銷效果,生成預測效果良好的有效營銷內(nèi)容,并為企業(yè)視頻廣告提供多維度優(yōu)化建議。超圖多模態(tài)大型語言模型(HMLLM)的相關(guān)成果曾榮獲ACM MM 2024最佳論文提名。
今年6月,基于自研的超圖多模態(tài)大型語言模型(HMLLM),協(xié)同混合專家(MoE)模型,明略科技再推創(chuàng)新成果——AI驅(qū)動的全球化廣告測試及優(yōu)化平臺AdEff。該平臺專為全球廣告創(chuàng)意測量打造,可快速、準確預測消費者對廣告的主觀反應(yīng)和廣告效果,并給出優(yōu)化建議。在測試效率大幅提升的同時,顯著降低廣告測試成本,讓企業(yè)有機會對每一支廣告進行測試,在 “創(chuàng)意感性” 與 “商業(yè)理性” 之間找到平衡。
直至7月本次研究成果被接收,標志著明略科技在多模態(tài)學習這一人工智能前沿方向取得了又一突破性進展,補齊了廣告預測模型中“用戶個性化視點追蹤”這一關(guān)鍵拼圖。它既是推動廣告預測模型高質(zhì)量發(fā)展的重要一環(huán),也昭示著機器理解人類感知的精度即將邁上新的臺階。
在數(shù)字化內(nèi)容日益碎片化的今天,AI驅(qū)動的科學預測已成為提升內(nèi)容觸達效率的關(guān)鍵引擎。明略科技在多模態(tài)學習領(lǐng)域的系統(tǒng)性實踐,將在品效提升、成本優(yōu)化和內(nèi)容創(chuàng)新層面展現(xiàn)出廣闊的應(yīng)用價值。
立足于此,明略科技的視野不止于多模態(tài)領(lǐng)域的深耕。未來,公司將會面向更廣闊的AI大模型及Agent技術(shù)領(lǐng)域持續(xù)探索,致力于把前沿科研成果轉(zhuǎn)化為強大的產(chǎn)業(yè)動能,驅(qū)動廣告營銷乃至更多行業(yè)的智能化升級,為構(gòu)建高效、智能的技術(shù)生態(tài)貢獻力量。
本文來源:http://www.iv82.cn/news/86b35499559.html
版權(quán)聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻,該文觀點僅代表作者本人。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔相關(guān)法律責任。如發(fā)現(xiàn)本站有涉嫌抄襲侵權(quán)/違法違規(guī)的內(nèi)容,請發(fā)送郵件舉報,一經(jīng)查實,本站將立刻刪除。