2025年6月24日,技術(shù)積淀教育基因隨著今年北京中考語文作文題目的訊飛星火型實揭曉,一場圍繞“一堂科學課”展開的大模奪冠特別較量正悄然上演。
在知名科技媒體“電腦報”的測中組織下,DeepSeek-R1、技術(shù)積淀教育基因字節(jié)豆包、訊飛星火型實訊飛星火、大模奪冠通義千問、測中騰訊混元、技術(shù)積淀教育基因文心一言、訊飛星火型實GPT七大主流大模型同臺競技,大模奪冠實測北京中考語文作文。測中本次測試聚焦題目二“一堂科學課”,技術(shù)積淀教育基因其開放性要求模型在有限篇幅內(nèi)整合科學史實、訊飛星火型實技術(shù)應(yīng)用與情感升華,大模奪冠較側(cè)重日常生活的題目一“這樣生活更健康”更需具備思辨能力,也跟大模型的科技屬相更相關(guān)。
為了確保公平,所有參與測試大模型統(tǒng)一關(guān)閉聯(lián)網(wǎng)功能,打開深度思考,以文本形式提問,并邀請全國性課程體系研發(fā)專家、中考命題高級研究員敬笑笑,及全國頭部教培機構(gòu)師訓負責人、全國高考語文高端論壇組織者、分享人李欣雅參與,由這兩位資深語文教育專家分別進行打分,取兩位老師的平均分作為最終評分的形式進行實測。
最終,訊飛星火憑借平均38.5分(滿分40分)的優(yōu)異成績脫穎而出,獲本次橫評榜首。
(注:圖源/電腦報制圖)
訊飛星火此次奪冠絕非偶然。前不久,在界面財聯(lián)社旗下的獨立科技媒體“電廠”最新發(fā)布的六大國產(chǎn)大模型(訊飛星火、DeepSeek、字節(jié)豆包、通義千問、騰訊混元、文心一言)高考作文實測中,訊飛星火也位列六大國產(chǎn)大模型之首。
訊飛星火在中高考中的優(yōu)異表現(xiàn)并非偶然,而是其“技術(shù)+教育”雙輪驅(qū)動的必然結(jié)果。
首先,在數(shù)據(jù)積累方面,具有顯著的教育專業(yè)性。依托科大訊飛21年教育行業(yè)深耕經(jīng)驗,覆蓋全國5萬所中小學的龐大數(shù)據(jù)資源,使模型能精準把握各地教育特點。從深度思考過程中,提及了一類卷標準,就可以看出,研發(fā)團隊從海量數(shù)據(jù)中針對性篩選考綱素材及高分作文范例。
其次,在算法層面,作文生成任務(wù)對AI模型提出了獨特挑戰(zhàn)。與其他文本生成場景不同,作文題目通常僅提供有限的主題要求,缺乏詳細prompt提示或多輪提問,但對應(yīng)的優(yōu)秀范文卻存在顯著差異。這種"單一題目對應(yīng)海量表達方式"的特點,大幅增加了模型訓練時準確理解并執(zhí)行指令的難度,而訊飛星火大模型在‘機器思維鏈’的深厚基礎(chǔ)上,深度融合了更多的教育優(yōu)質(zhì)數(shù)據(jù),以‘教學思維鏈’來驅(qū)動的深度推理大模型。
科大訊飛作為中國人工智能“國家隊”,訊飛星火是國內(nèi)唯一基于全國產(chǎn)算力底座訓練的深度推理大模型,2025年升級的訊飛星火X1實現(xiàn)三大技術(shù)躍遷:首創(chuàng)快慢思考統(tǒng)一模型突破認知瓶頸,創(chuàng)新多階段強化學習訓練法提升效率,更以比同行少一個數(shù)量級的參數(shù)量實現(xiàn)對OpenAI o1與DeepSeek R1的性能對標。這種"小體積、高智能"的突破性創(chuàng)新,結(jié)合科大訊飛21年深耕教育領(lǐng)域的專業(yè)積淀,使訊飛星火在中高考實測中始終保持領(lǐng)先優(yōu)勢。
訊飛星火的表現(xiàn)不僅證明了國產(chǎn)大模型在復雜認知任務(wù)上的硬實力,更凸顯了AI賦能教育的深遠價值。作為國內(nèi)唯一基于全國產(chǎn)算力底座訓練的深度推理大模型,其“懂教育”的匠心與“全國產(chǎn)”的底氣,正為培養(yǎng)新時代科學人才提供智能化支撐。從高考到中考,訊飛星火持續(xù)領(lǐng)跑AI教育賽道,是技術(shù)積淀與行業(yè)深耕的完美結(jié)合。未來,隨著AI與教育的深度融合,國產(chǎn)大模型將為推動科學素養(yǎng)提升注入更多創(chuàng)新動力。
本文來源:http://www.iv82.cn/news/77e31999603.html
版權(quán)聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻,該文觀點僅代表作者本人。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔相關(guān)法律責任。如發(fā)現(xiàn)本站有涉嫌抄襲侵權(quán)/違法違規(guī)的內(nèi)容,請發(fā)送郵件舉報,一經(jīng)查實,本站將立刻刪除。