低成本路線突圍 DeepSeek長文本架構引關注

波新聞─陶泰山編輯
2月13日，大陸現象級大語言模型DeepSeek 網頁和APP開始測試新的長文本模型結構，支持 1M 上下文。這也被外界認為，DeepSeek或將在春節期間再次“炸場”發佈新模型，複刻去年春節現象級轟動。
今年1月12日，DeepSeek曾發佈一篇新論文《Conditional Memory via Scalable Lookup:A New Axis of Sparsity for Large Language Models》（基於可擴展查找的條件記憶：大語言模型稀疏性的新維度），其CEO梁文鋒位列作者名單中，這篇論文為北京大學和DeepSeek共同完成。據分析，這篇論文的核心直指當前大語言模型存在的記憶力“短板”，提出了“條件記憶”這一概念。
作為當之無愧的大模型風向標，DeepSeek一舉一動都受到行業整體關注，因其以“低成本”加演演算法/工程優先，在高端算力晶片被美國封鎖的背景下，實現了技術突圍。
圖／DeepSeek。京報網提供

低成本路線突圍　DeepSeek長文本架構引關注

歐盟第20輪對俄制裁未達共識卡拉斯：挫折但不止步

陪伴高雄14載壽山動物園高齡明星白老虎「昭海」圓滿謝幕

相關的文章

移民署屏東縣服務站攜手慈善團體助新住民重見光明　跨界接力關懷點亮希望人生

大仁科大藥學系參訪輝瑞與台康生技　接軌國際藥廠培育全球醫藥人才

屏東長治鄉六堆紀念日盛大舉行　傳承客家忠勇精神與文化記憶

陪伴高雄14載壽山動物園高齡明星白老虎「昭海」圓滿謝幕

最新新聞

移民署屏東縣服務站攜手慈善團體助新住民重見光明　跨界接力關懷點亮希望人生

大仁科大藥學系參訪輝瑞與台康生技　接軌國際藥廠培育全球醫藥人才

屏東長治鄉六堆紀念日盛大舉行　傳承客家忠勇精神與文化記憶

梁育慈拋市政新藍圖爭取縣府超前規劃千禧公園親水步道、翻新鄰里公園體健設施

男子外出求職身體不適　美濃暖警暖心援助助平安返家

最多瀏覽

苗栗明德水庫南岸環湖步道建置工程開工完工可騎乘至黃屋伙屋及海棠島

少見脊椎屈曲牽張性骨折微創手術助移工康復

日本靜岡三島西扶輪社6學生體驗苗栗火旁龍等特色文化

「如果枇杷能演奏」古代就有的笑話 – 當年補校學生曾經發生過

關於京海

聯絡我們

美通社

捷氫科技發佈M5、P5系列新品硬核方案助力氫能規模化落地

Eightco Holdings (NASDAQ：ORBS) 公佈總持倉約達 4.06 億美元，其中包括 OpenAI、Beast Industries、超過 16,000 枚以太幣及超過 2.83 億枚 WLD 代幣

2026年繽紛悉尼燈光音樂節落幕城市光影餘韻悠長

北汽福田eView Connect在泰國強勢首秀，開創東南亞綠色物流新範式

更多新聞>>

歡迎回來！

找回您的密碼

新增播放列表

低成本路線突圍 DeepSeek長文本架構引關注

歐盟第20輪對俄制裁未達共識 卡拉斯：挫折但不止步

陪伴高雄14載 壽山動物園高齡明星白老虎「昭海」圓滿謝幕

相關的文章

最新新聞

最多瀏覽

關於京海

聯絡我們

美通社

歡迎回來！

找回您的密碼

新增播放列表

低成本路線突圍　DeepSeek長文本架構引關注

歐盟第20輪對俄制裁未達共識卡拉斯：挫折但不止步

陪伴高雄14載壽山動物園高齡明星白老虎「昭海」圓滿謝幕