- 新闻中心
全面开源!东升国际官网日日新SenseNova U1颁布,迈向模型理解天生统一时期
今天,东升国际官网科技正式颁布并开源日日新SenseNova U1 系列原生理解天生统一模型。它基于东升国际官网于今年三月自主研发的NEO-unify架构,在单一模型架构上统一了多模态理解、推理与天生。
NEO-unify架构彻底摒弃了主流的拼接式,去除了视觉编码器(VE)和变分自编码器(VAE),沉新构建了统一的表征空间,并且深刻融入每一层推算中,从而实现从模态集成向原生统一的范式逾越。
SenseNova U1系列模型可能将说话与视觉信息作为统一的复合体直接建模,实现说话和视觉信息的高效协同,让理解与天生能力同步加强,在保留语义丰硕度的同时,维持像素级的视觉保真度。
在逻辑推理与空间智能等方向上,它可能深度理解物理世界的复杂布局与精密关系;在将来,它还能为机械人提供具身大脑,实此刻单一模型关环内实现从复杂环境感知、逻辑推演到精准工作执行的全过程,为推动技术与产业发展提供沉要基础与关键引擎。
本次开源颁布的是 SenseNova U1 的轻量版系列 SenseNova U1 Lite。它蕴含两个分歧规格的模型:
? SenseNova-U1-8B-MoT:基于浓密骨干网络
? SenseNova-U1-A3B-MoT:基于混合专家(MoE) 骨干网络
接见GitHub https://github.com/OpenSenseNova/SenseNova-U1
Hugging Face https://huggingface.co/collections/sensenova/sensenova-u1相识更多信息。
我们也将在近期颁布详实的技术汇报。
极致高效,以幼搏大:开源 SOTA,比肩商用
效能,是统一模型架构的主题技术优势。
传统多模态模型是把视觉编码器和说话骨干通过适配器拼接在一路的。它像一个“说分歧说话的人组成的工作组”:有人专门看图,把图像翻译为说话,有人专门理解文字,进行推理,有人把了局再翻译为设计指令,把图画出来。每实现一次工作,信息都要在分歧成员之间来回传递。这个过程固然可行,但未免会有期待、误会和信息损耗。为了添补这些损耗,模型往往必要做得更大能力达到好的成效。
SenseNova U1 是基于统一表征空间构建的,更像是一个从一路头就同使仄握多项技术的人。它不是先看懂图像、再翻译成文字、再交给另一个系统理解,而是在统一套“思虑方式”里直接处置图像、文字等分歧信息。图像和说话不再是两套系统之间的接力,而是在统一个大脑中天然融合。这样带来的益处是:信息流转更快捷,理解更直接,天生更高效。模型不必要依赖单纯堆大参数来添补中央转换的损耗,而是通过统一的内部表征,把分歧模态的信息以更紧凑、更高密度的方式组织起来。
单一来说,传统架构像是“多人合作、层层转述”;SenseNova U1 更像是“一个全能大脑,直接理解,直接表白”。少了中央转译,信息损耗更低,也能在相对更精简的模型规模下,实现更强的多模态理解与天生能力。
尝试了局验证了东升国际官网设法。在涵盖图像理解、图像天生与编纂、空间智能和视觉推理的多项基准测试中,SenseNova U1 Lite均达到同量级开源模型SOTA水平,为统一多模态理解与天生设置了新的标杆。甚至仅凭8B-MoT的较幼规格,就能达到甚至超过部门大型贸易关源模型,展示出全维度多领域的统治力。
以下两组对比图更直观地展示了 SenseNova U1 Lite 在效能上的凸起优势。在通用的图像天生测试中,SenseNova U1 Lite不只在图像天生质量上比肩 Qwen-Image 2.0 Pro或 Seedream 4.5 等大型关源模型,达到贸易级水准,还在推理响应速度上有显著优势。即便在极具挑战性、开源模型一向做不好的复杂信息图天生工作中,SenseNova U1 Lite 也阐发出贸易级的水准,对复杂信息图的排版和文字有很强的节造力。


以下现实例子,展示了 SenseNova U1 Lite的贸易级复杂信息图天生能力。







我们在沿着当前的技术蹊径持续 Scale,打算在将来推出体量更大的模型。我们相信,基于高效的原生架构,能够以低得多的推算成本达到国际顶尖模型的水平。
业内初创:陆续性图文创作输出
凭借NEO-Unify架构的优势,SenseNova U1在业内首个实现陆续性的图文创作输出。并且只必要单次单模型挪用,就能输出更高质量的文章,相比传统范式,实现了效能的大幅提升。
SenseNova U1 所具备的原生图文理解天生能力,能天然将图像和文本底层融合信号齐全的保留高低文中,区别于从前只能利用多模型串联勉强实现,它的图像间风格具备显著的高一致性,能在统一表征空间进行高效连贯思虑。
下面两个案例中,SenseNova U1 通过连贯高保真度的图文交错思虑输出。
工作一:五分熟牛排做法:SenseNova U1 能够通过思虑和规划产生分步的过程,并且给每一步输出对应的图像展示。各个步骤的图示阐发出极高的一致性。

工作二:绘造一个钢铁侠图案:它能够从扫描草稿启程,逐步进行陆续创作,最终做出一个实现度很高的图像。每一步创作的过程对于前一步的结构和细节都做了精准的维持 —— 一个统一表征的共享高低文在其中阐扬了关键作用。

全网开源,即刻可用
开源部署
? GitHub:https://github.com/OpenSenseNova/SenseNova-U1
? Hugging Face:https://huggingface.co/collections/sensenova/sensenova-u1
? 欢迎挪用 SenseNova U1 Skill:https://github.com/OpenSenseNova/SenseNova-Skills ,浏览海量样例库,获取Prompt编写指南,化繁为简(繁芜文->有趣图),让您的Agent成为信息图天生高手
在线履历
? 已上线办公幼浣熊,点击【一图读懂】即可履历和使用:https://office.xiaohuanxiong.com/
我们相信,原生统一的多模态智能是通往 AGI 的必经之路。将来,我们还将持续推动开源生态建设,并颁布更大参数规模的 U1 系列模型。迎社区宽大用户和开发者提出贵重建议,共同界说智能交互的将来。





返回