新闻中心

全面开源！东升国际官网日日新SenseNova U1颁布，迈向模型理解天生统一时期

2026-04-28

今天，东升国际官网科技正式颁布并开源日日新SenseNova U1 系列原生理解天生统一模型。它基于东升国际官网于今年三月自主研发的NEO-unify架构，在单一模型架构上统一了多模态理解、推理与天生。

NEO-unify架构彻底摒弃了主流的拼接式，去除了视觉编码器（VE）和变分自编码器（VAE），沉新构建了统一的表征空间，并且深刻融入每一层推算中，从而实现从模态集成向原生统一的范式逾越。

SenseNova U1系列模型可能将说话与视觉信息作为统一的复合体直接建模，实现说话和视觉信息的高效协同，让理解与天生能力同步加强，在保留语义丰硕度的同时，维持像素级的视觉保真度。

在逻辑推理与空间智能等方向上，它可能深度理解物理世界的复杂布局与精密关系；在将来，它还能为机械人提供具身大脑，实此刻单一模型关环内实现从复杂环境感知、逻辑推演到精准工作执行的全过程，为推动技术与产业发展提供沉要基础与关键引擎。

本次开源颁布的是 SenseNova U1 的轻量版系列 SenseNova U1 Lite。它蕴含两个分歧规格的模型：

? SenseNova-U1-8B-MoT：基于浓密骨干网络

? SenseNova-U1-A3B-MoT：基于混合专家（MoE）骨干网络

接见GitHub https://github.com/OpenSenseNova/SenseNova-U1

Hugging Face https://huggingface.co/collections/sensenova/sensenova-u1相识更多信息。

我们也将在近期颁布详实的技术汇报。

极致高效，以幼搏大：开源 SOTA，比肩商用

效能，是统一模型架构的主题技术优势。

传统多模态模型是把视觉编码器和说话骨干通过适配器拼接在一路的。它像一个“说分歧说话的人组成的工作组”：有人专门看图，把图像翻译为说话，有人专门理解文字，进行推理，有人把了局再翻译为设计指令，把图画出来。每实现一次工作，信息都要在分歧成员之间来回传递。这个过程固然可行，但未免会有期待、误会和信息损耗。为了添补这些损耗，模型往往必要做得更大能力达到好的成效。

SenseNova U1 是基于统一表征空间构建的，更像是一个从一路头就同使仄握多项技术的人。它不是先看懂图像、再翻译成文字、再交给另一个系统理解，而是在统一套“思虑方式”里直接处置图像、文字等分歧信息。图像和说话不再是两套系统之间的接力，而是在统一个大脑中天然融合。这样带来的益处是：信息流转更快捷，理解更直接，天生更高效。模型不必要依赖单纯堆大参数来添补中央转换的损耗，而是通过统一的内部表征，把分歧模态的信息以更紧凑、更高密度的方式组织起来。

单一来说，传统架构像是“多人合作、层层转述”；SenseNova U1 更像是“一个全能大脑，直接理解，直接表白”。少了中央转译，信息损耗更低，也能在相对更精简的模型规模下，实现更强的多模态理解与天生能力。

尝试了局验证了东升国际官网设法。在涵盖图像理解、图像天生与编纂、空间智能和视觉推理的多项基准测试中，SenseNova U1 Lite均达到同量级开源模型SOTA水平，为统一多模态理解与天生设置了新的标杆。甚至仅凭8B-MoT的较幼规格，就能达到甚至超过部门大型贸易关源模型，展示出全维度多领域的统治力。

以下两组对比图更直观地展示了 SenseNova U1 Lite 在效能上的凸起优势。在通用的图像天生测试中，SenseNova U1 Lite不只在图像天生质量上比肩 Qwen-Image 2.0 Pro或 Seedream 4.5 等大型关源模型，达到贸易级水准，还在推理响应速度上有显著优势。即便在极具挑战性、开源模型一向做不好的复杂信息图天生工作中，SenseNova U1 Lite 也阐发出贸易级的水准，对复杂信息图的排版和文字有很强的节造力。

Generation Latency vs. Averaging Performance on Infographic Benchmarks, i.e., BizGenEval (Easy, Hard), and IGenBench.png