DeepSeek-TNG-R1T2-Chimera 是由 TNG Technology 使用三种 DeepSeek 父模型组装出的“专家混合体”语言模型,在智能、响应速度和一致性上实现平衡,相比前代提升显著并修复了关键的 token 问题。 三亲模型融合:不同于前代只融合两个父模型,R1T2 通过“Assembly of Experts”方法,将 R1-0...
今天的huggingface第一名是来自智谱的一款大模型:GLM-4.1V-9B-Thinking。 这个大模型最近几天一直徘徊在第二名,第一名是黑森林的Flux Kontext Dev,不过后者是一个AI绘画模型,二者没有可比性。 GLM-4.1V-9B-Thinking的优势在于以比较小的参数(9B)实现了接近DeepSeek和Qwen大参数模型的效果...
来自加州大学河滨分校(UC Riverside)、密歇根大学(University of Michigan)、威斯康星大学麦迪逊分校(University of Wisconsin–Madison)、德州农工大学(Texas A&M University)的团队在 ICCV 2025 发表首个面向自动驾驶语义占用栅格构造或预测任务的统一基准框架 U...
不圆 发自 凹非寺 量子位 | 公众号 QbitAI 大模型“当面一套背后一套”的背后原因,正在进一步被解开。 Claude团队最新研究结果显示:对齐伪装并非通病,只是有些模型的“顺从性”会更高。 测试的25个模型中,只有5个表现出更高的顺从性,其中2个会表现出>1%的对齐伪装推理。 这就引发了一个问题:为什么有些语言模型会对齐伪装,有些则不会? 对...
内容转载自「thinkingloop」 最近 3D AI 伴侣 EVE 给用户下单了一杯奶茶,引起了人们关于 Agent payment 方向的关注。 图源:公众号数字生命卡兹克《实测首款 3D AI 伴侣 EVE – 我收到了 AI 送的第一杯奶茶。》 Agent 支付需要哪些步骤?有哪些 AI 产品已经逐步集成了支付功能?Agent 离实现完全自主的...
vivo AI Lab 投稿 量子位 | 公众号 QbitAI vivo AI Lab发布AI多模态新模型了,专门面向端侧设计,紧凑高效~ 能够直接理解GUI页面的那种: 模型BlueLM-2.5-3B,融合文本和图文的理解和推理能力,支持长短思考模式自由切换,并引入思考预算控制机制。 与同尺寸模型相比,BlueLM-2.5-3B在多个文本与多模态评测任务...
上周,《每日经济新闻》爆出:宇树科技计划在2025年底前,正式向A股递交IPO申请。 一时间,市场普遍猜测,宇树将成为“A股人形机器人第一股”。 但这个故事,还没讲完,就迎来了新的变数。 就在昨晚,科创板上市公司上纬新材发布公告:智元机器人将收购其约67%的股份。交易完成后,智元CEO邓泰华将成为上市公司实际控制人。 虽然目前还谈不上“借壳上市”,但这一步...
智元机器人将至多收购其66.99%的股份。待交易完成后,上纬新材控股股东将变更为智元机器人及其管理团队共同持股的主体,实际控制人将变更为邓泰华,核心团队包括稚晖君等。 文|黄心怡 今日一开盘,上纬新材即 “20cm”涨停,涨停价9.34元/股。 据上纬新材前一天发布的公告,智元机器人拟至少收购其63.62%股份。待本次股权交易完成后,上纬新材控股股东将变...
文丨丁灵波 融资是为了上市,上市是为了融资,这两点,都被智元玩明白了。 7月8日晚,科创板上市公司上纬新材连发多条公告引发行业关注:狂奔了两年半的智元机器人(关联公司)将合计收购其至少63.62%的股份。 根据收购报告书显示,第一波股份转让中,智元恒岳、致远新创合计将拥有上市公司29.99%的股份及该等股份对应的表决权。 此外,公告称智元恒岳还拟通过部...
2025 年已经过半, 文本生成大模型是否已经进入下半场了? OpenAI 完全不重视 API 市场? Grok3 根本没人用? 「大模型战」未来的走向如何? 近期,推特博主「karminski-牙医」发布了一篇关于 2025 年上半年大模型 API 市场数据分析帖子,基于 OpenRouter 数据,「karminski-牙医」分析了上半年大模型的总 T...