安爸-超级家庭
bg

AI信息差

思科发布了思科时间序列模型:他们的第一个仅基于解码器Transformer架构的开放权重基础模型。

思科和Splunk推出了思科时间序列模型,这是一款针对可观测性和安全指标的单一变量的零样本时间序列基础模型。它是作为一个开放权重的检查点,在Hugging Face上以Apache 2.0许可发布,旨在为目标工作负载进行预测,而无需特定于任务的微调。该模型扩展了TimesFM 2.0,并采用显式的多分辨率架构,将粗略和详细历史数据融合在一个上下文窗口中。 ...

阅读:7 评论:0

苹果研究人员发布了CLaRa:一种针对压缩原生RAG的连续潜在推理框架,实现16x-128x语义文档压缩。

苹果和爱丁堡大学的研究团队推出了CLaRa(连续潜在推理),这是一种将文档压缩到连续记忆标记的检索增强生成框架,然后在共享的潜在空间中执行检索和生成。目标是缩短上下文,避免双重编码,并让生成器教授检索器下游答案中实际重要的内容。该框架在语义压缩和联合优化方面取得了重要进展,为RAG系统提供了一种统一且高效的解决方案。 文档压缩:CLaRa利用QA指导的语义...

阅读:4 评论:0

Meta AI发布Segment Anything Model 3(SAM 3)以实现图像和视频中的可提示概念分割

如何通过简单的提示,从大量图库和视频集中可靠地找到、分割和跟踪任何概念的所有实例?Meta AI团队刚刚发布了Meta Segment Anything Model 3,或称为SAM 3,这是一个开源的统一基础模型,用于图像和视频中的可提示分割,它直接在视觉概念上操作,而不是只操作像素。它可以从文本提示和视觉提示,如点、框和掩码中检测、分割和跟踪对象。与SA...

阅读:6 评论:0

艾伦人工智能研究所(AI2)推出Olmo 3:基于Dolma 3和Dolci栈的开源7B和32B语言模型家族

艾伦人工智能研究所(AI2)正在推出Olmo 3作为一个完全开放的模型系列,该系列揭示了整个“模型流程”,从原始数据和代码到中间检查点和部署准备变体。 Olmo 3是一个包含7B和32B参数模型的密集型transformer套件。该系列包括Olmo 3-Base、Olmo 3-Think、Olmo 3-Instruct和Olmo 3-RL Zero。7B和3...

阅读:6 评论:0

NVIDIA AI发布Nemotron-Elastic-12B:一个无需额外训练成本的单一AI模型,可提供6B/9B/12B变体。

为什么AI开发团队仍在为不同的部署需求训练和存储多个大型语言模型,而一个可伸缩的模型可以以相同的成本生成多个尺寸?NVIDIA正在将通常的“模型家族”堆叠合并为一个单独的训练任务。NVIDIA AI团队发布Nemotron-Elastic-12B,一个12B参数的推理模型,该模型在同一参数空间中内嵌了9B和6B的变体,因此这三种尺寸都来自一个可伸缩的检查点,...

阅读:6 评论:0

微软AI发布Fara-7B:适用于计算机使用的效率提升型智能体模型

微软研究部门发布了一个名为 Fara-7B 的7亿参数的智能体语言模型,专为计算机使用而设计。这是一个开源的计算机使用智能体,可以从屏幕截图中运行,预测鼠标和键盘操作,并且体积小巧,能够在单个用户设备上执行,从而降低延迟并保持浏览数据的本地化。 https://www.microsoft.com/en-us/research/blog/fara-7b-an...

阅读:8 评论:0

黑森林实验室发布FLUX.2:一款适用于生产图像流水线的32位流匹配变压器。

黑森林实验室发布了FLUX.2,这是其第二代图像生成和编辑系统。FLUX.2旨在针对现实世界的创意工作流程,如营销资产、产品摄影、设计布局和复杂的信息图表,支持高达4兆像素的编辑,并对布局、标志和排版具有强大的控制。 FLUX.2产品系列和FLUX.2[dev] FLUX.2系列产品包括托管API和开放权重: FLUX.2[pro] 是托管API层。它针对...

阅读:7 评论:0

腾讯混元发布混元OCR:一个1B参数的端到端OCR专家VLM

腾讯浑元发布了浑元OCR,这是一个专用于OCR和文档理解的1B参数视觉语言模型。该模型建立在浑元的原生多模态架构之上,通过单一端到端流程实现定位、解析、信息提取、视觉问答和文本图像翻译。 浑元OCR是通用VLM(如Gemini 2.5和Qwen3 VL)的轻量级替代方案,在专注OCR的任务上仍然能够匹配或超越它们。它针对如文档解析、卡片和收据提取、视频字幕提...

阅读:6 评论:0

OceanBase发布seekdb:适用于多模型RAG和AI代理的开源AI原生混合搜索引擎数据库

AI应用很少处理一个干净的表格。它们将用户资料、聊天记录、JSON元数据、嵌入和有时还包括空间数据混合在一起。大多数团队用OLTP数据库、向量存储和搜索引擎的一块补丁来应对这个问题。OceanBase发布了seekdb,这是一个基于Apache 2.0许可证的开放源代码AI数据库。seekdb被描述为一种AI原生搜索引擎,它统一了关系数据、向量数据、文本、J...

阅读:4 评论:0

DeepSeek AI发布DeepSeekMath-V2:在Putnam 2024竞赛中获得118/120分的开放权重数学模型。

DeepSeek AI 推出了 DeepSeekMath-V2,这是一个针对自然语言定理证明和自我验证进行优化的开放weights大型语言模型。该模型基于 DeepSeek-V3.2-Exp-Base 构建而成,作为一个 685B参数 的专家混合系统运行,并以Apache 2.0许可协议在Hugging Face上提供。 在评估中,DeepSeekMath-...

阅读:5 评论:0