Video-XL-Pro团队投稿 量子位 | 公众号 QbitAI 3B模型超越Meta 7B模型,超长视频理解SOTA刷新了! 来自上海交通大学、北京智源研究院、特伦托大学的联合研究团队推出了Video-XL-Pro,实现近一万帧视频的单卡处理,大海捞针准确率超98%。 现有的多模态大模型在超长视频训练和应用中仍存在显著瓶颈:一方面,难以大规模训练超长视频...
图片来源:Anthropic 据彭博社报道,苹果与Anthropic 正联手打造一款“氛围编程”软件平台,该平台将利用生成式 AI 为程序员编写、编辑和测试代码。 报道指出,iPhone 制造商计划内部推出该软件,但尚未决定是否公开上市。该系统是苹果编程软件 Xcode 的新版本,并依赖于 Anthropic 的 Claude Sonnet 模型。 苹...
图片来源:Unsplash Instagram联合创始人凯文·斯特罗姆(Kevin Systrom)近日公开批评当前AI聊天机器人行业陷入“数据泡沫”陷阱——通过高频追问用户“诱导互动”以美化运营指标,而非专注于提供真正有价值的答案。 在StartupGrind大会上,斯特罗姆直言这种策略是“一股伤害用户的势力”,并将其类比社交媒体公司早年激进扩张时期...
坐看“中国队”表演的五一假期。 📢本周AI快讯 | 1分钟速览🚀 1️⃣ 🔬 DeepSeek 发布数学证明模型 Prover-V2 :MiniF2F-test 达 88.9% 通过率,刷新最高纪录,显著领先同类模型,创新结合递归定理证明与强化学习技术。 2️⃣ 🚀 阿里发布国内首个混合推理模型 Qwen3 :预训练数据达 36 万亿 tokens,支持...
“ Embedding和Rerank模型是RAG系统中的核心模型。” 在RAG系统中,有两个非常重要的模型一个是Embedding模型,另一个则是Rerank模型;这两个模型在RAG中扮演着重要角色。 Embedding模型的作用是把数据向量化,通过降维的方式,使得可以通过欧式距离,余弦函数等计算向量之间的相似度,以此来进行相似度检索。 而Rerank的...
最近在做智能问答系统,深感这个领域的发展速度之快。曾经只能机械回答问题的机器人,现在已经能主动推荐内容、处理复杂任务,越来越像一个全能助手。 对话系统,按交互方式可分为“主动型”和“被动型”,按用途又可细分为“问答型”“闲聊型”“任务型”。从底层技术看,路径也从早期的检索、规则、语义解析,演进到了今天流行的深度生成模型,特别是结合企业知识库的大模型问答框架 ...
今天是2025年5月4日,星期日,北京,晴,假期已进入尾声。 我们今天来看看大模型部署的话题,之前也有介绍过,这次再温习一遍,讲的再细致些 计算LLM的显存需要考虑多个因素,了解核心组件(参数、优化器状态、梯度、激活值和开销)至关重要。根据任务(推理、全参数微调、PEFT)和操作设置(精度、批量大小、序列长度、多GPU配置),所需的显存差异很大。 如何进行估...
Real Dream是Pony时代最受欢迎的真人风格大模型之一,随着Flux的普及,作者终于发布了自己的第一个Flux模型。 比较搞笑的是,作者在C站称: 在我的Patreon上,我分享了我开发的模型的测试版本。它们大部分都在免费区分享,但如果你喜欢这个项目并希望帮助我获得更多的计算能力,请考虑作为贡献者加入我的Patreon。Patreon的价格是平台允...
新智元报道 编辑:定慧 【新智元导读】o3推理有多强?猜图大师Sam Patterson伪造GPS坐标想套路OpenAI o3,AI仅凭两张90°视图锁定地点,以23179分胜人类22054。假EXIF被AI识破,AI跨模态推理潜力呼之欲出,「视觉+搜索+思维链」正在改写人机博弈。 OpenAI的o3有点「神了」,不仅胜过人类,还识别了人类的诡计。...