图片来源:No Priors Z Highlights 传统的机器人研究往往专注于某一个具体应用场景,但这种方法很难推广到更广泛的任务。研究人员往往会在单一应用上深挖,但一旦想要扩展到其他任务,就会陷入瓶颈。我们认为,最大限度地利用所有可用数据才是关键。跨不同平台的数据可以传递丰富的信息,让模型的泛化能力更强。我们希望打造的通用机器人,本质上是一个“基础...
产品经理们快看看,这年头除了费劲心机想获得流量,有相当多的用户在发愁一件事:怎样能在社交媒体上「隐身」。 最近,微博智搜正是狠狠踩了一脚大雷,引发了无数微博用户哀嚎:我的半年可见,我的隐藏博文,都暴露了! 一时间,微博成了鱿鱼游戏,智搜就是广场上里面的巨型人偶,每个人都担心自己会被扫射击中。 于是就出现了各种实验,试图找到可以应对的方法是什么。有一些从上...
图片来源:Unsplash 主打“重塑Z世代投资方式”的跟单交易平台 Dub 今日宣布完成3000万美元A轮融资,使其累计融资额攀升至4700万美元。 这笔交易由Notable Capital和Neo(本刊近期深度报道的加密基金)共同领投,跟投方包括Sandberg Bernthal Venture Partners、Peak6 Strategic C...
Video-XL-Pro团队投稿 量子位 | 公众号 QbitAI 3B模型超越Meta 7B模型,超长视频理解SOTA刷新了! 来自上海交通大学、北京智源研究院、特伦托大学的联合研究团队推出了Video-XL-Pro,实现近一万帧视频的单卡处理,大海捞针准确率超98%。 现有的多模态大模型在超长视频训练和应用中仍存在显著瓶颈:一方面,难以大规模训练超长视频...
图片来源:Anthropic 据彭博社报道,苹果与Anthropic 正联手打造一款“氛围编程”软件平台,该平台将利用生成式 AI 为程序员编写、编辑和测试代码。 报道指出,iPhone 制造商计划内部推出该软件,但尚未决定是否公开上市。该系统是苹果编程软件 Xcode 的新版本,并依赖于 Anthropic 的 Claude Sonnet 模型。 苹...
图片来源:Unsplash Instagram联合创始人凯文·斯特罗姆(Kevin Systrom)近日公开批评当前AI聊天机器人行业陷入“数据泡沫”陷阱——通过高频追问用户“诱导互动”以美化运营指标,而非专注于提供真正有价值的答案。 在StartupGrind大会上,斯特罗姆直言这种策略是“一股伤害用户的势力”,并将其类比社交媒体公司早年激进扩张时期...
坐看“中国队”表演的五一假期。 📢本周AI快讯 | 1分钟速览🚀 1️⃣ 🔬 DeepSeek 发布数学证明模型 Prover-V2 :MiniF2F-test 达 88.9% 通过率,刷新最高纪录,显著领先同类模型,创新结合递归定理证明与强化学习技术。 2️⃣ 🚀 阿里发布国内首个混合推理模型 Qwen3 :预训练数据达 36 万亿 tokens,支持...
“ Embedding和Rerank模型是RAG系统中的核心模型。” 在RAG系统中,有两个非常重要的模型一个是Embedding模型,另一个则是Rerank模型;这两个模型在RAG中扮演着重要角色。 Embedding模型的作用是把数据向量化,通过降维的方式,使得可以通过欧式距离,余弦函数等计算向量之间的相似度,以此来进行相似度检索。 而Rerank的...
最近在做智能问答系统,深感这个领域的发展速度之快。曾经只能机械回答问题的机器人,现在已经能主动推荐内容、处理复杂任务,越来越像一个全能助手。 对话系统,按交互方式可分为“主动型”和“被动型”,按用途又可细分为“问答型”“闲聊型”“任务型”。从底层技术看,路径也从早期的检索、规则、语义解析,演进到了今天流行的深度生成模型,特别是结合企业知识库的大模型问答框架 ...
今天是2025年5月4日,星期日,北京,晴,假期已进入尾声。 我们今天来看看大模型部署的话题,之前也有介绍过,这次再温习一遍,讲的再细致些 计算LLM的显存需要考虑多个因素,了解核心组件(参数、优化器状态、梯度、激活值和开销)至关重要。根据任务(推理、全参数微调、PEFT)和操作设置(精度、批量大小、序列长度、多GPU配置),所需的显存差异很大。 如何进行估...