西风 闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 与OpenAI分道扬镳后,Figure 02开启日夜进厂打工模式。 这不,创始人刚刚放出最新监工视频。它干快递分拣员的活儿,愈发得心应手了。 只见它把快递逐个码放整齐,让条形码朝下,方便扫描仪识别。 碰到纸片型快递,翻面操作也轻松拿捏: 它还懂得把快递整理得更平整,瞅见红色充气快递,也不盲目按压...
WebDancer团队 投稿 量子位 | 公众号 QbitAI 能够完成多步信息检索任务,涵盖多轮推理与连续动作执行的智能体来了。 通义实验室推出WebWalker(ACL2025)续作自主信息检索智能体WebDancer。 WebDancer 通过系统化的训练范式——涵盖从数据构建到算法设计的全流程——为构建具备长期信息检索能力的智能体提供了明确路径。 同...
AutoMat团队 投稿 量子位 | 公众号 QbitAI AI Agent又解锁了一个领域! 清华大学牵头,与西北工业大学以及上海AI lab等机构推出了电镜领域的AI agent——AutoMat。 它相当于一位精准的“地图翻译官”,把原子级 STEM 图像自动转成标准 CIF 结构,并一步到位给出形成能等关键物性。 过去的人工流程被缩短到几分钟,真正...
克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 没等来o3 Pro和GPT-5,隔壁谷歌的Gemini先更新了。 深夜,谷歌通过等多个账号同时官宣,Gemini 2.5 Pro再次推出新版本(0605)。 新版本在代码、推理等任务上的表现更上一层楼,在超难数据集“人类最后的考试”中以21.6%的成绩超过了o3。 在大模型竞技场上,新版Gemini也...
明敏 发自 凹非寺 量子位 | 公众号 QbitAI Qwen3深夜上新,Embedding系列全新登场! 它专为文本表征、检索与排序任务设计,旨在将文本(如句子、段落)转换为高质量的向量表示,以便在语义搜索、问答系统、推荐引擎等应用中更有效地处理和理解自然语言。 可用于文档检索、RAG、分类、情感分析、检索等任务。 它在Qwen3基础模型上训练而来,充...
文| 杨柳 6月6日的2025北京智源大会上,宇树科技CEO王兴兴回应了公司频频进行机器人炫技的考量:在人形机器人真正去到工厂或家庭干活的终极目标尚未到来前,通过表演和赛事等形式,不仅向外界展示技术发展现状,也可以产生初步的商业价值。 自今年春晚爆火之后,宇树科技借势进一步展开“炫技”:从回旋踢、跳舞、武术到近期引发热议的格斗比赛,这家明星公司在赚足眼球的...
在AI技术飞速发展的当下,自动化工具正成为提升开发效率和软件质量的关键。微软推出的Playwright MCP项目,以其轻量级、高效能的特点,为AI大模型与浏览器自动化交互提供了全新的解决方案。本文将深入探讨Playwright MCP的技术原理、功能特性及应用场景,并通过实践案例展示其部署与使用方法。 一、项目概述 Playwright MCP是微软基于...
谷歌的 Gemini 2.5 Pro 又更新了,就在几小时前! Gemini 模型这更新速度没谁了,几乎是一个月一次。 上个版本,是 5 月 6 日发布的 I/O 版。 今天发布的新版 Gemini 2.5 Pro 代号 gemini-2.5-pro-preview-06-05,已正式在 AI Studio、Vertex AI、Gemini App 全面开放...
“ 智能体开发过程中存在很多问题,但由于其执行过程是个黑盒,因此其调试存在更多的困难。” 最近一段时间一直在搞智能体方面的开发,主要方向是数据分析智能体;采用的框架是langchain家族的Langgraph框架;原因就在于Langgraph有很强的定制功能。 但是,在实际开发的过程中却一步一步坎,面临着各种各样的问题;比如说数据分析结果不准确,找不到数...
今天是2025年6月6日,星期五,北京,晴 我们来回顾下大模型相关技术0605进展,围绕社区如何学习讨论,大模型实操项目集合,强化学习评估偏差,多模态一键换装,Deepseek-R1-0528蒸馏数据等进展,供各位参考。 其中,尤其是如何针对性的学习,是很多人的困境,所以来谈谈。 一、如何针对性的学习-带着问题去学习 社区昨天有个很有趣的话题,问题是“想要用...