安爸-超级家庭
bg
avatar

安爸

ACL 2025 告别Prompt玄学!新理论揭示大模型Prompt设计的奥秘与效能

近年来,大型语言模型(LLM)在自然语言处理领域取得了革命性进展。然而,其底层的 Transformer 架构在处理复杂推理任务时仍有不足。尽管「思维链」(CoT)提示技术提供了一条实用路径,但多数方法依赖通用指令,导致提示工程高度依赖反复试验,缺乏理论指导。 ▲ 图1:Prompt 模板深刻影响着答案空间的配置和导航方式。左侧展示了不同的 Prompt...

阅读:10 评论:0

谷歌发布音乐模型!

Magenta RealTime 是由 Google 开发的一个开源音乐生成模型,基于用于创建 MusicFX DJ 和 Lyria RealTime 的相同研究和技术。Magenta RealTime 允许通过文本提示、音频示例或多个文本提示和/或音频示例的加权组合来持续生成音乐音频。其相对较小的体积使其能够在资源有限的环境中部署,包括现场表演环境或免费可...

阅读:12 评论:0

MIT终身教授何恺明,入职谷歌了

一水 发自 凹非寺 量子位 | 公众号 QbitAI AI大牛何恺明最新动向来了! 才刚拿下MIT终身教职没多久,这转眼又加盟谷歌DeepMind任杰出科学家。 目前这一消息已在个人主页同步更新: 也是在最近,MIT官网发布公告称: 今年MIT工程学院一共有11位教职人员获得终身教职,而何恺明也在名单中。 要知道他去年3月才正式在MIT开讲,这中间几乎只隔...

阅读:14 评论:0

首个面向科学任务、真实交互、自动评估的多模态智能体评测环境,ScienceBoard来了

第一作者孙秋实是香港大学计算与数据科学学院博士生,硕士毕业于新加坡国立大学数据科学系。主要研究方向为 Computer-using agents 和 Code intelligence,在 NLP 和 ML 顶会 ACL,EMNLP,ICLR,COLM 等发表多篇论文。本文的 OS-Copilot 团队此前已发布了 OS-Atlas、OS-Genesis ...

阅读:11 评论:0

鸿蒙生态的“中国速度”:技术破局与生态共创的胜利

作者_|陆 邮箱|_xiaoyu@pingwest.com 当华为常务董事、终端 BG 董事长余承东在 2025 年华为开发者大会(HDC 2025)上宣布 HarmonyOS 6 开发者 Beta 正式启动时,台下热烈的掌声回应着鸿蒙生态的又一次进化。令人惊喜的是,就在一周前,华为 Pura 80 系列才刚刚向用户展示了 HarmonyOS 5.1 的新...

阅读:11 评论:0

谷歌太壕了!编程Agent大招至简:开源且免费,百万上下文、多模态、MCP全支持

鱼羊 发自 凹非寺 量子位 | 公众号 QbitAI 开源且免费!谷歌对编程Agent出手了。 推出Gemini CLI,让你在终端里就能访问Gemini,并且提供“业界最高免费限额”: 100万上下文窗口的Gemini 2.5 Pro,每分钟允许60次模型请求,每天的上限则是1000次。 官方还着重提醒: Gemini CLI写码很强,但不只能拿来编程哦...

阅读:13 评论:0

Gemini CLI 一夜极限测评,谷歌掀翻了 Vibe Coding 的牌桌

Vol 46. Gemini CLI 一夜极限测评 以及我用 Claude Code 修复了 Gemini Cli 作者:南川·2025-06-28 开源#Claude-Code##Gemini-Cli##Vibe-Coding 如果说 Claude Code 是 AI 编程助手界的 iPhone——精致、闭源、定义标准,那么 Gemini CLI 就是 A...

阅读:10 评论:0

宇树科技王兴兴:公司年度营收超十亿元,近距离人机交互时安全性挑战更大

文| 刘嫚 杨文君(发自天津) 6月26日,在天津夏季达沃斯论坛“解读中国AI发展路径分论坛”现场,宇树科技首席执行官王兴兴表示,当前人形机器人大批量商业应用的时间还未到。谈及未来人形机器人的应用场景是否会包括家庭智能应用,王兴兴认为,人形机器人家用领域,安全性是尤为需要关注的问题;对于近距离与人交互的场景,安全性挑战更大。 宇树科技首席执行官王兴兴 王...

阅读:11 评论:0

北大腾讯突破奖励模型瓶颈!让AI理解人类偏好,泛化能力比肩GPT-4.1

RA团队 发自 凹非寺 量子位 | 公众号 QbitAI 总是“死记硬背”“知其然不知其所以然”? 奖励模型训练也形成了学生选择标准答案的学习模式,陷入诸如“长回答=好回答”“好格式=好答案”等错误规律之中。 北京大学知识计算实验室联合腾讯微信模式识别中心、William&Mary、西湖大学等机构提出的RewardAnything突破了这一瓶颈——通...

阅读:11 评论:0

谷歌Gemini CLI:终端里的全能AI代理,免费开源的生产力新星

**关注我,记得标星⭐️不迷路哦~ 今天谷歌发布了Gemini CLI,一款开源的、运行在终端中的AI代理工具,被视为对标Claude Code和Cursor的“王炸级”产品。Gemini CLI 的推出,以其慷慨的免费额度、强大的模型能力以及全面的工作流支持,迅速在开发者社区引发关注,其GitHub项目上线不久便获得了过万的Star数量。 一、定位与核心...

阅读:10 评论:0