安爸-超级家庭
bg

AI进家庭

速递| 英伟达竞对Groq的估值冲60亿美元,中东金主加持

图片来源:Groq 据直接了解融资情况的人士透露,开发用于驱动大语言模型芯片的 Nvidia 挑战者 Groq 已与投资者洽谈,拟以 60 亿美元的投后估值筹集 3 亿至 5 亿美元资金。 Groq 已从包括基金巨头贝莱德、思科和三星的风投部门,以及 D1 Capital、Lee Fixel 的 Addition 和老虎环球管理在内的投资者处筹集了超过...

阅读:10 评论:0

醒醒吧!CEO猛吹AI写95%代码,绩效考核却还在拼程序员手速?

编译 | Tina 在 AI 工具席卷开发圈之后,一批技术老兵的工作方式悄然发生变化。Superhuman (原生 AI 邮件应用)工程负责人 Loic Houssier 正是这场转型的亲历者之一。 这位出身数学背景、拥有密码学工程经验的 VP,曾带领团队经历了从大型 B2C 到核心底层架构的复杂挑战。而当 ChatGPT、Claude Code 等工具...

阅读:8 评论:0

奖励模型也能Scaling!上海AI Lab突破强化学习短板,提出策略判别学习新范式

允中 发自 凹非寺 量子位 | 公众号 QbitAI 强化学习改变了大语言模型的后训练范式,可以说,已成为AI迈向AGI进程中的关键技术节点。 然而,其中奖励模型的设计与训练,始终是制约后训练效果、模型能力进一步提升的瓶颈所在。 当前,大模型在Next Token Prediction和Test-time Scaling两种扩展范式下,通过大规模的数据和模型...

阅读:9 评论:0

ICML 2025 Spotlight 快手、南开联合提出模块化双工注意力机制,显著提升多模态大模型情感理解能力!

“情智兼备”是新一代人工智能的重要发展方向,是迈向通用人工智能的关键一步。在人机交互场景中,具备情智的数字人与机器人需要精准解译多模态交互信息,深度挖掘人类内在情感状态,从而实现更具真实感与自然性的人机对话。然而,面对多模态情感数据语义的高度复杂性,如何有效建模跨模态关联关系仍是领域内亟待突破的核心挑战。 针对这一技术瓶颈,快手可灵团队与南开大学在「多模态...

阅读:7 评论:0

抱抱脸进军具身智能机器人:5小时成交破百万,299美元起售

henry 发自 凹非寺 量子位 | 公众号 QbitAI AI圈的“GitHub”居然开始卖机器人了! HuggingFace最新发布开源桌面机器人ReachyMini,5小时内卖出超13万欧元(约为人民币109万元)! 有线版本Reachy Mini Lite售价299美元,无线版本Reachy Mini售价499美元。 换算下来,用一块Apple w...

阅读:7 评论:0

感知错误率降低30.5%:隐式感知损失让模型主动“睁大眼睛” UIUC&阿里通义

PAPO团队 投稿 量子位 | 公众号 QbitAI 让大模型在学习推理的同时学会感知。 伊利诺伊大学香槟分校(UIUC)与阿里巴巴通义实验室联合推出了全新的专注于多模态推理的强化学习算法PAPO(Perception-Aware Policy Optimization)。 现有的强化学习算法(如GRPO)虽然在纯文本推理中表现优异,但当应用于多模态场景时,...

阅读:7 评论:0

RAG-Anything:PDF、表格、公式全能读!港大开源神器让AI真正理解复杂文档?

RAG-Anything是一个由香港大学数据智能实验室开发的开源多模态RAG系统,支持处理包含文本、图像、表格和公式的复杂文档,提供从文档摄取到智能查询的端到端解决方案。系统基于多模态知识图谱、灵活的解析架构和混合检索机制,显著提升复杂文档处理能力,支持多种文档格式,如PDF、Office文档、图像和文本文件等。 一、技术原理 (一)图增强文本索引 RA...

阅读:7 评论:0

马斯克 Grok 4 来了!史上最强、最贵、最敢说 AI?土耳其:已封杀!

昨天,马斯克的直播“如期”而至。 在这场迟到近 1 小时的发布会上,马斯克带着 xAI 的工程师们不仅演示了其最新模型 Grok 4,还一如既往地“语出惊人”: “Grok 4 在所有学科都已达到博士(PhD)水平,甚至更好。” 这味道,怎么有种熟悉的感觉? 没错,5 个月前发布 Grok 3 时,马斯克就表达过类似的观点:“Grok 3 是地球上最聪明...

阅读:9 评论:0

企业级智能体开发中所遇到的问题以及解决方案

“ 总之,智能体开发的理论很简单;但其真正的难点却在具体的落地实现。” 智能体开发是目前大模型应用的主流方向之一,但由于大模型的不稳定性导致智能体开发困难重重,特别是构建能够稳定运行的智能体,更是难上加难。 今天我们就从智能体开发过程中遇到的问题出发,尝试找到企业级的智能体架构方案。 企业级智能体架构 事实上智能体的概念很简单——就是LLM(大模型) +...

阅读:7 评论:0

近期代表性开源大模型梳理:Decoder转Encoder-Decoder、多模型组合新趋势

今天是2025年7月10日,星期四,北京,雨过天晴。 近期国外开源了不少有趣的模型,大的小的都有,还有对deepseek-r1的魔改,这里做个汇总,包括:SmolLM3小模型、T5Gemma模型、NextCoder-32B模型、DeepSeek-TNG-R1T2-Chimera专家组合模型,一共4 个模型。 尤其是,其中用到的模型合并方案,看来已经是广泛采用...

阅读:8 评论:0