安爸-超级家庭
bg
avatar

安爸

揭秘150亿元高估值的智元机器人,“不像一家传统初创公司”

文丨杨柳 智元机器人的对外扩张战略再落一子。4月底,智元和蓝思科技合资成立新公司的消息释出,二者共同运营的湖南具身智能创新中心在5月投入运营。 据不完全统计,从2024年7月至今,智元至少出资设立了8家合资公司——不少合资方为上市企业。此外,智元投资了6家具身智能产业链公司,其中一半是刚成立一年左右的初创企业,另有2家为上市企业控股的子公司。 “生态打法...

阅读:8 评论:0

LeCun亲自出镜打脸质疑者!憋了20年的AI世界模型,终于爆发了

新智元报道 编辑:Aeneas 桃子 【新智元导读】刚刚,LeCun竟然亲自出镜,重磅讲解了V-JEPA 2!就在外界猜测他已被边缘化之际,这位AI老将用一支视频回应了质疑:要坚定不移做世界模型!这位20年孤勇者押注的方向,是将引领AI的下一个潮流,还是走上了歧路? 正处于风暴中心的LeCun,亲自出镜了! 在视频中,他介绍了V-JEPA 2的新进...

阅读:7 评论:0

ICML 2025 Agentic时代唤醒NAS”第二春”!智能体超网动态组队,推理成本暴降55%

在 AI 的浪潮之巅,大语言模型(LLM)驱动的多智能体系统,正以其强大的协同能力,不断刷新我们对智能的想象。但一个痛点始终存在:构建这些复杂的系统,往往依赖于“炼丹师”们大量的手动设计和调试,这就像在用手工作坊的方式打造星际飞船,效率低下且难以规模化。 今天,这一瓶颈被彻底打破!来自新加坡国立大学、中国科学技术大学、同济大学和上海人工智能实验室的研究团队...

阅读:7 评论:0

Image Caption复兴宣言!南大港大CapArena重塑「详细图像描述」评测体系

图像描述(Image Captioning)是多模态学习中基础且重要的任务,随着 LLM 时代模型的发展,现代的视觉语言模型可以生成详细而全面的描述。然而,由于评测的主观性和困难,当前的视觉语言评测往往只关注 VQA、推理等任务,忽略了对模型 Detailed Image Captioning 能力的评估。 为了促进大模型时代图像描述的研究,本文主要做了以...

阅读:7 评论:0

视频理解“隐秘的角落”:多任务视频文本理解评测新基准VidText发布

视频理解是通往 AGI 的必要路径。当前视频理解的探索主要集中于视频事件内容,人物动作,关系等。然而,嵌入视频中的可视文字却往往被忽略。从视频字幕到场景文字(街头招牌,道路指示牌),这些视频文本对于推理视频的内容,人物行为等提供了重要线索。 针对于此,来自哈工大,特伦托大学,北大,中科院,北航,南理工和南开大学的研究者们联合提出了 VidText,旨在提供...

阅读:7 评论:0

喝点VC|a16z谈搜索大变局:搜索迈入由语言模型主导的“生成式引擎优化(GEO)”全新范式

图片来源:a16z Z Highlights 搜索行为从传统浏览器向大型语言模型(LLM)平台迁移,价值超800亿美元的SEO市场根基已现裂痕,搜索迈入由语言模型主导的“生成式引擎优化(GEO)”全新范式。 曝光定义从“搜索结果页排名”转变为“直接出现在模型生成的答案中”,LLM具备记忆、推理能力并提供个性化响应,彻底改变内容发现与优化逻辑。 竞争焦点从...

阅读:8 评论:0

CVPR 2025 多模态统一学习新范式来了,数据、模型、代码全部开源

本文第一作者杜恒辉为中国人民大学二年级硕士生,主要研究方向为多模态大模型视听场景理解与推理,长视频理解等,师从胡迪副教授。作者来自于中国人民大学,清华大学和北京腾讯 PCG AI 技术中心。 我们人类生活在一个充满视觉和音频信息的世界中,近年来已经有很多工作利用这两个模态的信息来增强模型对视听场景的理解能力,衍生出了多种不同类型的任务,它们分别要求模型具备...

阅读:7 评论:0

速递|OpenAI急筹400亿美元弹药,沙特PIF、印度信实或成关键金主

图片来源:Unsplash 据知情人士透露,OpenAI 已与沙特公共投资基金、印度信实工业集团及现有股东阿联酋 MGX,就参与由软银主导的 400 亿美元新一轮融资进行商谈。这些投资者每家可能至少投入数亿美元。 • 本轮融资总额400亿美元,分两期执行——首期100亿美元已到位,二期300亿正在推进,沙特PIF、印度信实、阿联酋MGX为主要谈判对象 ...

阅读:10 评论:0

小扎砸 9 位数挖 AI 大神、杨立昆发布世界模型,被群嘲的开源旧王要反击了

Llama 4 的折戟沉沙没有让 Meta 知难而退,反而坚定了 All In AI 的决心。 最近,创始人扎克伯格亲自操刀组建「超级智能」团队,重金投资 Scale AI、以及砸 9 位数挖角 Google、OpenAI 的顶级科学家,也因此抢占了这几天的国际头版头条。 就在今天凌晨,Meta 也开源了最新的重量级模型——V-JEPA 2。 不同于市面上...

阅读:7 评论:0

速递|火山引擎Force大会:豆包大模型1.6全球创新“区间定价”,火山引擎全力打造“AI云”

图片来源:火山引擎发布会 字节跳动旗下火山引擎,于6月11日举办Force原动力大会,本次大会正式发布了豆包大模型1.6、视频生成模型Seedance 1.0 Pro等新模型,同时升级了AI Agent开发平台等云原生服务。 Z Highlight: 技术性能突破:豆包1.6在多模态能力整合,视觉理解/深度思考/基础语言模型三合一(1.6-thinkin...

阅读:7 评论:0