安爸 - 安爸-超级家庭

AI信息差 2025-06-12

Image Caption复兴宣言！南大港大CapArena重塑「详细图像描述」评测体系

图像描述（Image Captioning）是多模态学习中基础且重要的任务，随着 LLM 时代模型的发展，现代的视觉语言模型可以生成详细而全面的描述。然而，由于评测的主观性和困难，当前的视觉语言评测往往只关注 VQA、推理等任务，忽略了对...

安爸

16 0

AI信息差 2025-06-12

视频理解“隐秘的角落”：多任务视频文本理解评测新基准VidText发布

视频理解是通往 AGI 的必要路径。当前视频理解的探索主要集中于视频事件内容，人物动作，关系等。然而，嵌入视频中的可视文字却往往被忽略。从视频字幕到场景文字（街头招牌，道路指示牌），这些视频文本对于推理视频的内容，人物行为等提供了重要线索...

安爸

18 0

AI信息差 2025-06-12

喝点VC｜a16z谈搜索大变局：搜索迈入由语言模型主导的“生成式引擎优化（GEO）”全新范式

图片来源：a16z Z Highlights 搜索行为从传统浏览器向大型语言模型（LLM）平台迁移，价值超800亿美元的SEO市场根基已现裂痕，搜索迈入由语言模型主导的“生成式引擎优化（GEO）”全新范式。曝光定义从“搜索结果页排名”...

安爸

20 0

AI信息差 2025-06-12

CVPR 2025 多模态统一学习新范式来了，数据、模型、代码全部开源

本文第一作者杜恒辉为中国人民大学二年级硕士生，主要研究方向为多模态大模型视听场景理解与推理，长视频理解等，师从胡迪副教授。作者来自于中国人民大学，清华大学和北京腾讯 PCG AI 技术中心。我们人类生活在一个充满视觉和音频信息的世界中，...

安爸

18 0

AI信息差 2025-06-12

速递｜OpenAI急筹400亿美元弹药，沙特PIF、印度信实或成关键金主

图片来源：Unsplash 据知情人士透露，OpenAI 已与沙特公共投资基金、印度信实工业集团及现有股东阿联酋 MGX，就参与由软银主导的 400 亿美元新一轮融资进行商谈。这些投资者每家可能至少投入数亿美元。 • 本轮融资总额40...

安爸

22 0

AI信息差 2025-06-12

小扎砸 9 位数挖 AI 大神、杨立昆发布世界模型，被群嘲的开源旧王要反击了

Llama 4 的折戟沉沙没有让 Meta 知难而退，反而坚定了 All In AI 的决心。最近，创始人扎克伯格亲自操刀组建「超级智能」团队，重金投资 Scale AI、以及砸 9 位数挖角 Google、OpenAI 的顶级科学家，也...

安爸

17 0

AI信息差 2025-06-12

速递｜火山引擎Force大会：豆包大模型1.6全球创新“区间定价”，火山引擎全力打造“AI云”

图片来源：火山引擎发布会字节跳动旗下火山引擎，于6月11日举办Force原动力大会，本次大会正式发布了豆包大模型1.6、视频生成模型Seedance 1.0 Pro等新模型，同时升级了AI Agent开发平台等云原生服务。 Z High...

安爸

19 0

AI信息差 2025-06-12

被“网暴”两个月后，Yann LeCun 携最新世界模型杀回！小扎千万美元激励抢人，Meta AI 内部权利之争开始

整理 | 华卫昨日，Meta 推出了其新的“世界模型”V-JEPA 2，旨在实现物理世界中顶尖的视觉理解与预测能力，以提升 AI 主体的物理推理能力。对于构建能在物理世界中运作的 AI 智能体和实现高级机器智能（AMI）的工作而言，物理...

安爸

21 0

AI信息差 2025-06-12

长文本推理 5 倍提速！面壁MiniCPM4 端侧模型发布，0.5B模型效果秒杀同级

整理 | 华卫近日，新一代“面壁小钢炮” MiniCPM4.0 端侧模型发布，拥有 8B 、0.5B 两种参数规模。一款 8B 稀疏闪电版，带来端侧性能大跃升；一款 0.5B “以小博大”，适配广泛终端场景。模型相关链接 Gi...

安爸

16 0

AI信息差 2025-06-12

豆包新版大模型降价超六成，可自主订酒店

6月11日，字节跳动旗下云业务平台火山引擎发布豆包大模型1.6，依据模型调用的上下文长度（即模型能处理的对话记忆范围），首度推行区间梯度定价策略。其中，最低价格区间的模型调用综合成本，相较4月中旬推出的豆包1.5深度思考模型下降63%，公...

安爸

18 0

安爸 的文章

安爸的文章