Scene Splatter团队 投稿 量子位 | 公众号 QbitAI 三维场景是构建世界模型、具身智能等前沿科技的关键环节之一。 尽管Hunyuan3D、Rodin-v1.5、Tripo-v2.5等生成模型已在三维生成领域取得显著进展,但其往往聚焦在物体级别内容生成,难以实现复杂三维场景的构建。 清华大学联合腾讯提出Scene Splatter——从一张...
作者|AICon 全球人工智能开发与应用大会 审校|罗燕珊 硅基流动已完成数亿元人民币 A 轮融资。本轮融资由阿里云领投,老股东创新工场等机构超额跟投,华兴资本担任独家财务顾问。 硅基流动创始人袁进辉表示:“作为深耕 AI 基础设施领域多年的专业选手,硅基流动通过持续的技术突破和产品创新有效解决了国内 AI 行业发展的多个重大问题。今年以来,随着阿里巴巴通...
克雷西 发自 凹非寺 量子位 | 公众号 QbitAI AMD大招逆袭,最强AI芯片号称大模型推理比英伟达B200快30%! CEO苏姿丰与OpenAI奥特曼共同登台发布。 这次AMD发布了MI350X和MI355X两款GPU,采用3nm工艺,包含1850亿晶体管,配备HBM3E内存。 相比前代的MI300X,MI350系列的算力提升了4倍,推理速度快了35...
在人工智能的浪潮中,多模态交互和深度学习正成为新的风口。尤其是在视觉与语言融合领域,如何让模型更好地理解和生成视觉丰富信息,一直是研究的热点和难点。如今,阿里巴巴通义大模型团队带来了他们的“秘密武器”——VRAG-RL,一个视觉感知驱动的多模态RAG推理框架,为视觉信息理解与生成带来了全新的思路和突破!今天,就让我们一起揭开它的神秘面纱! 一、VRAG-...
不得不说,最近 OpenAI 的更新,有点频繁。 两天前发布了 o3-pro 模型。 第一次面向 ChatGPT Team 用户开放了 o3-pro 的使用权限。 ChatGPT 里,o3 模型的使用次数翻倍。 刚刚,又推出了大改版、更加实用的 ChatGPT Projects。 01|o3-pro 对 ChatGPT Team 用户开放 之前的 o1-...
今天是2025年6月13日,星期五,北京,晴 我们先来看三种embedding编码范式,包括Bi-encoders、Cross-encoder、ColBERT三种,比较直观的可视化。 另外,还是再看一个知识图谱结合RAG的思路,其实套路还是之前的,核心还是怎么选择最相关的三元组,然后讲一些故事,例如,跟query扩展做结合? 一、先看三种embedding编...
作者|沐风 来源|AI先锋官 就在昨天上午的火山引擎Force原动力大会上,字节一下推出了一堆新玩意。 如:豆包大模型1.6、豆包视频生成模型Seedance 1.0 pro、豆包·语音播客模型,还升级了Agent开发平台等AI云原生服务。 但其中最令小编印象深刻的非视频生成模型Seedance 1.0 pro莫属。 它不仅是国内第一个拥有“多镜头叙事能力...
每日风险投资速递 TIPS 1、下载 IT桔子 APP,实时跟踪国内外一级市场投融资事件。 2、转载请注明来源自 IT 桔子(itjuzi521),侵权必究。 3、建立“投资速递”长期发布合作,请发邮件到 hello@itjuzi.com。 2025 年 6 月 12 日 IT 桔子(itjuzi521) 收录 28 起投资/IPO排队事件 可派机器人完成数...
**关注我,记得标星⭐️不迷路哦~ ✨ 1: SearchAgent-X 高效推理搜索LLM代理系统:SearchAgent-X 高效的推理-搜索交错式LLM Agent系统: SearchAgent-X是一个为大型语言模型(LLM)代理设计的,用于推理和搜索交错执行的高效系统。 性能优越: 相比于流行的LLM推理框架vLLM和基于HNSW的检索方法,...
项目介绍 一个MCP服务器,可启动多个Browser-Use代理来测试vibe-coded编码的网站,检测UI错误、失效链接、无障碍访问问题和其他技术问题。 非常适合测试线上网站和本地开发环境。 持续进行Vibecode和vibetest直到您的网站完美运行。 快速开始 # 安装依赖 uv venv source .venv/bin/activate uv ...