安爸-超级家庭
bg
avatar

安爸

上海AI实验室造出首个「通才」机器人大脑:看懂世界+空间推理+精准操控全拿下

VeBrain团队 投稿 量子位 | 公众号 QbitAI 机器人的新大脑框架来了! 上海人工智能实验室联合多家单位提出了一种全新的通用具身智能大脑框架:Visual Embodied Brain,简称VeBrain。 该模型通过同时集成视觉感知、空间推理和机器人控制能力,可实现多模态大模型(MLLM)对物理实体的直接操控,使机器人能像人类一样“看到-思考-...

阅读:8 评论:0

SmolVLA: 让机器人更懂 “看听说做” 的轻量化解决方案

🧭 TL;DR 今天,我们希望向大家介绍一个新的模型: SmolVLA,这是一个轻量级 (450M 参数) 的开源视觉 – 语言 – 动作 (VLA) 模型,专为机器人领域设计,并且可以在消费级硬件上运行。 SmolVLAhttps://hf.co/lerobot/smolvla_base 仅使用开源社区共享的数据集进行预训练,数据集标签为lerobot。...

阅读:7 评论:0

Matrix-Game:昆仑万维开源的170亿参数交互式世界模型,一键生成逼真虚拟世界!

在人工智能飞速发展的今天,虚拟世界与现实世界的融合愈发紧密。昆仑万维开源的Matrix-Game项目,作为工业界首个10B+空间智能大模型,凭借其强大的交互式视频生成能力,为虚拟游戏、影视制作以及元宇宙等领域带来了全新的技术突破。 一、项目概述 Matrix-Game是由昆仑万维开源的工业界首个17B参数交互式世界基础模型,专注于可控游戏世界的生成。该项...

阅读:8 评论:0

1 美元薅 ChatGPT 羊毛!5 个席位,人均不到 2 块,速冲!附保姆级教程

话接上文:OpenAI 凌晨放大招:ChatGPT 接入公司内网,打工人的 AI 助理真来了! ChatGPT 今天更新了,详情看上面那篇文章。 随着更新一起的,还有一个小彩蛋:OpenAI 静悄悄地给 ChatGPT Team 放出了个新优惠,首月 1 美元,最多支持 5 个席位的 Team 会员。 算下来,人均一块四人民币。 良心的都不像是那个我们熟悉...

阅读:9 评论:0

OpenAI 凌晨放大招:ChatGPT 接入公司内网,打工人的 AI 助理真来了!

就在刚刚,OpenAI 煞有介事地开了一场不太“悄悄”的直播,一口气扔出了几个对企业用户非常关键的更新。 简单说,他们现在开始认真搞“企业 AI 助手”这件事了,而且搞得还挺聪明的。 01|ChatGPT 开始懂你的工作了? 我们都知道,早期 ChatGPT 的回答大多数是基于公开互联网知识或预训练语料 —— 对个人用户还算可以,但对企业来说,最大的问题是...

阅读:9 评论:0

关于智能体开发过程中的概念普及——MAS,SAS和workflow工作流

“ 智能体开发是一项复杂的系统工程,用户需要根据自己的需求选择合适的架构。” 智能体开发是一项复杂的系统性工程,因此在开发过程中存在各种各样的问题,因此我们今天主要来普及一下关于智能体的几个概念: MAS——Multi Agent System 多智能体系统 SAS——Single Agent System 单智能体系统 workflow工作流 从功能上...

阅读:7 评论:0

DeepSeek彻底炸了!

我一直觉得2025是副业爆发的元年 有2点逻辑支撑 1、2024裁员潮,不光是上班族难,公司也难,不是公司不需要那么多岗位了,而是有些公司根本没必须存在了! 去年团队准备解散的公司暴增1000% 2、赚钱多元化,现在赚钱完全没必要非要找个班上了,发几个视频,写几篇文章奔小康的多的是! 为了大家2025更好的实现副业创收 我把我2024测试的最赚钱的项目分享给...

阅读:8 评论:0

RAG的有趣新尝试:将文本编码进MP4文件实现思路及Agentic-doc处理文档

今天是2025年6月5日,星期四,北京,晴 我们继续来看一些有趣的数据和新发现。 一个是将文本编码进MP4文件的有趣RAG尝试,思路很有趣,看看怎么做的。 另一个是Agentic-doc,用agent来做个文档处理。 都是很有趣的工作。 二、将文本编码进MP4文件的有趣RAG尝试 关于语义搜索进展,来一个很有趣的工作,Memvid,直接将文本数据编码成视频文...

阅读:7 评论:0

深创投集团领投一家人形机器人研发商 投资速递

TIPS 1、下载 IT桔子 APP,实时跟踪国内外一级市场投融资事件。 2、转载请注明来源自 IT 桔子(itjuzi521),侵权必究。 3、建立“投资速递”长期发布合作,请发邮件到 hello@itjuzi.com。 2025 年 6 月 4 日 IT 桔子(itjuzi521) 收录 22 起投资/IPO排队事件 加速进化获得数千万元A轮融资,由深创...

阅读:8 评论:0

颠覆传统向量数据库,直接将文本数据编码成视频文件,轻量级革命性的大规模AI记忆解决方案Memvid

项目简介 Memvid通过将文本数据编码为视频,彻底改变了AI记忆管理,实现了百万级文本块的闪电般语义搜索和亚秒级检索速度。与传统向量数据库消耗大量内存和存储不同,Memvid将知识库压缩为紧凑的视频文件,同时保持对任何信息的即时访问。 🎥 演示 https://github.com/user-attachments/assets/ec550e93-e9c4...

阅读:9 评论:0