让AI真正理解世界,Meta又迈出了关键一步。 编译 | 云鹏 编辑 | 漠影 智东西6月12日消息,刚刚,Meta发布了最新的开源世界模型V-JEPA 2,称其在物理世界中实现了最先进的视觉理解和预测,从而提高了AI agents的物理推理能力。 Meta副总裁、首席AI科学家杨立昆(Yann LeCun)亲自发布了该模型,他在官方视频中提到...
白交 发自 凹非寺 量子位 | 公众号 QbitAI 小扎亲手挖人,很疯狂。 最新爆料,谷歌DeepMind首席研究员Jack Rae已经确认转投。 另有消息称,Meta还招募了AI语音初创公司Sesame AI的ML主管 Johan Schalkwyk。 前一天刚被爆出,他想斥巨资150亿美元收购Scale AI,后者做数据标注已经做到了百亿美元估值。据...
NFD团队 投稿 量子位 | 公众号 QbitAI 在A100上用310M模型,实现每秒超30帧自回归视频生成,同时画面还保持高质量! 视频生成现在都快这个程度了? 最近,来自微软研究院的团队与北大联合发布新框架——Next-Frame Diffusion (NFD)。 通过实现帧内并行采样,帧间自回归的方式,NFD让视频生成在保持较高生成质量的同时,生成...
AutoSchemaKG团队 投稿 量子位 | 公众号 QbitAI 知识图谱(KGs)已经可以很好地将海量的复杂信息整理成结构化的、机器可读的知识,但目前的构建方法仍需要由领域专家预先创建模式,这限制了KGs的可扩展性、适应性和领域覆盖范围。 为此,香港科技大学KnowComp实验室联合香港华为理论部提出了AutoSchemaKG:一个无需预定义模式、用于...
作者_|王兆洋 邮箱|_wangzhaoyang@pingwest.com 01 火山引擎的名字里没有云。 这件事在以前是个需要解释的事情。2020年底,字节内部的关键决策会议上,正式决定让火山引擎对外提供服务、进入真实的市场,而在这个最初的会议上,字节希望这个技术平台不只是“又一个云计算厂商”。于是干脆从名字就不带云。 在火山引擎进入这个市场的时刻,云计...
前几天,全国 1335 万考生走出了高考考场,但真正的「战场」才刚刚开始。 当这千万的家庭一同涌入志愿填报这座「信息迷宫」,你会发现,这里的硝烟味,丝毫不亚于考场。 3000 多所大学,1600 多个专业,听着就让人头大。更别提年年「上新」的招生政策,什么「专业组平行志愿」、「院校投档线差」,复杂得堪比高数题。 信息差,在这里就是赤裸裸的成本。一步选错,可...
作者_|summer 邮箱|_huangxiaoyi@pingwest.com “做电商,要小心厂二代!” 这句玩笑话,却真实地道出了“厂二代”这个群体在电商行业的杀伤力——他们拥有着作为最源头的成本优势,更懂消费趋势和互联网,能捕捉风向快速反馈到生产端,把效率拉到极致,是如今电商环境下当之无愧的黑马。 张宇(化名),就是一个典型的厂二代。 2019年,2...
在需要高质量语音合成的场景中,第三方API(如ElevenLabs)不仅成本高昂,还可能带来隐私泄露风险,而直接部署开源模型往往配置复杂。 开源TTS与自托管的兴起,可以帮助我们很好的解决这一大痛点! 一款由devnen团队开源的TTS语音服务项目:Chatterbox-TTS-Server,可以帮助绝大多数人简单、高效的运行自己的TTS语音服务。 它是基...
微软官方又出MCP课程。教程为多语言版,含中文。这是个面向初学者的 Model Context Protocol (MCP) 课程。这个开源课程提供了结构化的学习路径,配有实用的代码示例和真实案例,涵盖 C井、Java、JavaScript、TypeScript 和 Python 等主流编程语言。 无论你是 AI 开发者、系统架构师还是软件工程师,本指南都是...
Mistral 刚又发了个小模型—— Magistral-Small-2506 这是他们的首个推理模型。这是个 Mistral Small 3.1 微调的版本,增加了推理能力的疯狂RL版本。这个大小很适合单卡 32G 跑。至于分数跟 Qwen3-4B 差不多。GPQA 会高一些。但AIME甚至没有Qewn3-4B 高。 参考文献: [1] 模型地址:htt...