文章转载自「量子位」。 新国产AI视频生成模型横空出世,一夜间全网刷屏。 Magi-1,首个实现顶级画质输出的自回归视频生成模型,模型权重、代码100%开源。 整整61页的技术报告中还详细介绍了创新的注意力改进和推理基础设施设计,给人一种视频版DeepSeek的感觉。 Magi-1将视频生成卷到了新高度,大片级品质直接锁住大家的眼球。 其主打能力,一是无...
该研究成果由北京大学和加州大学洛杉矶分校共同完成。第一作者蔡少斐为北京大学三年级博士生,通讯作者为北京大学助理教授梁一韬。该工作基于 MineStudio 开源项目,一个全流程简化版 Minecraft AI Agent 开发包,相关代码均已在 GitHub 上开源。 在 Minecraft 里能打怪、建房、探险的 AI 已经够厉害了,但你见过能一跳跨进另...
梦晨 西风 发自 凹非寺 量子位 | 公众号 QbitAI 新国产AI视频生成模型横空出世,一夜间全网刷屏。 Magi-1,首个实现顶级画质输出的自回归视频生成模型,模型权重、代码100%开源。 整整61页的技术报告中还详细介绍了创新的注意力改进和推理基础设施设计,给人一种视频版DeepSeek的感觉。 Magi-1将视频生成卷到了新高度,大片级品质直...
用户仅仅通过输入文字,就能生成一个3D世界。 文| 王毓婵** 编辑 | 苏建勋 一句话介绍 NYXverse是针对Z世代用户的AIGC内容平台,支持用户以“文生3D”的方式,创作“AI Agent+环境+情节+时间”的3D世界。 团队介绍 马宇驰(CEO):2033科技创始人兼CEO,人工智能领域连续创业者,经历O2O、人工智能、出海三大...
TIPS 1、下载 IT桔子 APP,实时跟踪国内外一级市场投融资事件。 2、转载请注明来源自 IT 桔子(itjuzi521),侵权必究。 3、建立“投资速递”长期发布合作,请发邮件到 hello@itjuzi.com。 2025 年 4 月 21 日 IT 桔子(itjuzi521) 收录 27 起投资/IPO排队事件 奥朋医疗宣布完成近亿元人民币C轮融...
随着人工智能技术的飞速发展,大型语言模型(LLMs)在各个领域展现出了强大的潜力。然而,在医学领域,由于其对准确性和可靠性的极高要求,如何让LLMs具备精准的医学推理能力成为了一个亟待解决的问题。MedReason项目的出现,为这一挑战提供了一个创新的解决方案。它通过结合知识图谱和链式推理(Chain-of-Thought, CoT),显著提升了LLMs在...
还没缓过神来,马斯克的 Grok 又整了个新活儿。 4 月 16 日,xAI 静悄悄上线了一个新功能 —— Grok Studio。 和上周的 Grok Workspace 一样,Grok Studio 的发布也没有大张旗鼓,只有一个简单的「帖子」。 Grok Studio 可以理解成一个“AI + Docs + IDE”的混合体,也可以说是马斯克版的 C...
“ 敢于尝试是一个好的开始,中间可能会存在各种各样的问题和困难,但只要用心思考,一定能找到合适的解决方案。” 从事人工智能领域方面的技术开发与应用已经差不多有两年左右的时间了,作者也从一个对人工智能什么都不懂的小白勉强进阶成为对人工智能行业有了初步了解的初级开发人员。 因此,从今天开始作者希望从一个纯粹的技术人员,向一个能够提供完整行业解决方案的项目人员...
在构建 RAG(检索增强生成)系统时,光有文档远远不够,一份结构清晰、可被理解的知识库才是模型“打怪升级”的关键。很多解析方案只是简单提取文字,忽略了段落、标题、表格、图表等结构信息,导致内容碎片化、上下文丢失,检索结果不准、回答效果不佳。 最终喂给大模型的是一堆“看不懂”的无结构输入,Attention 无法聚焦重点,RAG 效果自然大打折扣。如果你也遇到...
今天是2025年4月22日,星期二,北京,晴。 关于RAG切分,已经有很多的方案了,我们也说过很多文档解析的方案,例如基于文档布局分析,将文档解析成段落、标题、图片等等block。可以以这些block作为一个单位做切分。 但随着大模型的上下文越来越大,可能不需要切的这么细,可以直接作为目录进行索引,那么问题就来了,如何进行目录生成?我们来看一个实现方案。 然...