安爸-超级家庭
bg

AI信息差

速递|OpenAI技术落地流媒体?Netflix澳新地区测试AI搜索,交互式搜索重塑内容发现

图片来源:Unsplash Netflix 的CEO,格雷格·彼得斯(Greg Peters)在第一季度财报电话会议上表示,公司正在构建一种新的搜索体验,利用 AI 革新搜索功能以优化内容发现。 公司表示,第一季度收入同比增长12.5%,达到 105.4 亿美元。 彼得斯表示,Netflix 正在开发“基于生成技术的交互式搜索”功能,以帮助用户发现不同...

阅读:9 评论:0

纯自回归图像生成模型开源来了,复旦联手字节seed共同捍卫自回归

SimpleAR团队 投稿 量子位 | 公众号 QbitAI 基于Transformer的自回归架构在语言建模上取得了显著成功,但在图像生成领域,扩散模型凭借强大的生成质量和可控性占据了主导地位。 虽然一些早期工作如Parti、LlamaGen,尝试用更强的视觉tokenizer和Transformer架构来提升自回归生成的效果,但他们论文中的结果表明,只...

阅读:9 评论:0

速递|Anthropic首次战略投资:Goodfire获5000万美元A轮融资,押注AI“黑箱解码”

图片来源:Anthropic 据消息透露,Anthropic 首次投资了另一家初创公司 Goodfire,投入 100 万美元。Goodfire 成立一年,致力于帮助 AI 开发者理解其 AI 模型的内部运作机制。 Goodfire 联合创始人兼CEO的 Eric Ho 表示,这笔投资是这家总部位于旧金山的初创公司在新一轮融资中筹集的 5000 万美元...

阅读:8 评论:0

刚刚,全球首位机器人马拉松冠军诞生!赛博跑姿大赏:宇树「躺平」原地起立、最稳的是它……

多年以后,面对回收站,天工 1.2max 将会回想起,它的创造者带它去参加马拉松那个遥远的清晨。 在刚刚结束的全球首场人形机器人半程马拉松比赛,第一位冲线的机器人在刚刚已经诞生:天工 1.2max,全程用时 2 小时 40 分 24 秒。 不过在这场赛事里,与其关注谁会夺冠,远不如看看这些机器人的赛博跑姿更有意思。 实际上,本次比赛也为了验证机器人在不...

阅读:8 评论:0

让DeepSeek更可靠!清华提出Hyper-RAG,用超图提升知识建模精准度

新智元报道 编辑:LRST 【新智元导读】Hyper-RAG利用超图同时捕捉原始数据中的低阶和高阶关联信息,最大限度地减少知识结构化带来的信息丢失,从而减少大型语言模型(LLM)的幻觉。 大语言模型(Large Language Models, LLMs)在面对专业领域知识问题的时候,经常会生成偏离既定事实的回复,或模糊不清的回答,从而带来了潜在应...

阅读:10 评论:0

社区供稿 | 书生·万象 3.0 升级发布,创新预训练方法

驱动科学研究的人工智能正逐渐改变科学研究的模式,在探索以通专融合实现通用人工智能 (AGI) 的进程中,通用基座大模型,尤其是具备跨模态理解能力的多模态大模型至关重要——多模态大模型的创新突破,将大幅提升模型同时处理文本、图像、视频等数据的能力,从而为科研创新提供基础性支撑。 2025 年 4 月 16 日,上海人工智能实验室 (上海AI实验室) 升级并开...

阅读:10 评论:0

30天斩获10K星!GitHub MCP Server:AI大模型时代的GitHub自动化神器

GitHub作为全球最大的代码托管平台,拥有海量的项目和活跃的开发者社区。然而,随着项目规模的扩大和复杂度的增加,手动管理GitHub上的问题、Pull Request以及仓库内容变得越来越困难。为了应对这一挑战,GitHub官方开源了GitHub MCP Server,一个基于Model Context Protocol(MCP)的服务器工具,旨在通过自...

阅读:8 评论:0

它能看图说话、会写代码、还能自己查资料?我测了测 o3,有点可怕

OpenAI 最新一波模型更新,有点猛。底蕴尤在。 4 月 16 日,OpenAI 官宣推出两款新推理模型:一个是主打高性能的 o3,一个是走轻量路线的 o4-mini。 名字平平无奇,实则大有文章。 在我看来,被 OpenAI 官方评价为“可生成有用的新科学假设”的 o3 不单纯是 o1 的升级版,而是已经进化到了另一个维度。 主要体现在 2 个方面...

阅读:8 评论:0

大模型数据预处理——关于复杂文档在大模型应用中的解决方案

“ 复杂文档的处理是人工智能应用的基础,但同时也是一个门槛。” 在这里先思考一个问题,哪种文档格式最复杂? 以我们经常使用的文档为例,不同系统下有不同格式的文档;不论是文本,图片,还是视频都有很多种格式;但要说比较复杂的还是文本类文档。 因为文本类文档中包含着多种其它格式的文档;以作者个人为例,我认为最复杂的文档就是常用的word/pdf这种格式。 原因...

阅读:10 评论:0

多模态RAG框架LAYRA及Deepresearch、ReZero强化搜索优化实现思路

今天是2025年4月19日,星期六,北京,晴。 文档多模态RAG进展,关于多模态文档RAG,我们在前两天已经讲过了,关于起必要性和一些实现方式。大多数RAG系统依赖OCR或基于文本的解析来处理文档,但这些方法存在❌失去文档布局排版(列、表格、层级结构崩溃)、❌无法处理非文本视觉元素(图表、图形、图片等)、❌OCR分割导致语义断裂等问题; 多模态RAG,通过使...

阅读:10 评论:0