文| 杨柳 6月30日,国产GPU芯片公司摩尔线程和沐曦的科创板IPO申请,正式获上海证券交易所受理,分别拟募资80亿元和39.04亿元。 这意味着摩尔线程和沐曦在推进IPO进程中已领先一步。目前有四家头部AI芯片厂商冲击IPO,其余两家燧原科技、壁仞科技仍未结束上市辅导。 关键财务指标来看,摩尔线程和沐曦两家公司虽然营收增速快,但目前均未实现盈利。经营前...
克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 猫猫再立新功,这次竟然是拯救了人类的科研进程? 事情是酱婶儿的: 小红书上有人发帖说,自己通过以“猫猫”的安全相威胁,成功治好了AI胡编乱造参考文献的毛病。 据博主所述,掌握了猫猫命运的AI(Gemini),真的找到了真实的文献,还不忘解释说猫猫绝对安全。 这篇戳中无数科研人痛点的帖子,获得了400...
浙大APRIL实验室团队 投稿 量子位 | 公众号 QbitAI 为什么AI生成的视频总是模糊卡顿?为什么细节纹理经不起放大?为什么动作描述总与画面错位? 其中一个重要原因在于,现有的开源千万级视频数据集分辨率基本低于1080P(1920×1080),且大部分视频的说明(caption)简单粗糙,不利于大模型学习。 当主流视频生成模型还在720P画质挣扎...
随着人工智能正在重塑从教育到国防的方方面面,数字主权已不再是一个长期的愿景,而是一个迫在眉睫的现实需求。 为了确保各国能够对影响其社会的人工智能系统进行治理、审核和建设,开源人工智能正成为实现自主可控、激发本土创新、重建公众信任的关键支柱。 什么是数字主权? 数字主权是指一个国家或地区具备能力,依据自身的法律、价值观和战略利益,独立地治理、控制和保护其数字基...
在数字化时代,文档处理和信息提取的需求日益增长。传统的OCR技术虽然能够识别文档中的文本,但在处理复杂文档时往往存在局限性。Nanonets-OCR-s 作为一款先进的图像到 Markdown 的 OCR 模型,不仅能够提取文本,还能将文档转换为结构化的 Markdown 格式,并具备多种智能功能 一、Nanonets-OCR-s 概述 Nanonets...
最近关于 DeepSeek-R2 的讨论很热。 我翻了一下,最初的信息源应该是科技媒体 The Information 于 6 月 26 日发表的一篇题为《DeepSeek’s Progress Stalled by U.S. Export Controls》的文章,其中指出 DeepSeek 内部的 R2 模型开发遇到了两个关键瓶颈:一是 CEO 梁文锋对...
“ 大模型应用提示词是核心,但智能体中大模型是核心,大模型会接收用户输入和工具调用结果,同样也会返回思考过程和调用参数。” ReAct Agent基于思考-行动-观察的智能体,简单来说就是让智能体有更强的规划和逻辑推理能力,并且能够依靠自身去解决问题。 在前面的几篇文章中介绍了关于智能体的内容,以及大模型与提示词之间的关系;而今天我们再来仔细分析一下智能...
2024年是大模型从“会聊天”走向“能干活”的关键一年。从AutoGPT、BabyAGI掀起热潮,到微软AutoGen落地企业场景,再到清华智源的AgentVerse大模型评测体系,一个共识逐渐浮出水面:Agent的核心能力,不在“回答”,而在“拆解”。 无论是数据分析、代码生成,还是复杂流程自动化,想让大模型从“对话者”变成“行动者”,第一步就是——把复...
老刘说NLP技术社区,自建立以来,旨在以公正、客观的角度,围绕大模型&RAG&文档智能&知识图谱四个方向,展开每日早报、社区讨论、月度不定时分享、月度备份、专题整理等多种形式,以期达到一个较好的技术分享。 一起共创,共同地提升老刘说NLP的价值感和技术深度感,将是一件十分有意义的事儿,我们正在朝这个方向...
今天是2025年7月1日,星期二,北京,晴 今天是2025年下半年的第一天,新的起点,我们继续看技术。 从评估角度看多模态RAG中的文档信息增强,逐步整合跨模态输入(文本、图像、字幕、OCR)后对应的相应影响,虽然说,这种范式看起来像是去年的,但温故而知新。 另外,来看看一个问题,关于dify是否应该被抛弃的一些思考?还是要分具体使用场景去看。 一、从评估角...