新智元报道 编辑:编辑部 【新智元导读】就在刚刚,Ilya出现了!他大义凛然发文,自封为SSI唯一CEO,而Daniel Levy将担任总裁。要实现SSI的梦想,多少钱都不卖。 小扎到处挖人的举动,不仅是惹恼了奥特曼,连Ilya都忍无可忍,被炸出来了! 就在刚刚,消失许久的Ilya忽然现身X。 他发文表示,自己已亲自挂帅「安全超级智能」(SSI)的...
时令 发自 凹非寺 量子位 | 公众号 QbitAI 当我们读到“苹果”“香蕉”“西瓜”这些词,虽然颜色不同、形状不同、味道也不同,但仍会下意识地归为“水果”。 哪怕是第一次见到“火龙果”这个词,也能凭借语义线索判断它大概也是一种水果。 这种能力被称为语义压缩,它让我们能够高效地组织知识、迅速地对世界进行分类。 那问题来了:大型语言模型(LLM)虽然语言能力...
VScan团队 投稿 量子位 | 公众号 QbitAI 多图像、长视频、细粒度感知正在让大型视觉语言模型(LVLM)变得越来越聪明,但也越来越“吃不消”: 视觉Token数量的激增所带来的推理成本暴涨,正逐渐成为多模态智能扩展的最大算力瓶颈。 为解决这个问题,腾讯AI Lab联合CMU提出全新解决方案VScan。 该方法聚焦于大规模视觉语言模型推理阶段的效率...
文| 樊文扬 7月3日,2025全球数字经济大会“人工智能融合应用发展论坛”在北京举行,来自产业界的众多专家就AI技术创新如何有效支撑行业场景需求,打通从技术突破到大规模应用的路径展开探讨。会上,针对市场上广为流传的具身智能领域新秀自变量机器人“不做本体产品”的说法,自变量机器人创始人兼CEO王潜表示,其自研的轮式底盘双臂人形机器人将在今年第三季度发布。 ...
mcpsvr:一个社区驱动的MCP服务器目录平台,帮助开发者发现和分享优秀的MCP服务器。亮点:1. 提供集中化的服务器配置库,方便开发者提交和管理;2. 支持多种运行环境和参数配置,灵活满足不同需求;3. 界面友好,支持多语言文档和交互式参数提取。 参考文献: [1] http://github.com/nanbingxyz/mcpsvr [2] ht...
Open Deep Research:AI驱动的研究报告生成器。问问题,得全面答案。亮点:1. 利用Together.ai生成研究计划和搜索查询;2. 迭代式网络搜索,智能判断是否需要进一步研究;3. 自动生成包含来源和封面图像的综合报告。 参考文献: [1] http://github.com/Nutlope/open-deep-research [2...
Spegel:用AI将网页转换为终端优化的Markdown,让你在终端中畅享阅读。亮点:1. 自动将网页重写为适合终端查看的格式;2. 支持自定义配置文件,可调整视图和提示;3. 简洁的命令行界面,快速浏览网页。 参考文献: [1] http://github.com/simedw/spegel 知识星球:Dify源码剖析及答疑,Dify扩展系统源...
OpenMusic:前沿的文本到音乐生成项目,让音乐创作变得轻而易举。亮点:1. 零样本长音乐生成,无需额外训练即可创作无限时长音乐;2. 支持多种训练策略,满足不同需求;3. 提供详细的训练和推理教程,新手也能快速上手。 参考文献: [1] http://github.com/ivcylc/OpenMusic 知识星球:Dify源码剖析及答疑,Di...
egressLM:让文本回归分析变得简单高效。它能从文本中直接预测数值,比如从系统状态文本预测性能指标。亮点:1. 支持预训练和微调,适配多种回归任务;2. 可处理长文本输入,最大长度达2048;3. 基于PyTorch,易于扩展和集成。 参考文献: [1] http://github.com/google-deepmind/regress-lm ...
Embodied-World-Models-Survey:一份关于如何通过物理模拟器和世界模型学习具身智能的全面调研。亮点:1. 提出从IR-L0到IR-L4的智能机器人分级模型;2. 涵盖机器人运动、灵巧性与交互的多种技术;3. 对比主流模拟器和世界模型的架构与应用场景。 参考文献: [1] http://github.com/NJU3DV-Loon...