今天是2025年7月22日,星期二,北京,晴。 多模态长文生成的一个思路,重点是怎么做图文的插图,以及细粒度的引用,所以,看一个工作。 核心还是要梳理清楚逻辑,多思考,多借鉴。 多模态长文写作的一个思路DeepWriter 最近看到一个工作,用多模态做长文写作的一个工作,《DeepWriter: A Fact-Grounded Multimodal Writ...
MCP MongoDB Server是一个基于Model Context Protocol(模型上下文协议)的服务器,它允许语言模型(LLM)与MongoDB数据库进行交互。通过标准化的接口,MCP MongoDB Server提供了检查集合模式和执行MongoDB操作的能力。无论是查询文档、执行聚合管道,还是创建索引,MCP MongoDB Server...
**关注我,记得标星不迷路哦~ 1: ConvertX Grok AI 智能命令行助理 Grok CLI是一款由Grok-3驱动的会话式AI命令行工具,它使用户能够通过自然语言与系统进行智能交互,以实现文件操作(如查看、创建、编辑)和执行Shell命令。该工具的核心功能在于其AI能自动识别并选择合适的工具来响应用户请求,同时提供一个交互式的终端用户界...
项目简介 一个基于 React Native TVOS 和 Expo 构建的跨平台电视应用,旨在提供流畅的视频观看体验。项目包含一个用于数据服务的 Express 后端。 功能特性 跨平台支持: 同时支持 Apple TV 和 Android TV。 现代化前端: 使用 Expo、React Native TVOS 和 TypeScript 构建,性能卓...
简介 AI时代的资讯管理工具。Revornix可以帮助你便捷整合所有可见资讯,并在特定时间给你一份完整的报告。 功能特性 跨平台可用:当前支持网页端,后续将会支持iOS端APP和微信小程序。 一站资讯收集:一站式资讯收集,包括新闻、博客、论坛等。 文档转化&向量化存储:基于多模态大模型,将文件转化为Markdown,经过Embedding后存入行...
最近Kimi k2在huggingface屠榜,以至于很多优秀的模型被忽视了。 今天huggingface排名第15的是字节跳动的Seed X(看起来创作团队是高达爱好者)。 这个模型只有7B,意味着消费级显卡(约14G显存占用)就可以跑起来。 在机器翻译领域,如何在保证高质量的同时兼顾模型规模与推理效率一直是研究与工程应用的两难选择。 近日,字节跳动团队...
henry 发自 凹非寺 量子位 | 公众号 QbitAI 程序员越来越离不开的Coding Agent,还是闯!大!祸!了—— 这回,直接搞出了删库事故。 好消息(?)是,没跑路。 坏消息是,明明闯祸了还假装一切正常,并且反手就给自己闯的祸打95分。 AI:是的,删了你的库,我很慌,如何呢? 我再也不相信Vibe coding了 这位数据库被清空的“倒...
新智元报道 编辑:KingHZ 【新智元导读】从病历、口味偏好到不堪回首的往事,AI正悄悄建立你的数字人格档案。但你真准备好让AI永远记住你的每一句话?AI算法背后,不止有温柔,还有社死和残酷。 今年4月,OpenAI发布了ChatGPT的「记忆」功能: 此后,ChatGPT的记忆功能正在全面升级,不仅更智能、更自然,甚至免费用户也能享受。它能记...
来源:Semianalysis Z Highlights: 在人工智能的世界里,唯一重要的就是计算。与DeepSeek一样,Anthropic也受到计算能力的限制。Anthropic的产品开发专注于代码,并在Cursor等编程应用中获得了广泛的采用。 Token经济学的这一方面表明,提供商正在多维度改进模型。这不仅是为了提高智能化程度,也是为了提升每个t...
图片来源:techcrunch Figma 创始人 Dylan Field 将在 IPO 中套现约 6000 万美元,Index、Kleiner、Greylock 和红杉资本也将同步减持。 当 Figma 于周一公布其首次预期的价格区间 (25-28 美元) 时,同时也披露了这场备受期待的 IPO 中一个不寻常的决定。 该公司将允许现有股东以远高于公...