VARGPT团队 投稿 量子位 | 公众号 QbitAI 最近Google的Gemini Flash和OpenAI的GPT-4o等先进模型又一次推动了AI浪潮。这些模型通过整合文本、图像、音频等多种数据形式,实现了更为自然和高效的生成和交互。 北京大学团队继VARGPT实现视觉理解与生成任务统一之后,再度推出了VARGPT-v1.1版本。 该版本进一步提升了...
**关注我,记得标星不迷路哦~ 1: Index Index是开源浏览器代理,利用Claude 3.7 Sonnet自主执行复杂的网络任务,提供API和UI,并支持观测性。 Index 是一个开源的、最先进的浏览器代理,它能自主执行网络上的复杂任务。它由 Claude 3.7 Sonnet 模型驱动,未来将支持更多模型。Index 旨在通过模拟人类在浏览...
项目简介 BiliNote 是一个开源的 AI 视频笔记助手,支持通过哔哩哔哩、YouTube 等视频链接,自动提取内容并生成结构清晰、重点明确的 Markdown 格式笔记。支持插入截图、原片跳转等功能。 功能特性 支持多平台:Bilibili、YouTube(后续会加入更多平台) 本地模型音频转写(支持 Fast-Whisper) GPT 大模型总结...
项目简介 用于将 FastAPI 应用端点自动转换为 MCP 的开源工具,无需复杂配置,它通过直接集成 FastAPI 应用,自动发现所有端点并保留其请求/响应模型和文档,方便开发者快速部署 MCP 服务 核心功能 无缝集成: 将 MCP 服务直接挂载到 FastAPI 应用,或独立部署 零配置: 自动识别 FastAPI 端点并转为 MCP 工具 保留文...
今天推荐一个欧美风情的真实风格Flux模型。 作者称: 基于flux1-dev-fp8模型。这只是一个合并,因为我合并了一些我喜欢的Lora以使其更逼真。和我的所有模型一样,目标是实现最佳的写实效果。如果它还能在其他方面表现出色,那自然是额外的收获。在我进一步了解FLUX并看看是否有可能实现真正的合并之前,这已经是一个不错的起点了。我不确定它与所有软件的兼...
阿里在AI的应用上又抢先一步,这次是东南亚电商平台Lazada。国际权威调研机构凯度Kantar日前发布的一份东南亚电商AI报告显示,整体东南亚商家的AI工具应用率不足37%,但Lazada商家的应用率远高于此,报告指出,67%的Lazada商家认为AI工具显著刺激了生意增长。Lazada已经成东南亚电商AI领军人。 凯度对印尼、马来西亚、菲律宾、新加坡、泰...
新智元报道 编辑:桃子 好困 【新智元导读】ICLR 2025时间检验奖重磅揭晓!Yoshua Bengio与华人科学家Jimmy Ba分别领衔的两篇十年前论文摘得冠军与亚军。一个是Adam优化器,另一个注意力机制,彻底重塑深度学习的未来。 刚刚,ICLR 2025时间检验奖公布! 斩获大奖的是,xAI工程师、Hinton高徒Jimmy Ba发表的...
4月15日消息,钛媒体AGI获悉,据中国证监会网站,北京智谱华章科技股份有限公司(智谱AI)公布IPO上市辅导备案报告,辅导机构为中国国际金融股份有限公司(中金公司)。 根据辅导备案报告,本次智谱AI辅导前期准备工作于2025年4月启动,正式辅导期第二阶段在2025年8月到2025 年10月。这意味着,智谱AI最快将在2025年底前向上交所或港交所提交IP...
一水 发自 凹非寺 量子位 | 公众号 QbitAI 神奇!人类和海豚真的能实现跨物种交流了?! 当地时间4月14日(也是世界海豚日),谷歌CEO皮猜激动官宣: 隆重推出DolphinGemma,基于多年积累的海豚声音数据训练而成,有助于实现跨物种交流。 划重点,这个海豚模型参数仅400M,小到能直接在谷歌Pixel 9手机上运行。 而且皮猜还说了,...