安爸-超级家庭
bg

AI进家庭

视觉自回归生成理解编辑大一统!北大团队多模态新突破,训练数据代码全面开源

VARGPT团队 投稿 量子位 | 公众号 QbitAI 最近Google的Gemini Flash和OpenAI的GPT-4o等先进模型又一次推动了AI浪潮。这些模型通过整合文本、图像、音频等多种数据形式,实现了更为自然和高效的生成和交互。 北京大学团队继VARGPT实现视觉理解与生成任务统一之后,再度推出了VARGPT-v1.1版本。 该版本进一步提升了...

阅读:12 评论:0

智谱开源最快大模型

今日,智谱发布新一代开源模型GLM-4-32B-0414系列,包含基座、推理、沉思模型权重,并遵循MIT License。目前系列所有模型可以通过“z.ai”访问体验。据介绍,推理模型GLM-Z1-Air/AirX-0414模型推理速度可以做到最高200 Tokens/秒(MaaS平台bigmodel.cn上实测),这也是目前国内迄今最快的商业模型,而且...

阅读:10 评论:0

Windsurf 上未来一周免费无限使用 GPT-4.1,开源高效的浏览器智能体,开源的 AI 视频笔记生成工具

**关注我,记得标星不迷路哦~ 1: Index Index是开源浏览器代理,利用Claude 3.7 Sonnet自主执行复杂的网络任务,提供API和UI,并支持观测性。 Index 是一个开源的、最先进的浏览器代理,它能自主执行网络上的复杂任务。它由 Claude 3.7 Sonnet 模型驱动,未来将支持更多模型。Index 旨在通过模拟人类在浏览...

阅读:10 评论:0

让 AI 为你的视频做笔记,AI 视频笔记生成工具BiliNote

项目简介 BiliNote 是一个开源的 AI 视频笔记助手,支持通过哔哩哔哩、YouTube 等视频链接,自动提取内容并生成结构清晰、重点明确的 Markdown 格式笔记。支持插入截图、原片跳转等功能。 功能特性 支持多平台:Bilibili、YouTube(后续会加入更多平台) 本地模型音频转写(支持 Fast-Whisper) GPT 大模型总结...

阅读:10 评论:0

将 FastAPI 应用端点自动转换为 MCP 的开源工具FastAPI-MCP

项目简介 用于将 FastAPI 应用端点自动转换为 MCP 的开源工具,无需复杂配置,它通过直接集成 FastAPI 应用,自动发现所有端点并保留其请求/响应模型和文档,方便开发者快速部署 MCP 服务 核心功能 无缝集成: 将 MCP 服务直接挂载到 FastAPI 应用,或独立部署 零配置: 自动识别 FastAPI 端点并转为 MCP 工具 保留文...

阅读:10 评论:0

造梦师手记:欧美风情

今天推荐一个欧美风情的真实风格Flux模型。 作者称: 基于flux1-dev-fp8模型。这只是一个合并,因为我合并了一些我喜欢的Lora以使其更逼真。和我的所有模型一样,目标是实现最佳的写实效果。如果它还能在其他方面表现出色,那自然是额外的收获。在我进一步了解FLUX并看看是否有可能实现真正的合并之前,这已经是一个不错的起点了。我不确定它与所有软件的兼...

阅读:10 评论:0

67% Lazada商家称AI显著促进增长,Lazada成东南亚电商AI领军人

阿里在AI的应用上又抢先一步,这次是东南亚电商平台Lazada。国际权威调研机构凯度Kantar日前发布的一份东南亚电商AI报告显示,整体东南亚商家的AI工具应用率不足37%,但Lazada商家的应用率远高于此,报告指出,67%的Lazada商家认为AI工具显著刺激了生意增长。Lazada已经成东南亚电商AI领军人。 凯度对印尼、马来西亚、菲律宾、新加坡、泰...

阅读:10 评论:0

刚刚,ICLR 2025时间检验奖颁给Adam之父!Bengio「注意力机制」摘亚军

新智元报道 编辑:桃子 好困 【新智元导读】ICLR 2025时间检验奖重磅揭晓!Yoshua Bengio与华人科学家Jimmy Ba分别领衔的两篇十年前论文摘得冠军与亚军。一个是Adam优化器,另一个注意力机制,彻底重塑深度学习的未来。 刚刚,ICLR 2025时间检验奖公布! 斩获大奖的是,xAI工程师、Hinton高徒Jimmy Ba发表的...

阅读:14 评论:0

中国第一家启动IPO的“大模型六虎”来袭!智谱融资超160亿,美国OpenAI也将IPO|

4月15日消息,钛媒体AGI获悉,据中国证监会网站,北京智谱华章科技股份有限公司(智谱AI)公布IPO上市辅导备案报告,辅导机构为中国国际金融股份有限公司(中金公司)。 根据辅导备案报告,本次智谱AI辅导前期准备工作于2025年4月启动,正式辅导期第二阶段在2025年8月到2025 年10月。这意味着,智谱AI最快将在2025年底前向上交所或港交所提交IP...

阅读:10 评论:0

海豚语言被谷歌大模型破译!跨物种交流大门打开,哈萨比斯:下一个是狗

一水 发自 凹非寺 量子位 | 公众号 QbitAI 神奇!人类和海豚真的能实现跨物种交流了?! 当地时间4月14日(也是世界海豚日),谷歌CEO皮猜激动官宣: 隆重推出DolphinGemma,基于多年积累的海豚声音数据训练而成,有助于实现跨物种交流。 划重点,这个海豚模型参数仅400M,小到能直接在谷歌Pixel 9手机上运行。 而且皮猜还说了,...

阅读:12 评论:0