安爸-超级家庭
bg
avatar

安爸

超越OpenAI、拿下全球双料第一,“AI吴彦祖”背后大模型SOTA了!

明敏 发自 凹非寺 量子位 | 公众号 QbitAI 超越OpenAI! 国产大模型突袭,AI语音生成天花板被重新定义了。 MiniMax最新发布Speech-02,同时拿下Artificial Analysis Speech Arena和Hugging Face TTS Arena两项全球权威语音基准测评第一! 而且还是榜单前十名中唯一的国产玩家。 要知道...

阅读:9 评论:0

ChatGPT的记忆机制被公开了

鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI ChatGPT新版记忆功能居然被民间大佬逆向工程了! 能引用历史记录,甚至还能悄悄藏个人资料? 最近OpenAI推出了一项名为聊天历史记录的额外记忆功能,允许ChatGPT引用历史对话以进行个性化交互。 相较于原有的保存记忆功能,新功能更私人、更懂你。 相关功能默认关闭,需要用户自行在“设置->...

阅读:8 评论:0

GPT-4V仅达Level-2?全球首个多模态通才段位排行榜发布,General-Level打造多模态通用AI评测新范式

General-Level团队 投稿 量子位 | 公众号 QbitAI 多模态大模型(Multimodal Large Language Models, MLLM)正迅速崛起,从只能理解单一模态,到如今可以同时理解和生成图像、文本、音频甚至视频等多种模态。 在“如何全面客观地评测多模态大模型”这一问题的回答上,过去常用的多模态大模型评测方法是堆砌多个任务的成...

阅读:8 评论:0

创新性自动化 AI 工具-终结者机器人

Terminator 🤖 终结者机器人 Terminator 是最快的AI优先计算机操作SDK。它采用类似Playwright的API与Windows原生GUI应用交互,如同解析网页一般。通过操作系统级无障碍API,相比基于视觉的方案,Terminator为AI智能体提供了显著更快、更可靠的交互能力,并能操作后台应用程序。 ⚠️ 实验性警告 ⚠️:Term...

阅读:8 评论:0

超低延迟的端到端语音模型!首次生成音频仅需53ms,比同级别模型快3-5倍!

随着语音助手、有声交互、AI 角色配音等场景的普及,语音大模型也正在面临一个核心瓶颈:响应速度太慢,难以实时交互。 今天为大家介绍一款由 VITA 团队开源的端到端语音模型:VITA-Audio,可以带来前所未有的超低延迟体验,让语音生成进入毫秒级响应时代! 一个7B参数的端到端语音模型,首次生成音频仅需53毫秒,速度比同级别模型快3-5倍! 它完全开源,...

阅读:8 评论:0

Graphiti 为 AI 代理构建具有时间感知的知识图谱

Graphiti 是一个用于构建和查询时序感知知识图谱的框架,专为在动态环境中运行的 AI 代理量身定制。与传统的检索增强生成 (RAG) 方法不同,Graphiti 持续将用户交互、结构化和非结构化企业数据以及外部信息集成到一个连贯且可查询的图中。该框架支持增量数据更新、高效检索和精确的历史查询,无需完全重新计算图谱,因此非常适合开发交互式、情境感知的 A...

阅读:8 评论:0

Qwen3 的社区魔改:Qwen3-30B-A6B-16-Extreme

通过修改模型参数,把激活专家增加了一倍,于是A3B就变成A6B了。作者测试质量会有小提升。当然由于激活量变大生成速度会变慢。不过总体激活仍然是6B这种小规模还好。 当然,其实不用下载这个模型,自己修改 llama.cpp 的运行参数也行,只需要:–override-kv qwen3moe.expert_used_count=int:24 当然也可以反向操作,...

阅读:9 评论:0

吴恩达跟 Anthropic 官方合作的关于 MCP 的新课

吴恩达跟 Anthropic 官方合作的关于 MCP 的新课。 了解 MCP 的内部工作原理 如何构建自己的服务器 如何在本地或远程将其连接到由 Claude 提供支持的应用程序。 参考文献: [1] 课程地址:https://deeplearning.ai/short-courses/mcp-build-rich-context-ai-apps-w...

阅读:8 评论:0

本地RAG系统:Local Chat RAG,可以用来构建企业内部知识库等

本地RAG系统:Local Chat RAG,可以用来构建企业内部知识库等,对数据安全要求比较高的场景。问答带来源,可以看到答案来自哪些文档以及文档哪部分。 参考文献: [1] github:https://github.com/TAMustafa/Local\_Chat\_RAG 知识星球服务内容:Dify源码剖析及答疑,Dify对话系统源码,N...

阅读:10 评论:0

刚刚!梁文锋参与发表回顾性论文:DeepSeek首次揭秘V3模型背后扩展方案

DeepSeek刚刚发表了一篇名为《深入解读 DeepSeek-V3:AI 架构的扩展挑战与硬件思考》(Insights into DeepSeek-V3: Scaling Challenges and Reflections on Hardware for AI Architectures)的回顾性论文,梁文锋也是作者之一。这篇论文深入剖析了最新的大模型...

阅读:9 评论:0