01 第一个国产版通用 AI Agent 来源:扣子 4 月 19 日,字节跳动旗下 AI Agent 平台“扣子“悄然开启内测——「扣子空间(space.coze.cn)」。作为一个定位于“与 AI Agent 协同办公的最佳场所“的通用 AI Agent 平台,扣子空间致力于提升用户与 AI Agent 的协作效率,助力完成各类复杂任务。扣子空间...
朋友,你有没有对 ChatGPT 说过一句「谢谢」? 最近,一位 X 网友向 OpenAI CEO Sam Altman 提问:「我很好奇,人们在和模型互动时频繁说『请』和『谢谢』,到底会让 OpenAI 多花多少钱的电费?」 尽管没有精确的统计数据,但 Altman 还是半开玩笑地给出了一个估算——千万美元。他也顺势补了一句,这笔钱到底还是「花得值得」的。...
欢迎关注我,持续获取更多内容,感谢赞&在看\~ Python项目排行 | 10个 1. Byaidu / PDFMathTranslate 项目语言: Python Star总数: 20,607 Fork总数: 1,750 Star新增:71 stars today 项目地址: https://github.com/Byaidu/PDFMathTr...
在当今数字化信息飞速发展的时代,语音识别技术已成为人工智能领域的重要分支,广泛应用于视频字幕生成、会议记录、语音数据分析等众多场景。然而,面对长音频数据处理,传统自动语音识别(ASR)系统往往暴露出效率低下、精度不足等问题。就在这样的技术背景下,WhisperX 项目应运而生,它如同一颗新星,为语音识别领域带来了全新的解决方案,助力开发者和企业突破技术瓶颈...
马斯克、苏姿丰同榜,中国 AI 终于有人杀进《时代》百大! 4 月 16 日,美国《时代》周刊公布了 2025 年“全球最具影响力 100 人”名单。 在这个被马斯克、苏姿丰、朱浩伟、诺娃等人包围的名单里,一个中文名字悄然出现 —— 梁文锋,DeepSeek 创始人兼 CEO,被归入 “Pioneers(拓荒者)” 一栏。 这不是象征意义的礼貌提名,而...
Gemini 2.5 Flash:谁说低价模型不能硬刚Pro? 4 月,正是春暖花开的好时节。 然而,在 AI 领域,却是战火纷飞,硝烟滚滚。 当 OpenAI 在忙着发布 GPT-4.1、o3、o4-mini 时,谷歌也没有闲着。 4 月 18 日,谷歌悄悄扔出了一颗威力不小的“性价比炸弹”:Gemini 2.5 Flash。 顾名思义,Gemini...
大力出奇迹造就了预训练大模型的成功。这里的大力除了把模型参数量调大外,更为重要的是用于训练它们的大量和高质量的数据。 阿里开源的 Qwen2.5 系列的训练数据规模达到 18 万亿 token,是目前开源模型中训练数据量最大的之一。DeepSeek-V3 的训练数据规模为 14.8 万亿 token,GPT-4 的训练数据规模约为 13 万亿 token...
GPT 又升级了,你准备好了吗? 这次 OpenAI 发布的 GPT-4.1,一方面性能大幅提升,推理更强、响应更快,但另一方面,它也展现出一个明显的新特征:变得比以前“更听话”了——甚至可以说,听得“太认真”了。 过去你跟 GPT-4 说一句模糊的任务,它常常能自己“脑补”你的真实意图,给出不错的结果。即使你提示词写得不完美,它也能帮你“补全”。但现在的...
今天是2025年4月21日,星期一,北京,雨。 我们今天继续围绕RAG,看看多模态RAG技术总结及实现范式,也有多模态RAG中的embedding和rank模型进展,可以看看。 另外,关于幻觉问题,我们看看最新模型的表现,以及两个幻觉检测的工具,都是很有趣的工作,值得研究下。 抓住根本问题,做根因,专题化,体系化,会有更多深度思考。大家一起加油。 一、多模态...
音乐创作与歌声合成爱好者的福音来了! OpenUtau是一款免费、开源的音乐创作与编辑工具,提供现代化界面与丰富功能。它兼容 UTAU 音乐库和采样器,支持 VSQX 导入、多语言界面和预渲染。 适用于 Windows、macOS 和 Linux,开箱即用。 UTAU 作为经典的歌声合成软件,因其老旧界面和高学习曲线逐渐难以满足现代需求。OpenUtau ...