安爸-超级家庭
bg

AI进家庭

梁文锋登上《时代》榜单,这一刻,中国 AI 不再沉默

马斯克、苏姿丰同榜,中国 AI 终于有人杀进《时代》百大! 4 月 16 日,美国《时代》周刊公布了 2025 年“全球最具影响力 100 人”名单。 在这个被马斯克、苏姿丰、朱浩伟、诺娃等人包围的名单里,一个中文名字悄然出现 —— 梁文锋,DeepSeek 创始人兼 CEO,被归入 “Pioneers(拓荒者)” 一栏。 这不是象征意义的礼貌提名,而...

阅读:12 评论:0

OpenAI 发布 o3,谷歌反手祭出 Gemini 2.5 Flash:性价比直接拉满!

Gemini 2.5 Flash:谁说低价模型不能硬刚Pro? 4 月,正是春暖花开的好时节。 然而,在 AI 领域,却是战火纷飞,硝烟滚滚。 当 OpenAI 在忙着发布 GPT-4.1、o3、o4-mini 时,谷歌也没有闲着。 4 月 18 日,谷歌悄悄扔出了一颗威力不小的“性价比炸弹”:Gemini 2.5 Flash。 顾名思义,Gemini...

阅读:11 评论:0

破解合规难题,AI高质量数据集建设正当时

大力出奇迹造就了预训练大模型的成功。这里的大力除了把模型参数量调大外,更为重要的是用于训练它们的大量和高质量的数据。 阿里开源的 Qwen2.5 系列的训练数据规模达到 18 万亿 token,是目前开源模型中训练数据量最大的之一。DeepSeek-V3 的训练数据规模为 14.8 万亿 token,GPT-4 的训练数据规模约为 13 万亿 token...

阅读:12 评论:0

《GPT-4.1变“听话”了,但你会“说话”吗?这才是现在写提示词的正确姿势》

GPT 又升级了,你准备好了吗? 这次 OpenAI 发布的 GPT-4.1,一方面性能大幅提升,推理更强、响应更快,但另一方面,它也展现出一个明显的新特征:变得比以前“更听话”了——甚至可以说,听得“太认真”了。 过去你跟 GPT-4 说一句模糊的任务,它常常能自己“脑补”你的真实意图,给出不错的结果。即使你提示词写得不完美,它也能帮你“补全”。但现在的...

阅读:12 评论:0

再看大模型幻觉排行、检测工具及多模态RAG技术范式总结

今天是2025年4月21日,星期一,北京,雨。 我们今天继续围绕RAG,看看多模态RAG技术总结及实现范式,也有多模态RAG中的embedding和rank模型进展,可以看看。 另外,关于幻觉问题,我们看看最新模型的表现,以及两个幻觉检测的工具,都是很有趣的工作,值得研究下。 抓住根本问题,做根因,专题化,体系化,会有更多深度思考。大家一起加油。 一、多模态...

阅读:12 评论:0

2.6K Star!OpenUtau:开源歌声合成神器,开箱即用,完美兼容UTAU生态!

音乐创作与歌声合成爱好者的福音来了! OpenUtau是一款免费、开源的音乐创作与编辑工具,提供现代化界面与丰富功能。它兼容 UTAU 音乐库和采样器,支持 VSQX 导入、多语言界面和预渲染。 适用于 Windows、macOS 和 Linux,开箱即用。 UTAU 作为经典的歌声合成软件,因其老旧界面和高学习曲线逐渐难以满足现代需求。OpenUtau ...

阅读:11 评论:0

多模态RAG综述《 A Survey of Multimodal Retrieval-Augmen》

本文全面梳理了多模态检索增强生成 (MRAG) 领域的概念演进、关键技术、数据集、评估指标、挑战和未来方向,为研究人员提供了一份及时而深入的指南,并指明 MRAG 是未来提升多模态大模型能力、实现更智能、更通用人工智能的关键方向。 参考文献: [1] https://arxiv.org/abs/2504.08748 知识星球服务内容:Dify源码...

阅读:13 评论:0

Hyper-MCP:一个快速、安全的MCP服务器,通过WebAssembly插件扩展功能

Hyper-MCP:一个快速、安全的MCP服务器,通过WebAssembly插件扩展功能。亮点: 支持多种编程语言编写插件,兼容性极强; 轻量级设计,适合资源受限环境; 采用OCI标准分发插件,安全可靠。 参考文献: [1] http://github.com/tuananh/hyper-mcp 知识星球服务内容:Dify源码剖析及答疑,Dif...

阅读:11 评论:0

利用人工智能将代码库变成教程

利用人工智能将代码库变成教程,这是 Pocket Flow 的一个教程项目,Pocket Flow 是一个 100 行的框架。它会抓取 GitHub 代码库,并根据代码构建知识库。它会分析整个代码库,以识别核心抽象及其交互方式,并将复杂的代码转换为具有清晰可视化效果且易于初学者理解的教程。 参考文献: [1] https://github.com/The...

阅读:10 评论:0

PiLiDAR:一款开源的DIY 360° 3D全景扫描仪项目

PiLiDAR:一款开源的DIY 360° 3D全景扫描仪项目,用低成本硬件和开源软件打造高精度3D扫描解决方案。亮点: 支持多种LiDAR型号,适配LD06、LD19和STL27L; 6K全景图和3D场景重建,细节丰富; 硬件成本低,使用树莓派和常见组件。 参考文献: [1] http://github.com/PiLiDAR/PiLiDAR ...

阅读:10 评论:0