安爸-超级家庭
bg

AI进家庭

多模态语音表征新突破!CoGenAV:高效、鲁棒、通用的语音识别“利器”

在人工智能领域,语音识别和处理一直是研究热点。然而,传统的语音识别系统在复杂环境下的表现往往不尽如人意,尤其是在高噪声或多人说话的场景中。近年来,多模态学习逐渐成为解决这一问题的关键。通义联合深圳技术大学推出的CoGenAV模型,通过融合音频和视觉信息,为语音识别和处理带来了新的突破。 一、项目概述 CoGenAV(Contrastive-Generat...

阅读:7 评论:0

上线 o3-pro、降价 80%、联手谷歌、还全网宕机,OpenAI 今天杀疯了

OpenAI 终于发布新模型了。 但不是 GPT-5。 而是,o3-pro。 严格来说,o3-pro 不是完全“新”的模型,更像是 o3 的高阶形态。 一个专为 ChatGPT Pro 用户准备的高算力版本,也正式接替了上一代的 o1-pro。 与此同时,OpenAI 还宣布:o3 模型的 API 定价,直接下调了 80%。 而这,只是 OpenAI 一...

阅读:8 评论:0

弄明白智能体的运作流程,才能知道智能体目前存在那些问题,以及应该怎么解决

“ 智能体的运作流程非常复杂和不可控,因此需要其它解决方案来解决这些问题。” 从结构上来看智能体的实现非常简单,就是大模型LLM+工具Tools;而构建工具主要有两种方式,Function call和MCP协议。但由于智能体是由大模型自己决定怎么使用工具,以及怎么处理工具需要的参数和返回值。 而这个过程对技术人员是完全不可控的,因此这一点也是智能体执行过...

阅读:7 评论:0

GraphRAG的优劣势及文档解析结合RL强化学习新思路Infinity Parser

今天是2025年6月11日,星期三,北京,晴 我们继续回到文档解析这个话题,来看看一个新的思路,强化学习用于端到端文档解析Infinity Parser,其中涉及到的文档解析数据集的构造以及强化奖励函数的设计思路,很值得看看。 另一个,还是回到GraphRAG的问题,还是从评估的角度上去看看,其到底优势在哪儿,从技术上去理解。 一、强化学习用于端到端文档解析...

阅读:7 评论:0

MCP的9个代表项目可视化流程及近日大模型开源进展

今天是2025年6月11日,星期三,北京,晴 我们来看看两个事情,一个是关于MCP的9个代表项目流程,从中直观理解。 另一个是回顾下开源进展,有些新鲜事儿,做个记录。 一、关于MCP的9个代表项目流程 来看看关于MCP的9个代表项目流程,可以仔细看看其中的项目数据流程,来自于avi@dailydoseofds.com。 1、100% local MCP cl...

阅读:7 评论:0

专访得帆信息CEO张桐:AI Coding To B,小公司搞不了

面对AI Coding的创业红海,一位IT老兵的焦虑与兴奋:“新世界要来了。” 文| 苏建勋** 如果去标记“得帆信息”——这家成立十年的软件公司历史,2025年春节,一定是个刻骨铭心的时间点。 这本是个欢庆的时点,得帆信息的创始人&CEO张桐却忧心忡忡。他已经多年不写代码,却用美国AI Coding(AI编程)工具Cursor,花...

阅读:7 评论:0

第四范式前高管创业做AI玩具,获近千万美元融资|涌现新项目

“不一样的AI玩具形态” 文| 王方玉** 编辑 | 苏建勋 一句话介绍 贝陪科技是一家专注于研发融合AI大模型技术的智能玩具公司,致力于打造真正懂孩子、懂家长的智能陪伴产品。 团队介绍 创始人兼CEO黄缨宁拥有北京大学人工智能专业和儿童心理学双学位,曾是阿里巴巴P10级别高管,前第四范式AIOS总经理。 联合创始人姚良超是原编程猫智能教具...

阅读:7 评论:0

阿里巴巴开源增强Agent搜索能力预训练框架,AI代码生成助手:Code Puppy

**关注我,记得标星⭐️不迷路哦~ ✨ 1: MaskSearch 增强Agent搜索能力的通用预训练框架:MaskSearch MaskSearch 是一个新颖的预训练框架,旨在增强智能体的通用搜索能力。它引入了检索增强掩码预测(RAMP)任务,模型通过学习利用搜索工具填充大量的预训练数据中的掩码跨度,从而获得大型语言模型的通用检索和推理能力。该项目结...

阅读:7 评论:0

完美替代ToDesk等付费软件!开源免费的远程桌面控制工具BilldDesk

简介 BilldDesk 远程桌面控制,目前实现了类似 ToDesk、向日葵等远程桌面的功能。 对比ToDesk免费个人版 作者使用过很多远程软件:TeamViewer、向日葵、ToTesk、AnyDesk、RustDesk、UU远程、连连控,还有qq自带的远程协助等等,但用ToDesk免费个人版比较多,因此用ToTesk和BilldDesk作对比\~ ...

阅读:8 评论:0

最适合NSFW的欧美风

今天推荐一个Flux模型,NSFW效果比较好,但是手指的细节略有瑕疵。 (图片描绘了一位精致优雅的女性坐在桌旁。她拥有一头金色波浪长发,身着带有红色玫瑰刺绣的黑色蕾丝袖连衣裙。颈间佩戴着项链,耳饰点缀,妆容一丝不苟,醒目的红唇与大胆表情相得益彰。面前桌上摆放着一杯红酒与一支红玫瑰。背景光线幽暗,水晶吊灯隐约可见,营造出奢华浪漫的氛围。) Sophistic...

阅读:8 评论:0