Hi,周末快乐! 本周,多知举办了第49期OpenTalk活动,主题为““教育+AI”出海进行时”,这也是多知新书发布会。在活动现场,FoloToy 产品合伙人孔淼邈发表了主题演讲《以AI为桥梁,连接技术与童心》,谷东科技 产品解决方案部总经理许志刚发表了主题演讲《“学习无界:AR+AI技术在教育中的应用与展望》,网易有道词典笔产品负责人孟旭发表了主题演讲...
推荐一个真实风格的Flux模型,尤其是风格和背景风景经过了专门训练,这个模型叫Project0*。 梦幻田园 (这幅画面描绘了一片宁静而美丽的景象。一位红发飘逸的女子身着白色露肩长裙,站在野花盛开的原野中。一匹白马正温柔地用鼻子轻触她的面颊,马鬃在微风中轻轻飘动。背景是连绵起伏的丘陵和清澈的天空,营造出祥和而诗意的氛围。整体色调柔和淡雅,更增添了场景的宁静...
机器之心PRO · 会员通讯 Week 13 — 本周为您解读 ② 个值得细品的 AI & Robotics 业内要事 — 1. 强推理模型下,Agent workflow 仍有必要吗? 为什么说大模型本身才是构建 AI 智能体的关键?Anthropic 定义的两类智能体之间核心的区别是什么?更被看好的动态 Agents 的工作流是什么样的?为什么说...
何谓未来?何谓先锋? 作者|王艺 编辑|王博 “今天,我代表生数团队发布我们最新的高可控视频大模型——Vidu Q1。” 今天下午,在2025年中关村论坛年会“人工智能主题日”主论坛未来人工智能先锋论坛上,清华大学人工智能研究院副院长、生数科技创始人兼首席科学家朱军发布了业内首个高可控 AI 视频大模型Vidu Q1,其在多主体细节可控(特别是动作...
在文本转语音(TTS)领域,轻量化和高质量往往难以兼得,而字节跳动最新开源的 MegaTTS3 是可以实现两者兼得的优秀TTS模型之一。 MegaTTS3 作为字节跳动的最新力作,参数仅为 0.45B。它不仅能在普通设备上流畅运行,还能生成自然、逼真的语音,支持中英文混合场景和灵活的口音控制。 未来还将带来更细粒度的发音与时长调整。这款工具的开源发布,为用...
靠着吉卜力,OpenAI 又大出了一把风头。但实际在过去的一周里,有不少模型发布了版本更新,包括 DeepSeek,Gemini,Qwen。个个都是在推理上有所增强,以及多模态的支持。 每次有新的推理模型升级或者出现,怎么领略它们的能力很棘手。说白了,老让它们做题也没什么意思。 周末打游戏的时候,我忽然意识到:游戏不就是最好的试验场景吗? 版本齐齐更新,推...
来源| 多知** “多知新书什么时候面世?” 每逢岁末,多知团队总会迎来这样的“催稿”。在书架上码齐历年的《这一年》,已成为不少人的仪式感。它们见证了风起云涌的激越时代,也记录了转轨踏勘的人事沧桑,正在目睹着焕发新生的风华正茂。 读者的信任与期待,是我们持续写书最紧迫、最重要的动力来源。 自2014年我们出版第一本书籍以来,时光已悄然流转了十个春秋,其间多...
本文作者「有个梨」(微博:有个梨 GPT) 从经济学角度说说 AI。 网上有个流行的经济学观点是所谓破坏式创新理论,最简化的描述是谷歌微软这种创造大量程序员职位的高科技企业是破坏式创新里「创新」的一端,亚马逊零售和沃尔玛大量应用科技降低人力成本消灭职位是「破坏」的一端。 这个说法是美国一个教授搞出来的。很多人 buy in,尤其是在国内上过 EMBA 课的。...
图片来源:Andreessen Horowitz Z Highlights: MCP被视为可能成为AI与工具交互的默认接口,有望开启新一代自主、多模态、深度集成的智能体验。 随着MCP Client和server的快速发展,未来每个应用都有可能成为MCP Client,每个API都可能成为MCP Server,AI Agent将基于速度、成本和相关性动态...