少琢磨所谓的通用智能体了,先把垂类能力做好 就 MiniMax 这个新上线的语音工具能力,哪怕他以后不更新了我都愿意用 太猛了,效果自然、功能强大,又价格亲民 以下是我的完整体验: 国内AI领域的实力派玩家 MiniMax(就是做出海螺AI、引起大家关注的 MiniMax),最近上线了一款独立的AI音频工具——MiniMax Audio! 我上手体验了一番...
编辑部 整理自 AIGC现场 量子位 | 公众号 QbitAI 现在,不论你是去吃火锅,亦或是去趟医院,或许身边已经布满了AI。 这,就是当下大模型应用的发展趋势—— AI技术正以惊人的速度从实验室走向千行百业,深刻改变着各个领域的发展格局。 近期百度副总裁阮瑜在量子位举办的第三届AIGC产业峰会上,围绕着“万物皆可AI”的主题分享了百度在AIGC以及 AI...
新智元报道 编辑:桃子 好困 【新智元导读】GPT-4o之后,OpenAI原生多模态图像生成模型API正式推出了,一张图低至0.02美元。新模型能够结合世界知识,生成更加符合上下文图像,质量更高,还支持多种功能自定义。 昨夜,OpenAI发布全新图像生成模型gpt-image-1,API向所有开发者开放。 这一次,他们直接把每张图的成本打到几美分。...
Yoky_|yokyliu@pingwest.com summer|_huangxiaoyi@pingwest.com AI Agent行业的全球图景,中国和硅谷正在走上两条路线。 硅谷正在逐步拆掉影响Agent发展的墙,从0-1的建立规则。从Anthropic推出了MCP开放协议,统一了大模型连接应用的方式,到谷歌发布名为Agent2Agent(A2A)...
training-hot-swap:PyTorch训练代码热交换工具,无需从VRAM中卸载LLM即可更改代码。亮点: 无需等待模型从磁盘加载到VRAM,节省高达30秒的加载时间; 支持远程代码执行,搭配IntelliJ调试器,实现无缝远程开发; 兼容DearImgui Python绑定,快速启动训练脚本的UI界面。 参考文献: [1] http://...
斯坦福发了个新的 Transformer 课程,这个课程邀请到了 Andrej Karpathy, Geoffrey Hinton, Jim Fan, Ashish Vaswani 等大佬,可以免费在线观看。 参考文献: [1] http://web.stanford.edu/class/cs25/ 知识星球服务内容:Dify源码剖析及答疑,Dif...
MagiAttention:为超长文本和异构数据训练提供线性可扩展的分布式注意力机制。亮点: 支持多种注意力掩码类型,灵活性极高; 在Hopper GPU上性能与Flash-Attention 3相当; 实现零冗余通信,大幅提升分布式训练效率。 参考文献: [1] http://github.com/SandAI-org/MagiAttention...
又一款类似 Manus 的开源通用智能体应用:Suna。这款由 Kortix AI 团队开发的工具,能够通过自然对话理解用户需求并完成各类实际任务,是一位真正能为你交付结果的数字助手。 Suna 拥有丰富的功能:它支持浏览器自动化,可自主导航网页并提取所需数据;具备文件管理能力,能够创建和编辑各类文档;内置网络爬虫和扩展搜索功能;支持命令行执行系统任务,还能...
MAGI-1:自回归视频生成的全新突破,让视频创作变得轻而易举。亮点: 强大的自回归算法,支持实时视频流生成; 24B和4.5B模型,满足不同规模的创作需求; 高效的压缩和解码技术,解码速度提升8倍以上。 参考文献: [1] http://github.com/SandAI-org/MAGI-1 [2] https://sand.ai/ 知识...