安爸-超级家庭
bg
avatar

安爸

不藏了!让PDF瞬间说话,这款国产工具10秒学会说全球30+种语言

少琢磨所谓的通用智能体了,先把垂类能力做好 就 MiniMax 这个新上线的语音工具能力,哪怕他以后不更新了我都愿意用 太猛了,效果自然、功能强大,又价格亲民 以下是我的完整体验: 国内AI领域的实力派玩家 MiniMax(就是做出海螺AI、引起大家关注的 MiniMax),最近上线了一款独立的AI音频工具——MiniMax Audio! 我上手体验了一番...

阅读:8 评论:0

百度阮瑜:大模型应用落地正从简单高容错向复杂低容错场景延伸|中国AIGC产业峰会

编辑部 整理自 AIGC现场 量子位 | 公众号 QbitAI 现在,不论你是去吃火锅,亦或是去趟医院,或许身边已经布满了AI。 这,就是当下大模型应用的发展趋势—— AI技术正以惊人的速度从实验室走向千行百业,深刻改变着各个领域的发展格局。 近期百度副总裁阮瑜在量子位举办的第三届AIGC产业峰会上,围绕着“万物皆可AI”的主题分享了百度在AIGC以及 AI...

阅读:9 评论:0

刚刚,OpenAI最强图像生成API上线,一张图1毛5!

新智元报道 编辑:桃子 好困 【新智元导读】GPT-4o之后,OpenAI原生多模态图像生成模型API正式推出了,一张图低至0.02美元。新模型能够结合世界知识,生成更加符合上下文图像,质量更高,还支持多种功能自定义。 昨夜,OpenAI发布全新图像生成模型gpt-image-1,API向所有开发者开放。 这一次,他们直接把每张图的成本打到几美分。...

阅读:9 评论:0

深度 鏖战 AI Agents:硅谷修路,中国造车

Yoky_|yokyliu@pingwest.com summer|_huangxiaoyi@pingwest.com AI Agent行业的全球图景,中国和硅谷正在走上两条路线。 硅谷正在逐步拆掉影响Agent发展的墙,从0-1的建立规则。从Anthropic推出了MCP开放协议,统一了大模型连接应用的方式,到谷歌发布名为Agent2Agent(A2A)...

阅读:9 评论:0

training-hot-swap:PyTorch训练代码热交换工具

training-hot-swap:PyTorch训练代码热交换工具,无需从VRAM中卸载LLM即可更改代码。亮点: 无需等待模型从磁盘加载到VRAM,节省高达30秒的加载时间; 支持远程代码执行,搭配IntelliJ调试器,实现无缝远程开发; 兼容DearImgui Python绑定,快速启动训练脚本的UI界面。 参考文献: [1] http://...

阅读:9 评论:0

斯坦福发了个新的 Transformer 课程

斯坦福发了个新的 Transformer 课程,这个课程邀请到了 Andrej Karpathy, Geoffrey Hinton, Jim Fan, Ashish Vaswani 等大佬,可以免费在线观看。 参考文献: [1] http://web.stanford.edu/class/cs25/ 知识星球服务内容:Dify源码剖析及答疑,Dif...

阅读:8 评论:0

MagiAttention:为超长文本和异构数据训练提供线性可扩展的分布式注意力机制

MagiAttention:为超长文本和异构数据训练提供线性可扩展的分布式注意力机制。亮点: 支持多种注意力掩码类型,灵活性极高; 在Hopper GPU上性能与Flash-Attention 3相当; 实现零冗余通信,大幅提升分布式训练效率。 参考文献: [1] http://github.com/SandAI-org/MagiAttention...

阅读:9 评论:0

一款类似 Manus 的开源通用智能体应用:Suna

又一款类似 Manus 的开源通用智能体应用:Suna。这款由 Kortix AI 团队开发的工具,能够通过自然对话理解用户需求并完成各类实际任务,是一位真正能为你交付结果的数字助手。 Suna 拥有丰富的功能:它支持浏览器自动化,可自主导航网页并提取所需数据;具备文件管理能力,能够创建和编辑各类文档;内置网络爬虫和扩展搜索功能;支持命令行执行系统任务,还能...

阅读:10 评论:0

MAGI-1:自回归视频生成的全新突破,让视频创作变得轻而易举

MAGI-1:自回归视频生成的全新突破,让视频创作变得轻而易举。亮点: 强大的自回归算法,支持实时视频流生成; 24B和4.5B模型,满足不同规模的创作需求; 高效的压缩和解码技术,解码速度提升8倍以上。 参考文献: [1] http://github.com/SandAI-org/MAGI-1 [2] https://sand.ai/ 知识...

阅读:9 评论:0

从零实现多层感知机

从零实现多层感知机,基于 Eigen 库(用于线性代数的仅头文件 C++库)的 C++多层感知机(MLP)神经网络实现,支持多种激活函数和损失函数,采用小批量梯度下降与反向传播算法进行训练。而且根据reddit上的介绍这是个15岁的孩子写的。功能特点: 可定制架构 :可自定义网络层数及各层神经元数量。 多种激活函数 :支持 ReLU、Sigmoid、Tan...

阅读:8 评论:0