在需要高质量语音合成的场景中,第三方API(如ElevenLabs)不仅成本高昂,还可能带来隐私泄露风险,而直接部署开源模型往往配置复杂。 开源TTS与自托管的兴起,可以帮助我们很好的解决这一大痛点! 一款由devnen团队开源的TTS语音服务项目:Chatterbox-TTS-Server,可以帮助绝大多数人简单、高效的运行自己的TTS语音服务。 它是基...
微软官方又出MCP课程。教程为多语言版,含中文。这是个面向初学者的 Model Context Protocol (MCP) 课程。这个开源课程提供了结构化的学习路径,配有实用的代码示例和真实案例,涵盖 C井、Java、JavaScript、TypeScript 和 Python 等主流编程语言。 无论你是 AI 开发者、系统架构师还是软件工程师,本指南都是...
Mistral 刚又发了个小模型—— Magistral-Small-2506 这是他们的首个推理模型。这是个 Mistral Small 3.1 微调的版本,增加了推理能力的疯狂RL版本。这个大小很适合单卡 32G 跑。至于分数跟 Qwen3-4B 差不多。GPQA 会高一些。但AIME甚至没有Qewn3-4B 高。 参考文献: [1] 模型地址:htt...
大模型推理太慢?来看——Sparse Transformers稀疏推理加速器。简单来说,这个项目通过稀疏化技术让 Transformer 大模型推理提速1.6-1.8倍,提供: 融合稀疏C++内核优化MLP层计算 差分权重缓存机制动态管理激活权重 CPU/CUDA双平台支持,完整工具链 开箱即用的LLaMA模型稀疏化实现 “差分权重缓存”技术会通过智能预...
专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注! 今天凌晨,全球社交巨头Meta在官网开源了一个世界大模型V-JEPA 2。 与第一代相比,V-JEPA 2使用了100万视频+100万图片超大规模训练数据集,可以让AI Agent像人...
专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注! 6月11日,字节跳动旗下火山引擎举办Force原动力大会,发布豆包大模型1.6、视频生成模型Seedance 1.0 pro等新模型,并升级了Agent开发平台等AI云原生服务。 ...
今天给大家推荐的这个项目Memvid很新鲜,之前没见过这么玩的。 以前大家语义搜索,还是向量化那一套,对GPU算力的消耗还是蛮大的。 Memvid真的是创新,用CPU去做语义检索,还能做到极快的速度。 扫码加入AI交流群 获得更多技术支持和交流 (请注明自己的职业) 项目简介 Memvid 是一个AI 记忆管理开源项目,通过将文本数据编码为 MP4...
新智元报道 编辑:LRST 【新智元导读】普林斯顿大学AI实验室与复旦大学历史学系联手推出了全球首个聚焦历史研究能力的AI评测基准——HistBench,并同步开发了深度嵌入历史研究场景的AI助手——HistAgent。这一成果不仅填补了人文学科AI测试的空白,更为复杂史料处理与多模态理解建立了系统工具框架。 历史是关于时间中的人的科学。 ——马克...
如果要问我今年最期待谁家开发布会,那或许还得是华为。 其实今年的智能手机圈发布会已经非常精彩,有的亮出自研芯片,有的展示全新 UI。 但华为给人的感觉要更加「有趣」,原因就是今年华为都在发一些「怪东西」:「阔折叠」手机 Pura X,折叠电脑 MateBook Fold,都是市场上很少见的产品。 而今天华为发布会的两大主角:Pura80 系列手机和 WAT...