安爸-超级家庭
bg

AI信息差

IndexTTS-vLLM:让语音合成更快速、更高效

IndexTTS-vLLM:让语音合成更快速、更高效。核心价值在于通过vLLM加速IndexTTS的推理过程,显著提升语音合成的速度和并发能力。亮点:1. 单个请求RTF从0.3降至0.1;2. GPT模型decode速度提升至280 token/s;3. 支持多角色音频混合,为语音合成带来更多创意可能。 参考文献: [1] http://github....

阅读:10 评论:0

Cactus:让移动设备和可穿戴设备轻松运行AI模型的框架

Cactus:让移动设备和可穿戴设备轻松运行AI模型的框架。亮点:1. 硬件感知的C/C++后端,性能强劲;2. 支持多种开发平台,包括Kotlin、Java、Swift、React、Flutter等;3. 低内存占用,高效节能。 参考文献: [1] http://github.com/cactus-compute/cactus [2] https://...

阅读:10 评论:0

Seed1.5-VL:一款强大的视觉-语言基础模型

Seed1.5-VL:一款强大的视觉-语言基础模型,专为通用多模态理解和推理而设计,能在多种复杂任务中提供卓越表现。亮点:1. 高效架构,仅用5.32亿视觉编码器和200亿参数的MoE LLM,实现顶尖性能;2. 在60个公共基准测试中,38个达到最佳水平;3. 擅长复杂推理、OCR、图解理解、视觉定位、3D空间理解及视频理解等多种能力。 参考文献: [...

阅读:8 评论:0

使用Huggingface SmolVLM 和gglm llama.cpp 的实时摄像头AI识别演示

使用Huggingface SmolVLM 和gglm llama.cpp 的实时摄像头AI识别演示。 参考文献: [1] 代码:https://github.com/ngxson/smolvlm-realtime-webcam [2] https://github.com/ggml-org/llama.cpp/blob/master/docs/mult...

阅读:8 评论:0

阿里的移动端多模态大模型APP – MNN 又更新了

阿里的移动端多模态大模型APP(完全开源且使用移动端本地的模型哈)——MNN 又更新了!现在支持 Qwen-2.5-omni-3b 和 7b 了。这个APP搭配多模态模型可以支持 文本到文本、图像到文本、音频到文本和文本到图像生成。并且速度也可以。想学习移动端大模型应用开发的可以参考试试。 参考文献: [1] 地址:https://github.com/...

阅读:9 评论:0

字节放出了:DreamO,统一图像定制框架

字节放出了:DreamO,统一图像定制框架,把图像换装、换脸、换造型、换风格以及组合操作装在了一起。支持ID、IP、Try-On等组合,支持16GB/24GB显卡运行,用于虚拟试穿、商品广告、营销广告什么的比较实用。四个能力: IP,处理角色形象,支持人物、物体、动物等输入 ID,人脸身份处理 Try-On,虚拟试穿,可以同时换多件衣服 Style,风格迁...

阅读:8 评论:0

Flowshow:为Python任务流提供超轻量级的可视化工具

Flowshow:为Python任务流提供超轻量级的可视化工具。亮点:1. 通过简单装饰器即可追踪任务执行;2. 自动生成任务流可视化图表,直观展示任务关系;3. 支持日志记录与数据追踪,助力高效调试。 参考文献: [1] https://github.com/koaning/flowshow [2] https://koaning.github.io/...

阅读:9 评论:0

Github上超5万star的大模型课程

Github上超5万star的大模型课程。课程分为三个部分: LLM 基础部分为选修内容,涵盖数学、Python 和神经网络的基础知识。 LLM 科学家部分专注于运用最新技术构建最优的 LLMs。 LLM 工程师专注于创建基于 LLM 的应用程序并进行部署。 参考文献: [1] https://github.com/mlabonne/llm-cour...

阅读:10 评论:0

Poe:DeepSeek使用率下降50%,快手崛起、OpenAI暴涨

今天凌晨,全球著名大模型整合应用平台Poe发布了,2025年春季AI模型使用趋势报告。 结果显示,DeepSeek R1的使用率从2月中旬的峰值7%下降到了4月底的3%,整体使用率下降超过50%; OpenAI由于在GPT-4o推出新的文生图功能后,例如,吉卜力风格、仿真自拍等类型图片,实现病毒式增长使用率暴涨。 下面「AIGC开放社区」将从文本、视频、推...

阅读:10 评论:0

谷歌开源基于物理模拟的气象模型,能预测暴雨、台风、大干旱

专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注! 传统的通用循环模型(GCMs)在天气预报和气候模拟方面发挥了重要作用,但在处理特殊状态的小尺度时存在局限性,例如,处理云、辐射和降水等未完全解析的物理过程时会使用半经验性参数化,会导致...

阅读:8 评论:0