安爸-超级家庭
bg

AI进家庭

Sparse Transformers稀疏推理加速器

大模型推理太慢?来看——Sparse Transformers稀疏推理加速器。简单来说,这个项目通过稀疏化技术让 Transformer 大模型推理提速1.6-1.8倍,提供: 融合稀疏C++内核优化MLP层计算 差分权重缓存机制动态管理激活权重 CPU/CUDA双平台支持,完整工具链 开箱即用的LLaMA模型稀疏化实现 “差分权重缓存”技术会通过智能预...

阅读:9 评论:0

杨立昆亲自指导开源世界大模型,为AI Agent打造超级大脑

专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注! 今天凌晨,全球社交巨头Meta在官网开源了一个世界大模型V-JEPA 2。 与第一代相比,V-JEPA 2使用了100万视频+100万图片超大规模训练数据集,可以让AI Agent像人...

阅读:9 评论:0

火山引擎发布豆包大模型1.6,加速Agent大规模应用

专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注! 6月11日,字节跳动旗下火山引擎举办Force原动力大会,发布豆包大模型1.6、视频生成模型Seedance 1.0 pro等新模型,并升级了Agent开发平台等AI云原生服务。 ...

阅读:9 评论:0

RAG不香了!把百万文本片段编码为MP4视频文件,就能用AI实现亚秒级语义搜索。

今天给大家推荐的这个项目Memvid很新鲜,之前没见过这么玩的。 以前大家语义搜索,还是向量化那一套,对GPU算力的消耗还是蛮大的。 Memvid真的是创新,用CPU去做语义检索,还能做到极快的速度。 扫码加入AI交流群 获得更多技术支持和交流 (请注明自己的职业) 项目简介 Memvid 是一个AI 记忆管理开源项目,通过将文本数据编码为 MP4...

阅读:10 评论:0

全球首个历史基准!普林复旦打造AI历史助手,AI破圈人文学科

新智元报道 编辑:LRST 【新智元导读】普林斯顿大学AI实验室与复旦大学历史学系联手推出了全球首个聚焦历史研究能力的AI评测基准——HistBench,并同步开发了深度嵌入历史研究场景的AI助手——HistAgent。这一成果不仅填补了人文学科AI测试的空白,更为复杂史料处理与多模态理解建立了系统工具框架。 历史是关于时间中的人的科学。 ——马克...

阅读:10 评论:0

该翻篇就翻篇吧,搞 AI 一定要向前看

(文:Founder Park) 该翻篇就翻篇吧,搞 AI 一定要向前看最先出现在每时AI。

阅读:10 评论:0

刚刚,华为最强拍照手机发布! Pura80 Ultra 9999 起,余承东:对得起那四个字

如果要问我今年最期待谁家开发布会,那或许还得是华为。 其实今年的智能手机圈发布会已经非常精彩,有的亮出自研芯片,有的展示全新 UI。 但华为给人的感觉要更加「有趣」,原因就是今年华为都在发一些「怪东西」:「阔折叠」手机 Pura X,折叠电脑 MateBook Fold,都是市场上很少见的产品。 而今天华为发布会的两大主角:Pura80 系列手机和 WAT...

阅读:9 评论:0

刚刚发布的豆包大模型 1.6,直接让我少加班!还有一个视频神器超 Veo 3 登顶全球

这届大模型内卷到什么程度了? 回看今年的节奏,字节几乎月月有新招,甚至一月多更,一个个模型砸出来,不只是上新,也都有实打实的升级,持续把行业的竞争门槛推高一大截。 1 月,豆包 1.5 pro 模型上线。 4 月,豆包 1.5 深度思考模型、文生图模型 3.0、视觉理解模型同步升级。 5 月,Seedance 1.0 lite 视频生成模型 、豆包 1.5·...

阅读:10 评论:0

字节 AI 卷出新高度:豆包试水“上下文定价”,Trae 覆盖内部80%工程师,战略瞄定三主线

整理 | 褚杏娟 近日,字节分享了其对今年 AI 技术发展主线的思考,主要包括以下三个方面: 多模态的推理和思考。仅做文本的 reason 和 thinking 无法充分发挥模型能力,基于图片、视频等多模态数据,reason 和 thinking 能力才会真正爆发。但目前行业并没有涌现这样的能力。 视频生成技术突破。在 2024 年底之前,全球视频生成...

阅读:9 评论:0

对话智源王仲远:机器人的大小脑可能会“合体”,但不是今天

作者 | 华卫 今年的智源大会上,智源研究院推出全新的“悟界”系列大模型,其中包括原生多模态世界模型 Emu3、脑科学多模态通用基础模型见微 Brainμ、跨本体具身大小脑协作框架 RoboOS2.0 与具身大脑 RoboBrain2.0 以及全原子微观生命模型 OpenComplex2。 据介绍,Emu3 作为原生多模态统一架构让大模型具备理解和推理世界...

阅读:10 评论:0