昨天,大模型赛道又迎来了一位重量级选手,小米宣布入局并上来就开源了一款大模型——MiMo-7B。 虽然MiMo-7B只有70亿参数,但根据测试数据显示,MiMo-7B在数学AIME24/25中分别达到了68.2分和55.4分,超过了OpenAI的o1-mini以及阿里的QwQ-32B-preview;在代码LiveCodeBench v5中也达到了57.8分...
机器之心报道 编辑:Panda 现如今,微调和强化学习等后训练技术已经成为提升 LLM 能力的重要关键。 近日,一份围绕 LLM 后训练的综述报告收获了不少好评,其整理相关论文和工具的资源库已经收获了超过 700 star。 该综述来自阿联酋人工智能大学、中佛罗里达大学、谷歌 DeepMind 和牛津大学等多所机构,涵盖通过强化学习增强 LLM 的技术、监...
一凡 发自 上海车展 量子位 | 公众号 QbitAI 历史性的时刻,发生时往往显得随机漫不经心,但连点成线之下,却又戏剧得好像经过精心安排。 上汽大众,1984年诞生的中国首家轿车合资车企,代表着中国汽车面向西方先进汽车工业“技术输血”的开端。41年后,2025年的上海车展现场,AI智能化成为汽车变革主引擎的当下,完成了核心技术供应的切换——与中国智能辅助...
新智元报道 编辑:KingHZ 【新智元导读】AI裁员时代,大幕开启!Shopify CEO的内部信震惊了全网:全员All in AI,使用AI要形成条件反射;每年贡献提升20%-40%才有竞争力;团队要想招人,先要证明AI做不到。正式打响AI裁员第一枪! 使用AI是铁律,要形成条件反射! 全球电商平台Shopify流出的内部备忘录,震惊了全网。 ...
一水 发自 凹非寺 量子位 | 公众号 QbitAI 又一开源AI神器在外网引起热议! 名为PaperCoder,是一个多智能体LLM_(大语言模型)_系统,能自动实现机器学习论文中的代码。 据介绍,之所以推出这一工具,是因为经过统计发现: 2024年,在NeurIPS、ICML和ICLR等顶会上,平均只有21%的机器学习论文共享了代码。 造成的结果...
新智元报道 编辑:犀牛 【新智元导读】来自英伟达和UIUC的华人团队提出一种高效训练方法,将LLM上下文长度从128K扩展至惊人的400万token SOTA纪录!基于Llama3.1-Instruct打造的UltraLong-8B模型,不仅在长上下文基准测试中表现卓越,还在标准任务中保持顶尖竞争力。 大语言模型(LLM)在文本和多模态任务上已经展...
LearnAct团队投稿 量子位 | 公众号 QbitAI 想让手机AI像人类一样快速学习? 浙大与vivo联手突破!全新LearnAct框架仅需一次示范,就能教会AI完成复杂操作。 研究同步发布的LearnGUI基准,首次构建了面向移动端示范学习的评估体系,为AI智能体的实用化部署提供了关键技术支撑。 本文的作者来自浙江大学和vivo AI lab。本文...
🔍 LocalSend是什么? LocalSend是一款跨平台应用,支持Android、iOS、Windows、macOS和Linux等设备。它使用REST API和HTTPS加密技术,确保设备间的通信安全可靠。与其他依赖外部服务器的工具不同,LocalSend无需互联网连接或第三方服务器,所有数据仅在本地网络中传输,既快速又私密! 🎨 截图预览 iPh...
传统文件传输方式(如 USB、蓝牙、邮件)要么速度慢,要么操作繁琐,而 AirDrop 仅限苹果生态。 如果你还在为手机和电脑之间传文件来回折腾?还在装各种臃肿的客户端、扫码连 Wi-Fi、用数据线拖来拖去? 那小编推荐一个纯浏览器实现的开源的局域网文件传输工具:Snapdrop。有了它 ,你可以彻底告别这些麻烦。 基于 WebRTC 和 WebSocke...