📢本周AI快讯 | 1分钟速览🚀 1️⃣ ⚠️ DeepSeek-R2 发布推迟 :原计划 5 月发布的 DeepSeek-R2 因美国对英伟达 H20 芯片出口限制和 CEO 对性能不满而推迟。 2️⃣ 🎯 阿里发布多模态模型 :通义千问推出视觉模型 Qwen VLo,支持图像、文本、音频和视频输入,已在多平台开源。 3️⃣ 👓 小米 AI 眼镜上市 :售...
硅谷人才热战持续。 编译 | 陈骏达 编辑 | 李水青 智东西6月29日消息,昨日,据媒体The Information爆料,扎克伯格在硅谷AI圈的抢人大战又有了新动向:Meta已经成功挖走4名OpenAI的顶尖华人研究员。 这四位研究员都在中国完成本科教育: Shuchao Bi(毕树超):OpenAI多模态后训练研究负责人,本科毕业于浙江大学。...
李浩然,CMU 机器学习系研究生,研究方向是基础模型的长上下文建模、对齐、以及检索增强生成。 如今的视觉语言模型 (VLM, Vision Language Models) 已经在视觉问答、图像描述等多模态任务上取得了卓越的表现。然而,它们在长视频理解和检索等长上下文任务中仍表现不佳。 虽然旋转位置编码 (RoPE, Rotary Position Emb...
不圆 发自 凹非寺 量子位 | 公众号 QbitAI 三分之二的家猫都更倾向于向左睡。 这是来自最新刊登在Current Biology的研究结论,论文标题就是:家猫的侧睡姿势。 此前的研究显示,脊椎动物和无脊椎动物都表现出多种大脑和行为上的左右不对称性,就像是人类大部分是右撇子,小猫小狗一般也会有一个偏好的爪子。而大脑的右半球擅长处理与威胁相关的刺激...
新智元报道 编辑:LRS 【新智元导读】过去几十年,全球博士毕业生数量呈爆炸式增长,但学术界职位空缺数量远低于毕业生数量。如今博士生的就业趋势已从学术界转向工业界,未来博士教育培养模式应转变,产学研深入结合,以更好地匹配劳动力市场。 21世纪,最贵的是人才,最便宜的是学历。 博士,已然是学历金字塔的塔尖,也是通往学术和高端职业的敲门砖。 不过,过去...
睡醒第一件事,是看 Meta 今天又挖了谁。 今天凌晨,据 The Information 援引知情人士消息称,Meta 再度从 OpenAI 招来四名研究员(Shengjia Zhao、Jiahui Yu、Shuchao Bi 和 Hongyu Ren),助力其超级智能计划。 这四人此前都在 OpenAI 负责模型开发或多模态方向的核心工作。 消息一出,O...
采访 | 霍太稳 编辑 | Tina 过去一年,全球科技巨头都把宝押在了 AI 上。像 Meta、微软、亚马逊、谷歌 这些大公司,今年光是在 AI 基础设施上就打算砸 3,250 亿美元,秉持“先烧钱、后吃肉”的战略,推动大模型技术快速发展。在这一波浪潮中,DeepSeek 等企业在大模型上的创新,更是把各路玩家卷得不行,甚至逼得 OpenAI 都打起了价...
BIOCLIP 2团队 投稿 量子位 | 公众号 QbitAI 让AI看懂95万物种,并自己悟出生态关系与个体差异! 俄亥俄州立大学研究团队在2亿生物图像数据上训练了BioCLIP 2模型。大规模的训练让BioCLIP 2取得了目前最优的物种识别性能。 而更令人惊喜的是,即使在训练过程中没有相应监督信号,BioCLIP 2还在栖息地识别、植物疾病识别等5个非...
在人工智能领域,多模态大语言模型的发展正逐渐改变着我们对智能交互的认知。腾讯联合清华大学深圳国际研究生院、香港中文大学和香港大学等机构,共同推出了名为MindOmni的多模态大语言模型,它在视觉理解、文本到图像生成、推理生成等方面展现出了强大的能力,为多模态AI的发展开辟了新的路径。 一、项目概述 MindOmni是一个由腾讯ARC Lab联合清华大学深圳...