安爸-超级家庭
bg
avatar

安爸

DeepSeek-R2 推迟发布,小米 AI 眼镜亮相,OpenAI 深度研究API开放! AI Weekly 6.23-29

📢本周AI快讯 | 1分钟速览🚀 1️⃣ ⚠️ DeepSeek-R2 发布推迟 :原计划 5 月发布的 DeepSeek-R2 因美国对英伟达 H20 芯片出口限制和 CEO 对性能不满而推迟。 2️⃣ 🎯 阿里发布多模态模型 :通义千问推出视觉模型 Qwen VLo,支持图像、文本、音频和视频输入,已在多平台开源。 3️⃣ 👓 小米 AI 眼镜上市 :售...

阅读:11 评论:0

硅谷华人AI大牛被疯狂挖角!小扎打包带走4名OpenAI研究员

硅谷人才热战持续。 编译 | 陈骏达 编辑 | 李水青 智东西6月29日消息,昨日,据媒体The Information爆料,扎克伯格在硅谷AI圈的抢人大战又有了新动向:Meta已经成功挖走4名OpenAI的顶尖华人研究员。 这四位研究员都在中国完成本科教育: Shuchao Bi(毕树超):OpenAI多模态后训练研究负责人,本科毕业于浙江大学。...

阅读:11 评论:0

打破长视频理解瓶颈:HoPE混合位置编码提升VLM长度泛化能力

李浩然,CMU 机器学习系研究生,研究方向是基础模型的长上下文建模、对齐、以及检索增强生成。 如今的视觉语言模型 (VLM, Vision Language Models) 已经在视觉问答、图像描述等多模态任务上取得了卓越的表现。然而,它们在长视频理解和检索等长上下文任务中仍表现不佳。 虽然旋转位置编码 (RoPE, Rotary Position Emb...

阅读:11 评论:0

猫猫睡觉睡上顶刊:三分之二的家猫都倾向于向左睡

不圆 发自 凹非寺 量子位 | 公众号 QbitAI 三分之二的家猫都更倾向于向左睡。 这是来自最新刊登在Current Biology的研究结论,论文标题就是:家猫的侧睡姿势。 此前的研究显示,脊椎动物和无脊椎动物都表现出多种大脑和行为上的左右不对称性,就像是人类大部分是右撇子,小猫小狗一般也会有一个偏好的爪子。而大脑的右半球擅长处理与威胁相关的刺激...

阅读:10 评论:0

Nature:博士太多,高校已经装不下了!

新智元报道 编辑:LRS 【新智元导读】过去几十年,全球博士毕业生数量呈爆炸式增长,但学术界职位空缺数量远低于毕业生数量。如今博士生的就业趋势已从学术界转向工业界,未来博士教育培养模式应转变,产学研深入结合,以更好地匹配劳动力市场。 21世纪,最贵的是人才,最便宜的是学历。 博士,已然是学历金字塔的塔尖,也是通往学术和高端职业的敲门砖。 不过,过去...

阅读:12 评论:0

刚刚,OpenAI 四位华人 AI 大牛集体被挖!清北浙大中科大校友,小扎杀疯了

睡醒第一件事,是看 Meta 今天又挖了谁。 今天凌晨,据 The Information 援引知情人士消息称,Meta 再度从 OpenAI 招来四名研究员(Shengjia Zhao、Jiahui Yu、Shuchao Bi 和 Hongyu Ren),助力其超级智能计划。 这四人此前都在 OpenAI 负责模型开发或多模态方向的核心工作。 消息一出,O...

阅读:12 评论:0

AI正在淘汰“中间层”!昆仑万维方汉:要么冲进前10%,要么学会“向下兼容”

采访 | 霍太稳 编辑 | Tina 过去一年,全球科技巨头都把宝押在了 AI 上。像 Meta、微软、亚马逊、谷歌 这些大公司,今年光是在 AI 基础设施上就打算砸 3,250 亿美元,秉持“先烧钱、后吃肉”的战略,推动大模型技术快速发展。在这一波浪潮中,DeepSeek 等企业在大模型上的创新,更是把各路玩家卷得不行,甚至逼得 OpenAI 都打起了价...

阅读:9 评论:0

AI一眼认出95万物种,还能分辨雄雌老幼,2亿生物图像炼成“生命视觉”大模型

BIOCLIP 2团队 投稿 量子位 | 公众号 QbitAI 让AI看懂95万物种,并自己悟出生态关系与个体差异! 俄亥俄州立大学研究团队在2亿生物图像数据上训练了BioCLIP 2模型。大规模的训练让BioCLIP 2取得了目前最优的物种识别性能。 而更令人惊喜的是,即使在训练过程中没有相应监督信号,BioCLIP 2还在栖息地识别、植物疾病识别等5个非...

阅读:8 评论:0

MindOmni:腾讯联合清华等机构推出的多模态大语言模型,推理生成能力卓越

在人工智能领域,多模态大语言模型的发展正逐渐改变着我们对智能交互的认知。腾讯联合清华大学深圳国际研究生院、香港中文大学和香港大学等机构,共同推出了名为MindOmni的多模态大语言模型,它在视觉理解、文本到图像生成、推理生成等方面展现出了强大的能力,为多模态AI的发展开辟了新的路径。 一、项目概述 MindOmni是一个由腾讯ARC Lab联合清华大学深圳...

阅读:11 评论:0

智能PPT生成系统

🧠 项目简介 一个基于 A2A + MCP + ADK 的多智能体系统,支持流式并发生成高质量 PPT 内容。 MultiAgentPPT 利用多智能体架构实现从主题输入到完整演示文稿生成的自动化流程,主要步骤包括: 大纲生成 Agent:根据用户需求生成初步内容大纲。 Topic 拆分 Agent:将大纲内容细分为多个主题。 Research Agent...

阅读:10 评论:0