新智元报道 编辑:LRS 【新智元导读】过去几十年,全球博士毕业生数量呈爆炸式增长,但学术界职位空缺数量远低于毕业生数量。如今博士生的就业趋势已从学术界转向工业界,未来博士教育培养模式应转变,产学研深入结合,以更好地匹配劳动力市场。 21世纪,最贵的是人才,最便宜的是学历。 博士,已然是学历金字塔的塔尖,也是通往学术和高端职业的敲门砖。 不过,过去...
睡醒第一件事,是看 Meta 今天又挖了谁。 今天凌晨,据 The Information 援引知情人士消息称,Meta 再度从 OpenAI 招来四名研究员(Shengjia Zhao、Jiahui Yu、Shuchao Bi 和 Hongyu Ren),助力其超级智能计划。 这四人此前都在 OpenAI 负责模型开发或多模态方向的核心工作。 消息一出,O...
采访 | 霍太稳 编辑 | Tina 过去一年,全球科技巨头都把宝押在了 AI 上。像 Meta、微软、亚马逊、谷歌 这些大公司,今年光是在 AI 基础设施上就打算砸 3,250 亿美元,秉持“先烧钱、后吃肉”的战略,推动大模型技术快速发展。在这一波浪潮中,DeepSeek 等企业在大模型上的创新,更是把各路玩家卷得不行,甚至逼得 OpenAI 都打起了价...
BIOCLIP 2团队 投稿 量子位 | 公众号 QbitAI 让AI看懂95万物种,并自己悟出生态关系与个体差异! 俄亥俄州立大学研究团队在2亿生物图像数据上训练了BioCLIP 2模型。大规模的训练让BioCLIP 2取得了目前最优的物种识别性能。 而更令人惊喜的是,即使在训练过程中没有相应监督信号,BioCLIP 2还在栖息地识别、植物疾病识别等5个非...
在人工智能领域,多模态大语言模型的发展正逐渐改变着我们对智能交互的认知。腾讯联合清华大学深圳国际研究生院、香港中文大学和香港大学等机构,共同推出了名为MindOmni的多模态大语言模型,它在视觉理解、文本到图像生成、推理生成等方面展现出了强大的能力,为多模态AI的发展开辟了新的路径。 一、项目概述 MindOmni是一个由腾讯ARC Lab联合清华大学深圳...
ChatGPT 4o一句话P图功能发布后,引起了轰动。 一时间全世界都在用ChatGPT 4o 把图片P成吉卜力风格。 很长一段时间,其他AI团队难以复现这个功能。 后来豆包一定程度上实现了一句话P图功能,但缺点是风格不那么稳定,只能算“山寨”版。 再后来,Flux终于出手了,Kontext实现了超越ChatGPT 4o的一句话P图功能。 不过,Flux发...
机器之心报道 编辑:杜伟、大盘鸡 再一次,Meta「搜刮」了 OpenAI 的成员。The Information 发布了文章,谈到 Meta 再聘四名 OpenAI 研究人员。这离上一次 OpenAI 苏黎世办公室被 Meta 一锅端只隔了短短几天时间。 在 4 月发布 Llama 4 AI 模型后,Meta 启动了一波大规模招聘潮。据悉,Llama 4...
本文第一作者卫雅珂为中国人民大学四年级博士生,主要研究方向为多模态学习机制、多模态大模型等,师从胡迪副教授。作者来自于中国人民大学和上海人工智能实验室。 近年来,多模态大模型(MLLMs)已经在视觉语言、音频语言等任务上取得了巨大进展。然而,当在多模态下游任务进行微调时,当前主流的多模态微调方法大多直接沿用了在纯文本大语言模型(LLMs)上发展出的微调...
新智元报道 编辑:定慧 【新智元导读】「我的工作太复杂,AI替代不了」别天真了!从农业到制造业,再到今天的软件开发,历史早已证明:所有工作都难逃被技术重塑的命运。AI正以惊人速度吞噬人类岗位,程序员也未能幸免,或许所有人都无法幸免。 「我的岗位太复杂不会被AI替代的」。 如果你还在抱着这种看法来看待如今的AI时代,那你99%要完蛋了。 NO. JO...