研究背景 & 方法亮点 推荐系统(Recommendation System,RS)的核心目标是为用户生成个性化排序列表,但现有推荐模型的架构设计往往忽视了排序属性,导致推荐效果受限。 以 LightGCN 等基于 GNN 的传统推荐模型为例,模型的前向编码过程基于图的平滑性假设,通过“低通滤波”聚合信息,容易引发过平滑问题,且难以区分正负样本的...
©作者 | 谢春宇,王斌 单位 | 360人工智能研究院 做为多模态+大模型研究的重要开创性工作,自 20 年 OpenAI 发布第一代图文跨模态模型 CLIP 以来已经过去了 5 年的时间。 第一代 CLIP 模型及其后续各种改进模型广泛应用于互联网搜广推、办公检索、安防自动化等众多领域,并进一步做为 backbone encoder 应用于当前的各种图...
机器之心报道 机器之心编辑部 从编程开始,今年智能体要卷飞了!!! 昨天,OpenAI CEO 奥特曼预告了一项新研究,吊足了所有人的胃口。 就在刚刚,谜底揭晓!OpenAI 宣布,在 ChatGPT 中引入了 Codex 的研究预览版。 Codex 是一个云端软件工程智能体,可以并行处理多项任务,包括编写功能、解答代码库相关问题、修复 bug 以及提...
机器之心报道 作者:+0、刘欣 FastVLM—— 让苹果手机拥有极速视觉理解能力 当你用苹果手机随手拍图问 AI:「这是什么?」,背后的 FastVLM 模型正在默默解码。 最近,苹果开源了一个能在 iPhone 上直接运行的高效视觉语言模型 ——FastVLM(Fast Vision Language Model)。 代码链接:https://g...
OpenAI最强编程智能体Codex上线。 作者 | 李水青 编辑 | 心缘 智东西5月17日报道,昨夜,OpenAI推出一款基于云的软件工程Agent(智能体)——Codex的预览版。 Codex可并行处理多项任务,例如编程、解答代码库相关问题、修复错误以及提交拉取请求以供审核等,在云上运行并预加载用户代码库。 Codex由codex-1模型提供...
该工作由南洋理工大学陶大程教授团队与武汉大学罗勇教授、杜博教授团队等合作完成。 近些年,多模态大语言模型(MLLMs)在视觉问答、推理以及 OCR 等任务上取得了显著的成功。然而,早期的 MLLMs 通常采用固定的分辨率(例如 LLaVA-v1.5 将输入图像缩放为),对于输入图像为高分辨率图像(例如 8K 分辨率)会导致图像变得模糊,损失大量有效的视觉信...
新智元报道 编辑:编辑部 YXH 【新智元导读】OpenAI最强AI编程智能体真的来了!Codex震撼上线,由o3优化版codex-1加持,多任务并行,半小时干完数天软件工程任务。 从今天起,AI编程正式开启新时代! 刚刚,Greg Brockman带队与OpenAI六人团队开启线上直播,震撼发布了一款云端AI编程智能体——Codex。 用奥特曼的...
新智元报道 编辑:KingHZ 【新智元导读】ChatGPT「舔狗化」事件背后,暴漏目前AI仍是「黑箱」。 一场关于「机制可解释性」的路线分歧,正撕裂AI研究最核心的价值共识。谷歌认怂,Anthropic死磕——AI还能被「看懂」吗? OpenAI只是微微升级了一下ChatGPT-4o,却一夜让AI性格大变,化身「赛博舔狗」。 然而,没有人知道这到...
新智元报道 编辑:英智 【新智元导读】AI市场风起云涌!Poe最新报告揭晓:OpenAI的GPT-4o称霸文本生成,谷歌的Gemini 2.5 Pro领跑推理,Kling在视频领域异军突起,企业如何在这场AI竞赛中抢占先机? 最近,Poe发布了最新的使用报告,报告显示,OpenAI和谷歌的地位越来越稳,势头很猛。 Anthropic就没那么好运,有...
Altman 昨天早上还在 X 上卖关子,说有个研究预览版本快上线,要给它起个「如果它成了会很好记」的名字。 就在刚刚,OpenAI 正式发布 Codex。 这是一款基于云端运行的软件工程智能 Agent,能够并行处理多个开发任务,协助开发者高效完成编程工作。 UI 设计没整花活,Codex 提供一个输入框和两个按钮——「Ask」(提问)和 「Code」(...