文丨丁灵波 谁将进一步领跑AI浪潮?谷歌、OpenAI、xAI、Meta四家展开了更为激烈的对阵。 今天,OpenAI首次揭露其星际之门(Stargate)项目进展,以期获得市场投资者更多信心,只因近期各种不利消息让OpenAI颜面扫地。 ChatGPT智能体发布后,体验被吐槽没赶上Manus和Genspark;自封的IMO金牌没经过官方认可,荣誉最...
作者 | 吴梅梅 来源|IT桔子 封面|公众号AI生成 7月,热浪袭人的夏天,东哥火力全开! 京东不仅在外卖/即时零售战场全面开打,最近竟在一天里,更是密集地投资了3家国内知名具身智能机器人创业公司——千寻智能、逐际动力、众擎机器人,足迹遍布深圳、杭州,且对其中2家均作为领投方。 回顾过去10年,IT 桔子发现,京东在对外的股权投资上已经“沉寂多年”,过去...
随着大语言模型的能力爆发,各种“越狱(Jailbreak)”方法也如雨后春笋般涌现。它们通过巧妙的提示词、对话设定,甚至中间层改写,迫使模型“说出不能说的话”,对社会具有严重的潜在安全风险。 问题来了:这些攻击方法到底有多强?它们所揭示的 LLM 安全风险是否被夸大了? 为了回答这个问题,来自港科大的王帅老师课题组系统评估了自 2022 年以来具有代表性的...
©作者 | 张彧 单位 | 浙江大学 研究方向 | 音乐/空间音频 零样本歌声合成(SVS)旨在基于音频或文本提示,生成具有未见过的多级别风格的高质量歌声。该领域在专业音乐创作和短视频配音方面具有广泛的潜在应用。 尽管传统的歌声合成任务已经取得了显著进展,但人们对更具定制化的体验需求日益增长。这不仅包括通过音频提示实现零样本风格迁移,还需要利用自然语言文本...
多知7月23日消息,近日字节跳动旗下AI编程工具TRAE推出SOLO模式。 今年 1 月,TRAE IDE 国际版发布、3 月推出中国版,当前,TRAE 月活用户已超100万,累计生成并被采纳的代码超60亿行。TRAE已打磨出三个核心产品能力:Cue 代码补全、Chat 问答、Agent 代码生成。 TRAE的SOLO模式是基于“Context Engin...
时令 发自 凹非寺 量子位 | 公众号 QbitAI 趁着老黄中国行,马斯克给他偷了家。 这不,英伟达顶级工程师何宜晖(Ethan He),刚刚官宣加入了xAI。 这位西安交大校友表示,随着Grok4解锁AI领域,迫不及待进一步突破边界了。 有了“挖人大战”的热度在前,何宜晖的这波跳槽也引发不少猜测。有人在评论区直言:这年薪肯定不低! 不过对于和马斯克一...
FreeAudio团队 投稿 量子位 | 公众号 QbitAI 文生音频系统最新突破,实现精确时间控制与90秒长时音频生成! 想象一下,给AI发一段复杂指令生成音频: 0-10秒要有森林风吹声;0-4秒,鸟儿鸣叫;4-6秒,木头燃烧;6-16秒,动物踩在干树叶上的脚步声;10-16秒,蟋蟀鸣叫;16-19秒,猫头鹰鸣叫;17-26秒,溪水流淌。 现在它真...
PhysX团队 投稿 量子位 | 公众号 QbitAI 3D生成又补齐了一块重要拼图——物理属性! 南洋理工大学-商汤联合研究中心S-Lab,及上海人工智能实验室合作提出了PhysXNet,号称首个系统性标注的物理基础3D数据集。 团队表示,3D生成正从纯虚拟走向物理真实,但现有的3D生成方法主要侧重于几何结构与纹理信息,忽略了基于物理属性的建模。 为了填...
DIJA团队 投稿 量子位 | 公众号 QbitAI 扩散语言模型(Diffusion-based LLMs,简称 dLLMs)以其并行解码、双向上下文建模、灵活插入masked token进行解码的特性,成为一个重要的发展方向。 相较传统的自回归语言模型,dLLMs 既可以一次性生成多个位置的词,也能更自然地完成文本插入、改写、补全等任务,被广泛应用于交互...
亚马逊宣布收购初创公司Bee AI,后者生产一款售价50美元的可穿戴人工智能助手。 文|牛占林 当地时间周二,美国科技巨头亚马逊宣布,将收购初创公司Bee AI,后者生产一款售价50美元的可穿戴人工智能助手。 不过具体收购金额双方并未向外透露,交易完成后,Bee旗下的AI语音手环将并入亚马逊硬件矩阵,成为其继续加码AI的最新行动。 Bee联合创始人卢尔...