安爸-超级家庭
bg

AI进家庭

我在 4 年的机器人开源项目中学到了什么

作者 | Michael Parker 译者 | 刘雅梦 策划 | 褚杏娟 我是名为 Simplex 的开源 Discord 机器人的创建者 / 开发者。在这篇文章中,我想带你了解一下这个项目所做的一些决定、问题和缺陷修复,以及项目启动的原因。Simplex 是我 14 岁时创建的一个机器人,现在它运行在 500 台服务器上拥有 8.4 万用户。我希...

阅读:9 评论:0

硬刚GPT4o!Midjourney V7上线:言出法随,还有杀手锏「10倍速“草稿模式”」

Midjourney 刚刚宣布了一个重磅消息:V7 版本的 Alpha 测试正式上线 V7 模型带来的一大杀手锏,就是全新的“草稿模式”(Draft Mode)。它的成本直降一半,速度却狂飙 10 倍!这可能是迭代想法、打磨创意的史上最佳途径。另外强烈推荐试试语音功能 V7 核心升级 根据官方说法,V7 是一个显著进步的模型: 更懂你的 Prompt:无...

阅读:9 评论:0

多榜单登顶!华为 & 哈工深团队提出 AdaReTaKe,突破长视频理解极限

第一作者为哈尔滨工业大学(深圳)博士生王霄和华为大模型研究员佀庆一,该工作完成于王霄在华为实习期间。王霄的研究方向为多模态视频理解和生成,佀庆一的研究方向为多模态理解、LLM post-training和高效推理。 随着视频内容的重要性日益提升,如何处理理解长视频成为多模态大模型面临的关键挑战。长视频理解能力,对于智慧安防、智能体的长期记忆以及多模态深度思...

阅读:7 评论:0

刚刚,DeepSeek公布推理时Scaling新论文,R2要来了?

机器之心报道 机器之心编辑部 一种全新的学习方法。 这会是 DeepSeek R2 的雏形吗?本周五,DeepSeek 提交到 arXiv 上的最新论文正在 AI 社区逐渐升温。 当前,强化学习(RL)已广泛应用于大语言模型(LLM)的后期训练。最近 RL 对 LLM 推理能力的激励表明,适当的学习方法可以实现有效的推理时间可扩展性。RL 的一个关键挑战...

阅读:8 评论:0

思维链不可靠:Anthropic曝出大模型「诚信」问题,说一套做一套

机器之心报道 编辑:蛋酱 AI 可能「借鉴」了什么参考内容,但压根不提。 自去年以来,我们已经习惯了把复杂问题交给大模型。它们通常会陷入「深度思考」,有条不紊地展示思维链过程,并最终输出一份近乎完美的答案。 对于研究人员来说,思考过程的公开可以帮助他们检查模型「在思维链中说过但在输出中没有说」的事情,以便防范欺骗等不良行为。 但这里有一个至关重要的问题:...

阅读:10 评论:0

末日时间表来了!前OpenAI研究员76页硬核推演:2027年ASI接管世界,人类成NPC

新智元报道 编辑:编辑部 HNZ 【新智元导读】前OpenAI研究员Daniel Kokotajlo团队发布了「AI 2027」预测报告,描绘了一个超人AI崛起的未来:从2025年最贵AI诞生,到2027年自我进化的Agent-5渗透政府决策,人类可能在不知不觉中交出主导权。 2027年,AI究竟会如何接管人类? 今天,前OpenAI研究员和同事们...

阅读:8 评论:0

特朗普新关税是ChatGPT算的?被控「AI治国」,美科技股遭史上最黑暗一天

新智元报道 编辑:Aeneas 好困 【新智元导读】特朗普的全新关税政策,被曝是用ChatGPT计算出来的?!越来越多人发现了特朗普纸板上数字的秘密——跟ChatGPT这些AI给出的计算公式几乎一毛一样,这下,可真成「AI治国」了。 就在刚刚,特朗普的关税大棒落下,美国科技股直接遭遇史上最黑暗一天。 由此引发的市场大恐慌,让苹果领衔的「七姐妹」集团...

阅读:8 评论:0

250多篇论文,上海AI Lab综述推理大模型高效思考

最近,像 OpenAI o1/o3、DeepSeek-R1 这样的大型推理模型(Large Reasoning Models,LRMs)通过加长「思考链」(Chain-of-Thought,CoT)在推理任务上表现惊艳。 但随之而来的是一个日益严重的问题:它们太能「说」了!生成的推理过程往往充斥着冗余信息(比如反复定义)、对简单问题过度分析,以及对难题的探...

阅读:8 评论:0

即梦3.0杀疯了,2K高清中字海报直出,一周内设计师的天“塌”了3次

作者 | 阿虎 Kino 编辑 | 张洁 GPT-4o带来的“吉卜力”风潮还未散去,即梦带着3.0版本杀回来了。 4月2日,字节即梦3.0开启了灰度测试,相较之前的2.1版本,在影视质感、文字响应、清晰度上进行了全面升级。 不少网友已经抢先体验,玩得停不下来: 图片来源:歸藏 图片来源:小互、Orange.ai 图片来源:Solos Lee、Oran...

阅读:10 评论:0

新手必看!用 DeepSeek-R1 数据训练出你的专属中文推理模型

DeepSeek-R1 模型以其卓越的性能在自然语言处理领域引起了广泛关注,其基于 R1 蒸馏数据进行 SFT(Supervised Fine-Tuning)的小模型也展现出了强大的效果。前段时间,大佬“刘聪NLP”开源了中文 DeepSeek-R1(满血)蒸馏数据集,包括 SFT 版本和普通版本。这一数据集的发布,迅速吸引了众多研究者和开发者的目光,并成...

阅读:8 评论:0