安爸-超级家庭
bg

AI信息差

RL真让大模型更会推理?清华新研究:其能力边界或仍被基座「锁死」

近年来,RLVR(可验证奖励的强化学习)训练大模型在数学、代码等各项任务中表现惊艳,大模型的推理能力快速提升,强化学习因而被视为重要的推手。然而,其中直指核心的重要问题却悬而未决:强化学习真的能让大模型获得超越基础模型的新推理能力吗? 清华大学LeapLab团队联合上海交通大学开展的最新实证研究,通过实验现象揭示了一个值得关注的问题:当前的 RLVR 方法...

阅读:10 评论:0

免费用!OpenAI发布「轻量版」Deep Research,o4-mini加持

新智元报道 编辑:桃子 【新智元导读】OpenAI正式向免费用户推出深入研究(Deep Research)了!这次是轻量版,由o4-mini加持,准确率高达45.6%。 OpenAI深度研究,免费用户也能用了。 一大早,OpenAI官宣了深度研究「轻量版」正式上线,不论是免费用户,还是Plus、Team、Pro用户,都能立即享用。 目前,这个版...

阅读:11 评论:0

AI入侵学术圈,超700篇顶刊论文暴雷!科学侦探揭秘真相,登Nature头版

新智元报道 编辑:桃子 【新智元导读】ChatGPT潜入学术圈,已有超700篇论文偷用AI不报备。甚至,一些顶刊主动删除了100多篇论中的AI语。今天,最新Nature文章揭秘了学术论文背后的乱象。 「截至我最后的知识更新」,「重新生成响应」,「作为一个AI语言模型」…… 这些短句,已经成为顶刊论文中的常态。 2024年,一篇发表在Radiolog...

阅读:10 评论:0

用AI做“跳看”,爱奇艺要让用户掌握主动权

作者_|summer 邮箱|_huangxiaoyi@pingwest.com 打开一部剧集,想要迅速了解剧情发展?想要回顾关键画面?想要直接去看名场面? 在最新的爱奇艺App上,你只需上下一划,就能直接跳转。 这个比拖拽进度条更加便捷的新功能,就是爱奇艺最新发布的“跳看”功能。 在4月23日的爱奇艺世界大会上,爱奇艺基础架构与智能分发事业群总裁刘文峰现场...

阅读:11 评论:0

醒醒,只靠MCP和A2A还带不来AI Agent的大繁荣

作者_|王兆洋 邮箱|_wangzhaoyang@pingwest.com 1 AI Agents需要它的HTTPS 1981年,今天互联网共同遵守的网络规则“TCP/IP协议”诞生。在此之前,不同的计算机系统和网络“各说各话”,而以传输控制协议(TCP)和网际协议(IP)为主的设计则提供了一套标准化的通信规则,使得不同厂商的设备以及不同网络能够互联互通。...

阅读:11 评论:0

一款强大的社交媒体内容分析 AI 工具:Secretary

利用该工具自动抓取监控指定账号的最新发表内容,通过 AI 进行分析,并将结构推送到企业/个人微信。主要功能: 支持多平台监控(Twitter 和 Truth Social) 可配置多个监控账号和分析提示词 支持多维度分析(财经、科技等) 使用 AI 进行内容翻译和智能分析 支持推送到企业微信机器人和个人微信 提供了详细的使用指南,按要求配置好环境变量后,...

阅读:11 评论:0

全球首个工业界多模态推理模型Skywork-R1V

此前,R1V 1.0首次成功实现了「强文本推理能力向视觉模态的迁移」,才短短一个月后,Skywork-R1V 2.0就强势上线了。现在,R1V 2.0的所有资源已全面开源,可以预见,多模态推理社区将迎来新一轮发展。可以说,R1V 2.0的诞生,不仅推动了开源多模态大模型在能力边界上的突破,更为多模态智能体的搭建提供了全新的基座模型。 参考文献: [1]...

阅读:12 评论:0

GLM-4-32B 的 bartowski 量化版本放出了

GLM-4-32B 的 bartowski 量化版本放出了。 参考文献: [1] 地址:https://huggingface.co/bartowski/THUDM\_GLM-4-32B-0414-GGUF 知识星球服务内容:Dify源码剖析及答疑,Dify对话系统源码,NLP电子书籍报告下载,公众号所有付费资料。加微信buxingtianxia2...

阅读:10 评论:0

又一款开源免费的会议笔记 AI 工具:Hyprnote

又一款开源免费的会议笔记 AI 工具:Hyprnote。使用开源模型 Whisper 和 Llama,可完全离线运行,自动录音、转录会议内容,并结合我们随手记下的要点一键生成高质量的会议总结。所有数据存储在本地安全隐私,并提供类似 VSCode 的扩展框架,可根据自己需求进行高度定制。目前已提供 macOS 版本,可通过 Homebrew 一键安装,未来还会...

阅读:10 评论:0

一篇介绍推理模型的 test-time scaling 技术的文章

一篇介绍推理模型的 test-time scaling 技术的文章。 test-time scaling 是指在模型部署期间分配更多计算资源以提升其推理性能。文章指出,推理任务需要大量思考和计算资源,如高级数学运算和多模态推理等。为了提升大型语言模型(LLMs)在推理任务中的性能,研究人员开发了基于搜索的技术,如蒙特卡洛树搜索、n选优和多数表决等。这些技术虽...

阅读:10 评论:0