安爸-超级家庭
bg

AI信息差

ACL 2025 大语言模型正在偷改你的代码?

本文作者分别来自西安交通大学、马萨诸塞大学阿默斯特分校、武汉大学以及南洋理工大学。第一作者张笑宇是来自西安交通大学的博士生,研究方向聚焦于大模型安全以及软件安全。通讯作者为西安交通大学沈超教授。 在人工智能领域,大语言模型(LLM)作为新一代推荐引擎,在代码推荐等任务中展现出超越传统方法的强大能力。然而,其潜在的偏见问题正逐渐成为影响技术可靠性与社会公平的...

阅读:11 评论:0

顶会0篇,一夜RLHF爆文刷屏!他靠写作逆袭AI圈,院士都说好

新智元报道 编辑:KingHZ 【新智元导读】他不是天才,博士毕业0顶会论文,却靠着坚持写技术博客,因RLHF「网红」博客文章一炮而红,逆袭成功、跻身AI核心圈!技术可以迟到,但影响力不能缺席。这一次,是写作改变命运。 Ai2的高级研究科学家Nathan Lambert,最近分享了他如何走上AI之路。 尽管起步艰难、几经波折,他依旧在AI领域站稳脚...

阅读:10 评论:0

十二年了,苹果怎么想起来改UI了

作者_|王飞 邮箱|_wf@pingwest.com 十二年,对于科技行业而言是一个非常漫长的周期,这足以改变很多事情。 但是,苹果的UI设计却可以在十二年的时间里保持着最不明显的变化。 现在,这一切终于要改变了。 苹果在2013年发布iOS 7时,智能手机刚刚进入成熟期,社交媒体正在重塑人们的交流方式,而人工智能还只是实验室里的概念。如今,随着WWDC ...

阅读:11 评论:0

AI驱动的智能交易革命!开源多智能体交易系统,模拟真实团队决策,打造高效精准的股票交易系统!

在金融市场瞬息万变的今天,传统的交易策略和单一模型往往难以应对复杂多变的市场环境。 AI 多智能体的兴起,除了我们在所熟知的日常领域,同时还在金融投资领域掀起了技术热潮。 最近在 GitHub 上发现一款开源的创新的多智能体交易系统:TradingAgents,通过模拟真实交易团队的分工协作,利用大型语言模型(LLM)驱动的多个智能体,综合财务数据、市场情绪...

阅读:13 评论:0

adb-mcp项目通过四层架构可以完全实现AI对Adobe软件的精准操控

adb-mcp项目通过四层架构可以完全实现AI对Adobe软件的精准操控,其运作逻辑环环相扣,堪称技术与创意的完美融合。只要能给软件写插件,尤其是脚本插件这种能控制软件原生功能的,那么必然可以用MCP来实现AI控制,因为只要给开发者提供接口,再复杂的软件都不存在壁垒: 1、AI与MCP服务器交互:用户向大语言模型(如Claude)输入自然语言指令后,AI将指...

阅读:10 评论:0

vui:小型对话式语音模型,能在本地设备上运行

vui:小型对话式语音模型,能在本地设备上运行。亮点:1. Vui.BASE模型基于40k小时音频对话训练;2. Vui.ABRAHAM支持单人对话且具备上下文感知能力;3. Vui.COHOST支持两人对话互动。 参考文献: [1] https://github.com/fluxions-ai/vui 知识星球服务内容:Dify源码剖析及答疑,D...

阅读:11 评论:0

SFT+RL双阶训练突破LLM自我监督!人大DeepCritic实现AI批判自主进化

论文标题 DeepCritic: Deliberate Critique with Large Language Models 论文链接: https://arxiv.org/abs/2505.00662 代码链接: https://github.com/RUCBM/DeepCritic 作者团队: 中国人民大学高瓴人工智能学院、北京交通大学计算机科学与...

阅读:10 评论:0

35%准确率蒸发!字节&华科WildDoc揭示多模态文档理解鲁棒性短板

在文档理解领域,多模态大模型(MLLMs)正以惊人的速度进化。从基础文档图像识别到复杂文档理解,它们在扫描或数字文档基准测试(如 DocVQA、ChartQA)中表现出色,这似乎表明 MLLMs 已很好地解决了文档理解问题。 然而,现有的文档理解基准存在两大核心缺陷: 脱离真实场景:现实中文档多为手机/相机拍摄的纸质文件或屏幕截图,面临光照不均、物理扭曲...

阅读:15 评论:0

天塌了!苹果刚刚证明:DeepSeek,o3,Claude等“推理”模型根本没有推理能力

最新重磅研究:苹果并不认为推理模型比标准 LLM有重大突破 最新研究《思考的幻觉:通过问题复杂性视角理解推理模型的优势与局限》中,苹果对“大型语言模型已经具备真正的逻辑思维能力——即真正的“推理能力”——这一普遍存在的假设提出了质疑。苹果公司的研究人员看到的并非认知领域的突破,而是一种幻觉:这些模型仅仅创造了思考的印象,而实际上并没有稳定、可理解的思维过程...

阅读:10 评论:0

6大模型决战高考数学新一卷:豆包、元宝并列第一,OpenAI o3竟惨败垫底

机器之心报道 编辑:杨文 还在让大模型写高考作文?有本事做高考数学卷子。 又是一年高考时。 这届考生上午刚经历了抽象作文的洗礼,下午又被数学无情创飞。考试一结束,「高考数学」、「新一卷数学大题 难」等词条就火速冲上微博热搜,考生们在评论区集体「哀嚎」:「大题写到怀疑人生」、「选择填空送分,大题送命」。 而自从生成式 AI 走红后,大模型「决战」高考...

阅读:13 评论:0