AI信息差 - 安爸-超级家庭

AI信息差 2025-06-19

Meta出1亿美元，挖角OpenAI员工

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！ CNBC消息，OpenAI联合创始人兼首席执行官Sam Altm...

安爸

16 0

AI信息差 2025-06-19

清华SageAttention3，FP4量化5倍加速！且首次支持8比特训练

随着大型模型需要处理的序列长度不断增加，注意力运算（Attention）的时间开销逐渐成为主要开销。此前，清华大学陈键飞团队提出的即插即用的 SageAttention 和 SageAttention2 已经被业界及社区广泛的使用于各种开...

安爸

15 0

AI信息差 2025-06-19

统一框架下的具身多模态推理：自变量机器人让AI放下海德格尔的锤子

机器之心报道自变量机器人当 AI 放下海德格尔的锤子时，意味着机器人已经能够熟练使用工具，工具会“隐退”成为本体的延伸，而不再是需要刻意思考的对象。当一位熟练的木匠抓起锤子时，锤子消失了 —— 不是物理上的消失，而是无需思考便可自...

安爸

16 0

AI信息差 2025-06-19

信息过载时代，如何真正「懂」LLM？从MIT分享的50个面试题开始

机器之心报道编辑：+0 人类从农耕时代到工业时代花了数千年，从工业时代到信息时代又花了两百多年，而 LLM 仅出现不到十年，就已将曾经遥不可及的人工智能能力普及给大众，让全球数亿人能够通过自然语言进行创作、编程和推理。 LLM 的技术版图...

安爸

18 0

AI信息差 2025-06-19

10×加速！DCM显著提升视频扩散模型推理效率！HunyuanVideo13B推理时间从1500秒缩短至120秒！

本文由南京大学，香港大学，上海人工智能实验室，中国科学院大学与南洋理工大学 S-Lab 联合完成。扩散模型在视频合成任务中取得了显著成果，但其依赖迭代去噪过程，带来了巨大的计算开销。尽管一致性模型（Consistency Models）...

安爸

16 0

AI信息差 2025-06-18

一手实测超强开源OCR文档识别，效果超闭源模型。

这个OCR有点牛的。开源没几天就有2.5k星星了。看我实测的就知道有多猛，我用这个项目的论文测试了下，别家这里都是图片，它这里直接就识别成表格了，甚至符号都长得一样。开源的OCR已经进化到比很多闭源的效果更好了。所以PDF、文档翻...

安爸

16 0

AI信息差 2025-06-18

ACL 2025 深入浅出看关系：探索多模态大模型关系“幻觉”问题

什么是“关系幻觉”？如今，多模态大语言模型（MLLMs）已经在我们生活中随处可见，无论是聊天机器人还是自动驾驶，甚至是医疗诊断，都有它们的身影。然而，这些模型有时却会“编故事”，做出与现实不符的错误回答，我们称之为“幻觉”现象。在过...

安爸

16 0

AI信息差 2025-06-18

你的T2I模型真的看懂了你的Prompt吗？TIIF-Bench来了次摸底评测！

论文标题： TIIF-Bench: How Does Your T2I Model Follow Your Instructions? 作者单位：北京大学、清华大学、中山大学、香港理工大学、OPPO Y-Lab 项目主页 & ...

安爸

15 0

AI信息差 2025-06-18

字节Seed提出序贯策略优化方法，突破同传“质量-延迟”权衡问题

SeqPO-SiMT团队投稿量子位 | 公众号 QbitAI AI字幕总是慢半拍，质量和延迟难以平衡是业界老问题了。为此，香港中文大学、字节跳动Seed和斯坦福大学研究团队出手，提出了一种面向同声传译的序贯策略优化框架 (Sequen...

安爸

18 0

AI信息差 2025-06-18

AI玩宝可梦找出30年前代码Bug！谷歌论文介绍AI通关全过程，复杂任务都能解

梦晨发自凹非寺量子位 | 公众号 QbitAI 谷歌Gemini 2.5系列大模型技术报告发布，一大重点居然是AI玩《宝可梦》？没错，就是那个童年回忆里的游戏，谷歌花超长篇幅介绍了Gemini 2.5 Pro玩《宝可梦蓝》时的具体行...

安爸

16 0